Статьи Соросовского Образовательного журнала в текстовом формате
Негладкий анализ - раздел современной математики, в котором изучаются недифференцируемые функции. Ниже обсуждается проблема создания математического аппарата для исследования недифференцируемых функций (произвольных вещественных функций). На примере функций одной переменной показывается, что основой такого аппарата могут быть понятия верхней и нижней производной Дини.
ОБОБЩЕНИЕ ПОНЯТИЯ ПРОИЗВОДНОЙ В НЕГЛАДКОМ АНАЛИЗЕВ. Ф. ДЕМЬЯНОВ
Санкт-Петербургский государственный университет
ВВЕДЕНИЕ
"Я отворачиваюсь с отвращением и ужасом от этой жалкой язвы - функций, не имеющих производных." Более ста лет прошло с тех пор, как Ш. Эрмит написал эти строки в письме к Т. Стилтьесу. Негладкие (или недифференцируемые) функции для многих и сегодня еще являются изгоями в благородном семействе "гладких" функций. Наша цель - показать, что большинство из них - не гадкие утята, а прекрасные гладкие лебеди.
В 70-х годах XVII столетия независимо друг от друга И. Ньютон и Г. Лейбниц ввели понятие производной и заложили основы дифференциального и интегрального исчисления. Тем самым был создан математический аппарат, обеспечивший бурное развитие естественных и точных наук на три столетия вперед. Понятие производной является наиболее важным понятием высшей математики, без него все могучее здание современных естественных наук рухнет, как карточный домик. Основным объектом изучения в классическом математическом анализе является гладкая (или дифференцируемая) функция [1 - 3]. Возникавшие до недавнего времени практические задачи достаточно хорошо описывались гладкими математическими моделями. Конечно, негладкие функции естественным образом появлялись и в самой математике, и в ее приложениях, однако они представляли собой чаще всего экзотику, исключения, подтверждавшие правила (а "правила", конечно, были гладкими).
Негладкость все более настойчиво стучится в дверь. Специалисты по-разному относятся к негладкости. Одни считают ее "незаконным" ребенком в царстве чистой Математики и отказываются иметь с ней дело (их отношение вполне отражено в приведенных выше словах Эрмита). Другие принимают ее как неизбежное зло и нехотя мирятся с ней (и борются путем сглаживания). Третьи признают законность негладких функций и относятся к ним с полным уважением, то есть изучают и исследуют их.
Негладкий анализ (НГА) - это вполне сложившийся и быстро развивающийся раздел современной математики. Как ясно из названия, объектами изучения негладкого анализа являются недифференцируемые функции.
Негладкая задача - это задача, которая описывается с помощью недифференцируемых функций. Для решения ряда негладких задач были разработаны специфические методы, пригодные для одной задачи или узкого класса задач. Крестным отцом негладкого анализа по праву считается П.Л. Чебышев, который еще в 1853 году решил задачу нахождения алгебраического многочлена степени n со старшим коэффициентом единица, наименее уклоняющегося от нуля на заданном отрезке [4, стр. 579 - 608].
Решение этой задачи удалось получить в явном виде (в результате были открыты ставшие знаменитыми многочлены Чебышева). К сожалению, большинство негладких задач не может быть решено аналитически, для этого приходится привлекать численные методы.
Следующие сто лет, до середины пятидесятых годов нашего века, в недрах классического ("гладкого") математического анализа накапливались факты и создавались элементы аппарата, которые, достигнув критической массы, привели в шестидесятые годы к быстрому и для многих внезапному появлению таких разделов современного негладкого анализа, как выпуклый анализ [5, 6], теория минимакса (см. [7]). Последние 25 лет представляют собой время плодотворного развития теории, методов и приложений негладкого анализа (термин "негладкий анализ" был введен Ф. Кларком) [8]. Этому способствовало три фактора: потребности современной науки, техники и экономики; наличие уже хорошо разработанных элементов теории и численных методов; возможности современной вычислительной техники.
Подобно тому, как поверхность Земли представляет собой гладкую поверхность (сферу) лишь в первом приближении, так и математическая модель почти любого процесса или явления может быть описана с помощью гладких функций лишь весьма приближенно. Более точное описание требует привлечения негладких функций, а для их изучения необходимо применение негладкого анализа.
Элементы математического анализа уже прочно вошли в школьный курс математики, мы убеждены в том, что недалеко время, когда школьники будут знакомиться и с элементами негладкого анализа, поскольку это просто, интересно и полезно.
В настоящее время негладкий анализ (и его раздел - недифференцируемая оптимизация) находится в стадии "экспоненциального" роста и внедрения в различные области науки, здесь еще много трудных нерешенных задач [8 - 10].
Ниже обсуждаются вопросы негладкого анализа в основном в одномерном случае (на вещественной прямой).
1. ОБОБЩЕНИЕ ПОНЯТИЯ ПРОИЗВОДНОЙ
1.1. Постановка задачи
Пусть на некотором интервале S вещественной оси R задана конечная вещественная функция f (то есть в каждой точке x k S значение f (x) - конечное вещественное число). Это записывается так: f: S R. В частности, S может совпадать с R. Наша цель - построить математический аппарат для изучения произвольной конечной вещественной функции (не обязательно дифференцируемой). Для этого прежде всего выясним, что мы ожидаем от такого аппарата, какие задачи желаем решать. Для конкретности рассмотрим задачи оптимизации. Вначале обратимся к случаю дифференцируемой функции и напомним, для чего использовалась производная. Вспомним
Определение. Если существует конечный предел
то говорят, что функция f дифференцируема в точке x0 . Предел (1) называется производной функции f в точке x0 . Функция называется дифференцируемой на S, если она дифференцируема в каждой точке x k S.
Отметим следующие факты.
1. С помощью производной функции f в точке x0 можно построить представление функции f в окрестности точки x0 по формуле
f (x) = f (x0) + f '(x0)(x - x0) + o(x - x0);
здесь
Функция
F(x0 , x) = f (x0) + f '(x0)(x - x0)
является аппроксимацией функции f в окрестности точки x0 (рис. 1).
2. С помощью производной удается сформулировать необходимые условия минимума и максимума: для того чтобы функция f достигала своего наибольшего или наименьшего на множестве S значения в точке x * k S необходимо, чтобы
f '(x*) = 0
(напомним, что S - интервал и потому точка x * - внутренняя точка S ). Отметим, что условие (5) является необходимым условием и минимума, и максимума. Точка, удовлетворяющая (5), называется стационарной.
3. Если x0 не является еще стационарной точкой, то можно найти направления убывания и возрастания f : если, например, f '(x0) > 0, то справа от x0 функция возрастает, а слева от x0 она убывает.
Обратим внимание на то, что в окрестности точки x0 функция f достаточно хорошо описывается линейной (по x) функцией F(x, x0) (см. (2) - (4)), а для построения F требуется знать лишь значения f (x0) и f '(x0). Таким образом, вместо того, чтобы хранить значения функции в бесконечном числе точек, мы можем ограничиться лишь двумя числами. Правда, это возможно, если мы умеем эти числа находить. Предполагая, что в любой точке x мы имеем возможность вычислить значения f (x), можно (используя (1)) найти с любой точностью и значение f '(x). К счастью, существует хорошо разработанное дифференциальное исчисление (правила вычисления производных) [3].
1.2. Производные по направлениям
Пусть теперь f : S R не является дифференцируемой на S, то есть не в каждой точке x0 k S существует предел (1). Возьмем g k R (g называется направлением). Если существует конечный предел
то говорят, что функция f дифференцируема в точке x0 по направлению g, а значение f '(x0 , g) называется производной функции f в точке x0 по направлению g. Здесь a 0 означает, что a 0, a > 0. Конечно, в (6) предполагается, что a достаточно мало, так что x0 + ag k S.
Поскольку из (6) ясно, что
f '(x0 , lg) = lf '(x0 , g) " l > 0
(символ " означает "для всех"), то достаточно рассматривать только два направления (в R): g = + 1 и g = - 1 (случай g = 0 не представляет особого интереса, так как f '(x0 , 0) = 0).
Если существуют f '(x0 , + 1) и f '(x0 , - 1), то функция f называется дифференцируемой в точке x0 по направлениям. Класс функций, дифференцируемых на S по направлениям, гораздо богаче, чем класс дифференцируемых функций (мы его изучим более подробно в следующей лекции).
1.3. Производные Дини. Верхняя и нижняя аппроксимации
Пусть f : S R, x0 k S, g k R. Функция f может быть и разрывной. Положим
Отметим, что пределы в (8) и (9) существуют всегда, но могут (один из них или оба сразу) обращаться в +? или -?.
Величина называется верхней производной Дини функции f в точке x0 по направлению g, а величина называется нижней производной Дини функции f в точке x0 по направлению g. Оказывается, что верхняя и нижняя производные Дини могут быть использованы для решения задач, о которых мы говорили в п.п. 1.1. В частности, если соответствующие производные Дини конечны, то имеют место следующие представления:
где
Итак, в негладком случае вместо (2), (3) имеем соотношения (10) - (13).
Как и в случае f '(x0 , g), справедливы соотношения
Поэтому достаточно найти производные Дини только для g = +1 и g = - 1. Функции
и
называются соответственно верхней и нижней аппроксимациями функции f в точке x0 по направлению g. В силу (14) и (15)
то есть функции (x0 , x0 + ag) и (x0 , x0 +ag) линейны по a при каждом g. Как уже отмечалось, в силу (14) и (15) (при a > 0) достаточно рассматривать только g = + 1 и g = - 1. Имеем:
Все эти функции линейны по x (но каждая из них определена только на полупрямой).
Пример 1. Пусть
График функции f (x) изображен на рисунке 2. Для точки x0 = 0 имеем
Из (16) - (19) получаем
На рисунке 3 график функции изображен сплошной линией, а график функции показан штриховой линией.
Замечание 1. Если f дифференцируема в точке x0 по направлениям, то, как видно из определений (6), (8) и (9),
Отсюда и из (16) - (19)
2. ИССЛЕДОВАНИЕ ФУНКЦИИ
НА ЭКСТРЕМУМ
2.1. Условия экстремума
Пусть f : S R. Точка x* k S называется точкой локального минимума функции f, если существует такое d > 0, что B d(x*) ? S,
f (x*) # f (x) " x k B d(x*),
где B d(x*) = {x | | x - x* | # d}.
Если
f (x*) < f (x) " x k B d(x*), x ? x*,
то x* является точкой строгого локального минимума функции f. Если (20) имеет место для всех x k S, то точка x* - точка глобального минимума f на S, а если (21) справедливо для всех x k S, x ? x*, то x* называется точкой строгого глобального минимума функции f на S.
Аналогично определяются точки локального, строгого локального, глобального и строгого глобального максимума функции f (в (20) и (21) следует заменить неравенства на обратные). Может оказаться, что минимума или максимума не существует. Точки максимума и минимума называются точками экстремума. Ясно, что точка глобального минимума (максимума) является и точкой локального минимума (максимума).
Теорема 1. Для того чтобы точка x* k S была точкой локального или глобального минимума функции f, необходимо, чтобы
Если оказалось, что
то точка x* является точкой строгого локального минимума функции f.
Доказательство. Пусть x* k S - точка минимума. Если условие (22) не выполнено, то найдется такое g0 , что
Из определения следует, что найдется последовательность точек {ak} такая, что ak + 0 и
Из (25) вытекает, что при достаточно больших k будет
Так как ak + 0, то из (26) заключаем, что не существует d > 0, удовлетворяющего (20), что противоречит предположению о том, что x* - точка локального минимума. Необходимость установлена (то есть (22) имеет место).
Достаточность. Пусть в точке x* выполнено условие (23). Требуется показать, что тогда x* - точка строгого локального минимума. Допустим противное, тогда для любого d > 0 найдется такое x(d) k S, что
| x(d) - x* | < d, x(d) ? x*, f (x(d)) # f (x*).
Выберем любую последовательность {dk} такую, что dk + 0. Положим xk = x(dk ). Без ограничения общности можем считать, что либо xk > x* " k, либо xk < x* " k. Пусть, например, оказалось xk > x* " k. Положим g0 = + 1, ak = xk - x*. Ясно, что ak + 0. В силу (27)
Отсюда
что противоречит (23). Полученное противоречие завершает доказательство достаточности.
Аналогично устанавливается следующая
Теорема 2. Для того чтобы точка x** была точкой локального или глобального максимума функции f, необходимо, чтобы
Если
то x* является точкой строгого локального максимума функции f.
Точка x*, удовлетворяющая условию (22), называется inf-стационарной точкой функции f, а точка x**, удовлетворяющая условию (28), называется sup-стационарной.
Замечание 2. В силу (14) и (15) проверять условия (22), (23), (28) и (29) надо лишь для g = + 1 и g = - 1. Таким образом, для проверки точки на inf- или sup-стационарность требуется лишь проверить два соответствующих неравенства.
Пример 2. Рассмотрим снова функцию, описанную в примере 1. В точке x0 = 0, как было показано,
Поскольку ни условие (22), ни условие (28) не выполнены, точка x0 не является ни точкой минимума, ни точкой максимума.
Пример 3. Рассмотрим функцию
Имеем
Отсюда ясно, что в точке x0 = 0 условие (23) выполнено (а тогда и тем более (22) имеет место), в то время как условия (28) и (29) не выполнены. Отсюда заключаем, что x0 = 0 является точкой строгого локального минимума функции. График функции f изображен на рисунке 4.
Пример 4. Пусть
Для точки x0 = 0 найдем производные Дини:
В точке x0 выполнено условие (29), и x0 является точкой строгого локального максимума (рис. 5).
Замечание 3. Если f - дифференцируемая функция, то (см. п. 2.) условия (22) и (28) эквивалентны условию f '(x*) = 0, а достаточные условия (23) и (29) никогда не могут быть выполнены. Таким образом, условия (23) и (29) существенно негладкие.
2.2. Направления спуска и подъема
Будем говорить, что направление g k R является направлением спуска функции f в точке x0 , если
Направление g k R называется направлением подъема, если
Пример 5. Пусть снова
В примере 1 было показано, что для x0 = 0
Из (30) и (31) заключаем, что каждое из направлений g = + 1, g = - 1 является одновременно и направлением подъема, и направлением спуска (то есть в любой окрестности точки x0 и справа, и слева от точки x0 можно найти как точки, в которых значение функции f меньше, чем f (x0), так и точки, в которых значение f больше, чем f (x0). В гладком случае такая ситуация невозможна.
Замечание 4. Из результатов п. 1 следует, что производные Дини позволяют решать те задачи, о которых говорилось в п.п. 1.1. Для эффективного использования этого аппарата требуется уметь вычислять производные Дини. К сожалению, для производных Дини нет достаточно богатого исчисления. Для более узких классов негладких функций удается, используя их специфику, разработать более эффективный аппарат [5 - 7, 10].
Замечание 5. Если функция f дифференцируема по направлениям, то из определения ясно, что ее верхняя и нижняя производные Дини по направлениям (8) и (9) равны и совпадают по значению с производной по направлению (6).
Замечание 6. Рассмотренные выше понятия (производная по направлениям, производные Дини) обобщаются на случай функций многих переменных и широко там используются.
ЗАКЛЮЧЕНИЕ
Из изложенного выше следует, что произвольную вещественную функцию (не обязательно гладкую или непрерывную) на прямой можно исследовать с помощью верхней и нижней производных Дини по направлениям. Верхняя производная Дини позволяет построить верхнюю аппроксимацию функции, проверить условия максимума, а нижняя производная Дини дает возможность построить нижнюю аппроксимацию и проверить условия минимума. В гладком случае все эти задачи решались с помощью производной. Для практического использования введенных обобщенных производных по направлениям надо уметь эти производные вычислять (то есть находить соответствующие пределы). В общем случае это представляет трудности ввиду отсутствия достаточно богатого исчисления. Однако для более узких классов недифференцируемых функций часто удается вычислять указанные верхние и нижние производные конструктивно. Так, для выпуклых функций и функций максимума соответствующий аппарат построен [5 - 7]. Другие классы негладких функций в настоящее время активно изучаются [8 - 10]. Поскольку негладкие функции все чаще встречаются при математическом моделировании реальных процессов (технологических, экологических, экономических), то требуется развивать математический аппарат с упреждением. Таким аппаратом является негладкий анализ. Следующее столетие будет веком негладкости, и его надо встретить во всеоружии.
ЛИТЕРАТУРА
1. Глейзер Г.И. История математики в школе. IX - X классы. М.: Просвещение, 1983.
2. Гнеденко Б.В. Введение в специальность математика. М.: Наука, 1991.
3. Фихтенгольц Г.М. Курс дифференциального и интегрального исчисления. М.: Наука, 1966.
4. Чебышев П.Л. О функциях, наименее уклоняющихся от нуля. Избранные труды. М.: Изд-во АН СССР, 1955. С. 579 - 608.
5. Рокафеллар Р. Выпуклый анализ. М.: Мир, 1973.
6. Пшеничный Б.Н. Выпуклый анализ и экстремальные задачи. М.: Наука, 1980.
7. Демьянов В.Ф., Малоземов В.Н. Введение в минимакс. М.: Наука, 1972.
8. Кларк Ф. Оптимизация и негладкий анализ. М.: Наука, 1988.
9. Иоффе А.Д., Тихомиров В.Н. Теория экстремальных задач. М.: Наука, 1974.
10. Демьянов В.Ф., Рубинов А.М. Основы негладкого анализа и квазидифференциальное исчисление. М.: Наука, 1990.
* * *
Владимир Федорович Демьянов, доктор физико-математических наук, профессор, заведующий кафедрой факультета прикладной математики - процессов управления Санкт-Петербургского государственного университета. Область научных интересов: оптимальное управление, математическое программирование, негладкий анализ, недифференцируемая оптимизация. В.Ф. Демьянов - член редколлегии четырех международных математических журналов, автор более 100 работ, в том числе 7 монографий, часть из которых переведена на английский, немецкий, польский и китайский языки.