Статьи Соросовского Образовательного журнала в текстовом формате
Рассказано об открытии вариационных принципов в оптике и механике, оказавших большое влияние на все последующее развитие физики.
ВАРИАЦИОННЫЕ ПРИНЦИПЫВ ФИЗИКЕ
Е. Д. ТРИФОНОВ
Российский государственный педагогический университет
им. А.И. Герцена, Санкт-Петербург
ВВЕДЕНИЕ
Многие законы физики могут быть выведены из утверждения, что для истинного развития исследуемого процесса определенная характеристическая величина достигает минимального (в более общем случае экстремального) значения по сравнению с ее значениями для некоторых других возможных течений этого процесса. Чтобы математически сформулировать это утверждение, необходимо ввести в рассмотрение уравнения, описывающие данный процесс, и с помощью изменения (вариации) их формы добиться достижения экстремального значения вычисляемой характеристической величины. Те уравнения, при которых это экстремальное значение достигается, и выражают истинные законы изучаемого явления. В таком случае данное утверждение принимают за исходное и называют вариационным началом или вариационным принципом.
Обычное изложение механики (например, как в школьном курсе) основывается на трех законах Ньютона. Как известно, И. Ньютон внес особенно значительный вклад в развитие механики. В своем труде "Математические начала натуральной философии" (1687) [1] он решил множество сложных задач о движении материальной точки в поле центральных сил и этим конструктивно подтвердил правильность закона всемирного тяготения. Что касается второго закона Ньютона, то, оценивая его значение, А. Эйнштейн называл его главным законом не только механики, но и всей физики. Ньютон (наряду с Г.В. Лейбницем) был создателем дифференциального и интегрального исчислений, однако при решении механических задач он почти не пользовался этим математическим методом. Он применял геометрический метод. В упомянутой выше книге много чертежей, а стиль решения задач напоминает доказательство геометрических теорем.
Другое направление в механике возникло после работ Л. Эйлера, в которых был использован метод дифференциального и интегрального исчислений в форме, предложенной Лейбницем. Особое развитие это направление получило в трудах Ж. Лагранжа. Лагранж гордился тем, что в его книге "Аналитическая механика" (1788) нет ни одного рисунка или чертежа. Именно с применением аналитических методов в механике связаны интенсивное развитие и применение вариационных принципов. Сам термин "вариационный принцип" был впервые предложен в работе Эйлера. Однако, поскольку дифференциальное и интегральное исчисления лежат на границе школьных знаний по математике, мы не будем злоупотреблять ими и постараемся пояснить физическую идею вариационных принципов с помощью элементарных средств, доступных школьникам. Это как раз и будет составлять методическую особенность нашего изложения. Наверное, этот простой взгляд на достаточно сложную проблему окажется полезным и для тех, кто будет изучать эти вопросы на более серьезном уровне. Мы также советуем заинтересованному читателю познакомиться со статьей [2], посвященной изложению оптико-механической аналогии.
В наши дни исполняется 300 лет с того момента, когда были опубликованы первые сообщения о вариационном принципе в механике. В коротком письме на полстраницы, опубликованном в июньском номере немецкого научного журнала "Ученые труды" ("Acta Eruditorum") за 1696 год (см. [3]), Иоганн Бернулли поставил следующую задачу: "В вертикальной плоскости даны две точки А и В. Определить путь, спускаясь по которому под влиянием собственной тяжести, тело, начав двигаться из точки А, дойдет до точки В за кратчайшее время". В конце письма говорилось, что эта кривая хорошо известна в геометрии и что если по истечении текущего года никто не опубликует решение, то это сделает сам автор. В этот срок откликнулся только Лейбниц. Сообщая, что уже решил поставленную задачу, он предложил продлить конкурс до Пасхи следующего года. И вот в майском номере того же журнала за 1697 год были опубликованы решения этой задачи, полученные Лейбницем, Якобом Бернулли (братом И. Бернулли), Г. Лопиталем и самим Иоганном Бернулли. В майском же номере английского журнала "Философские труды" ("Philosophical Transactions") было помещено решение Ньютона без подписи. Но И. Бернулли определил автора. История сохранила его слова: "Я узнал льва по его когтям".
Как будет показано ниже, идея вариационных принципов в механике была инициирована вариационным принципом в оптике - принципом Ферма.
ВАРИАЦИОННЫЙ ПРИНЦИП ГЕОМЕТРИЧЕСКОЙ ОПТИКИ - ПРИНЦИП ФЕРМА
Вариационный принцип геометрической оптики был предложен Пьером Ферма (1601-1665) несколько ранее описанных выше событий, а именно в 1662 году: Если две точки находятся в различных прозрачных (однородных) средах, то луч света, чтобы пройти от одной точки к другой, преломляется у плоской поверхности, по которой соприкасаются обе среды, таким образом, что употребляет возможно меньшее время, совершенно так же, как это происходит при отражении от плоской поверхности. Хотя сам Ферма исходил из довольно общего постулата - природа действует наиболее легкими и доступными путями, - его статья носила вполне конструктивный характер (см.[3]). Он доказал, что принцип наименьшего времени является следствием закона преломления.
Выше мы привели формулировку принципа Ферма, данную Христианом Гюйгенсом (1629-1695), современником Ферма, в его знаменитом "Трактате о свете" (1678) [4]. Мы воспроизведем здесь также почти дословно принадлежащее ему доказательство принципа Ферма, обладающее большей простотой по сравнению с доказательством самого Ферма.
Так же как и Ферма, Гюйгенс считал, что в плотной среде свет распространяется с меньшей скоростью, чем в вакууме. Пусть KF - плоскость, разделяющая две среды (рис. 1), и точка A находится в менее плотной среде (например, в воздухе), а точка C - в более плотной среде (например, в воде). Пусть луч проходит из точки A через точку B, лежащую на границе, в точку C в соответствии с законом преломления
где n1 , c1 , n2 , c2 - показатели преломления и скорости распространения света в верхней и нижней средах соответственно. По предположению, n1 < n2 , c1 > c2 .
Требуется доказать, что время прохождения света по такому лучу самое короткое по сравнению с временем прохождения по любому другому преломленному лучу. Применим доказательство от противного. Допустим, что свет прошел по другому лучу AFC, так что точка F отстоит от точки A дальше, чем точка B. Проведем прямую FO ', параллельную AB, и построим перпендикуляры AO и BH к этим прямым. Опустим также перпендикуляр FG на прямую BC. Из того, что -HBF равен -PBA, а -BFG равен -QBC (как углы с соответственно ортогональными сторонами), следует, что
Поэтому, согласно (1), время распространения света по отрезку HF равно времени распространения по отрезку BG:
Таким образом, время прохождения света по лучу OF было бы равно времени прохождения света по пути ABG. Далее очевидно, что так как гипотенуза FC больше катета GC, то время прохождения по пути OFC больше, чем по пути ABC. Наконец, поскольку гипотенуза AF больше катета OF, то время прохождения света по пути AFC больше времени прохождения света по пути OFC и тем более по пути ABC. К аналогичному заключению можно прийти и в случае, когда точка F лежит левее точки B. Таким образом, время прохождения света по ABC самое короткое из возможных, что и требовалось доказать.
Интересно, что доказательству Гюйгенса закона преломления на основании его гипотезы о волновой природе света (которое приводится в школьном курсе физики) предшествовало рассуждение патера Меньяна "О солдатском фронте" (1648) (см. [5]). Его использовал Исаак Барроу (1631-1667) в своих "Лекциях по математике и оптике" (1668), в подготовке к изданию которых участвовал Исаак Ньютон (1643-1727). (Ньютон был учеником и преемником Барроу по Лукасовской кафедре в Кембриджском университете.) Эти рассуждения очень просты и наглядны. Они сводятся к тому, что при переходе из одной среды в другую световой фронт меняет свое направление так же, как меняет направление шеренга солдат, когда луг, по которому идут солдаты, преграждается пашней и граница между пашней и лугом проходит под углом к шеренге. Скорость движения солдат по пашне меньше, чем по лугу. Для сохранения строя солдаты должны маршировать по параллельным линиям как при движении по лугу, так и по пашне. Рисунок, иллюстрирующий такое движение солдатского фронта, аналогичен тому, который использовал Гюйгенс для объяснения изменения волнового фронта при преломлении и который теперь воспроизводится во всех учебниках. Очевидно, что фронт солдат быстрее всего пересечет любое замеченное место на пашне, если направление шеренги будет подчиняться закону преломления (1). Таким образом, в этих рассуждениях фактически содержалось доказательство закона преломления на основании принципа Ферма.
Принцип Ферма справедлив для любой неоднородной оптической среды с непрерывно изменяющимся показателем преломления. Здесь только следует сделать существенную оговорку: в неоднородной оптической среде две точки могут быть соединены несколькими лучами (примером может служить ход лучей при возникновении нижнего миража) (см. [2]). Поэтому требуется уточнение формулировки принципа Ферма: время распространения света вдоль луча между двумя точками неоднородной оптической среды с непрерывно изменяющимся показателем преломления минимально по сравнению с временем распространения света вдоль любой бесконечно близкой траектории, соединяющей эти же точки. По поводу других уточнений формулировки принципа Ферма мы вынуждены отослать читателя к более детальному изложению этого вопроса [6].
ЗАДАЧА О БРАХИСТОХРОНЕ
Теперь расскажем более подробно о том самом вариационном принципе, который был предложен Иоганном Бернулли (1667-1748). Поставленная им задача получила название задачи о брахистохроне, то есть о линии наибыстрейшего спуска. Предполагается, что материальная точка находится в однородном поле тяжести и может скатываться вниз по некоторой траектории (как бусинка, нанизанная на проволоку определенной формы). Трением при этом пренебрегают, а начальная скорость материальной точки равна нулю. Ответ, полученный И. Бернулли: этой кривой является циклоида - кривая, которую описывает точка на ободе колеса при его качении.
Рассмотрим одно важное для дальнейшего свойство циклоиды. Пусть задана окружность диаметра d, которая катится по прямой y = d в положительном направлении оси ОX, как это показано на рис. 2.
Пусть точка М окружности в начальный момент времени имела координаты x = 0, y = d. К моменту времени t окружность повернулась на угол j, и точкой касания окружности оси OX является точка N. Точка N имеет нулевую мгновенную скорость, и, как говорят, через нее проходит мгновенная ось вращения. Поэтому точка М в данный момент движется по окружности радиуса MN, а касательная к циклоиде в точке M перпендикулярна к мгновенному радиусу вращения MN.
Учитывая это, можно без большого труда определить, что угол a, который касательная SMK образует с осью OY, равен j /2. Ординату y точки M можно представить в виде
Отсюда с помощью элементарных тригонометрических формул получаем уравнение, связывающее ординату точки циклоиды с углом a:
С помощью этого уравнения можно провести построение циклоиды. Заметим, что в точке A (x = 0, y = d ), из которой исходит циклоида, a = 0 и, следовательно, касательная параллельна оси OY. Сместившись на малую величину D вдоль оси ОY, получим с помощью (4) новое направление касательной и, перемещаясь вдоль этого направления опять на малую величину D, найдем новую точку циклоиды, в которой таким же способом сможем определить следующее положение касательной и т.д.
Итак, мы привели ответ, не показав, как он был получен. Не будем в точности повторять доказательство Бернулли, но используем его основную идею. Он исходил из принципа Ферма. Ведь минимум времени прохождения света, как мы видели в предыдущем разделе, целиком определяется выполнением закона преломления, связывающего синусы углов падения и отражения со скоростями света в соответствующих средах. Рассмотрим слоистую плоскую среду, где в каждом слое свет имеет свою скорость. Закон преломления в этом случае может быть выражен соотношением
где ai - угол падения на границу, разделяющую i-й и (i + 1)-й слои, ci - скорость света в i-м слое, a - некоторая константа, одинаковая для всех слоев.
Очевидно, что принцип минимума времени движения будет справедлив и для материальной точки, если для нее выполняется аналогичное соотношение между величиной скорости в данной точке траектории и синусом угла между направлением скорости и направлением, перпендикулярным к плоскости слоя, в котором абсолютное значение скорости одинаково. (Слова Бернулли: "Что мешает нам в этом случае поставить одно на место другого?")
Скорость тела при его движении в однородном поле тяжести, когда оно движется без трения по некоторой поверхности (например, по наклонной плоскости), зависит только от высоты падения: , где g - ускорение свободного падения, h - высота падения. Таким образом, слои, в которых скорости материальной точки одинаковы, расположены горизонтально, а направление, ортогональное к плоскости слоя, совпадает с направлением вертикали. Следовательно, задача о брахистохроне сводится к нахождению такой кривой, соединяющей две заданные точки, для которой синус угла между касательной к траектории и вертикалью удовлетворял бы соотношению (5)
где b - пока произвольная константа. Сравнивая (6) с (4), мы видим, что уравнение совпадает с уравнением циклоиды, причем константа b имеет смысл диаметра окружности, а h = d - y.
Теперь остается только подобрать радиус окружности для того, чтобы циклоида прошла через вторую заданную точку B. Все циклоиды подобны друг другу. Поэтому Бернулли предложил следующее построение. Построим какую-нибудь циклоиду, исходящую из первой точки A. Построим прямую, проходящую через обе заданные точки A и B. Эта прямая пересечет построенную циклоиду в некоторой точке О (рис. 3, а). Радиус окружности для искомой циклоиды относится к радиусу построенной циклоиды как отрезок AB к отрезку AO. Интересно, что в некоторых случаях для быстрейшего достижения конечной точки оказывается выгодным предварительно опуститься ниже ординаты этой точки (рис. 3, б ).
Циклоида как форма траектории обладает еще одним замечательным свойством, открытым Гюйгенсом. Время движения тела по циклоиде под действием собственной тяжести до нижней ее точки не зависит от начального положения тела и превышает время падения с высоты h = d в p /2 раз.
Заметим, что решение данной задачи И. Бернулли основано на кинематической оптико-механической аналогии, отличной от динамической аналогии, которая рассматривалась нами в статье [2]. Она носит чисто кинематический характер. Далее перейдем к выводу вариационных принципов механики, основанных на динамической оптико-механической аналогии.
ПРИНЦИП НАИМЕНЬШЕГО ДЕЙСТВИЯ МОПЕРТЮИ
Напомним, что динамическая оптико-механическая аналогия состоит в том, что траектория материальной точки при движении ее в потенциальном поле U(x, y, z) и траектория луча в оптически неоднородной среде с непрерывно изменяющимся показателем преломления n(x, y, z) в точности совпадают, если выполняется соотношение пропорциональности
где m - масса материальной точки, u(x, y, z) - абсолютная величина ее скорости, Е - энергия. При этом направление скорости в начальной точке совпадает с направлением луча.
Воспользуемся опять принципом Ферма. Запишем время распространения света вдоль луча. С этой целью разобьем луч, соединяющий две фиксированные точки, на N достаточно малых отрезков Dqi , i = 1, _, N. Показатель преломления среды на каждом из отрезков обозначим через ni . Тогда скорость света на отрезке Dqi будет c / ni , где c - скорость света в вакууме. Время распространения света вдоль этого отрезка равно Dqi ni / c. Тогда полное время распространения света вдоль луча можно представить в виде суммы
Согласно принципу Ферма, эта сумма, вычисленная для истинного хода луча, должна быть минимальной по сравнению с такими же суммами для любой достаточно близкой вымышленной или, как говорят, виртуальной формы луча, проходящего через те же две точки.
Поскольку ход луча совпадает с траекторией движения материальной точки при определенном соответствии, выражаемом формулой (7), между потенциальным полем и показателем преломления, то очевидно, что аналогичный вариационный принцип должен выполняться и в механике. Подставляя в (8) вместо показателя преломления ni абсолютное значение скорости материальной точки, умноженное на массу, получим, что величина
для истинной траектории, соединяющей две заданные точки, принимает минимальное значение по сравнению со значением этой величины, вычисленной для близкой виртуальной траектории, проходящей через те же две точки.
Величину W, стоящую в левой части (9), называют в механике действием, а сформулированный выше вариационный принцип, выражаемый этой формулой, - принципом наименьшего действия Мопертюи, поскольку в такой форме он впервые (1740) был предложен французским академиком Пьером Мопертюи (1698-1759). Интересно, что это было сделано при очень смутных представлениях об оптико-механической аналогии и явилось скорее счастливой догадкой, основанной на теолого-философских воззрениях автора. Аргументируя справедливость высказанного им принципа, Мопертюи почти точно повторяет слова Ферма: "Природа в своих действиях всегда пользуется наиболее простыми средствами". Возникли горячие дискуссии о справедливости этого принципа (в которых принял участие даже Вольтер), а затем не менее горячие споры о приоритете открытия. Из современников лишь Леонард Эйлер (1707-1783) поддержал Мопертюи, доказав справедливость его принципа на конкретных примерах.
ПРИНЦИП НАИМЕНЬШЕГО ДЕЙСТВИЯ ГАМИЛЬТОНА
Следующий важный шаг в развитии вариационных принципов был сделан Уильямом Гамильтоном (1805-1865) (с биографией и творческой жизнью Гамильтона можно познакомиться по книге [7]).
Гамильтон предложил новую форму вариационного принципа механики. Мы проиллюстрируем вариационный принцип Гамильтона на примере материальной точки, движущейся в потенциальном поле, не зависящем от времени. В этом случае выполняется закон сохранения энергии, то есть сумма кинетической и потенциальной энергии не изменяется со временем:
хотя координаты и составляющие скорости частицы являются функциями времени: x = x(t), y = y(t), z = z(t), ux = ux(t), uy = uy(t), uz = uz(t). Пусть частица движется так, что в начальный момент времени t = 0 она находится в точке с координатами x0 , y0 , z0 , а в момент времени t = T - в точке с координатами x1 , y1 , z1 .
Разобьем траекторию движения на интервалы Dqi , которые частица проходит за малые промежутки времени Dti (последние можно считать равными по величине). Тогда скорость на i-м интервале будет ui = Dqi / Dti .
Запишем теперь действие для этого движения, прибавив к нему константу -ET. Используя очевидное равенство , получим
Введенную таким образом величину S также называют действием, а чтобы не было путаницы, величину W - укороченным действием. Мы видим, что для истинного движения действие S имеет минимальное значение по сравнению с его значениями на виртуальных траекториях, точки которых в начальный и конечный моменты времени совпадают соответственно с начальным и конечным положениями материальной точки.
Хотя это утверждение следует из принципа наименьшего действия Мопертюи, оказалось, что оно имеет большую область применимости и выполняется также для случая, когда потенциальная энергия зависит от времени. Причем при выборе виртуальных координат материальной точки можно не заботиться о сохранении энергии. В тех случаях, когда потенциальная энергия не зависит явно от времени, для истинного движения полная энергия будет сохраняться автоматически. Обратим внимание также на то, что в вариационном принципе Гамильтона можно варьировать (то есть изменять для сравнения величины действия S ) не только форму траектории (как в принципе Мопертюи), но и характер движения по ней с течением времени. При этом должно только выполняться условие: полное время движения фиксировано.
Итак, принцип наименьшего действия Гамильтона можно сформулировать следующим образом. Действие S для истинного движения материальной точки, траектория которого в начальный и конечный моменты времени проходит через две определенные точки, принимает минимальное значение по сравнению с любыми виртуальными движениями, траектории которых в указанные моменты времени проходят через те же две точки.
Из-за недостатка места мы не приводим здесь конкретных примеров, подтверждающих справедливость принципов Мопертюи и Гамильтона. Ученику можно рекомендовать самостоятельно убедиться в этом на примере свободного падения тела в однородном поле тяжести. Это можно сделать аналитически, если ученик знаком с интегрированием элементарных функций, или с помощью компьютера, который становится все более доступным для школьного обучения.
ЗАКЛЮЧЕНИЕ
Кратко остановимся на роли, которую сыграли вариационные принципы в развитии физики.
После формулировки вариационных принципов в форме Мопертюи и Гамильтона были предложены и другие вариационные принципы механики. Их общее значение заключалось в том, что с их помощью удавалось единым методом получать уравнения движения сложных механических систем. (В основной части статьи мы не затрагивали этого важного этапа применения вариационных принципов, поскольку это требует достаточно сложного, и не только для школьников, математического аппарата.) В дальнейшем было показано, что вариационные принципы возможны и в других разделах физики, например в электродинамике и специальной теории относительности.
Вариационные принципы, возникшие из конкретных физических задач, обогатили и саму математику. Одной из общих вариационных задач, появившейся почти одновременно с задачей о брахистохроне, была задача о геодезической линии: требуется найти линию наименьшей длины, соединяющую две заданные точки на некоторой поверхности. Позже эта задача была обобщена на случай многомерных пространств с неевклидовой геометрией и вернулась в физику в общей теории относительности, где роль геодезических в четырехмерном пространстве-времени играют уравнения движения материальной точки. В частности, геодезической с нулевой "длиной" является уравнение движения частицы со скоростью света. Так появился очень важный аспект, связывающий физику и геометрию пространства, которая оказалась зависящей от реального распределения масс.
Вариационные принципы и физическая идея об оптико-механической аналогии имели определяющее значение для рождения волновой и квантовой механики. В этом можно легко убедиться, если заглянуть в оригинальные работы Луи де Бройля и Э. Шр╦дингера (см. переводы этих работ в книге [3]). Вариационные принципы применяются и в квантовой теории поля, являющейся базой для исследования элементарных частиц.
Вы видите, что рожденные усилиями гениев вариационные принципы механики и оптики оказали огромное влияние на последующее развитие всей физики, - влияние, простирающееся до наших дней и далеко не исчерпанное.
ЛИТЕРАТУРА
1. Ньютон И. Математические начала натуральной философии. М.: Наука, 1989. 688 с.
2. Трифонов Е.Д. Оптико-механическая аналогия в изложении для школьников // Соросовский Образовательный Журнал. 1997. ╧ 10. С. 133-137.
3. Вариационные принципы механики: Сб. ст. / Под ред. Л.С. Полака. М.: Гос. изд-во физ.-мат. лит., 1959. 932 с.
4. Гюйгенс Х. Трактат о свете. М.; Л., 1935.
5. Кудрявцев П.С. История физики. М.: Учпедгиз, 1948. Т. 1. 535 с.
6. Сивухин Д.В. Общий курс физики: Оптика. М.: Наука, 1980. 751 с.
7. Полак Л.С. Уильям Гамильтон. М.: Наука, 1993. 270 с.
* * *
Евгений Дмитриевич Трифонов, доктор физико-математических наук, профессор Российского государственного педагогического университета им. А.И. Герцена. Область научных интересов: теория твердого тела, квантовая нелинейная оптика. Автор более 100 работ и двух монографий.