Статьи Соросовского Образовательного журнала в текстовом формате
Излагается подход к числам как к операторам над соответствующими векторами. С этих позиций как действительные, так и комплексные числа получают единообразную трактовку, при этом с мнимой единицы снимается мистический ореол. Изложение использует экспоненциальные функции, которые вводятся как решения простейших линейных дифференциальных уравнений.
ЧИСЛА КАК ОПЕРАТОРЫВ. А. БРУСИН
Нижегородский государственный
архитектурно-строительный университет
ВВЕДЕНИЕ
Натуральные числа явились одним из первых простейших продуктов абстрактного мышления человека. Эти числа имели для человека ясную физическую природу (физический смысл). Более сложным продуктом этой деятельности явились дробные числа. Однако и они имели для человека ясную физическую интерпретацию. Например, число обозначает, что нужно что-то разделить на 72 равные части и взять 33 таких частей.
Маленькой революцией в истории создания чисел явилось введение нуля. Введение числа 0 позволило завершить создание самой простой математической теории - арифметики (то есть математики четырех действий над целыми и дробными числами).
Отдельные иррациональные числа появились сначала в геометрии, а общее понятие иррационального числа связано с алгеброй. Поэтому некоторые из таких чисел имеют ясный геометрический смысл как длины характерных отрезков в простейших геометрических фигурах (которые можно построить с помощью циркуля и линейки). Другие иррациональные числа имели чисто алгебраический смысл как решения соответствующих алгебраических уравнений.
Отрицательные числа возникли из чисто научных потребностей создания законченной математической теории - алгебры. Но и эти числа впоследствии получили физическую интерпретацию с открытием заряженных частиц в физике.
Все эти числа, которые получили название действительных, объединяет один факт [1]: каждому такому числу можно сопоставить точку на прямой с выбранным на ней началом отсчета и масштабом. Такая прямая, как известно, получила название числовой прямой. В этом смысле каждое действительное число получает геометрический смысл, например как длина со знаком соответствующего отрезка, и как бы становится ощутимым.
Совершенно иная ситуация имела место при введении мнимой единицы i и комплексных чисел. Мнимая единица, как известно, была определена как решение квадратного уравнения i 2 + 1 = 0, которое обычного решения - в рамках обычных, действительных чисел - иметь не могло. После такого определения за числом i на долгое время закрепился некий мистический ореол.
Тема мнимых и комплексных чисел была излюбленной темой философов, особенно диалектико-материалистического направления. С одной стороны, определение числа i было явно идеалистическим. С другой - в XX веке просто отбросить это число и всю теорию комплексных чисел (как это случилось с генетикой) было нельзя, ибо аппарат комплексных чисел уже прочно вошел в практику многих научных центров и очень серьезных конструкторских бюро. Невозможно сейчас объяснить, каким образом философия того периода разрешала это диалектическое противоречие, но в 40-50-х годах тема "Комплексные числа" входила в программу школьного курса алгебры.
Ниже мы дадим другое определение числа i, которое может быть принято самым ортодоксальным философом-материалистом как материалистическое. Мы покажем, что если числа понимать как операторы, то все они, включая и комплексные числа, получают одинаковую трактовку.
ДЕЙСТВИТЕЛЬНЫЕ ЧИСЛА КАК ОПЕРАТОРЫ НА ЧИСЛОВОЙ ПРЯМОЙ
Начнем с действительных чисел и их образов на числовой прямой.
Один из вариантов определения произвольно взятого числа a как оператора таков: число a будем трактовать как преобразование любой точки x числовой прямой в точку x + a, то есть как соответствие
x x + a.
Геометрически это преобразование представляется как перемещение точки на расстояние | a | по направлению числовой прямой (обычно вправо), если a > 0, или в противоположном направлении, если a < 0. Если a = 0, то соответствующий оператор оставляет любую точку числовой прямой на месте. Можно сказать, что {0} - это оператор покоя в этом варианте.
Однако для наших целей более полезным будет другой вариант оператора. Именно, число a будем понимать как оператор преобразования любого числа x в число ax, то есть как соответствие
x ax.
В этом варианте получается другая интерпретация преобразования точек на числовой прямой. Будем теперь каждое число x изображать не точкой, а вектором (направленным отрезком), начало которого зафиксировано в начале отсчета (точке 0), а конец - в точке, изображающей число x (рис. 1). (Такие векторы - с фиксированным началом - называют связными.) При такой интерпретации положительные числа a будут иметь смысл операторов растяжения, если a > 1, и сжатия, если 0 < a < 1. Отрицательное число (-1) будет иметь смысл инверсии - оператора обращения векторов. Другие отрицательные числа получают смысл комбинаций преобразования инверсии с растяжением или сжатием. Число "нуль" в этой схеме будет интерпретироваться как преобразование всех векторов в начало отсчета (или нулевой вектор). Оператор покоя теперь будет представляться числом 1.
Таким образом, все действительные числа получают одну и ту же трактовку как определенные преобразования связных векторов на прямой.
Но тогда возникает вопрос, почему нужно ограничиваться прямой? Нельзя ли перенести все эти рассуждения на плоскость, пространство и далее? Оказывается, что перенесение на плоскость возможно: если только перейти от обычных чисел к комплексным. Это и станет предметом последующего изложения.
ЭКСПОНЕНТА ЭЙЛЕРА И ЕЕ РОЛЬ
В ИНТЕРПРЕТАЦИИ ЧИСЕЛ КАК ОПЕРАТОРОВ
Вначале мы введем второе замечательное трансцендентное число, обозначенное Эйлером буквой e. (О первом замечательном трансцендентном числе p мы узнаем еще в школьном курсе геометрии.) Формально число e вводится в математическом анализе с помощью понятия предела - как предел последовательности [1]:
Доказывается, что этот предел является трансцендентным числом. Первые цифры его десятичного представления таковы: (Выделенная группа цифр дает год рождения Л.Н. Толстого.) Ниже мы по-иному определим это число. Рассмотрим простейшее дифференциальное уравнение [2] относительно неизвестной функции x(t) (независимая переменная t часто, особенно в механике и физике, трактуется как момент времени или временной промежуток):
Обозначим: h(t) - решение уравнения (2), удовлетворяющее начальному условию [2]
x(0) = 1.
Такое решение определяется единственным образом [2]. Несложно проверить, что функция h(t) должна удовлетворять следующим свойствам:
h(t) > 0 для всех t,
и для любых t1 и t2
h(t1 + t2) = h(t1)h(t2).
(Число h(t1 + t2) - это значение решения уравнения (2) в момент t1 + t2 при выполнении в момент t = 0 условия (3). Число h(t1)h(t2) можно получить как значение решения с начальным условием h(t1) в момент t1 через промежуток времени t2 после этого момента. Ясно, что эти два значения равны, ибо соответствуют одному и тому же решению уравнения (1).) Свойства (3), (4) говорят о том, что функция h(t) - показательная функция [1]. Обозначим ее основание через e, то есть положим
h(t) := et.
В курсе дифференциального исчисления [1] при выводе таблиц производных показывается, что число e, равное пределу (1), удовлетворяет равенству и, следовательно, равно числу e из (5). Теперь можно показать, что функция eat, где a - произвольное действительное число, является решением уравнения
при начальном условии (3). Действительно, введем новую независимую переменную t = at и определим функцию y(t) в соответствии с равенством y(t) = = x(t). Из свойств операции дифференцирования [1] следует Отсюда вытекает, что функция y(t) удовлетворяет уравнению если функция x(t) удовлетворяет уравнению (6). Следовательно, получаем y(t) = et. Переходя к старой переменной t и от функции y(t) к x(t), получаем искомый результат: x(t) = eat.
Теперь вернемся к комплексным числам. Комплексным числом называют выражение вида z = x + + iy, где x и y - действительные числа, i - мнимая единица [1]. Для нас сейчас i - это просто знак, разделяющий числа x и y, но превращающийся в -1 при умножении самого на себя. Введем плоскость с прямоугольной сеткой координат и осями OX и OY (рис. 2) и будем изображать на ней комплексное число z как связный вектор с началом в точке O и координатами, равными x и y. (Такие векторы называют еще радиус-векторами.) Таким образом, каждое комплексное число представляется как радиус-вектор. Число нуль (0 + i0) представляется как нулевой вектор, положительные числа - как радиус-векторы, направленные вдоль направления оси абсцисс, отрицательные числа - как радиус-векторы, направленные в противоположную сторону.
Заметим, что действие вещественных чисел на эти векторы будет точно таким же, как на числовой прямой: они будут представлять собой операторы растяжения, сжатия, инверсии или их комбинации.
Рассмотрим дифференциальное уравнение вида (6), но относительно комплексной функции действительного аргумента z(t) = x(t) + iy(t) и при a = i:
Одно это уравнение, очевидно, эквивалентно системе из двух дифференциальных уравнений относительно действительных функций x(t) и y(t):
Поставим для уравнения (7) начальное условие при t = 0:
z(0) = 1.
Для системы (8) равенство (9) будет соответствовать начальным условиям вида
x(0) = 1, y(0) = 0.
В соответствии с изложенным выше и если забыть о комплексном смысле величин в (7) решение уравнения (7) при начальном условии (9) мы должны записать как
z(t) = eit.
К тому же, решая систему (8) при начальных условиях (10), мы получим
Приравнивая (11) и (12), приходим к равенству
ei t = cos t + i sin t.
Получается известная формула Эйлера: равенством (13) Эйлер определил комплексную экспоненту ei t. (Заметим, что из равенства вытекают известные тригонометрические формулы "синус суммы" и "косинус суммы".) Будем изменять параметр t, непрерывно увеличивая его от начального значения t = 0. При t = 0 будем иметь ei " 0 = = 1 и на комплексной плоскости получаем вектор, соответствующий числу 1 (рис. 3). При произвольном t мы получим вектор с координатами (cos t, sin t). А это значит, что радиус-вектор, соответствующий числу ei t, направлен под углом t (в радианах) к оси абсцисс, а конец его лежит на окружности единичного радиуса (рис. 3). В частности, будем иметь ei " p /2 = i, ei p = -1, ei " 3p /2 = - i, ei " 2p = 1, а также eit = ei(t + 2pk) для всех целых чисел k. Если интерпретировать аргумент t как время, то можно сказать, что функция eit изображает равномерное вращение вектора единичной длины против часовой стрелки с единичной угловой скоростью.
Рассмотрим произвольный радиус-вектор единичной длины на комплексной плоскости, расположенный под углом t. Этот вектор изображает некоторое комплексное число z. В соответствии с изложенным выше число z можно представить как значение комплексной экспоненты Эйлера: z = ei t. Умножим это число на i. Спрашивается, какой вектор будет изображать полученное число z1 = iz? Решаем этот вопрос следующим образом. Число i равно ei " p /2, значит, z1 = iz = ei " p /2, ei t = ei(t + p /2). Следовательно, число z1 является значением комплексной экспоненты при аргументе t + p /2, а изображающий это число радиус-вектор получается из исходного поворотом на p /2 против часовой стрелки.
Такой же вывод можно сделать, если z - произвольное число, не равное нулю. Действительно, это число можно представить в виде | z | ei t при некотором значении t, где | z | - это модуль числа z, или длина изображающего его радиус-вектора. Угол t называют аргументом комплексного числа. Поэтому будем иметь z1 = iz = | z | ei(t + p /2), и все сделанные выводы сохраняются.
Рассмотрим теперь произвольное комплексное число c. Пусть его модуль равен | c |, а аргумент j. Тогда можно записать c = | c | eij. При умножении числа z на это число получим cz = | c | eij " | z | ei t = | c | i i | z | " ei(j + t). Таким образом, действие числа c как оператора на произвольное число z будет интерпретироваться как поворот на угол j его радиус-вектора с соответствующим изменением его длины.
ИНТЕРПРЕТАЦИЯ КОМПЛЕКСНЫХ ЧИСЕЛ
КАК ОПЕРАТОРОВ
Вернемся к интерпретации чисел как операторов умножения и перенесем ее на комплексные числа.
Каждое комплексное число c будем понимать как оператор, преобразующий радиус-вектор произвольного числа z в радиус-вектор числа cz: z cz. Такое преобразование, исходя из изложенного выше, будет изображаться на комплексной плоскости как некоторая комбинация преобразований растяжения, сжатия, инверсии и поворота. При этом мнимая единица i будет соответствовать оператору поворота радиус-векторов на угол p /2 против часовой стрелки. Это характеристическое свойство можно взять за определение числа i. Это будет определение, из которого исключен всякий мистический смысл. Именно это характеристическое свойство и определяет прикладное значение числа i и комплексных чисел вообще в физике и инженерных науках.
Возникает естественный вопрос: существуют ли числа, каждое из которых можно интерпретировать как операторы преобразования радиус-векторов в трехмерном пространстве и пространствах больше трех измерений? (Такие пространства обозначаются Rn: R1 - это прямая, R 2 - плоскость и т.д.) Сначала следует ответить на вопрос: что называть числами? Математика трактует число в его обобщенном смысле как элемент бесконечного множества, в котором по каким-то правилам введены условные операции сложения, умножения и деления. При этом сложение обладает всеми свойствами обычного сложения, а с умножением связано распределительным законом: (a + b)c = ab + ac, a(b + c) = ab + + ac. Введено число 1: a " 1 = 1 " a = a, деление понимается как операция, обратная умножению. Кроме этого определен элемент 0 (нуль), такой, что 0 + a = = a, 0 " a = 0, а операция деления возможна на любое число, отличное от нуля. Более подробно об этом можно прочитать в [3, 4].
Теперь можно дать ответ на поставленный вопрос - он известен давно. Кроме действительных (n = 1) и комплексных чисел (n = 2) есть еще кватернионы (n = 4) и числа Кэли (n = 8) [3, 4]. При переходе от низших размерностей к высшим числа теряют одно из свойств: при переходе от действительных чисел к комплексным теряется свойство упорядоченности (когда для любых двух различных чисел можно сказать, какое из них больше); при переходе от комплексных чисел к кватернионам теряется свойство коммутативности умножения (ab = ba) и, наконец, при переходе к числам Кэли теряется свойство ассоциативности умножения (a(bc) = (ab)c).
Общность этих математических объектов как чисел проявляется в различных задачах. Упомянем так называемую задачу о еже. Представим себе сферу в пространстве Rn. Такая сфера обозначается обычно S n - 1 (так, S1 - это окружность, S2 - обычная сфера). Представим себе, что в каждой ее точке прикреплен вектор единичной длины, причем так, что при переходе от одной точки сферы к близкой эти векторы оказываются близкими - длина разности этих векторов мала и тем меньше, чем ближе точки сферы. (Такое векторное поле называется непрерывным.) Получится как бы еж в Rn. Задача заключается в том, можно ли непрерывной деформацией этих векторов (игл) преобразовать их в касательные векторы [5]? (То есть можно ли причесать ежа в Rn ?) Оказывается, ответ "да" на поставленный вопрос есть только в случаях n = 2, 4 и 8 [5].
ЛИТЕРАТУРА
1. Бугров Я.С., Никольский С.М. Дифференциальное и интегральное исчисление. М.: Наука, 1980. 432 с.
2. Понтрягин Л.С. Обыкновенные дифференциальные уравнения. М.: Наука, 1974. 331 с.
3. Курош А.Г. Лекции по общей алгебре. М.: Наука, 1973. 399 с.
4. Математическая энциклопедия / Под ред. И.М. Виноградова. М.: Сов. энциклопедия, 1985. Т. 5. Стб. 1248.
5. Арнольд В.И. Обыкновенные дифференциальные уравнения. М.: Наука, 1971. 239 с.
6. Сильвестров В.В. Системы чисел // Соросовский Образовательный Журнал. 1998. ╧ 8. С. 121-127.
* * *
Владимир Александрович Брусин, доктор физико-математических наук, профессор, зав. кафедрой высшей математики Нижегородского государственного архитектурно-строительного университета, член-корреспондент РАЕН. Область научных интересов - математические проблемы теории устойчивости и теории управления. Автор более 160 научных статей и учебного пособия.