Статьи Соросовского Образовательного журнала в текстовом формате
В статье рассмотрено недавно обнаруженное явление изменения корректности решаемой задачи при эквивалентных преобразованиях математической модели. Ранее считалось, что корректные и некорректные задачи четко отграничены друг от друга. В статье показано, что корректность задачи может изменяться, появляться и исчезать при эквивалентных преобразованиях, используемых в ходе ее решения.
ИЗМЕНЕНИЕ КОРРЕКТНОСТИ ПРИ ЭКВИВАЛЕНТНЫХ ПРЕОБРАЗОВАНИЯХ МАТЕМАТИЧЕСКИХ МОДЕЛЕЙЮ. П. ПЕТРОВ
Санкт-Петербургский государственный университет
Хорошо известно, что математические задачи делятся на корректные и некорректные (или, как иногда говорят, некорректно поставленные). У корректных задач их решения мало изменяются при малых изменениях параметров, коэффициентов, начальных условий и т.п., у некорректных задач даже при сколь угодно малых изменениях коэффициентов, параметров и т.п. решения могут изменяться существенно.
Поскольку параметры математических моделей реальных систем почти всегда известны лишь с ограниченной точностью и малые отклонения действительных значений параметров и коэффициентов от расчетных значений неизбежны, то на практике представляют интерес чаще всего только решения корректных задач. В последние десятилетия интерес вызвали и некорректные задачи [1], однако они требуют совершенно особых, более сложных методов решения. Поэтому перед решением всегда надо проверить, корректна решаемая задача или некорректна. Простейший метод проверки - повторение процесса решения для немного измененных коэффициентов. Если при этом результат решения изменится мало, то решаемая задача корректна. Существуют и другие методы проверки. Ошибка в оценке корректности опасна, поскольку если решать некорректную задачу обычными методами как корректную, то можно получить ошибочный результат.
До последних лет считалось, что корректные и некорректные задачи четко отделены друг от друга. Совсем недавно выяснилось, что это не так, что корректность может изменяться при эквивалентных преобразованиях, используемых в процессе решения.
Эквивалентные преобразования - это преобразования, не меняющие решений. Все решения исходной системы совпадают со всеми решениями системы преобразованной. Примеры эквивалентных преобразований: 1) прибавление к правой и левой частям уравнения одинаковых величин, 2) умножение всех членов уравнения на число, не равное нулю. Правила эквивалентных преобразований изучаются сейчас еще в средней школе, но до последнего времени не замечалось, что эти преобразования могут изменить корректность.
Рассмотрим очень простой пример - систему трех линейных однородных уравнений с параметром l:
lx1 - x3 = 0,
x1 - 2lx2 + x3 = 0,
x2 - x1 = 0
и поставим задачу - найти значения параметра l, при котором система (1) имеет ненулевые решения (такие значения параметра называют собственными значениями). В данном случае удобно начать с последнего уравнения и подставить x1 = x2 в первое и второе. Получим
lx2 - x3 = 0,
(1 - 2l)x2 + x3 = 0.
Сложив (2) и (3), мы исключим x3 и получим
(1 - l)x2 = 0,
откуда сразу видно, что ненулевые значения x2 (а тем самым и x1 = x2 и x3) возможны только при значении l = 1.
Нетрудно проверить, что рассматриваемая нами задача корректна: при малых отклонениях коэффициентов системы уравнений (1) от написанных значений мы придем к собственному значению l, которое будет мало отличаться от l = 1.
Однако поставленную задачу можно решать и по-другому. Можно исключить x1 из первого и второго уравнений системы, домножив второе уравнение на - l и сложив с первым. Получим
2l2x2 - (l + 1)x3 = 0
(разумеется, надо потом проверить, не внесли ли мы умножением на - l нового решения l = 0. В данном случае нового решения не появляется, преобразование эквивалентно).
Теперь можно исключить x1 из второго и третьего уравнений системы (1), просто сложив их. Получим
(1 - 2l)x2 + x3 = 0.
Система уравнений (5), (6) будет иметь те же решения, те же собственные значения l, что и система (1). В этом нетрудно убедиться, если домножить все члены уравнения (6) на (l + 1) и сложить его с (5). Получим снова уравнение (4) и единственное собственное значение l = 1. В отношении решаемой нами задачи система уравнений (5) и (6) эквивалентна системе (1) и имеет то же единственное решение (собственное значение) l = 1.
Однако для системы (5), (6) (полностью эквивалентной системе (1)!) задача вычисления собственных значений некорректна: если, например, коэффициент при x2 в уравнении (5) равен не двойке, а 2(1 + e), то после исключения x3 мы вместо уравнения (4) получим уравнение
(2el2 - l + 1)x2 = 0,
из которого найдем два собственных значения:
При малых e первое собственное значение l1 мало отличается от l1 = 1, зато второе остается большим даже при сколь угодно малых e и исчезает только в том случае, если имеет место точное равенство e = 0. Приближенно для малых e имеем
Таким образом, уже при сколь угодно малом e мы можем получить неверный ответ.
Подчеркнем, что возникающее в этом простейшем примере новое явление не имеет ничего общего с хорошо известным явлением появления ложных решений, лишних корней в том случае, если использованные преобразования уравнений не были эквивалентными и внесли новые решения. Уравнения (5), (6) в отношении рассматриваемой нами задачи полностью эквивалентны исходной системе (1) и имеют то же единственное собственное значение l = 1.
При целочисленных коэффициентах никаких затруднений и неприятностей не возникает. В то же время преобразование системы (1) в систему (5), (6) является одним из простейших примеров эквивалентного преобразования, изменившего корректность решаемой задачи.
Теперь посмотрим, к каким последствиям может привести изменение корректности, если мы рассматриваем задачу вычисления собственных значений для системы, похожей на систему (1) и имеющей одно собственное значение l, но не с целыми, а с дробными коэффициентами, заданными с полным использованием разрядной сетки используемой вычислительной машины. В этом случае при исключении x1 сперва из первого и второго уравнений для системы, похожей на систему (1), а потом при исключении x3 из второго и третьего уравнений мы уже за счет неизбежных погрешностей округления можем прийти к такой системе уравнений (5) и (6), которая будет иметь не одно, а два собственных значения, причем второе (ложное!) будет зависеть только от мало предсказуемой погрешности округления. Таким образом, изменение корректности при преобразованиях уравнений, используемых в ходе решения, может стать еще одним новым источником ошибок вычислений. Снова подчеркнем, что ошибки вследствие изменения корректности не имеют ничего общего с хорошо известным явлением постепенного нарастания ошибок, когда малая ошибка округления в ходе длинной цепочки итеративных вычислений постепенно возрастает и начинает существенно влиять на решение. В противоположность этому при изменении корректности ошибка может возникнуть всего за один шаг вычислений и может быть большой при сколь угодно малой ошибке округления.
РЕАЛЬНЫЕ ЗАДАЧИ
Разумеется, в рассматриваемом нами простейшем примере системы трех уравнений все достаточно ясно и ошибиться почти невозможно. Однако многие практические задачи приводят к необходимости вычисления собственных значений для систем, состоящих из большого числа линейных однородных уравнений, причем в некоторые из уравнений входит параметр l, а в некоторые не входит (простейшим примером является как раз система (1), в третье уравнение параметр l не входит).
В векторно-матричной форме такую систему можно записать в виде
где x - n-мерный вектор переменных x1 ; x2 ; _; xn , A - квадратная (n i n)-матрица коэффициентов, - квазиединичная матрица, в которой на главной диагонали стоят n - r единиц и r нулей, а остальные элементы - нули.
При больших n системы типа (9) можно решать на быстродействующих вычислительных машинах, например путем последовательного исключения переменных, последовательно исключая x1 , потом x2 и т.п. При таком последовательном исключении систематически возникает изменение корректности у преобразуемых уравнений и с ним надо считаться.
Любопытно, что при ручном счете, разумеется, удобнее сперва иметь дело с теми r уравнениями, в которые параметр l не входит. Пользуясь ими, можно выразить одни переменные через другие и, подставив эти соотношения в (9), иметь затем дело с системой вида
(A1 - lE )x = 0,
где теперь x - вектор размерности n - r, A1 - матрица размера (n - r) i (n - r), E - единичная матрица, в которой на главной диагонали стоят только единицы, нулей нет. Таким образом, при ручном счете удобно свести дело к системе (10), то есть к известной классической проблеме вычисления собственных значений для матрицы A1 . При исключении переменных в этой классической задаче потери корректности не происходит. Может быть, именно поэтому на возможность изменения корректности при эквивалентных преобразованиях не обращали внимания до начала широкого применения вычислительных машин. Для машины важнее всего унификация вычислений, и она будет исключать переменные xi из системы (9) последовательно. При этом возможно изменение корректности, а если этого не заметить, то можно получить ошибочные результаты.
НАИБОЛЕЕ СУЩЕСТВЕННАЯ ОПАСНОСТЬ
Мы убедились, что при эквивалентных преобразованиях математических моделей возможно изменение корректности. Она может исчезать, может и появляться. Наиболее опасен тот случай, когда первичная математическая модель, непосредственно следующая из законов и уравнений физики или теоретической механики и поэтому в наибольшей мере соответствующая физическому смыслу решаемой задачи, некорректна. Первичные, исходные уравнения, как правило, неудобны для исследования, и поэтому математическую модель преобразуют, как правило, к стандартной форме, для исследования которой можно применять ранее разработанные методы с хорошим программным обеспечением.
Именно так поступают при исследовании важной для практики задачи исследования устойчивости систем управления. Первичными, исходными математическими моделями систем управления являются системы нескольких линейных дифференциальных уравнений с постоянными коэффициентами различных порядков. Исследовать такие модели неудобно, и их простым введением новых переменных (а это эквивалентное преобразование) приводят к стандартному виду, к нормальной форме Коши, то есть к системе n дифференциальных уравнений первого порядка. Для нормальной формы Коши с помощью стандартных программ легко вычислить характеристический полином. Если все корни этого полинома имеют отрицательные вещественные части и это свойство сохраняется при вариациях (малых изменениях) параметров исходной математической модели, то делают вывод: исследуемая система устойчива и сохраняет устойчивость при вариациях параметров. Поскольку для реальных систем автоматического управления вариации параметров неизбежны, то исследование сохранения устойчивости при вариациях параметров особенно важно и его производят в сотнях проектно-конструкторских организаций - производят по описанной традиционной методике. Недавно обнаруженная возможность изменения корректности при эквивалентных преобразованиях позволила показать, что традиционные методы расчета могут давать ошибочные результаты.
Пример. Рассмотрим систему управления, состоящую из объекта управления и регулятора:
(D 3 + 4D 2 + 5D + 2)x1 = (D 2 + 2D + 1)u,
(D 2 + 4D + 5)x1 = (D + 1)u.
В уравнениях (11) переменная x1 - это регулируемая величина, u - управляющее воздействие, формируемое регулятором, а - оператор дифференцирования. Исключив переменную u из системы (11), получим уравнение
(D 3 + 5D 2 + 7D + 3)x1 = 0
с характеристическим полиномом
l3 + 5l2 + 7l + 3,
имеющим корни l1 = - 3, l2 = l3 = -1.
Решения уравнения (12) имеют вид
x1 = c1e- 3t + (c2t + c3)e- t,
где c1 , c2 , c3 - постоянные интегрирования, зависящие от начальных условий.
Для любых начальных условий решения устойчивы. В то же время при вариациях коэффициентов устойчивость не сохраняется: если мы изменим некоторые из коэффициентов уравнения (11), например, если в правой части второго из уравнений (11) коэффициент при D будет равен не единице, а некоторому числу a, то характеристический полином примет вид
(1 - a)l4 + (5 - 4a)l3 + (10 - 5a)l2 + 7l + 3,
и если число a больше единицы даже на сколь угодно малую величину e, то полином (15) будет иметь уже не три, а четыре корня. Три из них при малых e будут близки к ранее найденным корням l1 = - 3; l2 = l3 = -1, но четвертый корень будет большим и положительным, даже если число a на сколь угодно малую величину e больше единицы. Следовательно, уже при сколь угодно малых вариациях некоторых коэффициентов система управления (11) потеряет устойчивость. Это связано с тем, что для системы (11) задача вычисления корней характеристического полинома некорректна.
В то же время этого важного свойства системы мы не увидим, если приведем систему к нормальной форме Коши введением, например, новых переменных:
В новых переменных система (11) принимает вид
Ее характеристический полином по-прежнему сохраняет вид (13) и имеет те же корни l1 = -3; l2 = l3 = -1. Это еще раз подчеркивает, что система (17) эквивалентна системе (11). Если для системы (17) вычислить решение x1(t), то оно полностью совпадет с решением (14) системы (11) и будет устойчивым.
В то же время нетрудно проверить, что при вариациях любых коэффициентов системы (17) устойчивость решения сохраняется. При вариациях любых коэффициентов системы (17) корни ее характеристического полинома будут мало отличаться от l1 = - 3; l2 = l3 = -1. При эквивалентном преобразовании системы (11) в систему (17) некорректность задачи о вычислении корней характеристического полинома исчезла.
Если в регуляторе системы управления для формирования управляющего воздействия используется только переменная x1 и ее производные так, как это показывают уравнения (11), то реальная система управления, математической моделью которой являются уравнения (11), будет терять устойчивость при сколь угодно малых вариациях параметров и поэтому будет совершенно неработоспособна. Но традиционная методика расчета, использующая эквивалентное преобразование уравнений системы к нормальной форме Коши, этого не покажет и даст неверный ответ на вопрос о сохранении устойчивости.
Конечно, для простой системы (11) подобная ошибка еще неопасна. Однако современные системы управления могут описываться системами дифференциальных уравнений весьма высоких порядков -вплоть до сорокового и выше. При исследовании устойчивости таких систем невозможно обойтись без приведения к нормальной форме Коши, позволяющего использовать стандартное программное обеспечение. А мы уже убедились, что исследование преобразованной математической модели может дать неверную информацию об истинном поведении реальной системы при вариациях ее параметров. Исследуя преобразованную математическую модель, можно сделать неверный вывод о сохранении устойчивости, а подобный ошибочный вывод может стать причиной аварий и даже катастроф. Более подробно вопрос об авариях, почти неизбежно возникающих при некритическом использовании традиционных методов расчета, рассмотрен в работах [2-7].
Для предотвращения аварий необходимо уточнить само понятие эквивалентных преобразований и отличать преобразования, эквивалентные в классическом смысле, от преобразований, эквивалентных в расширенном смысле. При преобразованиях, эквивалентных в классическом смысле, у исходной и преобразованной систем совпадают все решения интересующей нас задачи. Свойства преобразований, эквивалентных в классическом смысле, изучаются еще в средней школе. Эти преобразования повсеместно используются при решении самых разнообразных вычислительных задач.
Преобразования, эквивалентные в расширенном смысле, - это преобразования, которые, во-первых, эквивалентны в классическом смысле, а во-вторых, не изменяют корректности решаемой задачи.
Свойства преобразований, эквивалентных в расширенном смысле, еще недостаточно исследованы, но для избежания ошибок желательно пользоваться только преобразованиями, эквивалентными в расширенном смысле.
Заметим, что чаще всего преобразования, эквивалентные в классическом смысле, эквивалентны и в расширенном. Преобразования, эквивалентные в классическом смысле, но не в расширенном, встречаются редко (это понятно, иначе ошибок во всех расчетах было бы слишком много). Однако преобразования, эквивалентные в классическом смысле, но не в расширенном, преобразования, изменяющие корректность, редко, но встречаются. Примеры мы приводили. А каждая неожиданная встреча с таким преобразованием может стать причиной грубой ошибки в расчете.
Поэтому обнаружение эквивалентных преобразований, изменяющих корректность решаемых задач, имеет серьезное практическое значение и очень желательно было бы предпринять более глубокое исследование всех свойств и особенностей таких преобразований, научиться заранее отличать преобразования, изменяющие корректность, от преобразований, корректности не меняющих. В опубликованных работах [2-7] (наиболее подробно в [7]) сделан лишь первый шаг в этом исследовании.
Но даже независимо от важных практических приложений интересно уже то, что в том разделе математики (теория эквивалентных преобразований), который изучается в средней школе и считался окончательно завершенным и неизменным с XVIII века, со времен Л. Эйлера, обнаружились новые, неожиданные стороны и открылось большое поле для научных исследований.
ЛИТЕРАТУРА
1. Тихонов А.Н., Арсенин В.Я. Методы решения некорректных задач. М.: Наука, 1979. 275 с.
2. Петров Ю.П. О скрытых опасностях, содержащихся в традиционных методах проверки устойчивости // Изв. вузов. Электромеханика. 1991. ╧ 1. С. 106-108.
3. Петров Ю.П. Предотвращение аварийности в системах управления // Там же. 1994. ╧ 1/2. С. 37-40.
4. Петров Ю.П. Устойчивость линейных систем при вариациях параметров // Автоматика и телемеханика. 1994. ╧ 11. С. 186-189.
5. Гайдук А.Р. К исследованию устойчивости линейных систем // Там же. 1997. ╧ 3. С. 153-160.
6. Петров Ю.П. Третий класс задач физики и техники - промежуточных между корректными и некорректными. СПб.: СПбГУ, 1998. 30 с.
7. Петров Ю.П., Петров Л.Ю. Неожиданное в математике и его связь с авариями и катастрофами последних лет. СПб.: СПбГУ, 2000. 115 с.
Рецензент статьи Ю.Г. Мартыненко
* * *
Юрий Петрович Петров, доктор технических наук, профессор факультета прикладной математики - процессов управления Санкт-Петербургского государственного университета. Область научных интересов - прикладная математика, теория оптимального управления, приложения этой теории к оптимизации конкретных технических объектов, обеспечение устойчивости при вариации параметров. Автор 118 статей и 11 научных монографий.