Статьи Соросовского Образовательного журнала в текстовом формате
Дано краткое описание традиционной методологии органической химии, базирующейся на структурной теории, и новейшая тенденция ее развития, обусловленная структурным моделированием и QSAR (аббревиатура "количественные соотношения структура-свойство").
О ТЕНДЕНЦИЯХ РАЗВИТИЯ СОВРЕМЕННОЙ ОРГАНИЧЕСКОЙ ХИМИИН. С. ЗЕФИРОВ
Московский государственный университет
им. М.В. Ломоносова
Органическая химия, как показывает само название, возникла в результате изучения органической живой материи, состава органических молекул. После того как в 70 - 80-х годах прошлого века появилась структурная теория, которая до сих пор является основой органической химии, ученые стали направленно определять структуру веществ, встречающихся в природе. Сначала это были довольно простые соединения, например, этиловый спирт, потом более сложные, как, например, аспирин, потом уже очень сложные структуры, например таксол - одно из самых перспективных современных противораковых средств.
Структурная теория органической химии - удивительная теория. Несмотря на успехи квантовой механики, несмотря на успехи в смежных физических дисциплинах, она до сих пор, как уже было сказано выше, базовая теория органической химии. Здесь уместно привести следующую убедительную цитату: "В науке нет общей теории (даже если мы будем рассматривать те из них, которые имеют строгую математическую формулировку), которая имела бы больший успех в обобщении самых разнородных фактов в простой форме, чем это приходится на долю концепций, которые мы называем структурной теорией" (Г. Льюис).
Структурная теория была дополнена стереохимией. Дело в том, что химия имеет дело с трехмерными объектами, а трехмерные объекты могут обладать хиральностью, когда предмет и его зеркальное отображение суть разные объекты. Приведем наглядный пример хиральных объектов: разрезание двух одинаковых яблок приводит к тому, что два полученных фрагмента яблока, совершенно одинаковых на первый взгляд, невозможно совместить в пространстве, то есть эти два куска хиральны и имеют разную стереоконфигурацию:
Многие молекулы обладают также свойством хиральности. Например, почти все аминокислоты, которые находятся в любом живом организме, хиральны и обладают L-конфигурацией.
Таким образом, базовой концепцией органической химии является структурная теория, дополненная стереохимией. На основе этой фундаментальной теории химики начали устанавливать структуры природных веществ, и, что более важно, осуществлять синтез органических соединений (а в случае хиральных молекул - асимметрический синтез).
С точки зрения структурной теории перед химиками встают две фундаментальные проблемы. Первая - это осуществление структурных трансформаций, то есть проблема перехода от одной структуры к другой. Иными словами, важнейшей проблемой органической химии стало научиться так манипулировать структурами, чтобы быть в состоянии получить любые, в том числе и неизвестные, структуры. Таким образом химики, используя язык структурной теории, в известной мере отгородились от других наук (очень часто химикам трудно говорить с представителями других наук и наоборот). Например, в химии трудно или невозможно придумать механические аналогии, поскольку все объяснения ведутся на языке структурных формул. Вторая проблема - соотнесение структуры и свойства вещества. Человечество интересуют свойства веществ, но химик-органик должен перевести свойство на язык структур. Если вы хотите сотрудничать с химиком, то обязаны перевести физическую, биологическую или другую задачу на язык структур.
Наконец, химия породила свой собственный объект исследования: химики синтезировали громадное количество веществ, которых нет в природе. Эта творческая способность химии подобна искусству. Например, многие могут написать характеристику Анны Карениной, хотя, строго говоря, Анна Каренина на самом деле не существовала. В химии примерно то же: в природе нет многих из синтезированных химиками веществ, но, зная законы химии, мы можем их синтезировать и как бы создать параллельную природу.
Приведем несколько примеров, взятых из работ Института физиологически активных веществ РАН и химического факультета МГУ. Атом углерода имеет связи с определенными направлениями в пространстве (тетраэдрическая модель атома углерода с углами между связями около 109?).
Что будет, если мы исказим эти углы? Очевидно, что нужно затратить на это некоторую энергию. Можно зафиксировать это искажение угла: например, можно получить треугольник из атомов углерода (угол 60?) с образованием структуры циклопропана:
Тогда дополнительная энергия, затраченная на искажение угла, зафиксируется в структуре полученного соединения. Мы получим соединение с повышенной внутренней энергией, или напряженное соединение. Далее все определяется фантазией авторов: можно синтезировать структуры с набором треугольников, сочлененных в самых разнообразных сочетаниях. Некоторые соединения такого типа, относящиеся к ряду каркасных структур, были нами синтезированы.
В чем практический интерес этой химии? При сгорании таких веществ избыточная энергия должна выделиться. Таким образом, напряженные соединения в принципе должны быть высокоэффективными топливами. Полученные соединения обладали еще одним интересным свойством - повышенной плотностью. Представьте себе, что это, по существу, бензин, но тяжелее воды. Таким образом, получены вещества, обладающие уникальными свойствами, хотя здесь я обращаю внимание на чисто структурный аспект.
Далее были синтезированы триангуланы, где все треугольники соединены углами.
Помимо чисто утилитарного значения, такие объекты отвечают и эстетическим запросам исследователя. Можно синтезировать, например, красивые гроздья циклопропанов, соединенных по пропеллерному типу. Особый, и уникально-структурный и прикладной интерес, представляют до сих пор неизвестные циклические триангуланы и, в частности, восьмиугольник или шестиугольник с шестью циклопропанами по периметру структуры. Подходы к этим соединениям мы сейчас ищем.
Таким образом, начав с установления структуры достаточно простых веществ, химики создали свой, во многом уникальный мир структур. В настоящее время из всех известных науке веществ (порядка 15 млн.) примерно 95% - соединения углерода, то есть органические вещества. Работы в области органической химии и биоорганической химии множатся быстрее, чем во всех остальных областях химии (их объем тоже растет, но существенно медленнее).
Итак, объем работ в области органической химии нарастает, и интеллектуально структурная органическая химия еще долго не исчерпает себя. Однако куда идти дальше? Синтезировать еще 15 млн. веществ? Поскольку из всего этого многообразия практическое применение находят всего 10 - 30 тысяч веществ, возникает весьма принципиальный вопрос: "куда идти дальше?"
В настоящее время в органической химии происходит ускоренное перераспределение усилий в пользу второй фундаментальной задачи. Мы в настоящее время на достаточно высоком уровне понимаем, как манипулировать структурами, и можем по заказу синтезировать достаточно сложные вещества. Поэтому все больше во главу угла выдвигается проблема соотношения структуры и свойства. Безусловно, эта проблема всегда существовала, и я специально акцентирую внимание на различии между этими двумя задачами. Поскольку в настоящее время вопросы понимания механизмов действия органических веществ, связи структуры и свойства достигли большой степени совершенства, это привело к возникновению новых поддисциплин в органической химии.
Рассмотрим, например, структурное моделирование. Давайте заменим в структуре водород на фтор. Что произойдет со свойствами таких веществ?
Сравнение фтора и водорода
Длина C-F связи 1,39 Б; Ван-дер-Ваальсов радиус 1,35 Б; энергия связи 116 ккал/мол; электроотрицательность 4,0.
Длина C-H связи 1,09 Б; Ван-дер-Вааальсов радиус 1,20 Б; энергия связи 99 ккал/мол; электроотрицательность 2,1.
Органическая химия может ответить на этот вопрос, поскольку различие в свойствах будет обусловлено главным образом большой разницей в электроотрицательности этих элементов. В настоящее время созданы уже такие модифицированные антибиотики, противораковые препараты и т.д., где атом водорода замещен на атом фтора.
"Модифицирование" означает следующее. Когда антибиотик содержит в своей структуре вместо водорода фтор, то ферменты биосистемы "не знают", что с ним делать, и антибиотик работает по-другому. Мы можем в известной мере предсказать, как он будет работать. Поэтому органическая химия развивается в направлении модификации активных веществ и создания специфических реагентов для такой модификации, как, например, новые фторирующие реагенты. Ниже приведены формулы некоторых из таких реагентов: трифторпроизводных теллура и селена, дифторида ксенона и дифториодбензола
RTeF3 , RSeF3 , XeF2 , PhIF2 .
Итак, одновременно с обычными структурными поисками сформировалась ясная общая тенденция направленной структурной модификации, показанная на примере простой структурной логики замены водорода на фтор для нужд медицинской химии.
Другое направление возникло на стыке органической химии, хемометрики, математического моделирования и компьютерной химии - QSAR (Quantitative Structure-Activity Relationship; дословный перевод - количественное соотношение структура-свойство). В русском языке для него нет краткой аббревиатуры, и поэтому далее мы будем использовать английское сокращение. В настоящее время издается несколько специальных журналов, посвященных QSAR, но, к сожалению, в нашей стране этому направлению уделялось не слишком много внимания. Вначале QSAR был попыткой найти корреляцию между структурой и свойством на основе каких-то локальных характеристик веществ. В настоящее время QSAR - это некое компьютерное правило, описывающее любое свойство (свойства молекулярные, свойства биологические) через дескрипторы.
Что такое дискриптор химической структуры? Это число или набор чисел, которые характеризуют структуру органического соединения, причем характеризуют так, что они "схватывают" существенные черты этой структуры. Вообще говоря, любое число, которое можно рассчитать исходя из структурной формулы (молекулярный вес, число определенных атомов, связей или групп, молекулярный объем, частичные заряды на атомах и т.д.), может выступать в качестве дескриптора.
Работает QSAR следующим образом. Прежде всего из набора соединений с известной активностью выбирают два поднабора: один тренировочный набор и другой тестовый. Все соединения обладают определенным свойством, полученным из соответствующего эксперимента и выраженным цифрой. Таким образом цифры, характеризующие свойства, соотнесены с конкретной структурой.
Далее нужно выбрать набор дескрипторов. Обычно хорошие компьютерные программы перебирают сотни дескрипторов в поиске наилучших. На следующем этапе методами статистики устанавливается корреляция величин "свойства" для соединений тренировочного набора с дескрипторами и получается так называемое QSAR-уравнение. В принципе это обычное уравнение, отражающее функциональную зависимость одного набора цифр (свойств) от другого набора цифр - переменных или дескрипторов.
Наконец, правильность этого уравнения проверяется на тестовом наборе структур. Для этого сначала вычисляются дескрипторы для каждой из тест-структур. Далее, подставляя их в QSAR-уравнение, рассчитывают свойства и сравнивают их с экспериментальными значениями. Если для тестового набора наблюдается хорошее совпадение рассчитанных и экспериментальных значений, то данное QSAR-уравнение можно применить для предсказания свойств новых, еще не синтезированных структур.
Среди дескрипторов большую роль играют так называемые топологические индексы - некоторые числовые характеристики структуры, получаемые чисто расчетным путем для любых структур. Проиллюстрируем идею этого подхода на примере так называемого индекса Рандича, обозначаемого c. (М. Рандич - известный хорватский математик и химик, работающий в США.)
Выберем в качестве примера молекулу изопентана, CH3CH2CH(CH3)2 и рассчитаем для нее индекс Рандича. Прежде всего нужно написать структурную формулу, убрать атомы водорода и каждый атом углерода представить в виде точки ("вершины графа") с выходящими из нее связями ("ребра графа"). Получим следующую конструкцию (называемую иногда молекулярным графом):
Теперь (а) пронумеруем ребра этого графа (в произвольном порядке) цифрами от 1 до 4 и (б) для каждой вершины подсчитаем число выходящих из нее ребер графа (связей) и обозначим эти величины как ni , где индекс обозначает номер вершины (в нашем примере величины n для каждой вершины обозначены цифрами 1 - 3):
Индекс Рандича вычисляется по формуле:
где суммирование проводят по всем связям ("ребрам"), а индексы i и j относятся к номерам атомов, соединенным данным ребром. Для нашего конкретного примера суммирование проводят по ребрам 1 - 4 и получают:
c = 1/(31/2) + 1/(31/2) + 1/(61/2) + 1/(21/2) = 2,27
Как понятно из этого примера, индекс Рандича легко рассчитать с помощью компьютера даже для очень больших молекул. Что более важно, он часто коррелирует с самыми различными свойствами молекул и достаточно часто входит в QSAR-уравнения. Так, например, для температур кипения алканов было найдено следующее QSAR-уравнение:
Ткип.(?C) = 57,85c - 97,9.
С помощью этого уравнения читатель может предсказать температуру кипения, процедура которого проиллюстрирована ниже.
В сложных реальных ситуациях QSAR-уравнения содержат много дескрипторов и их нахождение требует специальных компьютерных программ и больших затрат машинного времени. Приведу пример предметного исследования в области QSAR, которое было сделано в Лаборатории органического синтеза на Химическом факультете МГУ. Целью работы был поиск новых производных триазиндиона, представляющих интерес как средства, подавляющие развитие кокцидий (Eimeria tenella) у домашней птицы. С этой целью были сформированы тренировочный и тестовый наборы веществ, содержащие 54 и 13 соединений соответственно. Затем с помощью специальных программ ("ЭММА" и "БИБИГОН") построено QSAR-уравнение (см. схему 1).
Из схемы 1, во-первых, видно, что имеется довольно хорошая корреляция свойства от дескрипторов для соединений тренировочного набора. Как следует из второго графика, прогноз свойств на тестовом наборе (прямая линия показывает величины свойств, рассчитанные по QSAR уравнению) также показывает принципиальное соответствие рассчитанных и экспериментальных величин, хотя почти всегда прогноз несколько хуже, чем данные на обучающей выборке соединений. В частности, три точки на этом графике выпадают довольно значительно. Впоследствии было показано, что другие QSAR методы также давали несогласие с данными по этим трем соединениям. Причиной явилось неточное определение экспериментальных величин активности в этих трех случаях.
Особенно следует обратить внимание на то, что в качестве дескрипторов в QSAR-уравнении выступают подструктурные фрагменты. Иными словами, данное QSAR-уравнение связывает активность веществ с наличием или отсутствием определенных структурных фрагментов. Нетрудно понять, что это значительно облегчает структурное конструирование неизвестных соединений, которые могли бы обладать повышенной активностью.
Это типичный пример применения QSAR для поиска активных веществ. Методология QSAR позволяет химику довольно удачно достичь конечную цель исследований: предсказать (и затем синтезировать!) структуру с нужной целевой активностью.
В заключение нужно подчеркнуть, что в настоящее время в области биохимии достигнуты большие успехи. Мы хорошо понимаем, как вещество трансформируется, как и с чем оно реагирует в организме. Более того, мы все больше понимаем проблему молекулярного узнавания: как вещество в организме находит мишень, на которую действует, как эта мишень узнает вещество и как они взаимодействуют.
Поэтому сочетание компьютерных методов с одной стороны, и методов биохимии, с другой, вызывают переориентацию органической химии с традиционного ее толкования на все большее выявление взаимоотношений структуры и свойства. По всей видимости, можно прогнозировать, что органическая химия, поддержанная развитием биохимии, математики, биофизики, найдет новую точку роста в области связи структуры и свойства.
* * *
Николай Серафимович Зефиров, действительный член Российской Академии наук и Академии информатики России, профессор, президент Российского Общества медицинской химии, директор Института физиологически активных веществ РАН, зав. кафедрой органической химии Химического факультета Московского государственного университета им. М.В. Ломоносова, лауреат премии им. Ломоносова (МГУ), премии им. Бутлерова, премий ВХО им. Менделеева, лауреат Государственной премии СССР. Автор около 900 работ и четырех монографий.