Статьи Соросовского Образовательного журнала в текстовом формате
Международный проект "Геном человека" - один из наиболее дерзновенных, дорогостоящих и потенциально важных проектов в истории науки. Успехи в выполнении проекта оказались весьма значительными, и в октябре 1998 года было объявлено, что первый грубый вариант полной последовательности нуклеотидов в ДНК человека будет получен к 2001 году. Это позволит лучше понять принципы развития организма человека, генетические причины многих наследственных болезней и механизмы старения.
МЕЖДУНАРОДНЫЙ ПРОЕКТ "ГЕНОМ ЧЕЛОВЕКА"В. Н. СОЙФЕР
Университет им. Джорджа Мейсона, Фэйрфакс,
Виргиния, США
_Не нужно быть беспочвенным оптимистом, чтобы верить, что через пятьдесят лет "биологический код" - химическая зашифровка наследственных свойств - будет расшифрован и прочитан.
С этого момента человек станет полным властелином живой материи...
В.А. Энгельгардт. <Комсомольская правда>,
9 июня 1957 года
СКОЛЬКО ГЕНОВ
В ЧЕЛОВЕЧЕСКОМ ОРГАНИЗМЕ
В ядре каждой соматической клетки человека содержится 23 пары хромосом. На каждую из них приходится по одной молекуле ДНК. Длина всех 46 молекул в одной клетке тела человека равна почти 2 м, а если учесть, что тело взрослого человека составлено примерно из 5 " 1013 клеток, то общая длина молекул ДНК в организме достигнет 1 " 1014 м, или 1 " 1011 км, что в тысячи раз превышает расстояние от Земли до Солнца.
Но вернемся к одной клетке. Во всех молекулах ДНК одиночной клетки человека содержится 3,2 млрд пар нуклеотидов. Каждый нуклеотид состоит из пятиуглеродного сахара, фосфатной группы и азотистого основания. Сахара и фосфаты одинаковы во всех нуклеотидах, а смысл нуклеотидам придают основания, которых в ДНК четыре типа. Таким образом, язык генетических записей четырехбуквенный, и если одно основание представляет собой одну букву наследственной записи, то отдельными словами можно назвать генетическую информацию о порядке аминокислот в кодируемых генами белках. Кроме кодировки состава белков в геноме записаны, конечно, другие разнообразные сведения. Можно сказать, что Природа (либо в результате эволюции, либо в согласии с Божьим промыслом) закодировала в ДНК инструкции о том, как клеткам выживать, как реагировать на внешние воздействия, как должно происходить развитие тела, как стареет организм, предотвращает поломки различных частей клеток и множество других сведений. Любая поломка генных инструкций ведет к мутациям, и если они случаются в генеративных клетках - сперматозоидах или яйцеклетках, то мутации передаются следующим поколениям. Это может поставить в рискованное положение само существование данного вида.
За словами о 3 млрд пар оснований зримо не видно, что же это такое. Гигантский объем информации, содержащейся в геноме человека, лучше всего иллюстрирует следующий пример: если напечатать мельчайшим шрифтом телефонные книги, то чтобы внести в них все знаки из ДНК одной-единственной клетки, понадобится отпечатать тысячу тысячестраничных телефонных книг!
Сколько же всего генов, то есть последовательностей, кодирующих белки, имеется в составе человеческой ДНК? Года три назад называли цифру 100 тыс., затем 80 тыс. В конце 1998 года специалисты по биоинформатике начали склоняться к мысли, что на самом деле нужны более осторожные оценки и что в геноме человека может оказаться 50-60 тыс. генов. Важно подчеркнуть, что на их долю приходится только 3% общей длины ДНК человека. Функциональная роль остальных 97% остается пока непонятной.
ЧТО ТАКОЕ ПРОЕКТ "ГЕНОМ ЧЕЛОВЕКА"
Цель проекта заключается в выяснении последовательности оснований во всех молекулах ДНК в клетках человека. Одновременно должна быть установлена локализация всех генов, что помогло бы выяснить причины наследственных заболеваний и этим открыть пути к их лечению. В выполнении проекта задействовано несколько тысяч ученых, специализирующихся в биологии, химии, математике, физике и технике. Это один из самых дорогостоящих научных проектов в истории цивилизации. В 1990 году на изучение геномов было потрачено 60 млн долларов, в 1991 году - 135 млн, в 1992-1995 годах ежегодно выделялось от 165 до 187 млн долларов, а в 1996-1998 годах только США расходовали 200, 225 и 253 млн долларов ежегодно.
Об интересе к полученным в ходе реализации проекта результатам говорит такой факт: на сегодняшний день самыми цитируемыми авторами во всех областях науки стали Марк Адамс и Крэйг Вентер. Первый - ведущий сотрудник Института геномных исследований в штате Мэриленд (США), частной исследовательской компании, занимающейся исключительно работами в области картирования генома человека, а второй - директор этого института.
ОСНОВНЫЕ ЦЕЛИ ПРОЕКТА
"ГЕНОМ ЧЕЛОВЕКА"
Чтобы последовательно приближаться к решению проблемы картирования генов человека, было сформулировано пять основных целей: 1) завершить составление детальной генетической карты, на которой были бы помечены гены, отстоящие друг от друга на расстоянии, не превышающем в среднем 2 млн оснований (1 млн оснований принято называть 1 мегабаза, сокращенно Мб, от англ. слова base - основание), 2) составить физические карты каждой хромосомы (разрешение 0,1 Мб), 3) получить карту всего генома в виде охарактеризованных по отдельности клонов (5 тыс. оснований в клоне, или 5 килобаз, Кб), 4) завершить к 2004 году полное секвенирование ДНК (разрешение 1 основание) и 5) нанести на полностью завершенную секвенсовую карту все гены человека (к 2005 году). Ожидалось, что, когда все указанные цели будут достигнуты, исследователи определят все функции генов и разработают методы биологического и медицинского применения полученных данных.
ТРИ ТИПА КАРТ ХРОМОСОМ
В ходе проекта создают последовательно три типа карт хромосом: генетические, физические и секвенсовые (от англ. слова sequence - последовательность). Выявление всех генов, присутствующих в геноме человека, и установление хотя бы примерного расстояния между ними позволят локализовать каждый ген в хромосомах. Такие генетические карты помимо инвентаризации генов и указания места их расположения ответят на исключительно важный вопрос о вовлеченности генов в образование отдельных признаков организма. Ведь многие признаки формируются под контролем нескольких генов, часто расположенных в разных хромосомах, и знание локализации каждого из них будет способствовать лучшему распознаванию законов дифференцировки клеток, органов и тканей, а также лучшему лечению болезней.
В 20-е и 30-е годы XX столетия, когда создавали хромосомную теорию наследственности, выяснение положения каждого гена помогло нанести на генетические карты сначала дрозофилы, затем кукурузы, а после этого и других видов новые точки, как тогда говорили, "генетические маркеры" хромосом. Чисто генетический анализ локализации маркеров вдоль хромосом помогал насыщать генетические карты хромосом человека новыми сведениями. Первые данные о положении генов появились еще до 1968 года. Затем знания нарастали лавинообразно, и в настоящее время примерное положение найдено уже для нескольких десятков тысяч генов. Три года назад степень изученности положения генов была такова, что в среднем расстояние между двумя изученными генами составляло около 10 Мб (говорят, что разрешение на этой карте достигло 10 Мб). Для некоторых участков было достигнуто разрешение до 5 Мб.
Второй тип карт - это физические карты хромосом. Еще в 60-е годы цитогенетики использовали методы окрашивания хромосом для выявления так называемых бэндов (поперечных полосок) на хромосомах. Полосы можно было физически заметить в микроскоп. Установление соответствия полос и генов дало возможность внести в изучение хромосом новые детали. Затем были разработаны методы, позволившие физически следить за присоединением коротких отрезков радиоактивно-меченых или флуоресцентно-меченых ДНК к хромосомной ДНК. Локализация этих меток повысила разрешение структуры хромосом. Использование метода так называемой флуоресцентной in situ гибридизации (FISH-метод) дало возможность достичь разрешения от 2 до 5 Мб, а потом повысить его (при изучении хромосом делящихся клеток) до 100 Кб. В 70-х годах научились разрезать ДНК на участки ферментами, узнающими коротенькие отрезки, в которых информация записана в виде палиндромов (перевертышей), читаемых одинаково в обоих направлениях: с начала до конца и с конца до начала. Эти ферменты были названы рестрикционными [3]. С их помощью построили так называемые рестрикционные физические карты, в короткий срок были разработаны другие физические и химические методы, приведшие к увеличению степени разрешения физических карт в сотни раз.
Наконец, разработка методов изучения точных последовательностей нуклеотидов в ДНК, или методов секвенирования, открыла путь к созданию секвенсовых карт, на которых степень разрешения доведена до своего максимального значения: на этих картах должно быть указано положение всех нуклеотидов в ДНК.
ДВА ПОДХОДА К КАРТИРОВАНИЮ ГЕНОМОВ
Число хромосом и их длина различны у разных биологических видов. В бактериальных клетках есть одна хромосома, например: у бактерии Mycoplasma genitalium геном имеет размер 580 Кб (в нем закодировано 470 генов), у бактерии кишечной палочки (Escherichia coli) геном состоит из 4,2 Мб (4200 генов), у растения Arabidopsis thaliana - соответственно 100 Мб и 25 тыс. генов, у плодовой мушки Drosophila melanogaster - 120 Мб и 10 тыс. генов. У мыши и человека ДНК несет примерно по 3 млрд оснований и содержит предположительно 50-60 тыс. генов. Конечно, для картирования столь разных геномов нельзя в принципе применить одни и те же методы. Поэтому были предложены два кардинально различающихся по методологии подхода, их условно назвали "сверху вниз" и "снизу вверх". Первый, когда начинали работу со всей ДНК сразу и шли вниз (разрезали геномную ДНК на небольшое число кусков и анализировали их по отдельности, а затем воссоздавали всю начальную структуру), с успехом применили для генетического картирования малых по размеру геномов. Второй подход стали использовать для длинных геномов. В последнем случае нельзя было надеяться взять всю ДНК и нарезать ее на небольшое число кусков. Число их было бы столь большим, что путаница в последовательностях была бы неразрешимой. Поэтому шли снизу вверх: сначала секвенировали как можно более длинные, произвольно выбранные куски, затем прикладывали их друг к другу в надежде найти перекрывающиеся концевые участки. Как только находили перекрытие, куски объединяли в один (его называли контиг). С применением компьютерных и математических методов искали перекрытие все более крупных контигов и постепенно шли вверх выше и выше. Эту стратегию, в частности, успешно применили для 3-й хромосомы дрозофилы.
КРАТКИЙ АНАЛИЗ ОСНОВНЫХ ТЕХНИЧЕСКИХ ПОДХОДОВ К КАРТИРОВАНИЮ ГЕНОМОВ
Важная составляющая проекта "Геном человека" - это разработка множества новых, как любят говорить журналисты, революционизирующих методов исследований. Развитые еще до начала выполнения проекта методы (их назвали методами первого поколения) включали применение рестрикционных ферментов; создание гибридных молекул, их клонирование и перенос участков ДНК с помощью векторов в клетки-доноры (чаще всего в клетки кишечной палочки, E. coli и дрожжевые клетки; иногда этот процесс называют амплификацией генов in vivo); синтез ДНК на матрицах информационной РНК (сДНК-синтез); методы секвенирования генов; получение практически неограниченного количества копий генов с помощью PCR-машин (амплификация участков ДНК in vitro); методы, предназначенные для разделения молекул ДНК по плотности, массе, различной вторичной структуре.
В последние 4-5 лет, исключительно благодаря проекту "Геном человека", были развиты новые методы (так называемого второго поколения), которые включают как главный компонент автоматизацию большинства процессов (табл. 1). Почему это направление стало центральным? Самая маленькая хромосома клеток человека содержит ДНК длиной 50 Мб, самая большая (хромосома 1) - длиной 250 Мб. При существовавших до 1996 года методах самый большой участок ДНК, выделяемый препаративно из хромосом, имел длину 350 тыс. оснований, и на самом лучшем оборудовании можно было секвенировать от 50 до 100 Кб в год при стоимости 1-2 доллара за основание. С такой скоростью можно было ожидать завершения работы по полному секвенированию ДНК человека за 30 тыс. дней непрерывной работы при стоимости только секвенирования (без учета всех остальных операций по выделению и обработке ДНК до секвенирования) 3 млрд долларов.
Улучшение к началу 1998 года технологии позволило аккуратно секвенировать 100 Кб в день при стоимости около полудоллара за основание. Таким образом, за год, если работать без выходных, можно узнавать последовательности ДНК длиной 36,5 Мб. Ожидается, что разработка новых электромеханических устройств, которые к тому же требовали бы меньше реактивов, позволит уже к середине 1999 года достичь пятикратного ускорения работы, а к 2003 году можно будет секвенировать по 500 Мб в год при стоимости 25 центов за основание (для человеческой ДНК эта стоимость будет значительно меньше).
БАНКИ ДАННЫХ О ГЕНОМЕ ЧЕЛОВЕКА
В результате проведенной работы за последние шесть лет были созданы мощнейшие международные банки данных о последовательностях нуклеотидов в ДНК разных организмов (такие, как GenBank / EMBL / DDBJ) и о последовательностях аминокислот в белках (PIR / SwissPot). Любой специалист в мире может практически беспрепятственно войти в эти банки данных и воспользоваться для исследовательских целей собранной там информацией. Решение о доступности информации не было принято сразу, и потребовалась значительная работа как ученых, так юристов и законодателей, чтобы воспрепятствовать первоначальному желанию многих фирм, особенно коммерческих, патентовать все получаемые последовательности генов, закрыть их для доступа и коммерциализировать эту научную область.
КРАТКАЯ ХАРАКТЕРИСТИКА РЕЗУЛЬТАТОВ ВЫПОЛНЕНИЯ ПРОГРАММЫ
Организмы с полностью секвенированными геномами. Решение сначала более простых задач с постепенным их усложнением, обучением персонала, разработкой все более совершенных технологий - таким был путь исследователей, приступивших к разработке проблемы генома человека. Первой крупной вехой стало полное картирование в 1995 году генома бактерии Hemophilus influenzae. В 1996 году было закончено картирование ДНК дрожжевой клетки (12,5 Мб, 6 тыс. генов), в середине декабря 1998 года был полностью картирован геном круглого червя Caenorhabditis elegans (97 Мб и 19 099 генов, что составляет от 1/3 до 1/4 общего числа генов человека). Основные результаты, полученные международным коллективом ученых, опубликованы в журнале "Science" (1998. Vol. 282, ╧ 5396. Рp. 2012-2042).
Изученные гены человека. С января 1995 до января 1996 года длина участков ДНК человека, для которых была установлена полная последовательность оснований, увеличилась почти в 10 раз. Но хотя прогресс был налицо, однако все, что было сделано за год, составляло менее одной тысячной процента человеческого генома. Но уже к июлю 1998 года было секвенировано почти 9% всего генома (рис. 1), а затем каждый месяц приносил новые замечательные результаты. Параллельно изучили большое числе копий генов в виде сДНК, их последовательности сопоставили с участками хромосомной ДНК, и стало ясно, что к 23 октября 1998 года установлены последовательности 30 181 гена человека. К 11 ноября того же года число секвенированных генов достигло 30 261. Тем самым получена информация примерно для половины всех генов человека.
Сведения о функциях генов в организмах. Благодаря достигнутым успехам эти данные позволили впервые реально оценить функции генов в организме человека. Хотя более чем для четверти генов информация пока недоступна (рис. 2), для двух третей генов она или полностью установлена, или может быть примерно указана.
Была получена исключительно интересная информация о вовлеченности генов в образование и функционирование отдельных органов и тканей человеческого тела (рис. 3). Оказалось, что самое большое число генов необходимо для формирования мозга и поддержания его активности, а самое маленькое для создания эритроцитов - всего 8 генов.
Изучение геномов других организмов. Когда программа еще только планировалась, было решено, что на первых порах надо отработать методы на более простых моделях. Сначала изучили 8 разных представителей мира микроорганизмов, затем список расширяли, и в настоящее время секвенсовые карты составлены уже для 18 организмов, имеющих малый размер генома (от 1 до 20 Мб). В их числе представители многих родов бактерий: архебактерии, спирохеты, хламидобактерии, кишечная палочка, возбудители пневмоний, сифилиса, гемофилии, метанобразующие бактерии, микоплазмы, риккетсии, цианобактерии. Как уже упоминалось, закончен анализ генома первого эукариотического одноклеточного организма - дрожжей Saccharomyces cerevisae и первого многоклеточного животного организма - нематоды C. elegans.
Изучение последовательностей нуклеотидов в генах, повреждение которых вызывает наследственные болезни человека. В настоящее время описано примерно 10 тыс. различных заболеваний человека. Из этого числа около 3 тыс. - наследственные болезни. Они необязательно должны быть наследуемыми, то есть передаваться от поколения к поколению. Слово "наследственный" означает, что причина болезни заключается в поломке наследственного аппарата, то есть генов (в том числе в соматических клетках, а не только в генеративных). Выявление молекулярной причины поломки генов прямо вытекает из результатов исследования генома. В табл. 2 представлены гены, повреждения которых вызывают болезни человека и которые к концу 1997 года были полностью секвенированы. Можно видеть, как год от года растет число изученных болезнетворных генов. Ожидается, что в течение трех-четырех лет будут изучены все 3 тыс. генов, вовлеченных в развитие патологических процессов у человека. Эти сведения помогут разобраться в генетических программах развития и функционирования организма человека, в причинах возникновения раковых заболеваний и старения. Выявление молекулярных основ заболеваний поможет перевести на новый уровень методы их ранней диагностики, а значит, вести более утонченно и успешно борьбу с заболеваниями. Такие методы, как, например, адресная доставка лекарств в пораженные клетки, замещение больных генов здоровыми, включение/выключение боковых путей метаболизма за счет включения/выключения соответствующих генов, и многие другие перестали быть предметом нездорового прожектерства фантастов, а становятся частью арсенала современной медицины.
Лучшее понимание эволюции органического мира. Благодаря геномным исследованиям ученым удается по-новому взглянуть на эволюцию живого мира. В первую очередь это касается таких крупных категорий, как деление живых существ на прокариотов (безъядерных организмов) и эукариотов (организмов, в клетках которых имеется ядро с двухслойной оболочкой). До последнего времени к прокариотам относили древние бактерии, так называемые архебактерии, по многим признакам отличающиеся от настоящих бактерий, но представленные также одноклеточными организмами без обособленного ядра и несущими одиночные двунитевые молекулы ДНК. Когда год назад секвенирование ДНК архебактерий было завершено, стало ясно, что эти организмы представляют собой отдельную ветвь на эволюционном древе живых существ на Земле (рис. 4).
ПРИМЕНЕНИЕ ГЕННО-ИНЖЕНЕРНЫХ ПРОДУКТОВ В МЕДИЦИНЕ
Значительный прогресс достигнут в практической области создания новых продуктов для медицинской промышленности и лечения болезней человека (табл. 3). В настоящее время фармацевтическая промышленность завоевала лидирующие позиции в мире, что нашло отражение не только в объемах промышленного производства, но и в финансовых средствах, вкладываемых в эту промышленность (по оценкам экономистов, она вошла в лидирующую группу по объему купли-продажи акций на рынках ценных бумаг). Важной новинкой стало и то, что фармацевтические компании включили в свою сферу выведение новых сортов сельскохозяйственных растений и животных и тратят на это десятки миллиардов долларов в год, они же монополизировали выпуск химических веществ для быта, добавок к продукции строительной индустрии и т.п. Уже не десятки тысяч, а возможно, несколько сот тысяч высококвалифицированных специалистов заняты в исследовательских и промышленных секторах фарминдустрии, и именно в этих областях интерес к геномным и генно-инженерным исследованиям исключительно высок.
ЗАДАЧИ БУДУЩИХ ИССЛЕДОВАНИЙ
Рассмотрев темпы ускорения работы в рамках проекта "Геном человека", руководители проекта объявили 23 октября 1998 года, что программа будет полностью завершена гораздо раньше, чем это первоначально планировалось, и сформулировали <Новые задачи проекта "Геном человека">:
1) полностью завершить в декабре 1998 года работу по секвенированию генома круглого червя C. elegans (это было сделано в срок);
2) закончить предварительный анализ последовательностей ДНК человека к 2001 году, а полную последовательность к 2003 году;
3) картировать к 2002 году геном плодовой мухи Drosophila melanogaster ;
4) начать секвенирование генома мыши с использованием методов сДНК и искусственных хромосом дрожжей; завершить этот проект к 2005 году.
Помимо этих целей, официально включенных в поддерживаемый правительством США и рядом других правительств проект, некоторые исследовательские центры объявили о задачах, которые будут решаться в основном за счет частных фондов и пожертвователей. Так, ученые Калифорнийского университета (Беркли), Орегонского университета и Ракового исследовательского центра им. Фреда Хатчинсона начали программу "Геном собаки".
Международное общество секвенирования в феврале 1996 года приняло решение о том, что любая последовательность нуклеотидов размером 1-2 Кб должна быть обнародована (через Интернет) в течение 24 ч после ее установления.
ЧТО БУДЕТ СДЕЛАНО ПОСЛЕ ЗАВЕРШЕНИЯ АНАЛИЗА ГЕНОМА ЧЕЛОВЕКА
Главная стратегическая задача будущего сформулирована следующим образом: изучить однонуклеотидные вариации ДНК в разных органах и клетках отдельных индивидуумов и выявить различия между индивидуумами. Анализ таких вариаций даст возможность не только подойти к созданию индивидуальных генных портретов людей, что, в частности, даст возможность лучше лечить болезни, но и определить различия между популяциями, выявлять географические районы повышенного риска, что поможет давать четкие рекомендации о необходимости очистки территорий от загрязнения и выявлять производства, на которых есть большая опасность поражения геномов персонала.
Эта грандиозная задача рождает не одни радужные ожидания всеобщего блага, но и вполне осознанную тревогу юристов и борцов за индивидуальные права человека. Так, в частности, высказываются возражения против распространения персональной информации без разрешения тех, кого она касается. Один пример помогает понять эти тревоги: уже сейчас страховые компании нацелились на добывание таких сведений правдами и неправдами, они намереваются использовать данные против тех, кого они страхуют. Например, если подающий на страховку несет потенциально болезнетворный ген, компании не хотят страховать таких людей вовсе или же пытаются заломить бешеные суммы за их страховки. Исходя из этого, Конгресс США уже принял ряд законов, направленных на строгий запрет распространения генетической информации относительно отдельных людей, и юристы всего мира интенсивно работают в данном направлении.
ЦИТИРОВАННАЯ ЛИТЕРАТУРА
1. Кнорре Д.Г. Биохимия нуклеиновых кислот // Соросовский Образовательный Журнал. 1996. ╧ 3. С. 11-16; 1998. ╧ 8. С. 30-35.
2. Сойфер В.Н. Репарация генетических повреждений // Там же. 1997. ╧ 8. С. 4-13.
3. Лещинская И.Б. Генетическая инженерия // Там же. 1996. ╧ 1. С. 32-39.
* * *
Валерий Николаевич Сойфер, доктор физико-математических наук, профессор Университета им. Джорджа Мейсона и директор Лаборатории молекулярной генетики этого университета, академик Российской академии естественных наук, Академии педагогических и социальных наук, Нью-Йоркской академии наук, иностранный член Национальной академии наук Украины, почетный доктор Казанского и Иерусалимского университетов, председатель Правления и генеральный директор Международной Соросовской Программы Образования в Области Точных наук, награжден Международной медалью Грегора Менделя за выдающиеся достижения в области биологических наук. Области научных интересов - изучение структуры и функционирования ДНК, репарации, молекулярных последствий загрязнения окружающей среды, история и философия науки. Автор 19 книг и более 200 научных работ.
В сети Интернет сейчас можно найти большое число адресов, содержащих разнообразную информацию, касающуюся генома человека. Вот некоторые из полезных адресов:
http://www.nhgri.nih.gov
http://genlink.wustl.edu
http://www.geneletter.org
http://www.hhmi.org
http://www.mpimg-berlin-dahlem.mpg.de/~cytogen/
http://ftp.tigr.org
http://cancernet.nci.nih.gov/ord/index
http://www.wiley.co.uk/genetherapy
http://cos.gdb.org/best.html
http://www.med.jhu.edu/tfgtelsi
http://modimes.org/
http://www.hslib.washington.edu/helix
http://www.ncbi.nlm.nih.gov/omim
http://www.biol.tsukuba.ac.jp/~macer/index.html
http://www.bioethics.gov
http://www.ornl.gov/hgmis/resource/elsi.html
http://www.ornl.gov/hgmis
http://www.NORD-rdb.com/~orphan
http://www.ncgr.org
http://bioserver.uniba.it/fish/Cytogenetics/welcome.html