Автоматический секвенатор
Некоторые из секвенированных в конце концов фрагментов ДНК неизбежно обнаружат определенное «перекрытие» — совпадение участков последовательностей. Это обстоятельство в силу уникальности таких последовательностей (при достаточной их длине) используют для установления очередности фрагментов и получения из их совокупности единой последовательности нуклеотидов всего генома.
Впрочем, может оказаться и так, что из-за потери малых отрезков исходной ДНК генома при его дроблении между некоторыми расшифрованными фрагментами обнаруживаются пропуски (перекрытие отсутствует). Если два соседствующие с таким пропуском фрагмента уже секвенированы, то конец одного и начало второго из них позволяют синтезировать два праймера (начальный и концевой) и воспользоваться симметричной ПЦР-реакцией для получения на базе всей исходной ДНК или крупного ее куска пропущенной последовательности для ее секвенирования.
Если же нет достаточных оснований, чтобы после пропуска поставить один из расшифрованных фрагментов, то придется использовать асимметричную (с одним праймером) ПЦР-реакцию, начинающуюся от предшествовавшего пропуску фрагмента. Быть может даже в несколько этапов, когда праймер для каждого последующего секвенирования придется устанавливать по концу последовательности, расшифрованной на предыдущем этапе. И так до тех пор, пока не появится достаточно длинная последовательность нуклеотидов, уже обнаружившая себя в одном из секвенированных фрагментов. Разумеется, перебор и сопоставление всех последовательностей выполняет компьютер.
Необходимость секвенирования тысяч фрагментов ДНК ставит перед исследователем весьма трудоемкую задачу. Однако благодаря возможности автоматически секвенировать за один день 96 фрагментов и параллельного использования нескольких автоматов эта задача оказывается не такой уж страшной.
Другое дело — расшифровка генома человека с его тремя миллиардами пар нуклеотидов. Там, разумеется, есть свои приемы. Но, тем не менее, задача эта столь громоздка, что над ее разрешением координированно работают уже несколько лет многие лаборатории мира. (Общая программа «Геном человека».) О важности такой расшифровки для медицинских целей написано немало в общедоступной литературе. В первую очередь она ведется для тех участков генома, где расположены активные гены, в особенности гены, имеющие отношение к болезням человека. Эти гены во многих случаях могут быть найдены в геноме через синтез кДНК по иРНК, соответствующей белку — продукту деятельности интересующего гена, с дальнейшей гибридизацией с определенным куском генома. Для отыскания примерной локализации гена нет нужды получать соответствующие полноразмерные иРНК и кДНК. Достаточно знать последовательность в сотню нуклеотидов. Ее уникальность во всем геноме не вызывает сомнения — вероятность повтора составляет 1/4100.
К концу 1998 года были расшифрованы последовательности 50-60 тысяч генов, что составляет более половины всего предполагаемого числа генов человека. Это звучит оптимистически. Но стоит вспомнить, что все активные гены человека в совокупности составляют лишь около 3% его генома. Нужно ли расшифровывать остальные 97% ? Наверное нужно, хотя бы для того, чтобы подойти к пониманию роли этого огромного количества как будто «молчащей» наследственной информации. Неужели — это пустой балласт? Или эта «внегенная» информация играет какую-то роль в обеспечении жизнедеятельности человека во всех ее аспектах? На этом пути, быть может, ученых ждут еще великие открытия!