Вычислительные машины в исследовании биологических структур
"Пути научных исследований почти столь же
разнообразны, как и человеческие характеры"
Дж. Уотсон. "Двойная спираль"
На рис. 1 приведена классификация структурной организации живого до организменного уровня.
Рис. 1. Уровни организации биологических структур
Один уровень отличается от другого как геометрическими размерами (а следовательно, и методом исследования), так и параметрами, которыми описывается структура (табл. 1).
Таблица 1
Не будет преувеличенным утверждение, что крупные успехи биологии в исследовании молекулярного уровня живого связаны с применением УЦВМ. Некоторые из таких работ уже стали классическими, а 10-15 лет назад за многие из этих исследований были присуждены Нобелевские премии. Сюда следует отнести определение структуры дезоксирибонуклеиновой кислоты - знаменитой двойной спирали ДНК, расшифровку структуры белков: миоглобина - основного белка, содержащегося в мышечных тканях; гемоглобина - белка красной крови и основного переносчика кислорода в организме; лизоцима - одного из главных ферментов, способствующего разрушению оболочек бактериальных клеток, и многих других. Приведем примеры использования УЦВМ при исследовании биоструктур.
В 1966 году в Вене на Международном конгрессе по биофизике был показан стереоскопический атлас некоторых структур биологических макромолекул, построенный с помощью УЦВМ. Объемный эффект восприятия структуры достигался тем, что для макромолекулы были даны два рисунка, рассчитанные и вычерченные с помощью УЦВМ. На них макромолекула была изображена под разными ракурсами, благодаря чему эти рисунки образовывали стереоскопическую пару. Если одновременно на один рисунок смотреть левым глазом, а на другой - правым, то возникает эффект объемного изображения структуры. Для удобства наблюдения к атласу прикладывали специальные очки с экраном, отделяющим поле зрение одного глаза от другого. Атлас служил наглядным справочным пособием. Следует заметить, что биологические макромолекулы насчитывают тысячи и даже десятки тысяч атомов и рассчитать стереоскопическую пару без УЦВМ было бы делом почти безнадежным.
Приблизительно в то же время появились новые устройства общения человека с УЦВМ, так называемые дисплеи. Дисплей представляет собой телевизионный экран с блоками управления, на котором машина по определенной программе способна делать надписи, рисовать графики, чертить схемы. Возникла идея, используя дисплей, заставить УЦВМ конструировать схемы структур биологических макромолекул.
Для чего это было нужно?
Известно, что рентгеноструктурный анализ является основным методом, который может дать подробную информацию о конфигурации молекул нуклеиновых кислот и белков. Оптические методы, которые служат ценным дополнением к рентгеноструктурному анализу, дают на этом уровне исследования биологических структур более ограниченную информацию, в основном об ориентации связей и химических групп.
Рис. 2. Объемная модель (а) и рентгенограмма (б) молекулы миоглобина
Идеи, которые лежат в основе рентгеноструктурного анализа, общеизвестны и многократно рассматривались в популярной литературе. Напомним только, что для объемной реконструкции структуры необходимо исследовать множества ее сечений. Например, крупный английский ученый, лауреат Нобелевской премии Дж. Кендрью для расшифровки белка миоглобина (разрешение 2Аº) использовал для расчета более чем 9*103 дифракционных максимумов (рис. 2). Без применения УЦВМ такие расчеты провести невозможно. Поэтому многих исследователей заинтересовала возможность предсказывать структуру белковой молекулы по ее химической формуле без проведения рентгеноструктурного анализа. Однако, эта задача чрезвычайно сложна. Если действовать методом; перебора, то для создания, например, молекулы лизоцима потребовалось бы рассмотреть около 10129 вариантов - величина одного порядка с числом атомов в доступной для наблюдения части Вселенной. Поэтому весьма актуальными становятся две задачи: с одной стороны, найти наиболее сильные ограничения, накладываемые на структуру белковых молекул, а с другой - предельно автоматизировать перебор возможных вариантов.
В результате работ, проведенных за последние 15 лет, были сформулированы некоторые положения, позволяющие отбирать наиболее вероятные конфигурации молекулы, имеющей один и тот же химический состав.
Например, каждое звено в молекуле белка имеет определенную длину и пространственное расположение связей. Белковые молекулы синтезируются, начиная с определенного конца полипептидной цепи. Последние проявляют тенденцию к образованию спиральных конформаций. Наконец, молекула белка в целом стремится приобрести такую форму, при которой общая свободная энергия молекулы примет, минимальное значение для данных условий среды; Эти положения можно алгоритмизировать* и реализовать с помощью УЦВМ. В результате машина сможет нарисовать на телевизионном экране предполагаемую модель, молекулы.
* (Алгоритмизировать - построить алгоритм. Алгоритм - система, вычислений, выполняемых по строго определенным правилам, которые после последовательного выполнения приводят к решению поставленной задачи.)
Но телевизионный экран дает только плоское двумерное изображение. Поэтому, машине приходится, поворачивая молекулу вокруг своей оси, выдавать на экран; последовательный ряд проекций; по которым человек сам, мысленно воссоздает пространственный образ молекулы. Для удобства работы, вращение изображения: контролируется положением шара, на котором наблюдатель держит свою руку. Куда он повернет рукой шар, туда же поворачивается, и молекула на экране. Через некоторое время связь между рукой и мозгом становится привычной, и восприятие мысленной объемной реконструкции не вызывает никаких затруднений.
При построении модели с минимальной свободной энергией для каждого предлагаемого варианта пространственной геометрии молекулы УЦВМ оценивает общую энергию и вычисляет производную с тем, чтобы исследователь знал, как следует изменить структуру молекулы для получение минимальной энергии. Человек меняет" геометрию" молекулы и направляет процесс вычислений. В результате возникает исследовательская система "человек - вычислительная машина". С помощью такой системы, например, была сконструирована модель миоглобина, которая хорошо соответствует модели Дж. Кендрью, построенной на основе рентгеноструктурного анализа. Однако пока рано судить о том, какую пользу можно извлечь из комбинации "человек- вычислительная машина" при решении реальных проблем молекулярной биологии".
При использовании УЦВМ для анализа субклеточных структура т. е. для научения их электронно-микроскопических снимков, так же как и при решении большинства, других задач машинного анализа биоструктур, возникают другие проблемы:
Выделить подлежащую анализу структуру и преобразовать информацию о ней в цифровую форму.
Разработать, алгоритмы обработки информации для. получения количественной характеристики изучаемой, структуры.
Автоматизировать выделение и анализ изображения какой-либо субклеточной структуры, например, митохондрии, "а электронно-микроскопическом снимке чрезвычайно сложно из-за сильно "зашумленного" фона. Поэтому :часто используют полуавтоматический способ выделения изображения структуры, основанный на применении координатометров. Координатометр - это прибор, состоящий из подвижного маркера, выполненного в виде "карандаша", который связан с системой измерения координат X и Y. Исследователь сам находит изображение изучаемой структуры и обводит ее с помощью маркера координатометра, при этом координаты контура структуры преобразуются в цифровую форму и передаются для дальнейшего анализа в вычислительную машину. При изучении субклеточных структур можно выделить по крайней мере три типа задач, для решения которых использование электронно-вычислительной техники- оказывается весьма перспективным.
Классификация и подсчет объектов на электронно-микроскопических снимках.
Разработка методов количественного описания электронно-микроскопических изображений.
Разработка метода исследования динамики структурных перестроек субклеточных структур.
Как правило, морфолог ограничивается описанием "самых типичных частиц", считая таковыми только те, которые содержат наибольшее количество структурных элементов. Для объективного изучения необходим количественный анализ изображений разнообразных частиц. Сложность решения таких задач определяется тем, что поле зрения электронного микроскопа и толщина доступного для наблюдения объекта ничтожно малы. Чтобы создать представление о более протяженных областях объекта, нужно перемещать изображение - по экрану микроскопа, запоминать и сопоставлять отдельные его части.
До последнего времени изображения, как правило, сопоставляли мысленно. По мере накопления опыта морфолог может представить себе объект на протяжении большем, чем поле зрения микроскопа, и мысленно реконструировать его на глубину большую, чем толщина данного среза. Однако обилие деталей намного превышает возможности человеческого восприятия, даже достаточно тренированного.
Существуют методы, облегчающие изучение структуры по серийным срезам. Однако получать серийные срезы трудно, и не всегда удается отнести определенные участки среза к одним и тем же структурным элементам. Поэтому появляется задача количественного описания структур по случайно выбранным срезам. Задача облегчается, если удается аппроксимировать данный тип структур какими-либо простыми объемными, геометрическими фигурами, например, цилиндром, шаром, пирамидой, призмой или эллипсоидом вращения. Цилиндром можно аппроксимировать сосуды, шаром или эллипсоидом вращения - ядра клеток и некоторые виды органелл; призмой или конусом аппроксимируются некоторые из клеток.
Основной тип этих, так называемых, стерео логических, задач связан с сечением, случайной плоскостью аналитически описываемых, геометрических фигур, взвешенных в некотором объеме, По сечению необходимо определить параметры распределения фигур в объеме. Сложность решения задачи, состоит в том, что даже при разрезании одинаковых шаров и сечения будут представлять собой окружности различных радиусов. Однако ряд таких стереологических задач уже решен, например, в Институте биологической физики АН СССР.
Сейчас начинает развиваться динамическая морфология - учение о функциональном изменении структуры живого.
Фиксация застает элементы живой клетки в разнообразных состояниях и положениях. В совокупности этих состояний отражен ход развития объекта. Динамическая морфология включает в себя задачу реконструкции процесса развития по статическим снимкам. Теоретическое значение этой задачи очень велико. В практическом же плане она является составной частью типичных для современной экспериментальной биологии задач типа "воздействие - время - эффект".
Сравнительно легко обнаруживаются изменения структуры, если какие-то элементы сохраняют свои отличительные признаки (например, увеличивается их число, изменяется их локализация, объем и очертания при сохранении типичного внутреннего строения). Несравненно сложнее задача, когда в ходе эксперимента появляются новые элементы и нужно понять,- из каких прежних они развились.
Аналогичные задачи возникают при исследовании клеток и тканей с помощью оптического микроскопа. На одной из таких задач мы остановимся подробнее - это задача машинного-анализа хромосом.