НОВОСТИ   БИБЛИОТЕКА   ЮМОР   КАРТА САЙТА   ССЫЛКИ   О САЙТЕ  




предыдущая главасодержаниеследующая глава

Анализ масс-спектрограмм

Химику-органику часто необходимо узнать химическую природу чего-то, только что им синтезированного. Первым шагом, который мы здесь рассматривать не будем, является определение числа атомов различных элементов в одной молекуле синтезированного вещества. Этот шаг приводит к химической формуле, примером которой для химического вещества, используемого в рассмотрениях настоящей главы, является формула С8Н16О. Это обозначение указывает на то, что в каждой молекуле рассматриваемого вещества имеется восемь атомов углерода, шестнадцать атомов водорода и один атом кислорода.

При известной химической формуле для определения того, как организованы атомы, химик может воспользоваться масс-спектрограммой. На рис. 9.1 изображена типичная спектрограмма и согласующаяся с ней структура для С8Н160. Задача системы, к изучению которой мы собираемся приступить, состоит в том, чтобы, отправляясь от формулы и спектрограммы, вывести структуру молекулы так, как это делает хороший химик.

Масс-спектрограмма создается методом, показанным на рис. 9.2. В спектральном приборе некоторое количество вещества подвергается нагреванию до тех пор, пока его молекулы не распадутся на заряженные ионы различных размеров. Последние подвергаются сортировке путем пропускания через магнитное поле, которое отклоняет сильно заряженные и легкие частицы больше, чем слабо заряженные и тяжелые. После отклонения частицы налетают на фото-графическую пластинку, вызывая ее почернение пропорционально числу падающих частиц.

ДЕНДРАЛ способен помочь химикам установить химическую структуру

Работа системы ДЕНДРАЛ (DENDRAL) по выводу структур на основе химических формул и масс-спектрограмм характеризуется следующими этапами:

  • Масс-спектрограмма используется для образования списков требуемых и запрещенных подструктур.
  • Химическая формула подается на вход системы генерации структур, способной образовывать всевозможные структуры. Эта система генерирует только те структуры, которые совместимы с указанными списками требуемых и запрещенных подструктур.
  • Для каждой сгенерированной структуры предсказывается масс-спектрограмма.
  • Все эти сгенерированные масс-снектрограммы сопоставляются с имеющейся экспериментальной спектрограммой. Правильной признается та структура, которая находится в лучшем соответствии.
Рис. 9.1. Пример задачи с масс-спектрограммой. Химик должен, используя данную химическую формулу, С8Н1бО, и эту спектрограмму, вывести структуру молекулы. (Из работы Букхенена, Сазерленда и Фейгенбаума - см. список литературы - с разрешения Дональда Миши, главного редактора. Machine Intelligence, Эдинбургский университет, Шотландия.)
Рис. 9.1. Пример задачи с масс-спектрограммой. Химик должен, используя данную химическую формулу, С8Н1бО, и эту спектрограмму, вывести структуру молекулы. (Из работы Букхенена, Сазерленда и Фейгенбаума - см. список литературы - с разрешения Дональда Миши, главного редактора. Machine Intelligence, Эдинбургский университет, Шотландия.)

Рис. 9.2. Масс-спектрометр. Сначала исследуемое органическое соединение разрушается, а затем образовавшиеся частицы разделяются и регистрируются
Рис. 9.2. Масс-спектрометр. Сначала исследуемое органическое соединение разрушается, а затем образовавшиеся частицы разделяются и регистрируются

Одной из наиболее важных черт генератора структур системы ДЕНДРАЛ является то, что его выход приводится в соответствие со списками возможных и запрещенных структур. Обычно список возможных структур составляется исключительно на основе анализа масс-спектрограммы. Список запрещенных структур, однако, формируется частично на основе масс-спектрограммы, а частично на основе априорных химических знаний относительно неустойчивых конфигураций. Например, следующие серосодержащие фрагменты никогда не встречаются в устойчивых химических соединениях, и, следовательно, они составляют часть списка запрещенных подструктур:


Исходный список запрещенных структур всего содержит около двух десятков таких элементов. Этот начальный список сам по себе является источником серьезных ограничений. При формуле С8Н]вО может существовать несколько тысяч ациклических, согласующихся по валентности структур, но с учетом начального списка неустойчивых, запрещенных структур на выходе генератора появляется лишь 698 структур.

Анализ экспериментальной масс-спектрограммы помогает образованию структур-кандидатов

Конечно, число структур меньше, когда списки запрещенных и возможных структур пополняются путем исследования спектрограмм и выделения на них характерных максимумов. Спектрограмма, показанная на рис. 9.1, приводит, например, к тому, что в список возможных структур помещается n-пропилкетон-3, поскольку оказываются выполненными условия для следующей продукции:

Если имеется высокий пик в точке с отношением атомного 
     числа к заряду, равным 71, 
     имеется высокий пик в точке с отношением атомного 
     числа к заряду, равным 43, 
     имеется высокий пик в точке с отношением	атомного 
     числа к заряду, равным 86, 
     и имеется какой-нибудь пик в точке с отношением атомноного числа к заряду, равным 58, 
тогда должна присутствовать подструктура n-пропилкетон-3. 

Для каждой категории органических веществ, например кетонов или эстрогенов, имеется от шести до десяти таких правил. Некоторые приводят к пополнению списка требуемых под структур, а другие к пополнению списка запрещенных под структур, в зависимости от присутствия или отсутствия пиков. Результатом ограничений, которые вытекают из масс-спектрограммы, является снижение числа возможных структур для С8Н16О с 698 до более приемлемого списка, примерно сорока структур, содержащих кетоны. Таким образом, информация, скрытая в масс-спектрограмме, объединенная с априорным знанием, касающимся устойчивости соединений, приводит к уменьшению числа возможных структур от тысяч до десятков.

Синтез масс-спектрограммы для каждого кандидата помогает выбрать наилучшего

Далее ответ должен быть найден среди указанных десятков возможностей, поскольку очевидно, что теория исследования масс-спектрограммы не поставляет достаточно ограничений, чтобы завершить всю работу. Это делается другим специалистом, который располагает другой формой экспертной информации, на этот раз касающейся того, каким образом разрушаются структуры в масс-спектрометре. Воспользовавшись этим специалистом, система способна предсказать спектрограммы для каждого кандидата, которые в дальнейшем можно было бы сопоставить с экспериментально полученной масс- спектрограммой.

В этом устройстве предсказания масс-спектрограмм знания также хранятся в форме продукций. Та часть каждой продукции, которая ответственна за распознавание ситуации, опознает тот кусок, который известен продукции, а часть, связанная с действием, определяет продукты декомпозиции и параметр, показывающий, какой процент вещества будет претерпевать такую декомпозицию. В каком-то смысле эти функции памяти системы продукций аналогичны действию камеры, разрушающей молекулы в масс-спектрографе. Всего к настоящему моменту для этой цели было собрано около 100 продукций. Ясно, что использован громадный объем знаний из области химии.

Если мы достигли момента, когда мы располагаем некоторым множеством пар "спектрограмма - структура", то остается лишь определить подходящую функцию для принятия решения о том, насколько хорошо синтезированные спектрограммы соответствуют экспериментальной. Самым простым методом, разумеется, было бы простое измерение суммы квадратов разности высот пиков, т. е. применение стандартной меры измерения различия сигналов.

В действительности способ сопоставления, используемый в системе ДЕНДРАЛ, сложнее, поскольку необходимо отразить тот факт, что одни пики оказываются более важными, чем другие. Используемая процедура характеризуется следующими этапами:

  • В некоторых продукциях разложения определенные результаты помечены как наиболее существенные.
  • Если в экспериментальной спектрограмме нет помеченного пика, то та структура, из которой вытекало предсказание этого значащего пика, сразу же отбрасывается.
  • Затем остающиеся спектрограммы ранжируются в соответствии с тем, сколько экспериментальных пиков они объясняют. Неоднозначность при этом возникает редко.

Эта процедура позволяет отсеять почти все структуры, остаются лишь очень немногие. В случае С8Н16О выживает только одна структура, а именно следующая:


предыдущая главасодержаниеследующая глава








© Злыгостев А.С., 2001-2019
При использовании материалов сайта активная ссылка обязательна:
http://informaticslib.ru/ 'Библиотека по информатике'
Рейтинг@Mail.ru
Поможем с курсовой, контрольной, дипломной
1500+ квалифицированных специалистов готовы вам помочь