Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Компьютерный прогноз биотрансформации ксенобиотиков Рудик Анастасия Владимировна

Компьютерный прогноз биотрансформации ксенобиотиков
<
Компьютерный прогноз биотрансформации ксенобиотиков Компьютерный прогноз биотрансформации ксенобиотиков Компьютерный прогноз биотрансформации ксенобиотиков Компьютерный прогноз биотрансформации ксенобиотиков Компьютерный прогноз биотрансформации ксенобиотиков Компьютерный прогноз биотрансформации ксенобиотиков Компьютерный прогноз биотрансформации ксенобиотиков Компьютерный прогноз биотрансформации ксенобиотиков Компьютерный прогноз биотрансформации ксенобиотиков Компьютерный прогноз биотрансформации ксенобиотиков Компьютерный прогноз биотрансформации ксенобиотиков Компьютерный прогноз биотрансформации ксенобиотиков
>

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Рудик Анастасия Владимировна. Компьютерный прогноз биотрансформации ксенобиотиков : диссертация ... кандидата биологических наук : 03.00.28.- Москва, 2007.- 184 с.: ил. РГБ ОД, 61 07-3/1109

Содержание к диссертации

Введение

ГЛАВА 1. Обзор литературы 10

1.1. Экспериментальные методы исследования метаболизма веществ 10

1.1.1. Методы оценки метаболической стабильности in vitro 10

1.1.2. Определение структуры метаболитов 10

1.1.3. Определение метаболизирующих ферментов 11

1.2. Способы описания структурной химической информации 11

1.3. Дескрипторы 15

1.4. Форматы описания структуры химических соединений 16

1.4.1. Формат MDL Elsevier 16

1.4.2. Формат SMILES 19

1.4.3. Формат InChI 20

1.5. Компьютерные методы прогноза биотрансформации 21

1.5.1. Методы молекулярного моделирования 21

1.5.2. Квантово-химические методы 24

1.5.3. Метод нейронных сетей 25

1.5.4. ДСМ метод 26

1.5.5. Методы, прогнозирующие продукты биотрансформации 27

A. Эмпирический подход 28

Описание трансформационных преобразований 28

Поиск и замена фрагмента в структуре химического соединения 32

Оценка полученных продуктов 34

Критерий останова процесса генерации метаболитов 36

B. Неэмпирические подходы 37

Подход, основанный на BE матрицах 37

Метод программы SYNGEN 40

ГЛАВА 2. Материалы и методы 43

База данных Metabolite (Elsevier, MDL) 43

База данных Metabolism (Accelrys) 44

2.1. Метод генерации продуктов биотрансформации 47

2.1.1. Словарь фрагментов 47

2.1.2. Алгоритм поиска и замены фрагмента в структуре химического соединения .50

2.2. Метод прогноза типов биотрансформации 53

2.2.1. Формализация названий типов биотрансформации 53

2.2.2. Дескрипторы MNA 54

2.2.3. Алгоритм программы PASS 56

2.2.4. Анализ точности прогноза 58

2.3. Метод прогноза сайтов биотрансформации 58

2.3.1. Дескрипторы RMNA 58

Глава 3. Результаты и обсуждение 60

3.1. Метод компьютерного прогноза типов биотрансформации ксенобиотиков 60

3.1.1. Создание обучающих выборок, содержащих структуры веществ и данные о типах биотрансформации 60

3.1.2. Исследование применимости алгоритма PASS для прогноза типов биотрансформации 61

3.2. Метод компьютерного прогноза сайтов биотрансформации 69

3.2.1. Создание обучающих выборок, содержащих структуры веществ и данные о сайте биотрансформации 69

3.2.2. Исследование применимости алгоритма PASS для прогноза сайтов биотрансформации и метаболитов 71

ГЛАВА 4. Проверка устойчивости алгоритма прогноза 74

ГЛАВА 5. Интерфейс программы Metapredict 80

ГЛАВА 6. Заключение 84

Выводы 85

Благодарности 85

Список литературы

Введение к работе

Стремительные темпы развития промышленности приводят к появлению огромного количества разнообразных химических соединений, постоянно загрязняющих биосферу и пагубно влияющих на живую природу. Эти вещества могут взаимодействовать друг с другом, образуя новые соединения с неизвестными токсикологическими характеристиками [1].

Чужеродные для организма соединения (которые не используются ни для производства энергии, ни для выработки тканевых компонентов, не являются химическими посредниками или кофакторами) называют ксенобиотиками (от греч. хепо -чужой) [2,3].

Рисунок 1. Метаболическая сеть нитразепама.

Биохимический процесс изменения структуры соединения под действием ферментной системы получил название биотрансформации или метаболизма веществ [2, 4, 5]. Исходное соединение называют «субстрат биотрансформации», получившийся продукт - «метаболит биотрансформации». Один субстрат, как правило, преобразуется не в один, а в несколько метаболитов, в результате чего получается метаболическая сеть, пример которой для нитразепама - психотропного лекарственного вещества из ряда бенздиазепинов, - приведен на рисунке 1 [6].

Интерес к биотрансформации органических ксенобиотиков, среди которых лекарства занимают особое место по важности для человека и по контролю за их безопасностью, вызван многими причинами. Образующиеся в результате реакции биотрансформации метаболиты могут быть более токсичными, чем исходные соединения, или проявлять нежелательные побочные эффекты, а могут быть и более фармакологически активными.

Примеры возможных путей биотрансформации приведены ниже:

  1. Инактивация, в течение которой активное лекарство преобразуется в неактивный метаболит. Пример - фенобарбитал (обладающий противосудорожным, снотворным действием) в ходе реакции гидроксилирования превращается в гидроксифенобарбитал [7].

  2. Активация, в течение которой неактивное лекарство (пролекарство) преобразуется в фармакологически активный первичный метаболит. Примером может служить гетацилин (Hetacillin) в исходном состоянии не обладающий антибактериальной активностью, а после гидролиза преобразующийся в антибиотик ампицилин (Ampicillin) [8,9].

  3. Модификация активности, после превращения активного лекарства в метаболит, который также обладает фармакологической активностью. Например, морфий (Morphine) (анальгетик) после реакции глюкуронидации метаболизируется в морфий-6-глюкоронид (M6G) (Morphine-6-glucuronide) (анальгетик) [10, И].

  4. Интоксикация (летальный синтез), при которой образуются токсичные матаболиты. Например, парацетамол (Acetaminophen) после окисления превращается в токсичный нестабильный метаболит (N-ацетил-п-аминобензохинон) (NAPQI). При истощении запасов глютатиона, который его инактивирует, NAPQI связывается с белками плазмы с образованием комплексов, вызывающих некроз клеток [12-14].

Как правило, метаболизм ксенобиотиков проходит в две фазы. Реакции первой фазы обусловливают специфическую перестройку в молекуле субстрата с образованием функциональных групп [5]. Биотрансформация в ходе таких реакций обычно предшествует реакциям конъюгации (II фаза). Пример ферментных систем, ответственные за прохождение определенных реакций первой фазы биотрансформации, представлен в таблице 1 [4].

Таблица 1. Основные реакции и ферментные системы 1-ой фазы биотрансформации ксенобиотиков.

Вторую фазу (конъюгацию) выполняют, в основном, глюкоронозидтрансферазы, ацетилтрансферазы, сулфотрансферазы, метилтрансферазы, глютатионтрансферазы и аминокислотные трансферазы.

Исследование процесса биотрансформации включает анализ образующихся метаболитов, их стабильности, и определение ферментов, осуществляющих реакции биотрансформации, что важно для изучения зависимости от локализации в органах и тканях действия лекарств и исследования совместимости лекарственных средств.

Существующие экспериментальные методы in vitro и in vivo - сложный, дорогостоящий, трудоемкий и длительный процесс, возможности проведения экспериментов в клинике весьма ограничены, а результаты изучения биотрансформации in vitro и in vivo не всегда совпадают с таковыми для человека.

Компьютерные методы позволяют прогнозировать биотрансформацию и метаболиты органических соединений на основе химической структуры их молекул еще до проведения химического синтеза и биологического тестирования [15], что, благодаря сокращению количества соединений, которые будут подвергнуты биологическому тестированию, позволяет сократить время и затраты на разработку новых лекарств.

В настоящее время известно несколько компьютерных методов прогноза возможных путей биотрансформации органических ксенобиотиков [15-18]. Это, прежде всего, методы молекулярного моделирования. Они ориентированы на изучение механизмов взаимодействия определенных ферментов с субстратами. Основным их недостатком является продолжительность расчетов и необходимость использования мощных вычислительных ресурсов, что не приемлемо для высокопроизводительного скрининга. Помимо этого, необходимы данные о трехмерной структуре, как субстрата, так и фермента, информация о которых во многих случаях не доступна.

Экспертные системы для предсказания метаболизма основаны на формализации знаний экспертов и предсказывают возможные метаболические сети. Их недостатком является генерирование большого количества метаболитов, отсев которых также основан на экспертных знаниях, и, как правило, они не предсказывают ферменты, которые могут осуществлять реакции биотрансформации [17].

Определение метаболизирующих ферментов

Некоторые вершины мы можем пометить разными символами (например, указав тип атома), что даст нам возможность представить в виде графов структурные формулы любых соединений с гетероатомами.

Одной из наиболее широко используемых форм представления графов являются матрицы смежности. В них содержится информация о типах связей между атомами. Ниже приведен пример матрицы смежности для амида пропаргиловой кислоты.

В представленной матрице не содержится информация о типах атомов. Но её можно расширить, добавив информацию об атомах, которая будет содержаться в диагональных элементах. Из матрицы смежности можно получить другие матрицы, используемые для описания молекулярных структур, например, матрицы расстояний (каждый элемент ij в матрице расстояний представляет собой число ребер, соединяющих вершину / с вершиной j наикратчайшим путем), и матрицы, содержащие квантово-химические параметры, и т.д.

В большинстве случаев для решения конкретной задачи используется своя матрица. Например, BE (bond-electron) матрицы, которые будут рассмотрены ниже, используются в задачах генерации реакций.

Структурная формула характеризует атомный состав и структуру молекулы вещества. Однако реально вещество представляет собой смесь компонентов различного характера: различные конформации молекул различные ионные состояния молекул различные электронные состояния молекул различные таутомерные формы молекул и т.д. Эта смесь находится в динамическом квазиравновесии, и ее состав существенно зависит от внешних условий. Структурная же формула характеризует лишь одну компоненту, условно принимаемую за основную.

Более детальное описание молекулы можно получить только используя трехмерное (пространственное расположение атомов), четырехмерное (набор различных 3D конформации) или даже пятимерное представление о соединении [46]. Последнее представление относится к субстрат-ферментному взаимодействию и отражает пространственное изменение активного сайта фермента в процессе взаимодействия с субстратом.

Трехмерную структуру соединения можно получить с помощью многих компьютерных программ, которые используют различные методы расчета, такие, как молекулярную динамику, молекулярную механику или/и квантовую химию. Среди таких программ наиболее известны SYBYL (TRIPOS) [47], HyperChem (Hypercube) [48], SPARTAN (Wavefunction.) [49], и др. 1.3. Дескрипторы

Для того чтобы найти соотношение между свойством органического соединения и его структурой, последнюю необходимо представить в виде набора дескрипторов. Часто в качестве дескриптора выступает некий параметр, который рассчитывается из структурной формулы (молекулярный вес, число определенных атомов, связей или групп, молекулярный объем, частичные заряды на атомах, и т.д.). Главной задачей при прогнозе свойств химических соединений является выбор такого (желательно минимального) набора дескрипторов, который достаточен для описания заданного свойства [50].

Среди дескрипторов большую роль играют топологические индексы, которые выражают в численной форме топологию молекулярного графа. Первым и наиболее популярным из них стал индекс Винера, который представляет собой сумму топологических расстояний между всеми парами атомов углерода в молекуле. Математически этот индекс совпадает с полусуммой всех элементов матрицы расстояний: где gdiij) - расстояние между атомами; и у. Также широко используются индекс Балабана [51] и индекс связности Рандича [52].

Другие рассчитываемые дескрипторы можно разделить по дисциплинам. Например, это физико-химические дескрипторы (точка плавления, частоты в РЖ-спектрах, химические сдвиги в ЯМР спектрах, гадрофобность, растворимость, сорбция на границах раздела фаз и др.), квантово-химические дескрипторы (электронная плотность, энергия связи, HOMO, LUMO), и т.п.

Подструктурные или фрагментарные дескрипторы можно получить из структуры соединения без дополнительных расчетов, путем выделения определенных подструктур (например, -COO, -NH2, -ОН, С6Н5, и др.).

Одним из представлений подструктурных дескрипторов является бинарная строка, каждая ячейка которой содержит 0 или 1, что соответствует наличию или отсутствию в структуре соединения определенного фрагмента (рис. 4).

Алгоритм поиска и замены фрагмента в структуре химического соединения

Созданный словарь используется для генерации продуктов биотрансформации. Для этого производится поиск «фрагмента структуры субстрата» в структуре субстрата и если он найден, то производится его замена соответствующим «фрагментом структуры продукта», в результате чего генерируется структура продукта.

Чтобы избежать повторов и сделать словарь компактней, было принято решение не описывать все реакции биотрансформации, а создать иерархическую систему классификации и заносить в словарь фрагментов только самые нижние уровни.

Например, реакция биотрансформации «С-гидроксилирование» включает в себя «Ароматическое гидроксилирование» и «Алифатическое гидроксилирование». В словарь фрагментов заносятся только фрагменты реакций, относящихся к нижним уровням. При генерации продуктов реакции используются фрагменты всех нижестоящих реакций. Например, при генерации продуктов «С-гидроксилирования» используются фрагменты реакций «Ароматическое гидроксилирование» и «Алифатическое гидроксилирование».

В результате работы, проделанной совместно с химиком-экспертом, к.х.н. В.Г. Блиновой и аспирантом А.В. Дмитриевым, была построена система классификации реакций биотрансформации, основанная на следующих принципах: 1. Реакция биотрансформация относится к одной из 4 основных групп реакций: окисление, восстановление, конъюгация или гидролиз. 2. Внутри иерархии введены отношения «частное-общее» - верхний уровень включает в себя все реакции нижних уровней.

При прогнозе типов биотрансформаций структуры органических соединений описываются множеством дескрипторов многоуровневых атомных окрестностей MNA (Multilevel Neighborhood of Atoms) [99], разработанные в лаборатории структурно-функционального конструирования лекарств ГУ НИИ биомедицинской химии РАМН к.ф.-м.н. Д.А. Филимоновым.

Они основаны на представлении структурной формулы, в которой, согласно валентностям и зарядам атомов, явно указаны все водороды, и не учитываются типы связей. В таком виде структурная формула становится однозначной даже формально - она не зависит, например, от альтернативных способов изображения ароматических систем.

На основе описанного представления структурной формулы дескрипторы MNA для каждого атома молекулы строятся рекурсивно следующим образом: дескриптор MNA 0-го уровня - метка А самого атома; дескриптор MNA любого следующего уровня - это условное обозначение структурного фрагмента A(DiD2..Dj...), где Di - дескриптор MNA предыдущего уровня для /-го непосредственного соседа данного атома с меткой А.

Дескрипторы соседей DiD2..Dj... записываются в каком-нибудь однозначном порядке, например, лексикографическом.

Эта итерационная процедура может быть продолжена до любого уровня. Важно подчеркнуть, что метки атомов могут быть не только соответствующим символьным обозначением согласно таблице Менделеева, но и включать любую дополнительную информацию, например, о принадлежности атома к цепи или к какой-либо циклической системе, или что он является реакционным центром биотрансформации.

На рисунке 35 представлена структура никотиновой кислоты и её представление дескрипторами MNA. Метка"-" используется для обозначения атомов в цепях.

Компьютерная система PASS (Prediction of Activity Spectra for Substances - прогноз спектров биологической активности органических соединений) позволяет прогнозировать одновременно более 2500 видов биологической активности органических соединений по их структурным формулам [100, 101]. Алгоритм PASS основан на анализе взаимосвязей «структура-активность» с использованием обучающей выборки, содержащей большое количество разнородных химических соединений с различными видами биологической активности.

Биологическая активность представлена в PASS качественно в виде спектра биологической активности - комплекса всех биологических эффектов, которые органическое соединение способно вызвать при некоторых условиях взаимодействия с биологическими объектами, без учета особенностей конкретных экспериментов. Каждое соединение имеет список тех видов активности, которое оно способно проявить при соответствующих условиях. При этом в PASS принимается, что соединение не обладает теми видами биологической активности, которые не указаны в его спектре.

Для прогноза с помощью PASS может быть использован любой способ объективной классификации органических соединений: если соответствующие классы действительно определяются особенностями структуры молекул, то прогноз принадлежности к этим классам может быть вполне успешным. Поэтому применимость алгоритма PASS шире прогноза только спектра биологической активности и он может быть применен для прогноза типов биотрансформации.

Для прогноза в PASS используется SAR base, которая создается на основе анализа обучающей выборки, содержащей структурные формулы и спектры активности органических соединений. SAR base содержит словарь названий видов биологической активности, словарь дескрипторов MNA, описания структур и активностей веществ из обучающей выборки, данные и знания о взаимосвязях «структура-биологическая активность».

При включении органических соединений обучающей выборки в SAR base для каждой структурной формулы генерируются дескрипторы MNA. Если структура молекулы не полностью определена, то соединение не включается в SAR base. Если в SAR base обнаруживается эквивалентная структура, то существующий спектр активности вещества дополняется новыми активностями. Данные и знания о взаимосвязях «структура - биологическая активность» порождаются в ходе описанной ниже процедуры обучения.

Создание обучающих выборок, содержащих структуры веществ и данные о типах биотрансформации

Реакция биотрансформации идет по одному определенному положению в субстрате. Но, помимо реакционного центра, в субстрате могут быть и другие сайты, по которым возможно прохождение исследуемой химической реакции. Например, часто после прохождения реакции биотрансформации «Ароматическое гидроксилирование», метаболит образуется путем добавления гидроксила в пара- положение. Но в то же время, продукты химической реакции «Ароматическое гидроксилирование» будут образовываться и после добавления гидроксила в другие положения. Мы рассматриваем определенную химическую реакцию, и поэтому задача нахождения сайта биотрансформации для этой реакции является идентичной задаче нахождения метаболита этой реакции.

Задачей прогноза метаболитов, или по-другому сайтов биотрансформации, является выбор среди всех возможных продуктов химической реакции тех, которые с наибольшей вероятностью будут метаболитами. Из-за недостатка данных по метаболизирующим ферментам в БД, ферменты, катализирующие рассматриваемую химическую реакцию, не учитываются.

Задача прогноза метаболитов имеет принципиальную особенность: алгоритм PASS основан на том, что обучающая выборка состоит из положительных и отрицательных примеров. При прогнозе типов биотрансформации отрицательными примерами являются все субстраты в обучающей выборке, которые не являются субстратами реакций данного типа биотрансформации. Но для самих реакций биотрансформации доступные источники данных, как правило, содержат только «положительные примеры». В диссертационной работе положительными примерами являются известные метаболиты прогнозируемой реакции биотрансформации по данным БД Metabolite или/и Metabolism. Отрицательные примеры создаются автоматически. Для каждого субстрата из выборки генерируются продукты рассматриваемой химической реакции по всем гипотетическим центрам. Из полученных продуктов удаляются те, которые входят в состав положительных примеров. В результате проделанных операций получается выборка, состоящая только из отрицательных примеров. Возможно, что среди них будут содержаться продукты, которые на самом деле являются метаболитами, но так как сведения о них не содержатся в используемых базах данных, они не могут быть отнесены к положительным. Обучающие выборки для прогноза сайтов биотрансформации создавались двумя способами. В первом случае в качестве положительных примеров были взяты все метаболиты определенной биотрансформации (например, реакции «Алифатическое гидроксилирование») из базы данных. Во втором случае происходил автоматический отбор метаболитов. А именно - выделялись фрагменты структур субстрата и метаболита, изменяющиеся во время реакции. После этого выделенный фрагмент сравнивался с существующими в словаре фрагментов реакций. Если искомый фрагмент был найден, то данный продукт брался в качестве положительного примера. Эта процедура проводилась для отсечения метаболитов, образующихся после прохождения нескольких реакций. Отрицательные примеры генерировались автоматически (см. выше). Состав выборок приведен в таблицах 15 и 16.

Алгоритм прогноза сайтов биотрансформации идентичен алгоритму прогноза типов биотрансформации (см. выше).

В ходе обучения на основе обучающей выборки порождается база знаний SAR base, содержащая данные о взаимосвязях «субстрат - метаболит».

Для нового субстрата генерируются все возможные продукты определенной химической реакции, и для пары «субстрат-продукт» формируется набор дескрипторов RMNA, и рассчитываются величины Pt и Pf - вероятности того, что сгенерированный продукт может (Pt) и не может (Pf) быть метаболитом.

Как и в случае прогноза типов биотрансформации, нами был проведен эксперимент по выбору оптимального уровня дескрипторов для прогноза сайтов биотрансформации. В таблице 17 представлена точность прогноза сайтов биотрансформации четырех реакций биотрансформации для выборок на основе БД Metabolite при трех уровнях дескрипторов RMNA. Эти реакции биотрансформации были выбраны по следующим причинам -большое количество положительных примеров (более 1000) и относительно небольшое количество фрагментов реакций, их описывающих (менее 10).

Из таблицы 17 видно, что для прогноза метаболитов биотрансформации «Ароматическое гидроксилирование» лучше всего использовать четвертый уровень дескрипторов, а для остальных, напротив, дескрипторы RMNA4 дают наихудший результат. Это связано с тем, что при прогнозе ароматического гидроксилирования необходимо учитывать большее количество соседей, чтобы учесть ароматическое кольцо целиком, а для других реакций информации о ближайших соседях реакционного центра более чем достаточно для прогноза.

Ухудшение точности почти для всех реакций в случае отбора положительных примеров можно объяснить тем, что, получая более «чистую» выборку, мы можем потерять часть положений, по которым пойдет реакция (например, если этот сайт реакции указан совместно с сайтом другой реакции). Если не производится отбор положительных примеров реакций, то сайты других реакций вносят свой вклад в дескрипторы, что может влиять на точность прогноза в большую сторону (отличать положительные реакции от отрицательных становится проще).

В таблице 18 приведен пример результатов прогноза положения ароматического гидроксилирования для ХС (рис. 38) при использовании обучающей выборки без отбора положительных примеров.

Все продукты были сгенерированы автоматически, после чего для них был выполнен прогноз. Серым цветом выделены ячейки, в которых находятся экспериментально найденные метаболиты этого субстрата (есть информация в БД).

Создание обучающих выборок, содержащих структуры веществ и данные о сайте биотрансформации

В ходе диссертационной работы разработана программа "MRTAPREDICT" для прогноза биотраисформации органических ксенобиотиков (язык программирования: Object Pascal в среде Delphi; ОС: Windows 2000/XP/NT).

Первая часть программы - прогноз типов биотрансформации, - была официально зарегис фирована Ростпатентом (регистрационный № 2004610666). Входная информация программы - структурная формула органического соединения в формате Molfile Elsevier MDL (раздел 1.4.1). Выходная информация - список наиболее вероятных типов биотрансформации. Каждый тип биотрансформации включает название реакции биотрансформации, также может быть указана изоформа фермента или семейство ферментов, участвующих в биотрансформации.

Вторую часть программы составляет генерация метаболитов для предсказанных типов биотрансформаций и расчет вероятности их образования. При первом запуске программы она выглядит следующим образом (рис. 41): Главное окно программы METAPredict. Левый верхний угол предназначен для отображения структуры субстрата или реакции, нижний левый - для дополнительной информации о структуре, а правая часть окна - для результатов прогноза.

Чтобы получить возможность спрогнозировать биотрансформацию органического соединения, необходимо загрузить базу знаний SAR base, содержащую информацию о взаимосвязях «структура-тип биотрансформации».

После того, как база знаний SAR base загружена, можно выполнить прогноз для органических соединений (может быть открыт либо .mol файл, содержащий одну структуру ХС, либо „sdf файл, содержащий набор структур). Если файл не содержит ошибок, то в лево-верхней ячейке окна программы появляется структурная формула соединения, в правой - результат прогноза типов биотрансформации (рис. 42).

Результат прогноза - список возможных типов биотрансформации для данного соединения. Величина Р, является оценкой вероятности, что соединение подвергнется данной биотрансформации, Pf - оценкой вероятности, что соединение не подвергнется данной биотрансформации. На рисунеке 42 видно, что для некоторых типов биотрансформации спрогнозированы также конкретные изоформы фермента.

После того, как выполнен прогноз по типам биотрансформации, можно сгенерировать продукты соединения для определенной реакции биотрансформации и подсчитать вероятность того, что эти проудукты будут метаболитами. Для этого необходимо загрузить базу знаний SAR base, содержащую информацию о взаимосвязях «субстрат - сайт биотрансформации» и указать путь к словарю трансформаций. Результат генерации метаболитов выдается пользователю в следующем виде (рис. 43).

В левом верхнем окне представлена структура субстрата, в правом верхнем -структура метаболита, в правом нижнем окне указана разность вероятностей Р.-Р,-(вероятность, что образуется данный метаболит, минус вероятность, что он не образуется) для определенной реакции биотрансформации (в данном примере для алифатического гидроксилирования), профиль прогноза классов биотрансформации, идентификатор структуры и шаг метаболизма.

Окно с результатами генерации метаболитов программы METAPRED1CT. Структуры сгенерированных метаболитов и информация о них сохраняются в отдельный файл, который затем может быть использован для дальнейшего прогноза.

Таким образом может быть построена метаболическая сеть для любого интересующего соединения.

Помимо выполнения прогноза в программе можно создавать базы знаний, выбирая уровень используемых дескрипторов, создавать обучающие и тестовые выборки для генерации метаболитов, выбирать прогнозируемые классы биотрансформаций, и т.д.

В результате выполненной работы был создан метод и компьютерная программа METAPredict для прогноза биотрансформации лекарственных соединений. В основу системы положен метод анализа связей «структура-активность», используемый в программе PASS (Prediction of Activity Spectrum for Substances). Созданная программа METAPredict позволяет прогнозировать типы биотрансформации, где, помимо названия реакции биотрансформации, используются названия семейств ферментов и изоферментов. Эта информация важна как для изучения поведения органических ксенобиотиков в различных органах и тканях, так и для исследования совместимости лекарственных средств.

Помимо этого для некоторых реакций биотрансформации генерируются метаболиты и оценивается вероятность их образования. Основу метода генерации метаболитов составляет разработанный и созданный в полуавтоматическом режиме словарь фрагментов реакций, отражающий структурные изменения в субстрате в ходе реакции биотрансформации.

Созданная программа METAPredict может быть использована на ранних этапах разработки лекарственных препаратов с целью оптимизации экспериментальных исследований соединений.

Программа METAPredict (прогноз классов биотрансформации, язык программирования: Object Pascal в среде Delphi; ОС: Windows 98/XP/NT) официально зарегистрирована в РОСПАТЕНТЕ за номером 2004610666.