Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Программный комплекс для прогнозирования свойств сложных органических соединений на основе анализа неоднозначных зависимостей "структура-свойство" Боридко Владимир Станиславович

Программный комплекс для прогнозирования свойств сложных органических соединений на основе анализа неоднозначных зависимостей
<
Программный комплекс для прогнозирования свойств сложных органических соединений на основе анализа неоднозначных зависимостей Программный комплекс для прогнозирования свойств сложных органических соединений на основе анализа неоднозначных зависимостей Программный комплекс для прогнозирования свойств сложных органических соединений на основе анализа неоднозначных зависимостей Программный комплекс для прогнозирования свойств сложных органических соединений на основе анализа неоднозначных зависимостей Программный комплекс для прогнозирования свойств сложных органических соединений на основе анализа неоднозначных зависимостей Программный комплекс для прогнозирования свойств сложных органических соединений на основе анализа неоднозначных зависимостей Программный комплекс для прогнозирования свойств сложных органических соединений на основе анализа неоднозначных зависимостей Программный комплекс для прогнозирования свойств сложных органических соединений на основе анализа неоднозначных зависимостей Программный комплекс для прогнозирования свойств сложных органических соединений на основе анализа неоднозначных зависимостей Программный комплекс для прогнозирования свойств сложных органических соединений на основе анализа неоднозначных зависимостей Программный комплекс для прогнозирования свойств сложных органических соединений на основе анализа неоднозначных зависимостей Программный комплекс для прогнозирования свойств сложных органических соединений на основе анализа неоднозначных зависимостей
>

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Боридко Владимир Станиславович. Программный комплекс для прогнозирования свойств сложных органических соединений на основе анализа неоднозначных зависимостей "структура-свойство" : диссертация ... кандидата технических наук : 05.13.16.- Москва, 2000.- 106 с.: ил. РГБ ОД, 61 01-5/1308-1

Содержание к диссертации

Введение

Глава 1. Анализ методов исследования зависимостей "структура - свойство" для сложных органических соединений 6

1.1 Традиционные методы исследования зависимостей «структура-свойство» 6

1.2 Исследования зависимостей «структура-свойство» для конформационно гибких соединений 11

1.3 Математические методы построения моделей зависимости "структура - свойство" 12

1.4 Прогнозирование свойств сложных органических соединений на основе исследования неоднозначных зависимостей "структура - свойство" 15

Краткие выводы 17

Глава 2. Алгоритмы формирования гипотез о неоднозначных зависимостях "структура - свойство" 18

2.1 Алгоритмы выбора значимых индексов 18

2.2 Построение гипотез об интервалах значений активности нового вещества 25

2.3 Методика прогнозирования свойств сложных органических соединений на основе установления неоднозначных зависимостей «структура-свойство» 30

Краткие выводы 32

Глава 3. Программный комплекс для прогнозирования свойств сложных органических соединений на основе установления неоднозначных зависимостей «структура-свойство» 33

3.1 Назначение и архитектура комплекса. Выбор среды реализации 33

3.2 Фиксация двумерной структуры молекул отобранных соединений. Генерация трехмерных структур исследуемых молекул 36

3.3 Оптимизация трехмерных структур молекул отобранных соединений по энергетическим критериям. Расчет индексов 37

3.4 Выбор энергетически приемлемых конформеров. Подготовка данных для формирования гипотез 39

3.5 Выбор значимых индексов 40

3.6 Построение гипотез о зависимости «структура - свойство». Тестирование гипотез методом скользящего контроля 42

Краткие выводы 44

Глава 4. Применение программного комплекса для прогнозирование интервалов значений свойств сложных органических соединений 45

4.1 Прогнозирование анти-вич активности ненуклеозидных ингибиторов обратной транскриптазы 45

4.2 Прогнозирование хроматографической активности производных порфирина 52

4.3 Прогнозирование степени адсорбции и максимума поглощения тиамонометинцианинов 55

Краткие выводы 58

Заключение 59

Литература '61

Введение к работе

Одной из наиболее актуальных проблем в области химической и биотехнологии остается направленный синтез химических соединений, позволяющий значительно сократить стоимость исследований и ускорить путь от ряда структур соединений к целевому лекарственному препарату. Прогнозирование таких свойств новых, еще не синтезированных химических соединений, как токсичность, физиологическая и фармакологическая активность и т.п., как правило, выполняется на базе гипотез о зависимости между свойствами веществ и особенностями структуры их молекул. Такие гипотезы могут быть сформированы специалистами-химиками на основе выявления механизмов взаимодействия химических соединений, связанных с проявлениями анализируемого свойства, однако этот путь, в свою очередь, требует долгих и дорогостоящих исследований. Альтернативный подход на протяжении ряда лет развивается на стыке исследований в области химической технологии и прикладной математики и связан с анализом сведений об уже синтезированных и исследованных молекулах соединений того же класса. Наибольшее распространение получили методы, основанные на анализе двумерной структуры молекулы, в частности, на выделении отдельных структурных элементов молекулы. Развитие методов, связанных с расчетом параметров трехмерной структуры молекул, тормозилось в первую очередь недостаточной мощностью средств вычислительной техники. Выполнение таких расчетов за приемлемое время стало возможным совсем недавно. Кроме того, исследование трехмерной структуры молекул требует рассмотрения всего множества пространственных структур, соответствующих одной и той же двумерной структуре, что приводит к неоднозначной зависимости между параметрами, описывающими исследуемые молекулы, и свойствами соответствующих соединений.

В диссертационной работе предложены и реализованы методы построения гипотез о причинно-следственных зависимостях между множеством энергетически приемлемых трехмерных структур молекул сложных органических соединений и свойствами этих соединений.

Целью работы является разработка программных средств для прогнозирования свойств еще не синтезированных органических соединений на основе построения гипотез о неоднозначных причинно-следственных зависимостях между множеством

энергетически приемлемых трехмерных структур молекул и свойствами соответствующих соединений.

В этом плане ставятся и решаются следующие задачи:

анализ методов формирования множества энергетически приемлемых трехмерных структур молекул и расчета структурных и квантово-химических параметров таких структур (индексов);

разработка алгоритмов отбора значимых индексов с учетом неоднозначности зависимости «структура-свойство»;

разработка методики построения гипотез об интервальной зависимости значений исследуемого свойства от значений отобранных индексов;

разработка программного комплекса, реализующего предложенную методику прогнозирования интервальных значений свойств сложных органических соединений;

реализация и внедрение разработанного программного комплекса.

В основу выполненных в работе исследований положены методы решения задач условной оптимизации, парной линейной регрессии, анализа энергетических характеристик трехмерных структур молекул, расчета структурных и квантово-химических параметров молекул.

В диссертационной работе автором получены следующие научные результаты:

разработаны алгоритмы отбора значимых индексов для исследования неоднозначных зависимостей "структура-свойство" для сложных конформационно-лабильных органических соединений;

разработана методика прогнозирования интервала количественных значений исследуемого свойства на основе множества значений индексов;

разработаны алгоритмы реализации предложенной методики с использованием стандартных оптимизационных программ.

Практическая значимость полученных в работе результатов заключается в следующем:

разработан и реализован программный комплекс анализа неоднозначных зависимостей "структура - свойство" для сложных конформационно-лабильных органических соединений;

выполнено прогнозирование биологической активности анти-ВИЧ препаратов -производных тетрагидроимидазобензодиазипенона и фенилэтилтиазолилтиомочевины;

выполнено прогнозирование степени адсорбции и максимума поглощения тиамонометинцианинов;

сформированы гипотезы о хроматографической подвижности порфиринов.

Исследования порфиринов выполнены в рамках Международной программы по созданию фотосенсибилизаторов для фотодинамической терапии рака совместно с институтом Биомедицинской химии РАМН.

Основные результаты работы докладывались и обсуждались на международной научной конференции "Математические методы в технике и технологиях - 12", Великий Новгород, 1999, международной научной конференции «Process Control-99», Словакия, Братислава, 1999, международной научной конференции «СПИД, рак и родственные проблемы», Санкт-Петербург, 2000.

Разработанный программный комплекс награжден дипломом научно-практической выставки «Информационные технологи в науке», Москва, ВВЦ, 2000.

Полученные в работе результаты изложены в 6 опубликованных работах.

Математические методы построения моделей зависимости "структура - свойство"

После отбора индексов (дескрипторов), предположительно связанных с исследуемой активностью, выполняется следующий этап, связанный с построением модели зависимости "структура-свойство". Существует две основных группы методов, позволяющих получить такую модель: корреляционные методы и методы, основанные на методах распознавания образов.

Корреляционные методы основаны на попытках построить корреляционную зависимость между изменениями наблюдаемой активности и изменениями в структурах молекул, описываемыми значениями индексов (дескрипторов), для структурно сходных соединений. Эти методы применяются в традиционном варианте QSAR. В идеале при использовании корреляционных методов удается построить функцию, связывающую значения каких-либо индексов со значением активности - модель активности (свойства), которая в общем виде выглядит так:

Для получения модели активности при этом применяются различные методы математической обработки данных, такие как различные варианты регрессионного анализа, дискриминационный анализ, метод главных компонент и метод "частичных наименьших квадратов". Наибольшее распространение получили регрессионные методы, однако при применении регрессионного анализа не всегда удается получить хорошую модель. Причин для этого может быть несколько, например, нелинейность исследуемой зависимости между структурой и свойством (активностью), или комбинаторные затруднения проверить все возможные наборы параметров [18]. Кроме того, корреляционные методы неприменимы в случаях, когда учитывается конформационная гибкость молекул, так как при этом появляется неоднозначность соответствия "значение активности - значения индексов", так как при этом одному значению активности вещества (макросостяние) соответствует несколько значений индексов, зависящих от трехмерной структуры молекулы (микросостояния).

Для получения моделей зависимостей "структура-свойство" в тех случаях, когда исследуются такие зависимости для структурно несходных соединений или когда корреляционные методы не работают, используют методы, которые можно объединить под понятием методы "распознавания образов" (pattern recognition). В этих методах сопоставляются исследуемые соединения с тем, чтобы выяснить, что общего есть у веществ с близкой (высокой или низкой) активностью и наоборот, чем различаются вещества с высокой и низкой активностью. К этим методам можно отнести, например, CoMFA, метод "активных аналогов", нейронные сети, эволюционное программирование, метод образов общей реакционной способности и т.д.

Метод CoMFA основан на предположении, что постольку поскольку большинство взаимодействий между лигандом и рецептором (микро и макромолекулой) изначально не валентные, а стерические или зарядовые, то изменения в биологической активности должны быть связаны со стерическими и электростатическими полями вокруг молекулы лиганда и рецептора [26]. Для того чтобы получить численное представление этих полей, используется следующая методика: 1. Молекулы соединений, проявляющих одинаковую активность, оптимизируются полу- или неэмпирическими методами с целью рассчитать атомные заряды и другие электронные характеристики. 2. Молекулы накладываются друг на друга путем совмещения одинаковых фрагментов в их структурах (так называемые реперные точки). 3. Полученный агломерат помещается в пространственную решетку, узлы которой расположены с некоторьм фиксированным шагом. 4. Электростатические и стерические поля вокруг наложенных друг на друга молекул оцифровываются путем помещения в каждый узел решетки так называемого пробного атома, обычно атома углерода - в каждом узле рассчитываются силы, действующие на пробный атом. Получается таблица, описывающая поля вокруг молекул. Эта таблица затем подвергается математической обработке с тем, чтобы выявить, какие особенности поля ответственны за проявление активности или ее отсутствие. Метод CoMFA удобен для описания сложных с точки зрения механизма взаимодействий, например, ингибирование ферментов, взаимодействие рецепторов с их агонистами и антагонистами, противовирусную активность, онкогенные и токсикологические свойства соединений. Недостатком метода CoMFA является тот факт, что выбор реперных точек для наложения молекул каждый раз приходится осуществлять вручную и нет общей методики для их выбора. Кроме того, метод не учитывает конформационное разнообразие молекул.

Метод "активных аналогов", в отличие от CoMFA, рассматривает не один наиболее энергетически выгодный конформер, а несколько энергетически приемлемых конформеров, которые накладываются друг на друга, с целью выяснить структурное сходство между различными конформерами активных соединений при таком "наложении" [18]. В конечном счете сходство измеряется величинами расстояний между активными центрами, общими для исследуемых активных аналогов.

Так называемые эвристические методы (эволюционные алгоритмы, нейронные сети) используют разнообразные алгоритмы для понижения размерности исходного набора индексов. Методы дают хорошие результаты, однако для них характерны большие объемы вычислений и очень медленное достижение "глобального минимума", то есть нахождения такого набора индексов, который наилучшим образом описывает исследуемое свойство рассматриваемых соединений. Кроме того, появление в исследуемом наборе веществ новых веществ приводит к необходимости повторения процедуры обучения нейронных сетей или нового перебора разных наборов индексов для эволюционных алгоритмов.

Наконец, существуют методы, основанные на статистически вычисляемых критериях информативности или кластерном анализе. В качестве критериев информативности индексов могут рассматриваться так называемые метрики (рейтинги) подобия, которые отражают, насколько хорошо данный индекс (дескриптор) объединяет соединения с одинаковой (или близкой) активностью. Существуют также метрики, показывающие насколько хорошо тот или иной индекс (дескриптор) разделяет вещества с высокой и с низкой активностями. В принципе вычисление метрик подобия обычно происходит гораздо быстрее, чем стандартные процедуры и позволяет подобрать необходимые индексы, однако результаты обычно хуже, чем при применении более сложных методов, описанных выше.

В диссертационной работе предлагается новый подход к изучению зависимостей "структура - свойство", основанный на выявлении и анализе причинно-следственных взаимосвязей между параметрами молекул и исследуемой активностью. Такой подход основан на учете параметров всех энеретически приемлемых конформеров и позволяет описывать неоднозначные зависимости "структура - свойство" как взаимосвязь между интервалом значений параметра и интервалом значений свойства.

Методика прогнозирования свойств сложных органических соединений на основе установления неоднозначных зависимостей «структура-свойство»

Эта целевая функция линейна по параметрам и мы пришли к задаче линейного программирования, которая может быть решена симплекс - методом.

Начальные приближения параметров с і , сг и d выбираются равными начальным приближениям минорантно - мажорантной модели.

Таким образом, если удается использовать все три линейные модели (разделительную, минорантно - мажорантную и «минимакс - максимин») и получить соответствующие интервалы предсказываемой активности для одного дескриптора, то окончательно для этого дескриптора границы интервала активности определяются следующим образом: АтНов - это максимальное значение из левых границ этих интервалов, а Амнов - это минимальное значение из правых границ этих интервалов. Геометрически эту процедуру можно интерпретировать так: необходимо расположить полученные интервалы на числовой оси и выбрать внутри них такой подинтервал, который принадлежит всем этим интервалам. Границы этого подинтервала и будут значениями АтН0в и АМнов Следует заметить, что только минорантно - мажорантная модель может быть использована тогда, когда разделительная линия будет нелинейной (например, экспоненциальной).

Проведя те же вычислительные процедуры для всех имеющихся дескрипторов, получим множество значений Атн0в и Амнов- Выбирая максимальное значение из всего множества минимальных Атнов и минимальное из множества максимальных Амнов» получим искомый интервал значений предсказываемой активности. Методика прогнозирования свойств сложных органических соединений на основе установления неоднозначных зависимостей «структура-свойство» включает в себя два этапа: формирование и проверку гипотез о зависимостях "структура - свойство"; прогнозирование интервалов значений свойств соединений, входящих в тестовую выборку. При установлении гипотез последовательно осуществляются следующие действия: подбор обучающей выборки; фиксация в программной среде двумерных структур молекул отобранных соединений; построение трехмерных структур молекул отобранных соединений; оптимизация трехмерных структур молекул отобранных соединений по энергетическим критериям; расчет индексов для оптимизированных структур молекул отобранных соединений (конформеров); выбор энергетически приемлемых конформеров; выбор значимых индексов; построение гипотез о зависимости «структура - свойство»; тестирование полученных гипотез. При построении прогнозов для тестовой выборки последовательно осуществляются следующие действия: фиксация в программной среде двумерных структур молекул соединений, входящих в тестовую выборку (тестовых соединений); построение трехмерных структур молекул тестовых соединений; оптимизация трехмерных структур молекул тестовых соединений по энергетическим критериям; расчет индексов для конформеров тестовых соединений; расчет интервалов значений свойства для тестовых соединений. В том случае, если для тестовых соединений имеются экспериментальные данные об их активности, возможна проверка полученных результатов. В том случае, если экспериментально установленное значение активности попадает в интервал прогнозирования, результаты считаются удовлетворительными; в противном случае требуется дополнительная проверка построенных гипотез с учетом состава обучающей и тестовой выборки. Реализация отдельных этапов предложенной методики будет подробно рассмотрена в следующей главе. Программный комплекс разработан для поддержки методики прогнозирования свойств сложных органических соединений на основе установления неоднозначных зависимостей «структура-свойство». Комплекс основан на алгоритмах, представленных в главе 2, и обеспечивает: построение и отбор энергетически приемлемых трехмерных структур молекул (конформеров); расчет структурных и квантово-химических параметров конформеров; отбор значимых индексов; построение гипотез об интервальной зависимости значений исследуемого свойства от значений отобранных индексов; тестирование полученной гипотезы методом скользящего контроля; построение интервалов значений свойства для тестовых соединений. Исходными данными для комплекса являются количественные значения активности соединений из обучающей выборки и сведения о двумерной структуре молекул этих соединений. Результатом работы комплекса являются: гипотезы о зависимости "структура - свойство", построенные для соединений обучающей выборки; интервалы значений исследуемой активности для соединений тестовой выборки.

Гипотеза о зависимости "структура - свойство" представляют собой конъюнкцию гипотез о причинно - следственных зависимостях между интервалами значений отдельных индексов и значениями активности. Каждая из таких гипотез, в свою очередь, представляет собой двухлинейную модель, описанную в п.2.2.

Требования к среде реализации программного комплекса основаны на вышеперечисленных особенностях его функционирования. Так, среда реализации комплекса должна обеспечивать, с одной стороны, развитые и удобные для пользователя средства генерации и анализа численных интервалов, а также средства решения задач условной оптимизации, с другой стороны, средства фиксации двумерной и трехмерной структуры молекулы и средства расчета структурных и квантово-химических параметров молекулы.

Найти среду программирования, удобную для реализации всех компонент программного комплекса, на практике не удалось. Поэтому было принято решение использовать для разработки комплекса интегрированную среду, причем часть задач, связанная с формированием гипотез, выполнялась бы в рамках одной среды программирования, а часть, связанная с манипулированием структурными параметрами молекул - в рамках другой. При этом в качестве базовой была выбрана операционная система Windows (версии 98 и выше). Основная часть комплекса реализована в виде набора взаимосвязанных макросов MS Excel (версии 7.0 и выше) на языке Visual Basic for Applications. Для построения трехмерных структур молекул и расчета значений индексов используются программы HyperChem и Морас. Работа этих программ также осуществляется под управлением макросов MS Excel.

Оптимизация трехмерных структур молекул отобранных соединений по энергетическим критериям. Расчет индексов

Прежде всего, необходимо выбрать метод задания целевой функции. Такие методы основаны на различных моделях внутримолекулярных межатомных и межэлектронных взаимодействий, используемых при расчете энергии молекулы. Чаще всего используется метод AMI, поскольку этот метод наиболее универсален и хорошо зарекомендовал себя при исследованиях биологически активных веществ.

Кроме выбора виды целевой функции возможна настройка следующих параметров: PULAY - ускоренная процедура оптимизации, обеспечивающая более быструю сходимость по сравнению с традиционными градиентными методами; PRECISE - повышение точности вычислений в 1000 раз по сравнению со стандартной; NOMM - отключить коррекцию параметров программы для связей CONH - эта коррекция необходима только для пептидов; XYZ - исходные координаты атомов вводятся в декартовой системе координат. Задача нахождения энергетически выгодных трехмерных структур является задачей условной многомерной оптимизации и может быть решена только численно. Ее решение требует больших затрат вычислительных ресурсов, поэтому предусмотрены различные режимы работы макроса - от оптимизации конкретного конформера (описанного с помощью рабочего листа книги MS Excel) до оптимизации всех конформероЕ всех соединений, описания которых открыты.

В результате оптимизации часть построенных на предыдущем этапе трехмерных структур может быть отброшена (оптимизационная процедура не достигает сходимости), В том случае, если не оптимизировать конформацию не удается, исследователю предлагается осуществить корректировку параметров в зависимости от причин неудачи, описанных в файле отчета (программа МОР АС записывает их в текстовые файлы с расширением .OUT). Для тех структур, оптимизация которых завершилась успешно, создаются текстовые файлы, описывающие полученную структуры. Эти файлы имеют расширение .ARC и используются для фиксации результатов оптимизации в табличном виде. Координаты атомов оптимизированной структуры фиксируются в книге MS Excel, каждый лист которой описывает конформер.

Для каждой оптимизированной структуры в рамках программы МОРАС осуществляется расчет структурных и квантово-химических индексов. Значения индексов записываются в ту же книгу MS Excel, которая описывает результаты оптимизации. Вначале фиксируются параметры молекулы в целом, затем квантово-химические параметры отдельных атомов.

Выбор энергетически приемлемых конформеров реализован в виде отдельного макроса MS Excel, параметром которого является значение энергетического порога (по умолчанию 5 ккал/моль). Для выбора таких конформеров для каждого вещества определялся конформер с минимальной теплотой образования HFmjn, значения теплоты образования всех остальных конформеров сравнивались с суммой HFmin и величины энергетического порога. Данные о конформерах, энергия образования которых превышала указанную величину, не учитывались в дальнейших исследованиях.

Подготовка данных для формирования гипотез осуществляется в рамках специального макроса MS Excel, генерирующего сводную таблицу, содержащую значения индексов для всех энергетически приемлемых конформеров всех соединений из обучающей выборки. Параметрами макроса являются количество соединений, максимальное количество конформеров для одного соединения и количество совпадающих атомов (поскольку струткуры исследуемых соединений различаются, данные о тех атомах, которые встречаются не во всех исследуемых структурах, необходимо отбросить). С помощью отдельного макроса полученные результаты нормируются.

Полученная в результате сводная таблица представляет собой книгу MS Excel и описывает все данные о параметрах молекул исследуемых веществ. В отдельный лист этой же книги пользователю необходимо ввести данные о численных значениях свойств исследуемых соединений. Полученные таким образом книга содержит все исходные данные для построения гипотез о зависимости "структура - свойство".

При отборе значимых индексов для каждого исследуемого индекса генерируется отдельный лист книги MS Excel, на этот лист автоматически переносятся данные, относящиеся только к заданному индексу. В рамках макроса MS Excel осуществляется ряд попыток построения разделительной линии.

Первоначально выполняется попытка построить линейную разделительную линию. Для решения этой задачи используется надстройка "Поиск решения", входящая в состав MS Excel. С помощью этой программы выполняется решение задачи условной оптимизации, описанной в п.2.1. Параметры надстройки - целевая ячейка, изменяемые ячейки и ограничения в виде неравенств - записываются на тот же рабочий лист и автоматически загружаются макросом при необходимости.

В том случае, если удается построить линейную разделительную линию, индекс считается значимым; в противном случае выполняется подбор начальных приближений и попытка подбора параметров разделительной линии в виде экспоненциальной функции. При подборе начальных приближений и подборе параметров экспоненциальной зависимости также используется надстройка "Поиск решения" и значения параметров, полученные при попытке подбора линейной разделительной линии.

В том случае, если удается построить разделительную линию, индекс считается значимым; в противном случае предполагается, что исследуемое свойство не зависит от заданного индекса и лист книги MS Excel, соответствующий этому индексу, удаляется. Результаты отбора значимых индексов фиксируются в книге MS Excel. Каждый лист полученной книги содержит информацию о значимом индексе, в том числе параметры разделительной линии и, для наглядности, ее график (рис.3.4). Эти данные являются исходными данными для построения гипотез о зависимости "структура - свойство".

Процедура анализа значимости может быть осуществлена как для отдельного индекса, так и для группы индексов или для всей сводной таблицы в целом (ограничением является только достижение максимального количества листов в рабочей книге).

Прогнозирование степени адсорбции и максимума поглощения тиамонометинцианинов

Полученные результаты согласуются с экспериментальными наблюдениями и позволяют специалистам сделать предположения о механизмах взаимодействия исследованных соединений с обратной транскриптазой. В частности, важная роль донорно-акцепторных свойств атомов азота позволяет предположить, что связывание с обратной транскриптазой происходит путем образования донорно-акцепторной связи или протонирования атома азота свободной кислотной группой какой-либо аминокислоты, оказывающейся после встраивания рядом с отобранными атомами.

Производные порфирина в настоящее время широко используются при фотодинамической терапии рака.

Современное развитие фотодинамической терапии рака (ФДТ) в значительной мере связано с созданием новых сенсибилизаторов, имеющих улучшенные спектральные, фотохимические и биологические характеристики. К числу требований, предъявляемых к фотосенсибилизаторам второго поколения для ФДТ, относится интенсивное поглощение в красной области спектра, высокая селективность накопления в раковых клетках, низкая токсичность, отсутствие или минимально выраженное накопление в коже и хорошая флуоресценция [29]. В настоящее время ни одно из из -ченных соединений не обладает совокупностью этих свойств. Поэтому проблема поиска новых фотосенсибилизаторов для ФДТ является важной и актуальной.

В последние годы в связи с этим наблюдается повышенный интерес к природным гидрированпьм аналогам порфиринов. Выбор зеленых пигментов в качестве основы для синтеза новых фотосенсибилизаторов обусловлен рядом причин, включая такие, как широкое распространение в природе, структурная близость к эндогенным порфиринам, что позволяет предполагать низкий уровень токсичности подобных соединений и быстрое выведение из организма [21].

Ограниченное использование данных соединений для ФДТ связано с рядом обстоятельств, включая плохую растворимость в водных растворах и низкую селективность накопления в опухолях. Однако наличие в них различных функциональных групп позволяет осуществлять структурную модификацию пигментов в направлении требуемых свойств [22]. Известно, что порфирины с углеводными заместителями не только хорошо растворимы в воде, но также способны проникать в клеточные мембраны и обладают требуемой фототоксичностью. Хорошая растворимость в воде благоприятствует быстрому удалению вещества из организма после терапии, а гликозидные остатки могут участвовать в процессах межклеточного узнавания. [23,24]. Варьируя природу и число углеводных заместителей, можно изменять электронную плотность, гидрофильность и липофильность, которые определяют свойства соединения как потенциального агента для ФДТ.

В работе моделировалось влияние различных вводимых в порфириновую структуру заместителей на хроматографическую подвижность этих соединений, которая, как предполагается, определяется полярными свойствами молекулы в целом и отражает способность молекулы проникать в клеточную мембрану.

Молекулы порфиринов являются очень крупными объектами, кроме того, наличие большого числа разных заместителей приводит к возможности существования очень большого числа конформеров. Поэтому в работе для моделирования были использованы лишь 10 веществ, значения хроматографической подвижности которых в системе «хлороформ-вода» были взяты из [25]. Структуры исследованных соединений представлены на рис.4.3., значения хроматографической подвижности - в табл.4.8.

При генерации конформеров для производных РЕТТ использовался угол поворота 120. После оптимизации структуры молекул по методу AMI было получено от 24 до 81 конформеров.

Проведенные в работе исследования показали, что введение различных заместителей в структуру порфиринов приводит к значительным изменениям в электронных свойствах атомов порфиринового скелета, что, в свою очередь, отражается на подвижности, а значит и липофильности молекул. Выяснилось, что хроматографическая подвижность зависит от зарядов и поляризуемости атомов, выделенных на рис.4.4. Параметры двухлинейных моделей для отобранных индексов приведены в табл. 4.9. Полученная модель была проверена методом скользящего контроля. Полученные прогнозы оказались правильными для всех соединений: реальное значение активности во всех случаях попало в найденный интервал. В среднем, длина полученного интервала-прогноза составляет 27% от длины всего исследуемого интервала значений активности [33].

Тиамонометинцианины (ТММЦ) в настоящее время широко применяются в качестве спектральных сенсибилизаторов различных областей спектра для цветных негативны?: фотоматериалов, а также при производстве светочувствительных полимерных материалов. В работе исследовалась степень адсорбции (процентного отношения адсорбированного красителя на поверхности хлорида серебра) и максимум поглощения 32 соединений - тиамонометинцианинов. Структуры исследованных соединений представлены на рис.4.5, значения исследованных свойств - в табл.4.10.

Похожие диссертации на Программный комплекс для прогнозирования свойств сложных органических соединений на основе анализа неоднозначных зависимостей "структура-свойство"