Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Интегрированная информационно-аналитическая система для прогнозирования свойств неорганических соединений Столяренко Андрей Владиславович

Интегрированная информационно-аналитическая система для прогнозирования свойств неорганических соединений
<
Интегрированная информационно-аналитическая система для прогнозирования свойств неорганических соединений Интегрированная информационно-аналитическая система для прогнозирования свойств неорганических соединений Интегрированная информационно-аналитическая система для прогнозирования свойств неорганических соединений Интегрированная информационно-аналитическая система для прогнозирования свойств неорганических соединений Интегрированная информационно-аналитическая система для прогнозирования свойств неорганических соединений Интегрированная информационно-аналитическая система для прогнозирования свойств неорганических соединений Интегрированная информационно-аналитическая система для прогнозирования свойств неорганических соединений Интегрированная информационно-аналитическая система для прогнозирования свойств неорганических соединений Интегрированная информационно-аналитическая система для прогнозирования свойств неорганических соединений Интегрированная информационно-аналитическая система для прогнозирования свойств неорганических соединений Интегрированная информационно-аналитическая система для прогнозирования свойств неорганических соединений Интегрированная информационно-аналитическая система для прогнозирования свойств неорганических соединений
>

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Столяренко Андрей Владиславович. Интегрированная информационно-аналитическая система для прогнозирования свойств неорганических соединений : диссертация ... кандидата технических наук : 05.13.01 / Столяренко Андрей Владиславович; [Место защиты: Моск. гос. ин-т электроники и математики]. - Москва, 2008. - 164 с. : ил. РГБ ОД, 61:08-5/477

Содержание к диссертации

Введение

ГЛАВА 1. Средства и технологии, применяемые при разработке информационно-аналитической системы ... 101

1.1. Принципы создания информационно-аналитических систем 10

1.1.1. Назначение ИАС 10

1.1.2. Обзор исследований по созданию ИАС в области неорганического материаловедения 12

1.1.3. Состав архитектуры ИАС, построенной на базе хранилища данных... 13"

1.1.4. Методика интеграции информационных источников в ИАС 14

1.1.5. Анализ данных 15

1.1.6. Knowledge Discovery in Databases 16

1.1.7. Сравнение экспертных и партнерских систем 19

1.1.8. Web-портал 20

1.2: Технологии интеграции программных систем 22

1.2.1. Подходы к интеграции 23

1.2.2. Классификация способов взаимодействия интегрируемых программных систем 26

1.2.3. Применение сервисно-ориентированной архитектуры при проектировании ИАС 31

1.2.4. Web-сервисы. Современный подход к задачам интеграции 33

1.2.5. Принципы Web-интеграции 36

1.3. Методы анализа данных, применяемые в ИАС 37

1.3.1. Постановка задачи распознавания образов 37

1.3.2. Выбор методов распознавания образов для использования в ИАС 39

1.3.3. Методы обучения ЭВМ распознаванию образов 40

1.3.4. Способы повышения достоверности прогнозов 51

1.4. Выбор программной платформы для разработки ИАС 57

Краткие выводы 60

ГЛАВА 2. Разработка информационно-аналитической системы на основе системного подхода 61

2.1. Предпосылки создания ИАС 61

2.2. Компонентный состав ИАС 66

2.3. Поддержка принятия решений при прогнозировании параметров химических соединений 69

2.3.1. Основные принципы системного анализа ...; 70

232. Описание процедуры прогнозирования с помощью методов структурного системного анализа 72

2.3.3. Концептуальная модель данных :. 79

2.4. Этапы процедуры прогнозирования. ..81

Краткие выводы; 85;

ГЛАВА 3: Разработка програмного комплекса интегрированной информационно-аналитической системы

3.1 Разработка базы данных «Фазы» ...87

З.1.1. Разработка структуры БД. . 87

З.1..2. Система удаленного доступа к:БД!«Фазы»... ... 90

3.1.3. Административная часть БД «Фазы... 91

3.1.4. Интеграция БД «Фазы» с другими'БД: 95

3;2. Базаданных посвойствамїхимических элементов «Элементы»... 95;|

3.2.1. РазработкаструктурыБД . .„ ,96і

3.2І2! Разработка административной'системы... .97

3.2.3. Система удаленного.доступа к БД «Элементы» ...98

3.1.3; Подсистема визуализацишданных... ..102"

3:3.1. Предпосылки создания*подсистемы... .102!

3.3.2. Визуализация данных .,102

3.3.3. Визуализация многомерных данных 105

3;4; Интеграция программ; анализа данных 107

3.4.1. Взаимодействие с программами анализа данных... 107

3.4.2. Справочная база для-интеграции .110

3.4.3. Механизм интеграции 113

3^5. Механизмобучения и распознавания.

3;5.1. Подготовка данных для анализа..

3.5.2. Заполнение пропусков в выборках для обучения и прогнозирования 123

5;3. Повышение достоверности прогнозов за; счет использованияжоллектива признаковых описаний;... 127

3.5;4. Обучение системы 128

3.5:5. Проведение прогнозирования 131

3.5.6. Пользовательский уровень работы с ИАС 133

Краткие выводы 135

ГЛАВА 4. Применение интегрированной информационно-аналитической системы для прогнозирования новых неорганических соединений 137

4.1. Компьютерное конструирование новых неорганических соединений состава АВХ2 (Х = S, Se, Те) 137

4.1.1. Прогноз возможности образования соединений состава АВХ2 при нормальных условиях 137

4.1.2. Прогноз типа кристаллической структуры соединений состава АВХ2 при нормальных условиях 141

4.1.4. Прогноз температуры плавления соединений состава ABD2 при атмосферном давлении 144

4.2. Прогноз возможности образования и типа кристаллической структуры соединений состава ABF5 147

4.3. Предложения по дальнейшему развитию ИАС 151

Краткие выводы 152

Основные результаты и выводы 154

Литература 156

Введение к работе

Появление многочисленных баз данных в различных предметных областях поставило перед специалистами вопрос их рационального использования не только для информационного обслуживания, но и для анализа хранящихся в них данных с целью выявления зависимостей и прогнозирования неизвестных значений. Одно из наиболее перспективных и актуальных направлений связано с разработкой информационно-аналитических систем (ИАС), объединяющих базы данных с программами анализа данных. С помощью таких систем, в частности, удается найти взаимосвязи между различными объектами и выявить закономерности, присущие предметной области информационно-аналитической системы. ИАС автоматизирует хранение и изменение информации, подготовку данных для анализа, проведение прогнозирования, визуализацию и отображение результатов. Для повышения достоверности прогнозов целесообразно использовать в ИАС набор программ анализа данных, включающих алгоритмы с различными принципами работы. В связи с этим перспективной задачей является интеграция множества программанализа данных. Перспективным является проведение интеллектуального анализа данных с применением программных решений не только в локальной среде, но и в сети Интернет.

Поиск новых неорганических материалов с заданными свойствами - одна из важнейших проблем химии. Эта многоуровневая (в системном смысле) проблема включает в себя множество частных вопросов: научных, технологических, технико-экономических и т.д. На уровне химии и химической технологии можно выделить следующие взаимосвязанные задачи: поиск составов, оценка свойств, выбор технологии получения материалов и поиск оптимальных технологических режимов синтеза и обработки материалов. Актуальность создания ИАС в области неорганического материаловедения вызвана стремлением облегчить и ускорить поиск новых неорганических веществ, перспективных для практических применений. Использование ИАС дает возможность найти взаимосвязи между фундаментальными свойствами неорганических соединений и фундаментальными свойствами химических элементов. Примене-

6 ниє найденных взаимосвязей позволяет проводить прогнозирование образования неорганических соединений и оценивать их различные свойства без реального синтеза этих соединений, то есть решает первую из трех задач по поиску новых материалов.

Цель работы

Целью исследования была разработка интегрированной информационно-аналитической системы для поддержки принятия решений при прогнозировании свойств неорганических соединений на основе разнородных информационных источников и различных методов, алгоритмов и программ анализа данных. Применение информационно-аналитической системы сокращает время и затраты на поиск новых неорганических соединений и прогноз их свойств, без реального синтеза.

Для достижения цели работы были решены следующие задачи:

рассмотрены принципы построения современных ИАС;

на основе системного подхода разработана архитектура ИАС и приведе-ны детализированные диаграммы этапов ее работы при прогнозировании параметров неорганических соединений;

разработана концептуальная модель данных для прогнозирования параметров неорганических соединений;

проведен обзор методов распознавания образов, применяемых в ИАС, и способов повышения достоверности прогнозов;

проанализированы и систематизированы современные подходы к интеграции программ;

осуществлен выбор программной платформы для построения информационно-аналитической системы;

предложена и применена методика интеграции разнородных программ анализа данных в ИАС;

разработана ИАС в виде программного комплекса и осуществлена ее апробация на реальных данных.

Научная новизна работы состоит в следующем:

выполнен системный анализ информационных процессов в области прогнозирования свойств неорганических соединений и разработана архитектура информационно-аналитической системы;

для повышения качества прогнозирования обосновано принятие коллективного решения по различным сочетаниям алгоритмов и признаковых наборов;

предложен и реализован подход к обработке пропусков в выборках для обучения и прогноза с учетом специфики предметной области;

предложены методика и технологии включения в ИАС программ анализа данных с различными принципами работы;

впервые в данной предметной области проведена интеграция в единую систему разнородных информационных компонентов - системы, баз данных и программ анализа данных, учитывающую априорно назначаемые и возникающие и фиксируемые в виртуальном эксперименте новые связи и обеспечивающую аналитическую и информационно-технологическую гибкость, вычислительную эффективность.

Практическая ценность

Теоретические исследования завершены созданием на их основе алгоритмического и программного обеспечения ИАС. Практическая ценность подтверждена в ходе использования результатов работы специалистами Института металлургии и материаловедения им. А.А. Байкова Российской Академии наук (ИМЕТ РАН).

На разработанную информационно-аналитическую систему было получено свидетельство об отраслевой регистрации і разработки в Общероссийском Фонде Алгоритмов и Программ (ОФАП) [31].

Результаты работы, имеющие практическую ценность:

разработанные методы и алгоритмы применены при создании информа
ционно-аналитической системы для компьютерного конструирования не
органических соединений, перспективных для практических применений;

разработано программное обеспечение баз данных «Фазы» и «Элементы» и проведена их интеграция с другими базами данных, разработанными в ИМЕТРАН;

разработанная в диссертации информационно-аналитическая система внедрена в практику работы ИМЕТ РАН;

применение ИАС позволяет сократить время и затраты на поиск новых неорганических соединений;

полученные в диссертации результаты могут быть использованы для создания информационно-аналитических систем и в других предметных областях.

Методы исследования

Структуризация и формализация предметной области и разработка архи
тектуры ИАС выполнены на основе методов системного анализа. При разра
ботке интегрированной. ИАС использованы теория построения БД, принципы
«сервисно-ориентированного подхода» и Web-технологии. Для анализа данных
і использованы программы и алгоритмы распознавания образов.

( Структура диссертации

Диссертация состоит из введения, 4 глав и заключения.'
І В первой главе рассматриваются принципы построения современных

а ИАС, исследования по созданию ИАС в области неорганического материалове-

} дения, современные технологии интеграции программ, основные методы рас-

познавания образов, применяемые в ИАС, и программные платформы для по
строения интегрированной ИАС. Во второй главе на основе системного подхо
да разработана архитектура ИАС и проведена детализация структурных диа-
і грамм, описывающих отдельные этапы процедуры прогнозирования свойств

* неорганических соединений. В третьей главе предложена методика интеграции

\ в ИАС программ анализа данных, описана реализация интегрированной ИАС в

виде программного комплекса, включая разработанные информационные сис-
^ темы и вспомогательные подсистемы, вошедшие в состав ИАС. Также с учетом

8 специфики предметной области предложен и реализован подход к обработке

9 пропусков в выборках для обучения и прогноза. Для повышения качества прогнозирования обосновано использование коллективов признаковых описаний. В четвертой главе представлены результаты применения ИАС для прогнозирования свойств неорганических соединений. Также проведено обсуждение эффективности методов распознавания образов. Сформулированы предложения по дальнейшему развитию ИАС. В заключении сформулированы основные результаты, полученные в диссертационной работе.

Исследования, представленные в настоящей диссертации, были поддержаны РФФИ (гранты №04-07-90086, №06-07-89120 и № 05-03-39009).

Принципы создания информационно-аналитических систем

Задачами любой информационно-аналитической системы являются эффективное хранение, обработка и анализ данных. В настоящее время накоплен значительный опыт в этой области. Информационно-аналитические системы разрабатываются в различных предметных областях [4, 36].

Эффективное хранение информации достигается наличием в составе информационно-аналитической системы целого ряда источников данных. Анализ осуществляется при помощи современных инструментов анализа данных.

Информационно-аналитические системы, являясь одним из основных инструментов повышения эффективности работы специалистов, представляют собой сложные программно-аппаратные и телекоммуникационные комплексы и выступают в качестве самостоятельного объекта исследований. Вопросы архитектуры таких систем и организации управления информационным процессом представляют одно из главных направлений системного анализа. Информаци онные системы помогают в решении информационных и расчетных задач. Теоретические основы информационного, математического, программного и других видов обеспечения распределенной обработки информации, построения баз данных, баз знаний, аналитических и других систем определяют потенциальные возможности и ограничения информационно-аналитических систем в целом.

Основная цель создания информационно-аналитической системы - предоставление пользователю инструмента для выполнения эффективного анализа данных. Следует отметить, что система не генерирует правильные решения, а только предоставляет пользователю данные в виде отчетов, таблиц, графиков и т.п. - материала, позволяющего провести комплексную оценку ситуации и обеспечить возможность проведения анализа больших объемов данных в условиях ограниченного времени. Функциональная схема ИАС представлена на рис.1.

Поддержка анализа данных основана на обеспечении автоматизации решения следующих задач: Обобщение - детализированные данные предоставляются пользователю в агрегированном виде, позволяя провести глобальную оценку ситуации, выявить общие закономерности исследуемого процесса. Визуализация - для повышения эффективности восприятия отчетов используются различные схемы графической визуализации данных, например, различные диаграммы и графики. Прогнозирование — пожалуй, самая востребованная и в то же время труднореализуемая функция аналитических систем. В настоящее время применяется множество методик прогнозирования.

Возможности ИАС могут быть расширены путем использования компонентов, реализующих функции интеллектуального анализа данных (Data Mining). Средства Data Mining позволяют осуществлять, так называемой, глубинный анализ данных с целью автоматизации выявления скрытых закономерностей, тенденций и т.п. В качестве источника первичных данных для анализа могут использоваться различные информационные системы.

Традиционные области приложений искусственного интеллекта - органическая и аналитическая химия. Следует отметить, что первые применения искусственного интеллекта в химии были связаны с органической химией и обработкой спектральной информации [16, 60, 67]. В 1965 г. в Станфордеком университете Buchanan, Feigenbaum и Lederberg начали разработку одной из первых экспертных систем - DENDRAL, предназначенной для анализа спектральных данных об органических соединениях. В 1990 г. за работы по созданию принципов компьютерного дизайна органических соединений E.Corey получил Нобелевскую премию по химии [77].

Наиболее интересные применения в этих областях связаны с конструированием лекарственных препаратов [26], установлением связей «спектр - струк тура- свойства.органических соединений» [16, 60], планированием органического синтеза [26] и т.д.

Количество применений распознавания образов в неорганической химии значительно меньше, чем в органической и аналитической химии. Однако в последние годы сформировались несколько научных групп, работающих в этой области. Коллективом разработчиков под руководством проф.8.1\\ а (Токийский университет) и д-ра P.Villars (фирма Material Phases Data System (MPDS)). В настоящее время создана БД по свойствам неорганических систем «Pauling File» [75], а для анализа данных применяются полуэмпирические методы и нейронные сети [96]. Параллельно вКитае под руководством проф.\УХи (Шанхайский университет) создаются ИАС для конструирования интерметаллических и солевых соединений [98]. В настоящее время создана БД по солевым системам и разработан комплекс программ анализа данных, включающий следующие алг горитмы: нейронные сети; метод опорных векторов, метод к-ближайших соседей. Компанией Granta Design Limited (Великобритания) [76] разработана БД по» свойствам материалов и система поиска в ней информации по различным наборам критериев . Анализ данных производится с помощью средств визуализации.

Основными1 недостатками существующих систем являются либо нехватка данных для проведения анализа, либо ограниченное количество применяемых алгоритмов распознавания образов. В них также не используются коллективные подходы для решения задач распознавания [22].

Подходы к интеграции

Существует два подхода к организации маршрутов взаимодействия интегрируемых систем. Первый — прямое взаимодействие интегрируемых систем по принципу «каждая.с каждой», или «точка-точка». Второй — взаимодействие через центральный, узел; подобную архитектуру обычно называемую «хаб + спицы».

Частная интеграция (взаимодействие «точка - точка») - это традиционный и наиболее распространенный в прошлом подход к интеграции систем, заключающийся в создании специализированных интерфейсов к приложениям для каждой отдельной ситуации (рис. 4). При таком подходе количество необходимых частных интерфейсов пропорционально квадрату числа используемых приложений. Частная интеграция требует больших объемов программирования, отнимает много времени, приводит к огромным структурным сложностям, а. проведение изменений отнимает много сил и средств. Фактически каждая частная интеграция приводит к созданию еще одной независимой информационной системьги.увеличивает стоимость внедрения каждого нового приложения.

Реализация архитектуры «хаб + спицы» базируется на применении подхода к интеграции на уровне приложений (Enterprise Application Integration -ЕАІ) (рис.5). EAI - это интеграционный подход, с помощью которого удается добиться централизации и оптимизации при интеграции приложений на основе использования тех или иных технологий оперативной доставки информации (push technology), которая управляется внешними событиями (event-driven) [79]. Средства EAI вовлекают несколько приложений в единый процесс и осуществляют преобразование форматов данных между ними. Необходимость в интеграции приложений обычно возникает, если приложения разработаны различными производителями.

Центральной задачей при интеграции приложений является стандартизация интерфейсов для всех подсистем, входящих в состав централизованной системы. EAI устраняет необходимость в выполнении больших объемов программирования. Подход интеграции на уровне приложений объединяет программные компоненты с помощью стандартизированных программных интерфейсов, распределенных объектных технологий и связующих программных средств. Все эти технологии сильно различаются в частностях, но суть сводится к тому, что функциональность, присутствующая в одном приложении, может использоваться другими, независимо от базовой платформы.

Вместо специализированных интерфейсов между отдельными программами EAI применяет связующую среду, которая играет роль универсального программного ядра, соединяющего все приложения. Таким образом, для интеграции нового приложения необходимо создать только один интерфейс для связи со структурой интеграции приложений, вместо того чтобы создавать все новые интерфейсы для связи с каждым новым приложением. Преимуществом технологии на основе интегрирующей среды является простота поддержки и расширения разработанной на ее основе системы. Интеграционные среды такого рода получили название middleware (промежуточное ПО или инфраструктурное ПО).

Кроме того, EAI интегрирует приложения, не внося каких-либо модификаций в их внутреннюю функциональность, что гарантирует отсутствие ошибок в критически важных приложениях. Взаимная изоляция взаимодействующих приложений является основой для построения масштабируемых, интероперабельных и безопасных систем. Приложения оперируют только атрибутами обмена, необходимыми для взаимодействия с интегрирующей средой.

Интегрирующая система включает в себя реализацию основных уровней интегрирующей среды: базовый уровень интегрирующей среды (представляет собой ядро интегрирующей среды и содержит платформу для исполнения сценариев, базовый функционал по взаимодействию приложений, службы протоколирования и мониторинга состояния интегрирующей среды); уровень сценариев интеграции (схема обмена сообщениями между системами, алгоритмы преобразования и маршрутизации этих сообщений); транспортный уровень интегрирующей среды (физическая доставка сообщений между компонентами); уровень адаптеров компонентов (взаимодействие с системой посредством ее программных интерфейсов, генерация сообщений, передача сообщений базовому уровню посредством транспортного).

Интегрирующая среда контролирует взаимодействие приложений, т.е. отслеживает временные, частотные или иные параметры взаимодействия приложений друг с другом. Для обеспечения взаимодействия приложений интегрирующая среда включает в себя механизм для трансформации передаваемых данных из одного формата в другой. Надо обратить внимание, что трансформация касается только форматов представления и не затрагивает собственно данные.

Файловый обмен (рис.6) - пожалуй, самый распространенный подход к организации взаимодействия. Это связано с относительной простотой реализации, а также существованием стандартных (или «почти» стандартных) форматов обмена. В последнее время в качестве единого формата файлов обмена все чаще выбирают XML, как наиболее распространенный и поддерживаемый» в. мире. Большинство систем позволяют производить экспорт-импорт данных в формате XML, на рынке программного обеспечения существует большое количество программ, позволяющих в удобной форме создавать так называемые: «преобразователи» XML данных на основе технологии XSLT [б].

Предпосылки создания ИАС

Вначале рассмотрим, как была организована работа специалистов-химиков до применения ИАС. Модель «как есть» включает в себя существующие применяемые неавтоматизированные технологии. Формальный анализ этой модели позволит выявить узкие места в технологиях и предложить рекомендации по их улучшению.

Информация хранилась различными способами: начиная от бумажной формы и таблиц Excel и заканчивая разрозненными базами данных. Таким об разом, первой; задачей на пути к созданию единой ИАС была разработка баз данных на современных программных платформах; и загрузка в них всей накопленной: информации. Следующим шагом является интеграция всех созданных БД в единую систему для улучшения?информационного; обеспечения?специалистов.

Возможны два пути использования баз;, данных:, локальный вариант на GD-ROM и доступ из глобальной сети Интернет. Второй путь является более сложным; для; программной реализации; но именно он обеспечивает доступ к постоянно обновляемым базам;данных. Для? обеспечения специалистов; необходимой-и актуальной информацией все БД; входящие: в ИАС, представлены в сети Интернет. Дляг удобствам пользователей? возможные запросы к; БД. должны; быть запрограммированы, и дляшоиска информацишвсего лишь нужно выбрать.. соответствующий пункт меню -И:ввести параметры.запроса в;определенную экранную форму.

Базы данных обеспечивают оперативность обновления информации; удобство; и быстроту поиска необходимых, сведений. Однако предоставление данных- это; одна из сторон современных- информационных технологий. Возможности БД наиболее полно реализуются;. если- проводится обработка информации с цельюшоиска зависимостей;. которые применяются для. прогнозирования неизвестных параметров.

Рассмотрим предпосылки; компьютерного конструирования неорганических соединений без реального!их синтеза;. Поиск новых неорганических; материалов с заданными свойствами - одна из важнейших проблем: химии; Эта многоуровневая; (в системном смысле); проблема включает в себя множество-частньщвопросов: научных,,технологических, технико-экономических игт.д. На уровне химии и химической? технологии можно- выделить следующие взаимосвязанные задачи: поиск составов (т. е. указание компонентов;и их количественных соотношений), оценка свойств, выбор технологии получения, материалов и поиск оптимальных технологических режимов синтеза и обработки материалов. Таким образом, можно рассматривать следующую последо вательную процедуру конструирования новых неорганических соединений с заданными свойствами: базы данных — программы распознавания образов —- оптимизация технологии синтеза. Прогнозирование соединений и оценку целевого свойства с использованием информации базы данных, а также прогнозирование наилучшего типа технологии синтеза можно рассматривать как стратегию поиска веществ с заданными свойствами. БГоснове поиска еще не полученных веществ лежит эксперимент, а также опыт и интуиция исследователей. Как правило, открытие нового вещества с «хорошим» набором свойств ведет к интенсивному синтезу и исследованию веществ-аналогов. Появление уже первых ЭВМ обеспечило возможности для ускорения такого поиска новых неорганических веществ на основе компьютерного конструирования соединений-аналогов [32, 33, 53].

При конструировании еще не полученных соединений-аналогов необходимо решить следующую задачу: найти совокупность химических элементов и их соотношение (т.е. качественный и количественный состав) для создания определенной пространственной молекулярной или кристаллической структуры соединения, позволяющей реализовать необходимые функциональные свойства. Эта задача конструирования новых неорганических соединений может быть сведена к обнаружению зависимостей между свойствами физико-химических систем, в том числе, свойствами соединений, и свойствами элементов, образующих эти системы.

В данном случае можно говорить о моделировании процесса получения новых химических соединений и выяснения свойств уже существующих соединений. Моделирование - процесс исследования реальной системы, включающий построение модели, изучение ее свойств и перенос полученных сведений на моделируемую систему. При реальном синтезе химических соединений распространена практика поиска новых соединений, состоящих из элементов со свойствами, близкими к элементам уже ранее полученных соединений. Эта же идея применяется при компьютерном конструировании химических соединений.

Разработка базы данных «Фазы»

База данных «Фазы» содержит информацию о более 44000 тройных соединениях из 18000 систем и более 15000 четверных из 6000 систем. Эта информация извлечена из более 20000 публикаций. Каждая система и соединение характеризуются рядом параметров. Перед тем как приступать к реализации базы данных на ЭВМ, необходимо рассмотреть предметную область БД и разработать структуру данных в базе данных. База данных состоит из двух подсистем: подсистемы тройных соединений и подсистемы четверных соединений, структура которых и соответствующее программное обеспечение различаются незначительно.

После рассмотрения предметной области и консультаций со специалистами по неорганической химии стало понятно, что информация о неорганических соединениях может быть представлена в виде иерархической трехуровневой структуры (рис.22). Верхний уровень «Система» - это данные о системе, образованной тремя (четырьмя) химическими элементами. Набор атомных номеров химических элементов является уникальным для каждой системы. В каждой системе могут существовать несколько соединений разного состава. Состав и свойства этих соединений соответствуют уровню «Тройные (четверные) соединения». При этом составы соединений для каждой системы («Область гомогенности соединения») - являются уникальными. Каждое соединение может иметь несколько кристаллических модификаций в зависимости от условий получения. Параметры этих модификаций соответствуют самому низкому уровню «Типы кристаллических структур». Также в отдельный уровень можно выделить информацию о литературных ссылках, из которых была почерпнута информация о той или иной системе. Соответственно этот уровень связан с уровнем «Система».

После проведения процесса нормализации базы данных, получена структура, показанная в таблице 3. Главными таблицами БД являются System, Compound, StrType и Data. Все остальные таблицы БД условно разбиты на четыре группы (системы и их характеристики, соединения и их свойства, кристаллические структуры и их параметры, литературные ссылки), имеющие общий ключевой столбец: System, SysTab, ItsTab, QbsTab, BiblRef + Compound (общий столбец -Strl). Compound, MeltType, TempMelt, TempBoil, TempDcmp + StrType (общий столбец - Str2). StrType, Trans, SyngTab, SpGrTab, ZTab, TcTab и Hc2Tab (общий столбец - Str3). Data, Authors, Years и Pdf (общий столбец - N). Таблица Users содержит информацию о пользователях БД.

Концептуальная структура БД, разработанная на основе анализа предметной области, дает возможность удобной записи новой информации в БД и минимизирует избыточность данных. Также упрощается процедура поиска необходимой информации, хранящейся в базе данных.

При разработке системы удаленного доступа [55] были предусмотрены практически все запросы, необходимые пользователю. Информация выдается в форме, удобной и привычной для специалистов в области химии.

Меню «Администрирование» (подсистема тройных соединений) состоит из четырех подпунктов - «Химические системы», «Тройные соединения», «Кристаллические структуры», «Библиографические ссылки» (рис.25). Каждый из этих подпунктов меню предоставляет доступ к администрированию соответствующей группы таблиц базы данных. (= Текущий SQL-сервер: «193.233.10.21» Q Текущая база данных: «PHASES»

При выборе пункта меню «Администрирование: Химические системы» открывается окно, в котором пользователь имеет возможность получить информацию обо всех тройных химических системах, информация о которых хранится в базе данных и включающих один или несколько химических элементов, выбранных пользователем.

После успешного завершения поиска на экран выдается список систем, удовлетворяющих заданному критерию (рис.27). Для каждой химической системы выводится: уникальный номер системы в базе данных; набор элементов, образующих данную систему; количество соединений, образованных этими элементами; изученность системы (изучена частично/изучена полностью).

В этот момент у пользователя программы существуют следующие возможности: Показать соединения - перейти к списку соединений, образованных элементами, которые входят в выбранную химическую систему. Добавить систему - ввести в базу данных информацию о новой системе.

Похожие диссертации на Интегрированная информационно-аналитическая система для прогнозирования свойств неорганических соединений