Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Метод и средства интеграции онтологий разнородных источников данных в автоматизированных системах управления промышленных предприятий Кузнецов Дмитрий Павлович

Метод и средства интеграции онтологий разнородных источников данных в автоматизированных системах управления промышленных предприятий
<
Метод и средства интеграции онтологий разнородных источников данных в автоматизированных системах управления промышленных предприятий Метод и средства интеграции онтологий разнородных источников данных в автоматизированных системах управления промышленных предприятий Метод и средства интеграции онтологий разнородных источников данных в автоматизированных системах управления промышленных предприятий Метод и средства интеграции онтологий разнородных источников данных в автоматизированных системах управления промышленных предприятий Метод и средства интеграции онтологий разнородных источников данных в автоматизированных системах управления промышленных предприятий Метод и средства интеграции онтологий разнородных источников данных в автоматизированных системах управления промышленных предприятий Метод и средства интеграции онтологий разнородных источников данных в автоматизированных системах управления промышленных предприятий Метод и средства интеграции онтологий разнородных источников данных в автоматизированных системах управления промышленных предприятий Метод и средства интеграции онтологий разнородных источников данных в автоматизированных системах управления промышленных предприятий Метод и средства интеграции онтологий разнородных источников данных в автоматизированных системах управления промышленных предприятий Метод и средства интеграции онтологий разнородных источников данных в автоматизированных системах управления промышленных предприятий Метод и средства интеграции онтологий разнородных источников данных в автоматизированных системах управления промышленных предприятий
>

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - 240 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Кузнецов Дмитрий Павлович. Метод и средства интеграции онтологий разнородных источников данных в автоматизированных системах управления промышленных предприятий: автореферат дис. ... кандидата технических наук: 05.13.06 / Кузнецов Дмитрий Павлович;[Место защиты: Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования «Владимирский государственный университет имени Александра Григорьевича и Николая Григорьевича Столетовых»].- Владимир, 2013

Содержание к диссертации

Введение

Глава 1. Подходы к интеграции разнородных источников данных в АСУ промышленных предприятий 9

1.1. Методы и проблемы интеграции данных 9

1.2. Средства интеграции данных на основе онтологического подхода . 24

1.3 Постановка задачи диссертационного исследования 44

Глава 2. Метод интеграции онтологий разнородных источников данных в АСУ промышленных предприятий. математический аппарат 47

2.1 Обоснование выбранного решения 47

2.2 Метод интеграции онтологий разнородных источников данных в АСУ промышленного предприятия 47

2.3 Математический аппарат интеграции онтологий разнородных источников данных в АСУ промышленного предприятия 53

Выводы по главе 2 59

Глава 3. Разработка и анализ алгоритмов метода семантической интеграции разнородных АСУ промышленных предприятий 61

3.1. Последовательность этапов интеграции онтологий разнородных АСУ промышленных предприятий при формировании корпоративного хранилища данных 61

3.2. Оценка вычислительной сложности алгоритмов интеграции онтологий разнородных АСУ промышленных предприятий . 70

Выводы по главе 3 . 72

Глава 4. Применение полученных результатов к решению прикладной задачи интеграции разнородных источников данных предметной области «хранение и переработка зерна» . 73

4.1 Анализ предметной области . 73

4.2. Реализация автоматизированной системы . 78

4.3. Внедрение метода и средств интеграции онтологий разнородных АСУ на ОАО «Вологодский комбинат хлебопродуктов» . 87

Выводы по главе 4 . 93

Заключение 95

Список литературы 98

Введение к работе

Актуальность темы исследования и степень её разработанности.

Современные российские промышленные предприятия, многие из которых функционируют на протяжении длительного периода времени, обычно имеют громоздкую и сложную информационную инфраструктуру, включающую источники данных различных автоматизированных систем управления (АСУ), - базы данных разных форматов, электронные таблицы, текстовые файлы и т.д. Такое положение, сложившееся в результате многолетней «островковой» автоматизации, усложняет совместное использование данных из различных источников, снижая оперативность и достоверность при подготовке данных для принятия управленческих решений на уровне предприятия. В настоящее время многие промышленные предприятия решают задачу интеграции данных различных АСУ, выбирая надежный и проверенный способ консолидации данных в единое корпоративное хранилище (Data Warehouse).

В силу возможного (и весьма вероятного) наличия структурных, лексических и семантических конфликтов в различных источниках данных, формирование хранилища данных представляет собой сложный многоэтапный процесс, который нужно рассматривать в контексте более общей задачи управления корпоративными знаниями. В связи с этим пристального внимания заслуживает онтологический подход к интеграции данных, который развивается в работах А.Н. Бездушного, И.А. Васильева, И.С. Михайлова, Т.А. Гавриловой, М.Р. Когаловского. Важные вопросы управления производством представлены в работах Д.А. Поспелова, Ю.И. Клыкова, Р.И. Макарова, Д.В. Александрова, А.В. Кострова, П. Мертенса.

Анализ показал, что в настоящее время не существует теоретически обоснованной методики интеграции онтологии разнородных источников данных АСУ, на рынке программного обеспечения представлены лишь частичные решения для автоматизации отдельных этапов процесса интеграции данных, при этом специфика промышленных предприятий в них не учитывается. В связи с этим тема диссертации, посвященной семантической интеграции разнородных данных АСУ промышленного предприятия на базе онтологического подхода, является актуальной.

Дополнительным мотивом для выполнения диссертационного исследования явилась острая необходимость интеграции данных различных АСУ на Вологодском комбинате хлебопродуктов с целью преодоления проблем многолетней «островковой» автоматизации предприятия.

Объектом исследования являются процессы интеграции автоматизированных систем управления на промышленных предприятиях.

Предмет исследования - модели, методы и алгоритмы интеграции онтологии разнородных источников данных АСУ промышленных предприятий.

Цели и задачи. Основной целью настоящей работы является повышение оперативности и достоверности при подготовке данных для принятия управленческих решений на промышленных предприятиях.

В соответствии с заявленной целью необходимо решить следующие задачи:

1. Провести анализ существующих методов интеграции АСУ, выявить
преимущества онтологического подхода к интеграции данных.

  1. Разработать метод семантической интеграции онтологии, извлеченных из источников данных АСУ промышленных предприятий, позволяющий осуществить глубокую интеграцию и устранить лексические и семантические конфликты разнородных источников данных.

  2. Проанализировать имеющийся математический аппарат для поддержки процесса интеграции онтологии, при необходимости выполнить его модификацию.

  3. Разработать алгоритмы для поддержки процесса интеграции онтологии.

  4. Разработать прототип автоматизированной системы интеграции данных АСУ промышленного предприятия.

Научная новизна работы заключается в следующем:

разработаны: новая научная идея по определению семантической близости понятий и атрибутов онтологии разнородных источников данных АСУ промышленных предприятий, множество операций интеграции онтологии и алгоритм поиска семантически близких понятий и атрибутов онтологии;

предложен нетрадиционный подход к семантической интеграции онтологии, извлеченных из разнородных источников данных АСУ, с использованием базовой онтологической модели промышленного предприятия, позволяющий устранить структурные, лексические и семантические конфликты в процессе интеграции;

доказана перспективность и практическая значимость исследований для решения задачи интеграции источников данных АСУ промышленных предприятий;

введены измененные трактовки понятий семантической и лексической близости применительно к элементам онтологии.

Теоретическая значимость работы:

- доказаны положения, вносящие вклад в расширение представлений об
интеграции онтологии разнородных источников данных АСУ промышленных
предприятий за счет применения идей и технологий «Semantic Web»;

- применительно к проблематике диссертации результативно (эффективно, то
есть с получением обладающих новизной результатов) использован комплекс
существующих базовых методов исследования, в том числе численных методов,
экспериментальных методик, методов теории множеств и дескрипционной логики;

- изложены идеи и положения, доказывающие применимость предлагаемого
подхода к интеграции онтологии в АСУ промышленных предприятий;

- раскрыты противоречия и выявлены проблемы интеграции онтологии
разнородных источников данных;

изучены связи процесса интеграции онтологии с другими этапами интеграции источников данных АСУ и факторы, предопределяющие изменение семантической близости понятий и атрибутов онтологии при изменении базовой онтологической модели и словаря синонимов предметной области;

проведена модернизация существующих математических моделей, алгоритмов, обеспечивающих получение новых результатов по теме диссертации.

Практическая значимость работы:

- разработаны и внедрены алгоритм поиска семантически близких понятий и
атрибутов онтологии разнородных источников данных АСУ промышленных
предприятий и прототип системы интеграции на промышленном предприятии ОАО
«Вологодский комбинат хлебопродуктов», г. Вологда;

- определены перспективы практического использования полученных
результатов при интеграции источников данных АСУ промышленных предприятий;

- создана система практических рекомендаций по реализации процесса
интеграции источников данных АСУ промышленных предприятий;

- представлены методические рекомендации по дальнейшему
совершенствованию и практическому использованию предложенного метода
интеграции онтологии на промышленных предприятиях и в учебном процессе.

Методология и методы исследования. Теоретическая база исследования -дескрипционная логика, теория множеств, методы экспертных оценок. Положения, выносимые на защиту:

  1. Метод семантической интеграции онтологии, извлеченных из разнородных источников данных АСУ, с использованием базовой онтологической модели промышленного предприятия для устранения конфликтов в интегрируемых данных.

  2. Математический аппарат для поддержки процесса интеграции онтологии разнородных источников данных АСУ промышленных предприятий, включающий математическую модель определения семантической близости понятий и атрибутов интегрируемых онтологии и множество операций интеграции онтологии.

3. Алгоритм поиска семантически близких понятий и атрибутов онтологии.

4. Прототип автоматизированной системы интеграции разнородных данных
АСУ промышленного предприятия.

Степень достоверности и апробация результатов. Достоверность научных положений и выводов подтверждается корректным использованием математического

аппарата при проведении исследований и результатами эксперимента на реальных данных промышленного предприятия. Основные результаты диссертации докладывались и обсуждались на следующих семинарах и конференциях: международная научно-техническая конференция «ИНФОС-2011», всероссийская научно-техническая конференция «Вузовская наука - региону» (2009, 2010 гг.), всероссийская студенческая олимпиада «Конкурс компьютерных программ» (2009 г.), всероссийская научно-техническая конференция студентов и аспирантов «Молодые исследователи регионам» (2009, 2010 гг.). По теме диссертационной работы опубликовано 9 печатных работ, в том числе 6 без соавторов, из них 2 опубликованы в издании, рекомендованном ВАК.

Диссертационная работа состоит из введения, четырех глав, заключения, списка используемой литературы и приложения. Работа содержит 109 страниц машинописного текста, из них 3 страницы приложения, 16 рисунков, 5 таблиц и 103 наименования используемых литературных источников.

Средства интеграции данных на основе онтологического подхода

На сегодняшний день не существует универсального средства выражения семантики данных, однако подавляющее большинство практических задач основано на выражении семантики в рамках одной предметной области с помощью онтологий.

Механизмом для создания непрерывного информационного поля является онтология. Онтология — это попытка всеобъемлющей и детальной формализации некоторой области знаний с помощью концептуальной схемы, благодаря которой могут общаться люди, компьютерные системы [94]. Для онтологий характерны следующие особенности: они могут быть множественными (составными), в которых различаются представления контекста одного и того же домена, а могут идентифицировать абстрактные уровни онтологий (быть уровнем выше других онтологий). Существует несколько уровней абстракции, на каждом из которых могут быть определены собственные онтологии. Например, в каждой области промышленности можно определить онтологии отдельных видов (пищевая, деревообрабатывающая, металлургическая промышленность), еще уровнем выше можно описать общие онтологии отрасли. Для каждого отдельного предприятия также можно описать свою онтологию, онтологии для отдельных бизнес-процессов предприятия. Такого рода обобщение приводит к необходимости различать виды онтологий, чтобы организовывать их в библиотеки онтологий. Типы онтологий 1. Предметно-ориентированные онтологии – ориентированные на предметную область. Онтология предметной области обобщает понятия, использующиеся в некоторых задачах домена, абстрагируясь от самих задач. Онтология предметной области может быть повторно использована в рамках предметной области. 2. Онтологии, ориентированные на прикладную задачу. Данные онтологии используются для решения конкретной задачи. Они содержат термины, которые мы используем при разработке системы прикладных программ выполняющих задачу. Они могут отражать специфику приложения, также могут содержать некоторые общие характеристики. 3. Общие онтологии – онтологии верхнего уровня (абстрактные онтологии). Они могут быть использованы повторно в других предметных областях. 4. Онтологии представления. Концептуализация формализмов знаний. Стандарт онтологического исследования IDEF5 Основной характерной чертой онтологического анализа является, в частности, разделение реального мира на составляющие и классы объектов и определение их онтологий, или же совокупности фундаментальных свойств, которые определяют их изменения и поведение. Таким образом, естественная наука представляет собой типичный пример онтологического исследования. Например, атомная физика классифицирует и изучает свойства наиболее фундаментальных объектов реального мира, таких как элементарные частицы, а биология, в свою очередь, описывает характерные свойства живых организмов, населяющих планету. [64] Однако фундаментальные и естественные науки не обладают достаточным инструментарием для того, чтобы полностью охватить область, представляющую интерес для онтологического исследования. Например, существует большое количество сложных формаций или систем, созданных и поддерживаемых человеком, таких как производственные фабрики, военные базы, коммерческие предприятия и т.д. Эти формации представляют собой совокупность взаимосвязанных между собой объектов и процессов, в которых эти объекты тем или иным образом участвуют. Онтологическое исследование подобных сложных систем позволяет накопить ценную информацию об их работе, результаты анализа которой будут иметь решающее мнение при проведении процесса реорганизации существующих и построении новых систем. Методология IDEF5 обеспечивает наглядное представление данных, полученных в результате обработки онтологических запросов в простой естественной графической форме. [64] Основные принципы онтологического анализа Онтологический анализ обычно начинается с составления словаря терминов, который используется при обсуждении и исследовании характеристик объектов и процессов, составляющих рассматриваемую систему, а также создания системы точных определений этих терминов. Кроме того, документируются основные логические взаимосвязи между соответствующими введенными терминами и понятиями. В дальнейшем мы не будем делать различия между понятиями и терминами. Результатом этого анализа является онтология системы, или же совокупность словаря понятий, точных их определений и взаимосвязей между ними. Таким образом, онтология включает в себя совокупность понятий и правила, согласно которым эти понятия могут быть скомбинированы для построения достоверных утверждений о состоянии рассматриваемой системы в некоторый момент времени. Кроме того, на основе этих утверждений могут быть сделаны соответствующие выводы, позволяющие вносить изменения в систему для повышения эффективности её функционирования. В любой системе существует две основные категории предметов восприятия, такие как сами объекты, составляющие систему (физические и интеллектуальные) и взаимосвязи между этими объектами, характеризующие состояние системы. В терминах онтологии, понятие взаимосвязи однозначно описывает или, другими словами, является точным дескриптором зависимости между объектами системы в реальном мире, а понятия являются, соответственно, точными дескрипторами самих реальных объектов. При построении онтологии в первую очередь происходит создание списка или базы данных дескрипторов и с помощью них, если их набор достаточен, создается модель системы. Таким образом, на начальном этапе должны быть выполнены следующие задачи: 1) Создание и документирования словаря понятий 2) Описание правил и ограничений, согласно которым на базе введенной терминологии формируются достоверные утверждения, описывающие состояние системы. 3) Построение модели, которая на основе существующих утверждений позволяет формировать необходимые дополнительные утверждения.

Метод интеграции онтологий разнородных источников данных в АСУ промышленного предприятия

В общем виде идея метода семантической интеграции онтологий разнородных АСУ промышленного предприятия с использованием базовой онтологической модели представлена на рисунке 4.

Из любого имеющегося источника данных, будь это база данных, XML – файл, Excel- можно получить его онтологическое представление. В данном случае сложно предложить какой-либо универсальный автоматический способ ввиду того, что мир информационных технологий пестрит разнообразием реализаций представления различной структурированной информации. В данной диссертации будут рассматриваться на примере практической реализации только крупные обновляемые источники данных, для которых нужно единожды разработать схему интеграции. Данный метод позволяет проводить интеграцию и с малыми по объему источниками информации. Главная задача – это получить онтологическое представление источника. Далее приложение интегратор отфильтрует противоречия и сформирует обновленную онтологию предметной области, на основе которой можно сформировать структуру хранилища. На рисунке 5 представлена детализированная схема интеграции разнородных источников данных. Известный факт, что из любой действующей АСУ можно получить ее логическую схему. На основе полученной логической схемы можно получить концептуальную схему, которая и будет являться онтологическим представлением действующей базы данных АСУ промышленного предприятия, с которой мы будем производить интеграцию. Таким образом, задача интеграции разнородных источников данных сводится к подзадаче интеграции онтологий. На сегодняшний день использование онтологий для семантической интеграции затрудняется из-за следующих проблем: 1. Отсутствие возможности автоматического определения соответствия двух интегрируемых онтологий. 2. Определение соответствия противоречивых онтологий при интеграции. Основные конфликты интеграции: Два понятия или атрибута имеют разные названия и одинаковый смысл. Два понятия или атрибута имеют одинаковые названия и разный смысл. Два понятия или атрибута могут пересекаться, но не совпадать. Различные типы данных, единицы измерения, декомпозиция атрибутов. 3. При реализации программного продукта интеграции онтологий может возникнуть проблема производительности для обеспечения логического вывода онтологии. Указанные трудности необходимо учесть при разработке метода. - Решение проблем 1 и 2. При интеграции разнородных АСУ промышленного предприятия используется единая базовая онтология предметной области, при разработке которой достигнуто соглашение всех заинтересованных лиц -экспертов и пользователей. Это позволит стандартизировать процесс интеграции онтологий. На промышленных предприятиях технологические процессы сравнительно устойчивые, номенклатура выпускаемой продукции и используемого сырья также довольно стабильна, тезаурус предметной области также довольно стабилен. Поэтому имеется возможность для разработки базовой онтологии, которая также будет довольно стабильной и сможет использоваться в течение длительного периода времени. А хранилище данных будет достаточно обновлять с разумной периодичностью. Существует достаточно большое количество нормативных актов для промышленных предприятий, в которых вводятся основные понятия этой предметной области. Кроме того, на предприятиях имеется опытный персонал, который может выполнить функции экспертов предметной области квалифицированно. Основная идея использования базовой онтологии состоит в том, чтобы избежать коллизий интеграции разнородных АСУ промышленного предприятия, так как в них может находиться противоречивая информация об основополагающих знаниях предметной области. [14]

Главенствующей позицией при интеграции будет являться базовая онтология предметной области. Противоречивые данные при интеграции на нижних уровнях иерархии не оказывают существенного влияния на сходимость и вычислительные способности онтологии и могут быть урегулированы применением адекватных аксиом в онтологии, которые могут быть использованы для более точной спецификации семантики понятий и не повлияют на результат.

Решение проблемы 3. Для обеспечения приемлемой производительности программного средства интеграции достаточно грамотно выбрать язык описания онтологий, который обеспечит полиномиальную сходимость.

Так как в данном исследовании онтологический подход используется для построения единого корпоративного хранилища данных, уже с которым напрямую будут работать пользователи, то нет необходимости обеспечить высокую скорость получения доступа к информации, а требуется максимально выразительно описать интегрируемые источники данных, что позволит максимально точно передать данные в хранилище.

Ядром данного метода является блок – хранилище, который пополняется полезной информацией, как от экспертов предметной области, так и от АСУ.

Последовательность этапов интеграции онтологий разнородных АСУ промышленных предприятий при формировании корпоративного хранилища данных

Программный комплекс АСК ТУР - Автоматизированная система контроля температуры и уровня продуктов в силосах элеватора. Это система оперативного учета, обеспечивающая непрерывный контроль за состоянием зерна. В системе обеспечивается отслеживание и отображение динамики изменения температур и уровня в каждом силосе. Возможен ввод предупредительных уставок по уровню и температурам, при превышении которых происходит включение звуковой и цветовой сигнализации и запись данных в журнал событий. Работает на СУБД MySql. 5. АСУТП «Дозирование комбикормов» - Автоматизированная система управления технологическим процессом приготовления комбикормов. Данная учетная система производит управление процессами комбикормового производства для точного дозирования выхода готовой продукции. Работает на СУБД SQL Server 2000. Управленческий учет всех направлений деятельности предприятия ведется в пяти учетных системах, к тому же покрывает не все потребности, что отрицательно сказывается на управленческом учете и получении сводных отчетов. Формируемая сводная отчетность Отчетность на любом предприятии всегда играет особую роль. Каждое структурное подразделение крупных предприятий зачастую формирует собственный пакет отчетности, при этом состав показателей в отчетах разных подразделений может пересекаться, но это никем не контролируется. При смене руководителей состав отчетности подразделений обычно пересматривается, что приводит к появлению новых форм, но не отменяет уже существующих. В итоге отчетность предприятия неуклонно разрастается и становится избыточной, повышается трудоемкость процессов ее формирования, потребители информации от этого едва ли выигрывают. Далеко не всегда сотрудники предприятия, предоставляющие показатели отчетов, заинтересованы в «прозрачности» процесса получения этих сведений. Излишняя открытость лишает их возможности некоторого «маневра» и усиливает контроль со стороны руководства, поэтому формализация процессов формирования отчетности на местах, как правило, не приветствуется. К тому же на это обычно «нет времени». Низкая формализация, безусловно, способствует хаотичности процессов формирования отчетности и умышленному искажению соответствующей информации. Повышение трудоемкости при ограниченном штате сотрудников и сохранении старых методов формирования отчетности неизбежно приводит к снижению оперативности. Сам процесс доставки информации лицу, принимающему решения (конечному пользователю отчета), может состоять из множества звеньев, каждое из которых чревато задержками и искажением информации. Разумеется, предприятие может работать и даже развиваться, несмотря на перечисленные проблемы. Однако их воздействие на эффективность и конкурентоспособность предприятия, по мере его укрупнения, становится все более негативным. Основная сложность получения сводной отчетности заключается: 1. в сложности ее получения в связи с разнородностью данных; 2. работники предприятия тратят слишком много времени на поиск необходимой информации; 3. опыт ведущих и наиболее квалифицированных сотрудников используется только ими самими; 4. ценная информация захоронена в огромном количестве документов и данных, доступ к которым затруднен; 5. дорогостоящие ошибки повторяются из-за недостаточной информированности и игнорирования предыдущего опыта; 6. в высокой динамике требований, предъявляемых к ней со стороны потребителей. В такой ситуации отчетные формы, реализуемые в системах хранилищах данных, быстро устаревают и перестают удовлетворять запросы конечных пользователей. Схема работы, при которой формирование большей части отчетности вынуждены были выполнять технические специалисты ИАЦ и окружных ИТ-центров путем прямых выборок из соответствующих информационных хранилищ, приводила к их высокой непрофильной загрузке и не обеспечивала оперативного получения аналитической информации ее конечными пользователями. Этот пункт напрямую зависит от первого, так как доступность и простота необходимой информации обеспечивает быстроту извлечения нужных выборок для отчетов. При ведении учета в нескольких учетных системах неизбежно происходит дублирование информации, ручной перенос из одной системы в другую, двойной учет. Использование промежуточных бумажных носителей внутренней отчетности между подразделениями приводит к рассогласованным данным вследствие человеческого фактора. Данные ошибки очень сложно вычислить, так как нет единой системы документооборота, и у различных подразделений есть доступ не ко всем источникам информации предприятия. Перечисленные проблемы напрямую отражаются на качестве продукции и конечных потребителях, что подчеркивает особую важность задачи. Представленные выше разнородные операционные системы предприятия ОАО «Вологодского комбината хлебопродуктов» сильно затрудняют и замедляют процесс формирования оперативной, сводной, управленческой отчетности, что может привести к финансовым потерям, низкой эффективности работы, к принятию ошибочных управленческих решений, необходимости наличия большого количества персонала для обслуживания и управления предприятием. Основной проблемой является то, что, как правило, приобретаемые учетные системы не имеют какой-либо единой информационной среды, а приобретаются только исходя из их дешевизны, что и приводит к высокой степени разнородности и дублирования данных.

Внедрение метода и средств интеграции онтологий разнородных АСУ на ОАО «Вологодский комбинат хлебопродуктов»

На основе полученных данных (Таблица 5) сравнительных результатов поиска были рассчитаны на основании формул (38) и (41) точность и полнота поиска. Точность вручную = 99%, точность с помощью ПО = 95%. Полнота вручную = 79% , полнота с помощью ПО = 96%. Из результатов видно, что человек точнее определяет сходство понятий и атрибутов чем ПО, но все же человеку трудно определить все схожие понятия и атрибуты, здесь он заметно уступает ПО. Результаты, полученные в ПО, будут обработаны человеком, что позволит повысить точность до уровня точности, найденной вручную. Из приведенной таблицы видно, что чем больше интегрируемый источник данных по объему, тем сложнее человеку вручную находить соответствия, и тем больше ему требуется времени для нахождения соответствий для последующей интеграции. Возможны и результаты, где ПО + интегратор не смогут превзойти ручной труд одного интегратора вследствие плохо структурированного и описанного источника данных. Также налицо разница во времени, затраченного на операцию нахождения соответствий. Выводы по главе 4 1. В результате интеграции была получена расширенная базовая онтология предприятия ОАО «Вологодский комбинат хлебопродуктов», на основании которой была сформирована схема корпоративного хранилища данных. 2. Работа программного комплекса, основанного на данном методе и математической модели, позволяет в автоматизированном режиме проводить интеграцию онтологий разнородных АСУ промышленного предприятия с базовой (расширенной базовой) онтологией, беря всю черновую работу по поиску на себя, оставляя за интегратором лишь принятие ответственных решений. 3. Настроенная обратная связь в процессе интеграции в программном комплексе позволяет оперативно перемещаться по алгоритму интеграции в контрольные точки без потери оперативной информации. 4. Были проанализированы результаты эксперимента на ОАО «ВКХП», произведено сравнение автоматизированного поиска с ручным поиском, в результате чего сделан вывод, что с помощью ПО «АУПП-Интегратор», разработанного на основе предложенного метода и математического аппарата, человек справляется с задачей интеграции быстрее, полнее и точнее. Важным практическим результатом работы является прототип автоматизированной системы интеграции данных «АУПП-Интегратор», позволяющий эффективно проводить интеграцию разнородных источников данных, с помощью которого была решена задача объединения разобщенной и разнородной информации о предметной области «Хранение и переработка зерна» на Вологодском комбинате хлебопродуктов. В соответствии с заявленной целью были решены следующие задачи: 1. Проведен анализ существующих методов интеграции АСУ, выявлены преимущества онтологического подхода к интеграции данных. 2. Разработан метод семантической интеграции онтологий, извлеченных из источников данных АСУ промышленных предприятий, позволяющий осуществить глубокую интеграцию и устранить лексические и семантические конфликты разнородных источников данных. Данный метод, основанный на базовой онтологической модели, в полной мере позволяет решить поставленную задачу интеграции разнородных АСУ промышленного предприятия и отлично систематизирует и структуризирует входящие разнородные АСУ. Данный метод позволяет качественнее и быстрее проводить интеграцию разнородных источников данных. В случае если источник включает в себя большие объемы информации, время, затраченное на операцию нахождения соответствий, в разы превосходит в скорости, чем ручная работа. Одно из ключевых преимуществ, которое предоставляет данный метод, это оперативный унифицированный доступ к корпоративным знаниям предметной области предприятия. В результате разработанного метода проводить интеграцию разнородных источников данных в автоматизированном режиме стало проще и быстрее. Это обусловлено тем, что человек, проводящий интеграцию, всегда может пропустить ту или иную важную составляющую. 3. Проанализирован имеющийся математический аппарат для поддержки процесса интеграции онтологий. Разработан математический аппарат для поддержки процесса интеграции онтологий разнородных источников данных АСУ промышленных предприятий, включающий математическую модель определения семантической близости понятий и атрибутов интегрируемых онтологий и множество операций интеграции онтологий. Данный математический аппарат формализует и эффективно решает задачу интеграции разнородных АСУ промышленного предприятия с базовой онтологией предметной области: - Поиск и исключение понятия и атрибутов с одинаковым названием и разным смыслом. - Поиск и объединение понятий и атрибутов с разным названием и одинаковым смыслом. - Решает задачу поиска вложенных онтологий. - Дополнение отсутствующих понятий и атрибутов. - Эффективно умеет разделять и объединять множества понятий и атрибутов. - Позволяет проводить интеграцию крупных источников информации с любым количеством вложенности структур понятий. 4. Разработан алгоритм для поддержки процесса интеграции онтологий. 5. Разработан прототип автоматизированной системы интеграции данных АСУ промышленного предприятия.

Похожие диссертации на Метод и средства интеграции онтологий разнородных источников данных в автоматизированных системах управления промышленных предприятий