Методы, алгоритмы и программные инструменты достижения интероперабельности прикладного программного обеспечения на основе частотного анализа данных Мальшаков Григорий Викторович

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Мальшаков Григорий Викторович. Методы, алгоритмы и программные инструменты достижения интероперабельности прикладного программного обеспечения на основе частотного анализа данных: диссертация ... кандидата Технических наук: 05.13.11 / Мальшаков Григорий Викторович;[Место защиты: ФГБОУ ВО Московский технологический университет], 2017

Содержание к диссертации

Введение

ГЛАВА 1. Разработка метода идентификации сущности предметной области на основе частотного анализа данных для достижения интероперабельности прикладного программного обеспечения 11

1.1. Аналитический обзор способов обеспечения интероперабельности прикладного ПО 11

1.2. CALS-технологии как средство обеспечения информационного обмена 12

1.3. Теоретическое обоснование использования частотного анализа данных как средства обеспечения интероперабельности прикладного ПО 22

1.4. Идентификация сущностей предметной области 23

1.4.1. Основные понятия и допущения 23

1.4.2. Организация вычислений 24

1.4.3. Построение алфавита частотной идентификации сущности предметной области

1.4.4. Анализ и устранение ошибок, возникающих при идентификации сущностей предметной области 30

1.4.5. Метод идентификации сущности предметной области на основе частотного анализа данных 54

Выводы 55

ГЛАВА 2. Разработка метода оценки интероперабельности прикладного программного обеспечения на основе объектно-ориентированных полихроматических множеств состава и свойств их данных 57

2.1. Аналитический обзор методов оценки интероперабельности прикладного программного обеспечения

2.2. Объектно - ориентированные полихроматические множества состава и свойств данных как средство структурного описания прикладного программного обеспечения 59

2.3. Метод оценки интероперабельности прикладного программного обеспечения на основе объектно-ориентированных полихроматических множеств состава и свойств их данных 81

Выводы 83

ГЛАВА 3. Разработка алгоритмов и программных инструментов поддержки достижения интероперабельности прикладного программного обеспечения на основе частотного анализа данных 84

3.1. Архитектура программного комплекса поддержки обеспечения интероперабельности прикладного ПО 84

3.2. Разработка анализатора EXPRESS - схем 89

3.3. Разработка загрузчика EXPRESS - схем 102

3.4. Разработка синтезатора EXPRESS - схем 103

3.5. Разработка SDAI - интерфейса 105

3.6. Конвертирование данных 118

3.7. Программный комплекс обеспечения итероперабельности прикладного ПО 123

3.8. Внедрение результатов исследований 126

Выводы 127

Заключение 129

Сокращения и условные обозначения 131

Словарь терминов 137

Список литературы

Идентификация сущностей предметной области
Анализ и устранение ошибок, возникающих при идентификации сущностей предметной области
Объектно - ориентированные полихроматические множества состава и свойств данных как средство структурного описания прикладного программного обеспечения
Разработка SDAI - интерфейса

Введение к работе

Актуальность темы исследования. За последние 50 лет во многих странах
наблюдается снижение удельного веса занятых и доли промышленности во
внутреннем валовом продукте (ВВП). В среднем по миру за 1960—2007 гг. доля
промышленности в ВВП сократилась с 40% до 28%, а доля занятых — до 21%. В
экономике начинает преобладать инновационный сектор экономики с

высокопроизводительной промышленностью, индустрией знаний, с высокой долей в
ВВП высококачественных и инновационных услуг, с конкуренцией во всех видах
экономической и иной деятельности, а также высокой долей населения, занятого
более в сфере услуг, нежели в промышленном производстве. Это стало возможным
благодаря развитию информационных технологий и трансформации

технологического, продукт-ориентированного способа производства в

постиндустриальный.

Наступает эра информационного общества — общества, в котором большинство
работающих занято производством, хранением, переработкой и реализацией
информации. Информационное общество в России поддерживается на

государственном уровне. Так, в 2002 году Правительством РФ была принята федеральная целевая программа «Электронная Россия 2002—2010 гг.», которая дала мощный толчок развитию информационного общества в российских регионах, в 2008 году принята Стратегия развития информационного общества до 2020 года.

Общество — это форма объединения людей, обладающих общими интересами, ценностями и целями. Информационное общество предполагает обмен информацией между людьми общества, которая в настоящее время хранится в различных программных системах. Без объединения программных систем в единую систему для обмена информацией невозможно построение информационного общества. Программное обеспечение (ПО), используемое в обществе, должно обладать высоким уровнем интероперабельности - способности к взаимодействию.

В настоящее время изучение отдельных аспектов обеспечения взаимодействия программ и программных систем, включающих разнородные программно-аппаратные платформы и цифровые телекоммуникации, объединено в целое направление исследований и разработок - технологию открытых систем (ТОС) (Гуляев Ю.В., Олейников А.Я., Филимонов Е.В., Журавлёв Е.Е. и др.). В основу открытых систем согласно ISO/IEC TR 14252-1995 положены: создание среды, обеспечивающей переносимость, взаимодействие и масштабируемость программ и данных (технологическая интероперабельность - способность к обмену данными); создание набора базовых стандартов, необходимых для решения программами общих функциональных задач системы (семантическая интероперабельность -способность информационных систем одинаковым образом понимать смысл информации, которой они обмениваются).

Распространенные методы обеспечения интероперабельности в большинстве случаев решают проблемы интеграции на технологическом уровне при помощи стандартизации форматов представления данных. Появление стандарта XML предоставило единый синтаксис для описания структур данных, но XML не может обеспечить семантическую интероперабельность.

Единое понимание смысла данных различными прикладными программами и
программными системами обеспечивается заранее созданной и

стандартизированной общей моделью информационного пространства открытой

системы и установленными соответствиями её элементов элементам моделей программ. Соотнесение элементов данных различных моделей обычно выполняется вручную.

Как правило, до присоединения к открытой системе ПО уже существует, поэтому приходится лишь решать проблему его расширения и модификации, позволяющих обеспечить взаимодействие с системой. Программы с учётом информационной модели содержат в себе данные, имеющие уникальные частотные характеристики (повторение букв, пар букв, m-грамм и т.д.), по которым их можно идентифицировать.

Возможно сделать предположение о существовании уникального частотного распределения лексем данных, по которому идентифицировать, к каким сущностям предметной области информационной модели они относятся, тем самым установить связи между информационными моделями. Затем между самими программами установить взаимодействие, не прибегая к изначальной стандартизации.

Требования способности взаимодействия информационных систем друг с другом по мере создания информационного общества растут, а текущие методы, основанные на стандартизации, не могут быстро обеспечить это взаимодействие. Поэтому необходимо провести специальное исследование использования частотных характеристик данных для идентификации элементов информационных моделей программ и программных систем и разработать методы, позволяющие решить эти проблемы.

Объект исследования - программная система, вступающая во взаимодействие с другими программными системами.

Предмет исследования - методы, алгоритмы и программные инструменты для организации взаимодействия программ и программных систем.

Цель диссертационного исследования - разработка методов, алгоритмов и программных инструментов достижения интероперабельности прикладного программного обеспечения на основе частотного анализа данных.

Для достижения поставленной в диссертации цели решены следующие основные задачи:

1. разработка метода идентификации сущности предметной области на основе
частотного анализа данных для достижения интероперабельности прикладного ПО;

разработка метода оценки интероперабельности прикладного ПО на основе его данных;
разработка алгоритмов и программных инструментов поддержки достижения интероперабельности прикладного ПО на основе полученных методов.

Методологическую основу диссертационного исследования составили: теория алгоритмов, теория автоматов, теория полихроматических множеств и графов, функциональный и системный анализ, математическая статистика.

Основные научные результаты, выносимые на защиту:

1. Метод идентификации сущности предметной области на основе частотного
анализа данных;

2. Критерий принятия решения о принадлежности данных сущности предметной
области с учётом ошибок первого и второго рода;

3. Метод оценки интероперабельности прикладного ПО на основе объектно-
ориентированных полихроматических множеств состава и свойств их данных;

4. Алгоритмы и программные инструменты поддержки достижения
интероперабельности прикладного ПО на основе частотного анализа данных;

5. Внедрение результатов исследований в части: критерия принятия решения о
принадлежности данных сущности предметной области с учётом ошибок первого и
второго рода, метода идентификации сущности предметной области на основе
частотного анализа данных, метода оценки интероперабельности прикладного ПО
на основе объектно-ориентированных полихроматических множеств состава и
свойств их данных, программно-инструментального средства поддержки
достижения интероперабельности прикладного ПО, программы "Анализатор
EXPRESS-схем".

Научная новизна и теоретическая значимость исследования:

Введено ранее не используемое понятие "алфавит частотной идентификации сущности предметной области" и разработан алгоритм его построения. Алфавит позволяет идентифицировать данные сущности предметной области по количествам в них повтора лексем;
Разработан метод идентификации сущности предметной области на основе частотного анализа данных, и определены требования к исходным данным для его использования в различных условиях;

3. Разработан метод оценки интероперабельности прикладного ПО, позволяющий
количественно оценить интероперабельность на основе объектно-ориентированных
полихроматических множеств состава и свойств их данных;

4. Предложено расширение полихроматических множеств состава и свойств
данных ПО, позволившее разработать метод оценки интероперабельности
прикладного ПО без ограничений на его размеры.

Практическая значимость исследования:

Результаты диссертационной работы могут быть использованы при решении задач, связанных с организацией взаимодействия программ и программных систем. Интерес проявлен со стороны организаций: ООО «Лоция Софтвэа», ООО «Ижмаш» - Беспилотные системы», ООО «СВИР-Трейд», ООО «Хайнеманн Медицинтехник», ООО «Транспортное Снабжение Нерудами», кафедра РК9 МГТУ им. Н.Э.Баумана.

Метод идентификации сущности предметной области на основе частотного анализа их данных, в отличие от существующих методов достижения интероперабельности, позволяет ввести в процесс согласования данных объединяемых программ и программных систем элементы автоматизации, переложив часть функций распознавания сущностей предметной области на вычислительную машину, что позволяет сократить трудозатраты, увеличивая оперативность и достоверность этого процесса.

Метод оценки интероперабельности прикладного ПО на основе объектно-ориентированных полихроматических множеств состава и свойств их данных позволяет количественно оценить интероперабельность, не прибегая к экспертным оценкам, уменьшая тем самым влияние человеческого фактора.

Разработанные программные инструменты (синтезатор EXPRESS-схем,

позволяющий по базе данных сформировать заготовку её информационной модели, анализатор EXPRESS-схем, позволяющий проверить информационную модель на корректность, загрузчик EXPRESS-схем, позволяющий настроить базу данных для хранения данных в соответствии с полученной информационной моделью)

позволяют сократить сроки организации взаимодействия программ и программных систем.

Внедрение результатов. Полученные в работе результаты внедрены в различных организациях:

- программный комплекс поддержки процесса автоматизации управления
предприятием на основе CALS-технологий в ООО «Лоция Софтвэа» (акт внедрения
от 25.11.2008);

- критерий принятия решения о принадлежности данных сущности предметной
области с учётом ошибок первого и второго рода, метод идентификации сущности
предметной области на основе частотного анализа данных, метод оценки
интероперабельности прикладного ПО на основе объектно-ориентированных
полихроматических множеств состава и свойств их данных использованы в ООО
«Ижмаш» - Беспилотные системы» при выполнении ОКР «Муха», ОКР «Бушприт-
М» (акт внедрения от 1.03.2016);

- программно-инструментальное средство поддержки достижения
интероперабельности прикладного ПО использовано в ООО «СВИР-Трейд» при
выполнении работ (заказ №151110-1 для ООО «Бетамакс-Альфа», заказ №151029
для ООО «Серебряный квартет 3», заказ №151021-1 для ООО «Авто-Сейл») (акт
внедрения от 12.02.2016);

метод идентификации сущности предметной области на основе частотного анализа данных, метод оценки интероперабельности прикладного ПО на основе объектно-ориентированных полихроматических множеств состава и свойств их данных, программные инструменты поддержки достижения интероперабельности прикладного ПО на основе частотного анализа данных (синтезатор, анализатор, загрузчик EXPRESS-схем) использованы ООО «Хайнеманн Медицинтехник» при выполнении работ в двух проектах «Модернизация - 1», «Модернизация - 2» по созданию программного обеспечения автоматизации линии (акт внедрения от 16.03.2016);

метод идентификации сущности предметной области на основе частотного анализа данных использован ООО «Транспортное Снабжение Нерудами» при построении системы автоматизированного учёта горюче-смазочных материалов (акт внедрения от 15.12.2015);

- программа «Анализатор EXPRESS-схем» используется в учебном процессе
факультета «Робототехника и комплексная автоматизация» МГТУ им. Н.Э.Баумана,
кафедры РК9 при выполнении лабораторной работы «Работа с данными ISO 10303
STEP» (акт внедрения от 16.10.2008).

Получены свидетельства об официальной регистрации программ: Анализатор
EXPRESS-схем (№ 2008612276 от 8.05.2008), Синтезатор EXPRESS-схем (№

2008612274 от 8.05.2008), Загрузчик EXPRESS-схем (№ 2008612275 от 8.05.2008), Программа идентификации сущностей предметной области на основе частотного анализа их данных (№ 2016614140 от 14.04.2016).

Апробация результатов исследования. Основные результаты исследований доложены, обсуждались и прошли экспертизу на:

заседаниях кафедры 403 "Электронно-вычислительные средства и информатика" МАИ в 2008, 2010, 2016 гг.;

международных научно-практических конференциях: "Достижения и проблемы современной науки" в 2016 г., "Приоритетные научные исследования и разработки" в 2016 г., "Техника и технология: новые перспективы развития" в 2016 г.;

всероссийских конференциях: “Информационные технологии в авиационной и космической технике - 2009” (МАИ), “Цивилизация знаний: глобальный кризис и инновационный выбор России” в 2009 и 2010 гг. (РосНОУ), “Информационные технологии в обеспечении нового качества высшего образования” (МИСиС), “Микроэлектроника и информатика - 2010” (МИЭТ, Зеленоград); “Научно-техническое творчество молодёжи - путь к обществу, основанному на знаниях” в 2010 г. (Москва);

5-м международном симпозиуме по компьютерным наукам в России “Семантика, спецификация и верификация программ: теория и приложения” в 2010 г. (Институт информатики АН РТ, Казань);

региональных конференциях: МИРЭА в 2010 г., “Инновации в авиации и космонавтике - 2010” (МАИ);

межотраслевом молодёжном научно-техническом форуме “Достижения молодых научных и инженерных кадров для авиации и космонавтики” в 2010 г. (Москва);

конкурсе “Лучший инновационный проект студентов, аспирантов, молодых учёных и сотрудников МАИ” в 2010 г. (МАИ).

Достоверность и обоснованность полученных результатов обеспечивается непротиворечивостью теоретических выводов с вычислительными экспериментами. В связи с большим объёмом вычислений для вычислительных экспериментов на кафедре 403 МАИ на базе компьютерного класса разработана и использована распределённая вычислительная система, состоящая из 5-ти компьютеров.

Публикации. Полученные в диссертационном исследовании результаты представлены в 18 научных публикациях, из них 5 - в изданиях из списка рекомендованного ВАК, 9 - тезисов докладов, 4 - свидетельства о регистрации программ для ЭВМ.

Структура и объем работы. Диссертация состоит из введения, трёх глав, заключения и приложения, изложенных на 161 страницах, включая 53 рисунка и 22 таблицы, а также списка литературы из 130 наименований.

Идентификация сущностей предметной области

Норенков, Ю.М. Соломенцев, В.В. Павлов, П.К. Кузьмик, А.Ф. Колчин, М.В. Овсянников, А.Ф. Стрекалов, СВ. Сумароков, Жирков А.О., Коган Ю.Г., Расюк О.В., Солдатов А.С., и др. В РФ в рамках Госстандарта функционирует технический комитет № 431 «CALS-технологии», который в 1990-х годах разработал и к настоящему времени принял в РФ ряд серий международных стандартов, представляющих CALS-технологии, среди которых наиболее значимы стандарты ISO 10303 STEP (Standard for Exchange of Product data) [50, 91, 112].

Проектирование единого информационного пространства осуществляется с помощью моделирования [Ш], результатом которого является единая информационная модель объединяемого прикладного ПО. Начальные версии информационных моделей прикладного ПО синтезируются синтезатором EXPRESS-схем по их базам данных с использованием частотного анализа данных. Затем они благодаря сопряжению и единению объединяются экспертом в единую модель; для каждой объединяемой модели формируется спецификация приведения, фиксирующая изменения, происходящие в ней при единении (рисунок 1.1). Для проверки на соответствие языку EXPRESS созданная экспертом модель проверяется анализатором EXPRESS-схем.

Разработка единого информационного пространства объединяемого прикладного ПО происходит на основе результатов его проектирования. Полученная единая информационная модель загружается в PDM-систему загрузчиком EXPRESS-схем, настраивая её на единое информационное пространство. Затем каждая прикладная программа модифицируется с учётом полученной спецификации приведения, подключаясь тем самым к единому информационному пространству.

Онтологическая модель проектирования и разработки единого информационного пространства прикладного ПО представлена на рисунке 1.2.

CALS - это набор правил и регламентов для организации единого информационного пространства, в основе которых лежит стандарт STEP (Standard for the Exchange of Product data).

Стандарт STEP состоит из 3-х уровней: инструментарий, базовая модель изделия, информационная модель изделия (рисунок 1.3). Каждый последующий уровень основан на предыдущем уровне. Для описания базовой модели используется инструментарий, а при создании информационной модели используется базовая модель изделия. IfflCTFSTSlEHTAPIDI Методы описания (EXPRESS) тома 11-19 Методы реализации тома 21-29 Методы тестирования тома 31-39 БАЗОВАЯ МОДЕЛЬ ИЗДЕЛИЯ Интегрированные ресурсы тома 41-49 и 101-199 ИНФОРМАЦИОННАЯ МОДЕЛЬ ИЗДЕЛИЯ Прикладные протоколы тома 201-299 Рисунок 1.3. Структура стандарта STEP (ISO 10303) Стандарт STEP упрощает реализацию информационного обмена между прикладным ПО. Позволяет создать модель информационного пространства и сократить количество конверторов до 2 N штук (рисунок 1.4).

В качестве методов описания в стандарте STEP используется формальный язык определения данных EXPRESS [4, 82], удобный для восприятия как человеком, так и компьютерной программой. На языке EXPRESS возможно создать информационную модель любой сложности благодаря поддержки им объектно-ориентированного подхода.

В основе этого языка лежит объектно-ориентированный подход. Суть его состоит в том, что основным элементом модели является нейтральное понятие "объект", называемое в EXPRESS "сущностью". Сущность - класс объектов реального мира с общими характеристиками. Для определения какого - либо конкретного элемента из множества применяется термин "экземпляр сущности".

Общие характеристики сущности определяются атрибутами. Атрибут сущности представляет отдельную характеристику класса объектов реального мира. Каждый атрибут сущности обладает именем. Для каждого атрибута сущности указывается область его допустимых значений. Для этих целей используются типы данных. В языке EXPRESS имеются пять категорий типов данных: простые, агрегированные, поименованные, составные. Язык предназначен для формального описания моделируемых реальных объектов. Определение объекта дается через его свойства (атрибуты), особенности или характеристики, имеющие важное значение для понимания и использования объектов. Представление атрибутов может иметь простой тип данных или являться другим объектом. Атрибуты характеризуются путем определения области их значений и ограничений, накладываемых на область значений.

В этом языке EXPRESS-схема содержит в себе набор сущностей и является основой для структурирования и взаимосвязи элементов представления данных об изделии.

Язык EXPRESS создан по образу и подобию языка программирования. При разработке языка EXPRESS использованы несколько языков, в частности Ada, Algol, С, C++, Euler, Modula-2, Pascal, PL/1 и SQL [4].

Модель на языке EXPRESS описывает структуру данных и ограничения на эти данные предметной области прикладного ПО. Для каждого реального моделируемого объекта в модели создаётся сущность (ENTITY). ENTITY имя сущности ; тело сущности ; END ENTITY; Для каждого свойства объекта в сущности создаётся отдельный атрибут, имеющий тип и уникальное в рамках сущности имя. имя атрибута : тип атрибута ; Тип (TYPE) может быть простым (булевским (BOOLEAN), логическим (LOGICAL), целочисленным (INTEGER), вещественным (REAL), строковым (STRING), двоичным (BINARY)), определяемым на основе другого типа данных с целью расширения выразительных возможностей EXPRESS. TYPE имя типа имя исходного типа ; END TYPE;

Анализ и устранение ошибок, возникающих при идентификации сущностей предметной области

В матрице указано процентное соотношение вхождения объектов одной сущности предметной области в другую по полю "Наименование".

Для повышения достоверности исследования ошибок ложной идентификации сущности предметной области схожие (не менее чем на 30%) по частотам повторов лексем сущности предметной области исключены из рассмотрения. С учётом исключения из 178 сущностей предметной области осталось 113. Экспериментальные данные включали 56020 корреляций между алфавитом и объектами сущностей предметной области при различных искажениях алфавита и данных.

2. Исследование ошибок ложного обнаружения, возникающих из-за того, что количество отсутствия лексем алфавита в объектах другой сущности предметной области пропорционально их встречи в объектах поисковой сущности предметной области, что даёт коэффициент корреляции Пирсона = 0,7 [70]. Пример данных такого случая представлен в таблице 1.6. Таблица 1.6 Пример корреляционных данных с номером id = 304546 между данными сущности предметной области с № 162 и алфавитом сущности с № 50, приводящих к ложному обнаружению лексема in Rings Аг be re d ol Ts Ers количество встреч в объектах 2 0 0 0 0 1 0 0 0 частоты в алфавите 4 3 2 2 2 2 2 2 2 Указанные данные дают максимальный (0,8838) и минимальный (0,7499) коэффициенты корреляции больше 0,7, что приводит к ложному обнаружению. Чтобы избавится от такого рода ошибок, необходимо учитывать количество ненулевых значений встречи лексем алфавита в объектах исследуемой сущности предметной области.

Экспериментальные данные по ложным и правильным обнаружениям для 113 сущностей предметной области с учётом количества ненулевых встреч лексем алфавита в объектах исследуемой сущности предметной области обобщены и сведены в таблицу 1.7.

Ложное и правильное распознавание от количества нулевых встреч Nd(количество ненулевых встреч лексем алфавита в объектах исследуемой сущности), % 20 30 40 50 60 70 80 90 Количество ложных обнаружений 143 77 44 31 16 6 5 0 0 Количество правильных обнаружений 0 0 1 0 1 6 18 30 63 Их графики представлены на рисунке 1.13. Y+ Правильное обнаружение

Зависимости ложного и правильного обнаружения сущностей предметной области от количества ненулевых встреч лексем алфавита (Na) Условие Nd = 60±5% обеспечивает оптимальное соотношение между количеством ошибок ложного обнаружения и количеством правильно обнаруженных сущностей предметной области. Однако имеется зона неоднозначности, из-за которой возможны как ложное обнаружение, так и пропуск обнаружения. Поэтому, учитывая количество ненулевых встреч лексем алфавита в объектах исследуемой сущности предметной области, полностью от ошибок избавиться невозможно. Произведено построение в среде Mathcad полиноминальной регрессионной зависимости [31] ошибки ложного обнаружения от количества ненулевых встреч лексем алфавита. Исходные данные: [ма5 і переменная Функция 1(Л (143 20 77 44 31 к := 50 У := 16 6 5 ч90, ч 0 ; Вызов функции, реализующей полиноминальную регрессию: Y.(Nd) = 248,778 - 13,432-Nd + 0,309-Nd2 - 3,337-10"3-Nd3 + 1,361-10"5-Nd4; Выполнена проверка регрессионного полинома для v := 90 g := 248,778 - 13,432-v + 0,309-vv - 0,003337-vv-v + 0,00001361 -vv-v-v = 3,077 interp (z, x, у, t)

Полиноминальная регрессионная зависимость ошибки ложного обнаружения от количества ненулевых встреч лексем алфавита. Произведено построение в среде Mathcad регрессионной зависимости [31] правильного обнаружения от количества ненулевых встреч лексем алфавита. Исходные данные: има; і переменная Функция 0 1 0 X .= 50 У := 1 6 18 ,90; ч63; ( 4.889 -1.741 -4.771 -4.201 d2 := -0.031 7.739 19.109 34.079 52.649; corr(y,d2) = 0.974 -стз" 1.117 0.556 -0.388 d3 := 0.2884.5914.52432.093ч59.305„ corr(y,c ІЗ) = 0.95 Я Вызов функции, реализующей полиноминальную регрессию: z := regress (х, у, 4), где х, у - исходные данные; 4 - степень полинома. Коэффициент корреляции регрессионной зависимости с экспериментальными данными для полинома со степенью 2. Коэффициент корреляции регрессионной зависимости с экспериментальными данными для полинома со степенью 3. Коэффициент корреляции регрессионной зависимости с экспериментальными данными для полинома со степенью 4. Коэффициент корреляции регрессионной зависимости с экспериментальными данными для полинома со степенью 5.

Устранение ошибок ложного обнаружения, возникающих из-за того, что алфавит частотной идентификации сущности содержит часто употребляемые лексемы, содержащиеся в данных объектов других сущностей предметной области. Чтобы не возникало ложного обнаружения из-за того, что алфавит частотной идентификации сущности содержит часто употребляемые лексемы, располагающихся в данных объектов других сущностей предметной области предложено из него их исключить. Чем короче лексема, тем больше вероятность, что она встретится в данных объектов других сущностей предметной области. Поэтому признаком исключения стала длина лексемы, в частности минимально допустимое количество символов (Nc).

На рисунке 1.16 представлены зависимости автокорреляции для данных БТИЗ (для 30% выборки), выпрямительного диода, импульсного диода, ПТ от минимально допустимого количества символов в лексемах. Ґ биполярный транзистор с изолированным затвором j

Объектно - ориентированные полихроматические множества состава и свойств данных как средство структурного описания прикладного программного обеспечения

В случае наличия свойства в этом векторе устанавливается 1, в случае отсутствия - 0.

Это представление цветов обеспечивает возможность применения унифицированных средств описания цветов множества и отношений между ними в едином информационном пространстве CALS-технологий.

Булева матрица [A F(A)] описывает составы цветов элементов множества А, в которой Si(j) отражает бинарное отношение между элементом ai и цветом FJ: 1(1) 1(2) " S\(m) 2(1) 2(2) " 2(«) (2.19) Si(j) [AxF{A)] = A,F(A) s, $n (1) Sn (2) n(m) Если элемент ai множества А имеет цвет Fj, то Si(j) = 1, в противном случае Si(j)=0: SHj) 1, если FjF{ct,\ 0, если F} F(at). (2.20) Раскраска F(at) элемента ai множества А характеризует в целом свойства элемента а,-. Множество цветов в раскраске F(cii) не является однозначно определенным и зависит от уровня знаний о свойствах предмета а,-, от точки зрения на роль этого предмета в конкретной ситуации и т.п. Свойства реального предмета, моделируемого элементом щ OOnS-множества, могут разделяться на группы, обладающие общностью природы, общим целевым назначением и т.п. При решении определенных задач часто охватываются не все, а лишь некоторые группы свойств объекта и, следовательно, группы цветов щ. В этом случае описания элемента щ в разных задачах будут различаться полнотой представления цветов в его раскраске.

Между раскраской F(cii) как единым целым и входящими в нее собственными цветами элемента щ существуют отношения, которые формально можно представить в виде теоретико-множественного отношения F{at)= [Fh{ai),Fh{ai) Fjja,)}, (2.21) или, с учетом логических отношений между цветами F(cii), - логическими уравнениями F(at) = RL(Fh (я,), Fh (аД.... Fjm (о,)). (2.22) Смысловая интерпретация приведенных отношений зависит от рассматриваемых свойств объекта, моделируемого элементом а,-, обусловленных целью моделирования. Такими целями могут быть: описание полного состава собственных цветов F(di), присущих элементу А;; описание возможных вариантов составов цветов в раскраске F(ai), при наличии которых данный элемент щ удовлетворяет заранее заданным условиям; описание взаимосвязи всех цветов элемента а; по условиям их существования в раскраске F(cii) и т.д.

Соответствие раскраски элемента щ ее смысловой интерпретации представляется как истинность логического уравнения (2.22), имеющего определенную структуру, и определяется соотношением Пад = 1, если F{ai) = RL(Fh (лД 2(дД..., Fjm (А,)) = 1, (2.23)

Описание полного состава цветов щ осуществляется либо теоретико-множественным отношением (2.21) в виде списка цветов, входящих в множество F(dj), либо логическим отношением (2.22) в виде логического уравнения F(ai) = Fl(ai) F2(ai) ...AFm(a() = AbFj(ai), (2.24) поскольку в составе раскраски F(a$ должны присутствовать все цвета. Поэтому наличие полного состава цветов F(aj), присущих элементу а,-, в этом случае определяется соотношением F(a)=l, если (2.25) F(ai) = Fi(ai)AF2(ai)A...AFm(ai) = /\Fj(ai) = L 3-І =А h Описание возможных вариантов составов цветов щ осуществляется либо списками таких составов, либо логическим уравнением (2.22) в виде ДНФ или КНФ: W = VAFJ («,),; (226) ip nq FiaJ AVFM. (2-27) В случае ДНФ соответствие состава F(cii) цветов элемента щ заданным условиям определяется соотношением Пр nq F{a —\, если F(af) = VAF, Ц)=1, (228) р=\ =1 а в случае КНФ - соотношением пр »ч F(a,)=l, если F(«.) = AVF. (Щ) =1. (2.29) Предельными случаями отношения (2.22) будут уравнение (2.24), когда единственным вариантом состава собственных цветов щ является полный состав F(di), и уравнение =v т F(a,.)=F1(oi)vFa(a/)v..,vFw(fl V F(ui% (2.30) j=1 когда возможным вариантом состава цветов щ может быть любой отдельный цвет Fjq(di)=\, или любое сочетание этих цветов.

В этом случае соответствие цветов элемента щ заданным условиям определяется, в отличие от (2.25), соотношением F{a =\, если FCA) = VF, A) = 1. (2-31) ;=i J Если отношение (2.22) интерпретируется как описание взаимосвязи всех собственных цветов элемента щ по условиям их существования в раскраске F(cii), то смысловое содержание приведенных выше логических формул будет следующим: формула (2.25) соответствует случаю, когда все цвета в раскраске F(at) взаимосвязаны друг с другом по условиям существования, т.е. ни один из этих цветов не может существовать в отдельности; формула (2.26) соответствует случаю, когда в раскраске F(at) имеются наборы цветов, существующих только совместно друг с другом; каждый такой набор описывается конъюнктивно связанной группой цветов, при этом сами группы конъюнктивно связанных цветов независимы друг от друга по условиям их существования; формула (2.27) описывает составы групп совместно независимых цветов, при этом цвета разных групп связаны конъюнкцией по условиям существования в F(at), формула (2.30) соответствует случаю, когда все цвета в раскраске F(at) независимы друг от друга по условиям существования.

Вычислимые цвета. Элементы могут содержать в себе вычислимые цвета на основе других цветов этого же элемента. Одно и то же свойство может вычисляться несколькими способами, с участием различных комбинаций свойств. Состав свойств комбинации к, участвующих в расчёте Fj свойства, записывается в виде булева вектора:

Разработка SDAI - интерфейса

Для поддержки создания единого хранилища данных созданы [25, 59, 62, 95] три утилиты: синтезатор, анализатор и загрузчик. Синтезатор EXPRESS-схем по БД прикладной программы создаёт его информационную модель в виде EXPRESS-схемы. Анализатор EXPRESS-схем выполняет проверку и разбор созданной экспертом единой информационной модели. Загрузчик EXPRESS-схем по объектному файлу сформированным анализатором, загружает исходную EXPRESS-схему в PDM-систему, формируя необходимые структуры данных полученной модели для их хранения.

Так как идеология CALS подразумевает открытость систем по взаимодействию на всех этапах жизненного цикла продукта, то разрабатываемое ПО должно быть открыто, т е. общедоступно для просмотра и изменения, поэтому три утилиты - синтезатор, анализатор и загрузчик - написаны на скриптовом языке сценариев Microsoft Visual Basic Script Edition (VBScript) [24, 101].

Скриптовые языки позволяют быстро выполнять доработку кода и не требуют компиляции. Исходный код, написанный на языке VBScript, готов к выполнению. Открытость языка позволяет всем желающим более полно использовать программный код для своих нужд, в случае необходимости модифицируя его.

Для взаимодействия прикладных программ с единым хранилищем данных разработан SDAI-интерфейс, для PDM-системы - Party Plus. В среде Visual Studio написана СОМ-библиотека стандартных функций SDAI. SDAI-интерфейс выполнен на основе привязки SDAI ISO 10303-24, доступ к данным обеспечивается через ADO, в нём реализованы контроль вызовов, механизм транзакций. Согласно ГОСТ Р ИСО 10303-22 [6] созданный интерфейс соответствуют 5-му классу реализации.

Разработка единой EXPRESS-схемы

Последовательность разработки единой EXPRESS-схемы приведена на рисунке 3.5. Вначале на основе БД объединяемого прикладного ПО получают EXPRESS-схемы их БД с помощью синтезатора EXPRESS-схем. Далее оператор-аналитик на основе документации и имеющегося опыта дорабатывает созданные синтезатором EXPRESS-схемы БД прикладных программ с учётом их работы. Затем он объединяет их в единую EXPRESS-схему. В процессе создания EXPRESS-схем аналитик для проверки их корректности использует анализатор EXPRESS-схем, который выполняет лексическую, синтаксическую и семантическую их проверку.

Загрузка EXPRESS-схемы в РРМ-систему Созданная экспертом единая EXPRESS-схема среды взаимодействия прикладного ПО с помощью загрузчика EXPRESS-схем загружается в PDM Lotsia Soft, реализуя тем самым единое информационное пространство. Разработка конвертеров прикладного ПО Чтобы прикладные программы могли работать с единым информационным пространством, взаимодействуя с ним через SDAI-интерфейс, для каждой из них необходим конвертер данных (процессор).

Процесс разработки процессора конвертирования (рисунок 3.6) состоит из создания процессора конвертирования, его подключения к прикладной программе (внесение в них изменений) и тестирования всей системы целиком. Единая EXPRESS-схема

В ходе разработки процессора конвертирования создаётся алгоритм его работы (конвертирования одного формата данных в другой), он записывается на языке программирования, подключается к прикладной программе и тестируется.

К задачам разработанного анализатора EXPRESS-схем (рисунок 3.7) относятся [11, 61, 65, 81, 89, 109, 118]: - разбор исходной EXPRESS-схемы на составные части языка EXPRESS; - выдача пользователю сообщений о найденных ошибках; - формирование, в случае успешного разбора, промежуточного представления модели данных. Для упрощения реализации анализа работа анализатора разбита на три фазы [61]: 1. лексический анализ, при котором поток символов исходной программы считывается слева направо и группируется в лексемы; 2. синтаксический анализ, который включает группирование лексем исходного текста программы (схемы) в грамматические фразы (выражения и операторы) и проверку их синтаксиса (того как должна выглядеть программа); 3. семантический анализ, при котором осуществляется проверка наличия семантических ошибок - проверка смыслового соответствия синтаксических конструкций (проверка соответствия типов фактических и формальных параметров; проверка единственности: объект может быть определен только один раз - проверка идентификаторов и меток; проверка использования объявленных объектов; проверка наличия объявлений сущности предметной области, используемой в качестве атрибута другой сущности предметной области). диспетчер таблицы символов исходная EXPRESS

Разбор схемы производится в два прохода: при первом проходе выполняется лексический и синтаксический анализ, при втором проходе -семантический анализ.

Диспетчер таблицы символов служит для ведения таблицы символов, обеспечивающей хранение всех найденных в модели лексем EXPRESS-схемы (в начале работы в него загружаются лексемы ключевых слов языка EXPRESS с атрибутами). На этапе лексического анализа происходит добавление найденных лексем -в случае их отсутствия - в таблицу символов. В процессе синтаксического и семантического анализа дополнительная информация о лексемах вносится в таблицу символов (информация о лексемах в таблице символов хранится в виде атрибутов) и используется различными способами (для выполнения анализа).

На каждой фазе анализа могут встретиться ошибки, которые передаются обработчику ошибок для дальнейшей их выдачи пользователю.

На этапе лексического анализа выявляются ошибки, при которых символы из входного потока не формируют ни одной из лексем языка, соответствующих правилам языка. Ошибки, при которых последовательность лексем нарушает структурные правила (синтаксис) языка, определяются на фазе синтаксического анализа. В процессе семантического анализа проверяется смысл конструкций, корректных с точки зрения синтаксиса. Например, попытка сложения двух идентификаторов, один из которых — имя массива, а второй — имя процедуры, должна вызвать семантическую ошибку.

Анализатор написан на скриптовом языке высокого уровня сценариев Microsoft Visual Basic Script Edition (VBScript), работающем в операционной системе Microsoft Windows 2000/XP. Это позволяет быстро выполнять доработку его кода и не требует компиляции.

Таблица символов - структура данных, предназначена для хранения информации по каждой лексеме (их роли в языке, набор атрибутов: название, тип данных, инициализируемое значение). В программе она реализуется с помощью 5-ти массивов. Для возможности работы с таблицей символов созданы подпрограммы поиска, добавления лексем, чтения / установки значения атрибута. Перед анализом таблица символов заполняется ключевыми словами языка EXPRESS.