Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Использование естественного языка при автоматизации слабо структурируемых процессов в проектировании технических, программных и информационных систем Заболеева-Зотова Алла Викторовна

Использование естественного языка при автоматизации слабо структурируемых процессов в проектировании технических, программных и информационных систем
<
Использование естественного языка при автоматизации слабо структурируемых процессов в проектировании технических, программных и информационных систем Использование естественного языка при автоматизации слабо структурируемых процессов в проектировании технических, программных и информационных систем Использование естественного языка при автоматизации слабо структурируемых процессов в проектировании технических, программных и информационных систем Использование естественного языка при автоматизации слабо структурируемых процессов в проектировании технических, программных и информационных систем Использование естественного языка при автоматизации слабо структурируемых процессов в проектировании технических, программных и информационных систем Использование естественного языка при автоматизации слабо структурируемых процессов в проектировании технических, программных и информационных систем Использование естественного языка при автоматизации слабо структурируемых процессов в проектировании технических, программных и информационных систем Использование естественного языка при автоматизации слабо структурируемых процессов в проектировании технических, программных и информационных систем Использование естественного языка при автоматизации слабо структурируемых процессов в проектировании технических, программных и информационных систем
>

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Заболеева-Зотова Алла Викторовна. Использование естественного языка при автоматизации слабо структурируемых процессов в проектировании технических, программных и информационных систем : диссертация ... доктора технических наук : 05.13.01.- Волгоград, 2004.- 378 с.: ил. РГБ ОД, 71 05-5/723

Содержание к диссертации

Оглавление 2

Введение 4

1. Состояние вопроса и постановка задачи исследования. 14

1.1. Модели и методы обработки естественного языка в автоматизированных системах 14

1.2. Обзор методов моделировании семантики на ранних стадиях проектирования 45

1.3. Выводы. Постановка задачи исследования 70

2. Формализация семантики текста при автоматизации слаооструктурируемых процедур в процессе синтеза технических систем. 74

2.1. Семантика структурного синтеза как формальна» система 74

2.2. Представление сложной системы в виде нечеткого семантического графа , 78

2.3. Нечеткий семантический граф как нечеткая решетка 86

2.5. Формализация описания процесса проектирования 99

Выводы к главе 2 114

3. Формализация семантики текста яри автоматизации слабо структурируемых процедур в процессе синтеза информационных систем 114

3.1. Моделирование структуры систем управлення 117

3.2. Модель мнотагентной системы 120

3.3. Синтез сисгемы управления ИП 126

3.4. Управление проектированием и функционированием АСУ 142

3.5. Оценка эффективности системы проектирования 146

Выводы к главе 3 149

4. Формализация лингвистического этапа при формировании естественно-языкового сопровождения процесса автоматизации синтеза структур сложных систем 150

4.1. Определение тина отображаемой информации 150

4.2. Формирование тезауруса.— 153

4.3. Модель текстообразова пня 155

4.4. Морфологический синтез словоформ „ 161

Выводы к главе 4 165

5. Реализация и применение программно-методического комплекса естественно-языкового сопровождения автоматизации слабоструктурируемых процессов в проектировании 166

5.1. Структуры данных и организации базы знаний 168

5.2. Алгоритмическое обеспечение основных этапов синтеза ТС 1S1

5.3. Л и н гв исти чески и процесс ор 204

5.4. Примеры синтеза описания ТС с использованием разработанной программной среды 206

Выводы к главс 5 24О

6. Использование естественного языка при проектировании программного обеспечения 241

6.1. Естественно-языковое сопровождение процесса формировании структуры программного

о бес н еч е н и я 241

6.2. Методика приближения программного кода к естественному языку проектировщика

6.3. Алгоритмическое и программное обеспечение использования особенностей естественного языка при проектировании программных систем 262

В ы в од ы к гл аве 6 307

ОСНОВНЫЕ РЕЗУЛЬТАТЫ РАБОТЫ. 310

Библиографический список 313

ПРИЛОЖЕНИЯ 331  

Введение к работе

Актуальность проблемы. В современном обществе эффективность умственного труда во многом зависит от степени информационной обеспеченности работников творческих профессий. Наиболее естественным для человека способом информационной коммуникации является естественный язык.

Представление естественного языка как естественно научного объекта и привлечение соответствующих методов его моделирования пока нельзя считать успешным, так как во всех случаях речь идет о четком теоретико-множественном моделировании языковых объектов, которые по своей природе не могут рассматриваться автономно. Большой потенциальной возможность в моделировании языковых структур обладают методы нечеткой математики, которые первоначально и были предназначены для описания лингвистических неопределенностей. При этом данные методы используются как вспомогательный аппарат при обработке простейших языковых процедур. Таким образом, является актуальной задача формализации ограниченного естественного языка на основе нечеткой математики.

Наиболее сложным в формализации языковой деятельности является моделирование смысла текста. Данная проблема восходит своими традициями к методам метаматематики и семиотики. Эта задача может быть решена только применительно к конкретной мыслительной деятельности. Одним из наиболее трудно формализуемых когнитивных процессов является творческая деятельность. Формализовать данные процессы имеющимися методами искусственного интеллекта не удается. Все существующие достижения связаны с имитацией творчества, когда результат способен обмануть лишь не специалиста в моделируемой области. Это связано со сложностью задачи, характеризуемой использованием трудно поддающихся изучению механизмов мышления. При этом если не пытаться заменить естественные мыслительные процессы искусственными, а использовать методы естественной коммуникации, объясняющие процесс формирования сложной системы, возможно получение новых решений, основанных на знаниях, которыми исследователь не обладал. Таким образом, задача построения формализации, предназначенной для объяснения процесса синтеза новой системы, является актуальной.

При проектировании программного обеспечения также является актуальной задача моделирования естественной коммуникации. Это связано с тем, что в процессе отладки программ проектировщик большую часть ресурсов тратит на понимание программного кода. Сейчас языки программирования развиваются в направлении дальнейшего наращивания алгоритмических средств и использования все более совершенных моделей данных. Единственная компонента, которая так и не претерпела значительных изменений, это форма их записи. При этом средства, предоставляемые языками программирования, недостаточны для построения простого, легко читаемого текста. Удобство языковых конструкций целиком зависит от родного языка -прототипа. Поэтому дальнейшее развитие и совершенствование средств разработки программного обеспечения должно быть направлено на приближение их к эталону - родному языку разработчика.

Таким образом, на современном этапе, проблема разработки комплекса моделей и методов, обеспечивающих естественно-языковое сопровождение процесса принятия решения на начальном этапе проектирования технических, информационных и программных систем, является актуальной.

Работа выполнена в Волгоградском государственном техническом университете в соответствии с планом госбюджетной НИР кафедры «Системы автоматизированного проектирования и поискового конструирования» по теме: ГАСНТИ 14.01.21, 14.35.00 "Разработка автоматизированных контрольно-обучающих систем по разделам учебных курсов"(№39.274-02). Цель и задачи работы.

Целью настоящего исследования является разработка средств естественно-языковой коммуникации, предназначенных для повышения эффективности начальных этапов проектирования технических, информационных и программных систем.

Для достижения указанной цели необходимо решить следующие задачи: разработать формальную систему, описывающую семантику текста для естественно-языкового сопровождения процесса синтеза технических и информационных систем при автоматизации слабо структурируемых процедур в проектировании;

разработать модель лингвистического этапа синтеза текста, реализующую описание слабо структурируемой системы на ограниченном естественном языке;

разработать методику использования естественного языка при проектировании программных систем;

реализовать методики, модели и алгоритмы в виде программно-методического комплекса, предназначенного для обеспечения естественноязыковой коммуникации при автоматизации начальных этапов проектирования технических, информационных и программных систем;

проверить адекватность построенной формализации результатами работы программно-методического комплекса.

Основные методы исследования. При разработке формальной системы представления семантической информации использовался математический аппарат высшей алгебры и теории доказательств, системного анализа, теории управления, нечеткой математики. Для моделирования лингвистического этапа применялись методы теории автоматов, формальных грамматик, структурной и компьютерной лингвистики. Формализация процесса проектирования основана на технологиях поискового конструирования, теории мультиагентных систем. Научная новизна.

Решен комплекс научных задач, обеспечивающих естественно-языковое сопровождение процесса принятия решения на начальном этапе проектирования технических, информационных и программных систем, вносящий существенный вклад в развитие теории и практики автоматизации проектирования:

1. Впервые семантическая модель текста представлена как квазиаксиоматическая теория, моделирующая процесс синтеза структуры сложной системы в виде нечеткой семантической решетки, использующая комплекс математических, проблемно-ориентированных эвристических методов, а также фактов, истинность которых определяется мерой нечеткости.

2. Предложен и разработан новый подход к формализации пространства и процесса решений на начальном этапе проектирования распределенных систем, отличающийся использованием методов нечеткой алгебры, агентно-ориентированной технологии и методов поискового конструирования, обеспечивающий повышение эффективности процесса автоматизации за счет использования возможностей распределенных вычислительных комплексов.

3. . Предложено новое представление глубинной структуры текста в виде нечеткой семантической решетки, что позволило формализовать процесс и разработать методику преобразования смысла в естественно-языковое формирование: лингвистический семантический граф, словосочетание, предложение, текст.

4. Разработана методика использования особенностей естественного языка в процессе проектирования программных систем, отличающаяся принципом двухуровневой организации программного обеспечения: язык, использующий различные конструкции естественного языка, повышающие эффективность программирования, - традиционный алгоритмический язык.

Практическая ценность работы.

Разработанная автором интегральная модель естественно-языкового сопровождения процесса структурного синтеза позволяет упростить процесс алгоритмизации в слабо структурируемых задачах при проектировании технических, программных и информационных систем.

Разработанные формализмы внелингвистического синтеза структур технических систем могут использоваться для синтеза новых физических принципов действия в различных предметных областях при автоматизации проектирования технических систем.

Использование элементов естественного языка в средствах разработки программного обеспечения позволяет улучшить и упростить программный код, уменьшить время обучения программированию в школах и ВУЗах.

Реализация результатов работы. Теоретические и практические результаты работы использовались при выполнении госбюджетных научно исследовательских работ, выполненных на кафедре «Системы автоматизированного проектирования и поискового конструирования» Волгоградского государственного технического университета.

Разработанные формализмы, алгоритмы, программное и методическое обеспечение используются в учебном процессе в ВолгГТУ, в ВолГУ, в Волгоградской гимназии №9, в Волгоградском технологическом колледже.

Разработанные программные системы используются в производственном процессе компании Санкт-Петербургского филиала ЗАО "West Call Communication", в Волгоградском ЦНТИ, в Волгоградом и др.

Апробация работы. По основным результатам диссертационной работы сделаны доклады на 23 международных научных конференциях, семинарах и симпозиумах.

Публикации. Основные теоретические и прикладные результаты работы изложены в 2-х монографиях, 3-х учебных пособиях, 10-ти статьях в центральных научных журналах, 36-ти статьях в сборниках научных трудов, 6-ти работах, депонированных в ВИНИТИ и 1-й, депонированной в ЦИНТИ-ЦНТБ (Болгария), 33-х тезисов докладов. Без соавторства опубликованы 11 работ. В работах, опубликованных в соавторстве, личное участие автора заключается в определении проблемы, постановке задач, разработке теоретических положений, а таюке непосредственном участии во всех этапах исследования.

Структура и объем диссертации. Диссертация состоит из введения, шести глав, заключения, списка литературы и приложения.

Во введении обоснована актуальность темы, дана общая характеристика работы.

В первой главе рассмотрены существующие подходы к решению проблемы автоматизации лингвистической обработки; проанализированы классы систем обработки естественного языка (ЕЯ), показаны основные методы моделирования языковой деятельности в автоматизированных системах. Показано состояние вопроса реализации внелингвистического синтеза на ранних стадиях проектирования технических и информационных систем. Проведен анализ современных средств разработки программного обеспечения.

На основании проведенных исследований сформулирована научная проблема работы и соответствующие ей задачи.

Во второй главе рассмотрен вопрос формализации семантики в процессе синтеза сложных систем. Описана формальная система формирования смысла текста. Определены понятия формализации, цели формализации, охарактеризован объект формализации. Рассматривается вопрос формализации семантики при синтезе технических систем. Построенная формализация позволяет применять к моделям технических систем методы теории алгебраических систем. Одной из наиболее развитых и проработанных теорий алгебраических систем является теория решеток. Представление технической системы при помощи нечеткой решетки позволяет учитывать как возникающие в процессе моделирования неопределенности, так и использовать мощный и апробированный алгебраический аппарат, В работе приведена методика преобразования нечеткого семантического графа, описывающего концептуальную модель технической, информационной или программной систем, в виде нечеткой решетки. Процесс проектирования, рассматриваемый как многоитерационная задача формирования модели цели, формализуется посредством построения декомпозиции пространства систем с установлением возможных связей до устранения всех разрывов в структуре системы или удовлетворения требований к ее структуре, заданных проектировщиком. 

В работе сформулирован подход к формальному описанию интеллектуальной мультиагентной системы проектирования с использованием методов общей алгебры и топологии.

Третья глава посвящена формализации семантики текста при автоматизации слабоструктурируемых процедур в процессе синтеза информационных систем.. В данной модельной интерпретации показано единство методов формального описания структурных элементов технических и информационных систем. В работе рассматривается интегрированный процесс синтеза структуры и структурного управления системы автоматизированного управления для увеличения степени гибкости СУ с изменением структуры объекта управления. Это позволяет повысить эффективность функционирования системы автоматизации управления в целом за счет оптимального распределения нагрузки и динамического определения структуры системы управления в ситуациях отказа части узлов или расширения и изменения структуры управляемой информационной инфраструктуры.

Построенная формализация допускает реализацию процесса синтеза СУ с использованием многоагентной технологии в виде многоосновной алгебраической системы. Агент включает набор свойств, или качеств, позволяющих интерпретировать некоторые сущности из модели предметной области, и набор правил поведения, позволяющих агенту предпринимать активные действия для достижения поставленных целей. Агент может представлять как модель цели, отдельную подсистему, так и множество агентов, представляющих подсистемы или множества других агентов.

Для решения задач проектирования выделеныять три класса агентов: агент абстрактной цели, агент конкретной цели, агент реализации. Показана иерархия взаимодействия классов агентов.

В работе рассмотрена модель ментальных характеристик агента проектирования, реализующего последовательность действий по достижению цели проектирования.

В четвертой главе описана формализация лингвистического этапа при формировании естественно-языкового сопровождения процесса автоматизации синтеза структур сложных систем. Рассмотрены вопросы: определение типа информации, содержащейся в формируемом тексте; выбора структуры текста; состав и структура лексических единиц тезауруса; синтаксическая модель предложения, описывающего структуру ТС; преобразование нечеткой решетки в лингвистический семантический граф; линеаризация семантического графа и отображение его в модель предложения; согласование лексем.

В пятой главе, показана реализация и применение программно-методического комплекса естественно-языкового сопровождения автоматизации слабоструктурируемых процессов в проектировании. В целях программной реализации рассмотренных формализмов ЕЯ-синтеза, описан состав и структура базы знаний, имеющей следующие основные компоненты: семантический; синтаксический; морфологический и словообразовательный. Описана архитектура лингвистического процессора, алгоритмическое обеспечение выделенных этапов структурного синтеза ТС.

В работе рассмотрены примеры структурного синтеза вибрационных систем с использованием разработанных формализмов и алгоритмов. Отражены следующие вопросы: формирование содержания предметно ориентированных баз знаний; примеры формирования технических заданий для синтеза вибрационных систем; примеры синтеза различных типов структур ТС.

Приведены примеры формирования текста, описывающего промежуточные этапы синтеза ТС. Рассмотрено применение построенных формализмов описания систем структурного синтеза к решению задачи проектирования автоматизированных систем управления сложными информационными процессами на примере управления предоставлением информационных услуг на предприятиях телекоммуникационной отрасли.

В шестой главе рассмотрен вопрос использования естественного языка при проектировании программного обеспечения.

Выделены две подзадачи: задача ЕЯ-сопровождения процесса формирования структуры программного обеспечения и задача разработки методики, улучшающей процесс восприятия текста программы разработчиком в процессе программирования.

Задача ЕЯ-сопровождения процесса формирования структуры программного обеспечения решается на основе разработанных формализмов формирования смысла и текста при синтезе систем управления.

В предлагаемой работе задача синтеза ЕЯ-описания структуры программного обеспечения детально не рассматривается. Более перспективным считеается второе направление использования естественного языка в процессе проектирования программного обеспечения - разработка методики, улучшающей процесс восприятия текста программы разработчиком в процессе программирования. При формировании синтаксической структуры нового формального языка необходимо учесть следующие особенности :

структура предложения должна максимально совпадать со структурой предложения на естественном языке читателя; необходимы развитые средства использования контекста;

необходимы дополнительные (помимо простого форматирования) синтаксические средства логической разметки текста;

основой алгоритмического языка должен служить родной язык проектировщика.

В работе представлены методы решения каждой из данных проблем. Приведена методика реализации транслятора, описаны особенности формализации, алгоритмического и программного обеспечения. В приложениях приведены: документы о внедрении результатов работы; примеры использования программного комплекса; структурные схемы программного обеспечения; отдельные алгоритмы; грамматики для лингвистического процессора и транслятора; примеры наполнения баз данных, дополнительная информация.

Диссертационная работа выполнена на кафедре САПРиПК Волгоградского государственного технического университета. 

Похожие диссертации на Использование естественного языка при автоматизации слабо структурируемых процессов в проектировании технических, программных и информационных систем