Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Модели, методы и средства разработки лингвистического обеспечения проектных репозиториев САПР Арзамасцева, Иветта Вячеславовна

Модели, методы и средства разработки лингвистического обеспечения проектных репозиториев САПР
<
Модели, методы и средства разработки лингвистического обеспечения проектных репозиториев САПР Модели, методы и средства разработки лингвистического обеспечения проектных репозиториев САПР Модели, методы и средства разработки лингвистического обеспечения проектных репозиториев САПР Модели, методы и средства разработки лингвистического обеспечения проектных репозиториев САПР Модели, методы и средства разработки лингвистического обеспечения проектных репозиториев САПР
>

Диссертация, - 480 руб., доставка 1-3 часа, с 10-19 (Московское время), кроме воскресенья

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Арзамасцева, Иветта Вячеславовна. Модели, методы и средства разработки лингвистического обеспечения проектных репозиториев САПР : диссертация ... кандидата технических наук : 05.13.12 / Арзамасцева Иветта Вячеславовна; [Место защиты: Ульян. гос. техн. ун-т].- Ульяновск, 2011.- 270 с.: ил. РГБ ОД, 61 11-5/2071

Введение к работе

Характерной чертой современного этапа развития промышленности становится очень быстрая смена вариантов, серий и даже поколений изделий. Быстрый ввод новых изделий в производство связан с их автоматизированным проектированием. Современные САПР обладают развитым лингвистическим обеспечением, традиционной частью которого стали тезаурусы. Тезаурусы позволяют достичь унификации терминологии на этапе проектирования. Но при условии быстрой смены вариантов изделий встает и задача быстрого и эффективного формирования тезаурусов.

В настоящее время проблема эффективного формирования тезауруса нового изделия, как элемента лингвистического обеспечения САПР, решается в двух направлениях: во-первых, интеллектуализации тезауруса, например, с помощью онтологического подхода; во-вторых, использования методик формирования словарей различных терминологических систем, разработанных в современной лингвистике, для формирования лингвистического обеспечения САПР. Ряд новых лингвистических методик предложен в последние годы для мезотерминосистем (до 1500 терминов). Тезаурусы многих промышленных изделий характеризуются именно таким объемом лексики, например, активно развиваемая в настоящее время область разработки программно-аппаратных комплексов - область нечетких контроллеров.

Другой особенностью современного лингвистического обеспечения САПР является мультиязычность, для которой характерно использование ряда языков, например, английского, русского, немецкого.

Разнообразные лингвистические методики формирования словаря-тезауруса можно обобщить на основе математического моделирования терминологической системы промышленного изделия. Математические модели должны отражать структуру и характерные признаки терминологической системы в такой степени, чтобы они позволили решить задачу идентификации предметной области проектного документа. Для достижения адекватности и применимости к автоматизированному проектированию подобные математические модели должны обобщать не произвольный корпус текстов, а корпус проектных документов.

Таким образом, в настоящее время существует научно-техническая задача построения математических моделей, методик и алгоритмов формирования терминологических систем проектных документов промышленных изделий при автоматизированном проектировании.

Актуальность темы:

Актуальность данной проблемы нашла отражение в целом ряде работ по математическому моделированию терминологических систем и формированию лингвистического обеспечения в САПР. В частности, рассматриваемые проблемы наиболее полно отражены в трудах таких ученых, как Норенков И.П., Пиотровский Р.Г., Поспелов Д.А., Соловьев В.Д., Баранов А.Н., Гринев СВ., Ивина Л.В., Лейчик В.М., Лукашевич Н.В. и др.

Вместе с тем, на сегодняшний день не существует математических моделей, методик и алгоритмов построения терминологических систем проектных документов промышленных изделий при автоматизированном проектировании, обеспечивающих быстрое формирование словаря-тезауруса для лингвистической настройки среды автоматизированного проектирования.

Объектом исследования стала мультиязычная (русский, английский, немецкий) терминологическая система предметно-специального языка «Нечеткая логика», относящая к классу мезотерминосистем.

Предмет диссертационного исследования - автоматизированное проектирование и моделирование терминосистемы (ТС) и применение модели в системах проблемно-ориентированного проектирования при формировании лингвистического обеспечения САПР в форме словаря-тезауруса на основе корпуса проектных документов, научных статей и монографий.

Материалом исследования послужили проектные документы по аппаратно-программным комплексам, учебники, монографии, научные статьи по нечетким контроллерам за последние 15 лет, общим объемом 832154 слова. Такой объем является достаточным для получения достоверных результатов об объеме терминосистемы для узких областей знаний (Алексеев, 1983).

Целью диссертационной работы является разработка математических моделей, методик, алгоритмов формирования терминологических систем (на примере нечеткой логики) для решения задач создания лингвистического и информационного обеспечения проектных репозиториев САПР.

Для достижения поставленной цели необходимо решить следующие задачи:

  1. разработать методику формирования терминологических систем технических описаний объектов проектирования на основе обработки корпуса текстов (на примере терминосистемы нечеткой логики);

  2. провести классификацию средств представления логико-понятийных схем предметной области, выбрать средство моделирования терминосистем;

  3. разработать математические модели рубрикации информационных ресурсов на основе нечеткого логического вывода, повышающие точность идентификации предметной области документов;

  4. разработать мультиязычный электронный словарь-тезаурус предметной области проектирования на примере «нечеткой логики»;

  5. разработать и реализовать комплекс программ обработки корпусов текстов, описывающих объект проектирования;

  6. провести экспериментальную проверку эффективности качества классификации электронных документов с использованием фреймового словаря-тезауруса, разработанного на основе предложенных методик и математических моделей.

Для решения поставленных задач использовались следующие методы исследования: современная теория неопределенности, нечетких систем, методы концептуального и лексикографического анализа, моделирование и фреймовый анализ, а также метод экспертной оценки.

Научная новизна:

В результате проведенного исследования были получены следующие новые научные результаты:

  1. предложена методика формирования терминологической модели промышленного изделия в САПР на основе логико-понятийных схем предметной области;

  2. разработаны математические модели терминологической системы на основе нечеткого вывода по Мамдани и на основе мультсловарей;

  3. разработаны алгоритмы обработки корпуса текстов с целью формирования словаря-тезауруса в САПР;

  4. создан комплекс программ математического моделирования и формирования словаря-тезауруса лингвистического обеспечения проектных репозиториев САПР.

Достоверность результатов диссертационной работы

Достоверность научных положений, выводов и рекомендаций подтверждена результатами вычислительных экспериментов, а также результатами использования материалов диссертации и разработанной системы в проектной организации в соответствии с актом внедрения.

Основные положения, выносимые на защиту:

  1. Концептуально-фреймовая структура терминологической системы объекта проектирования (на примере нечеткой логики);

  2. Методика формирования структуры терминологической системы объекта проектирования;

  3. Математическая модель мультиязычной терминосистемы объекта проектирования на основе нечеткого вывода по Мамдани;

  4. Математическая модель мультиязычной терминосистемы объекта проектирования на основе мультисловарей;

  5. Комплекс программ обработки документов для автоматической рубрикации предметной области.

Все перечисленные положения являются новыми.

Теоретическая значимость диссертации заключается в том, что в ней построены математические модели терминологических систем документов в САПР.

Практическая значимость состоит в том, что разработанный комплекс программ формирования словаря-тезауруса может использоваться в качестве информационного и лингвистического обеспечения проектных репозиториев

САПР.

Реализация результатов работы:

Результаты диссертации и практические рекомендации использованы при проектировании интеллектуального сетевого архива электронных информационных ресурсов в ФНПЦ ОАО «НПО "МАРС"» (г.Ульяновск), что подтверждается актом внедрения.

Результаты работы оформлены также в виде программы "Fuzzy Base", зарегистрированной Федеральной службой по интеллектуальной собственности, патентам и товарным знакам (№2008615366 от 10.11.2008г.).

Апробация результатов исследования

Основные положения и результаты диссертации докладывались, обсуждались и получили одобрение на всероссийской научной конференции «Квантитативная лингвистика: исследования и модели» (Новосибирск, 2005), международных конференциях «Проблемы обучения переводу в языковом вузе» (Москва, 2005), «Актуальные задачи лингвистики, лингводидактики и межкультурной коммуникации» (Ульяновск, 2006, 2008гг.), «Interactive Systems and Technologies" (Ульяновск, 2007, 2009гг.), 1-ой Международной конференции по бизнес-информатике (Звенигород, 2007), на Х-ой школе-семинаре TEL-2008 «Актуальные проблемы компьютерной и когнитивной лингвистики» (Казань, 2008), на конгрессе по интеллектуальным системам, информационным технологиям и интеллектуальным САПР «AIS-IT'09», на конференции «Нечеткие системы и мягкие вычисления» (Волгоград 2009), на всероссийской конференции «Проведение научных исследований в области обработки, хранения, передачи и защиты информации ОИ-2009» (Ульяновск, 2009), на двенадцатой национальной конференции по искусственному интеллекту с международным участием КИИ-2010 (Тверь, 2010). Апробация диссертации осуществлялась также в работе над проектом терминологического банка данных по нечеткой логике в университете прикладных наук г. Дармштадт (Германия) при прохождении стажировки с 01.11.2006 по 30.12.2006 года. Основные положения неоднократно докладывались и обсуждались на научно-технических конференциях УлГТУ «Вузовская наука в современных условиях».

Публикация результатов работы:

По теме диссертации опубликовано 34 работы, в том числе 11 тезисов докладов, 23 статьи, получено свидетельство о государственной регистрации программы для ЭВМ.

Три статьи опубликованы в изданиях, входящих в перечень ВАК.

Личный вклад:

Все результаты, составляющие содержание диссертации, получены автором самостоятельно.

Структура и объем диссертационного исследования:

Работа изложена на 270 страницах машинописного текста, содержит 70 рисунков и 51 таблицу, состоит из введения, четырех глав, заключения, списка использованной литературы, списка исследованной литературы и 10 приложений.

Похожие диссертации на Модели, методы и средства разработки лингвистического обеспечения проектных репозиториев САПР