Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Автоматизация построения гипертекстовых систем на основе текстовой информации тезаурусным методом Холодова Светлана Анатольевна

Автоматизация построения гипертекстовых систем на основе текстовой информации тезаурусным методом
<
Автоматизация построения гипертекстовых систем на основе текстовой информации тезаурусным методом Автоматизация построения гипертекстовых систем на основе текстовой информации тезаурусным методом Автоматизация построения гипертекстовых систем на основе текстовой информации тезаурусным методом Автоматизация построения гипертекстовых систем на основе текстовой информации тезаурусным методом Автоматизация построения гипертекстовых систем на основе текстовой информации тезаурусным методом Автоматизация построения гипертекстовых систем на основе текстовой информации тезаурусным методом Автоматизация построения гипертекстовых систем на основе текстовой информации тезаурусным методом Автоматизация построения гипертекстовых систем на основе текстовой информации тезаурусным методом Автоматизация построения гипертекстовых систем на основе текстовой информации тезаурусным методом Автоматизация построения гипертекстовых систем на основе текстовой информации тезаурусным методом Автоматизация построения гипертекстовых систем на основе текстовой информации тезаурусным методом Автоматизация построения гипертекстовых систем на основе текстовой информации тезаурусным методом
>

Данный автореферат диссертации должен поступить в библиотеки в ближайшее время
Уведомить о поступлении

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - 240 руб., доставка 1-3 часа, с 10-19 (Московское время), кроме воскресенья

Холодова Светлана Анатольевна. Автоматизация построения гипертекстовых систем на основе текстовой информации тезаурусным методом : диссертация ... кандидата технических наук : 05.13.06.- Москва, 2002.- 168 с.: ил. РГБ ОД, 61 03-5/1480-6

Содержание к диссертации

Введение 4

1. Глава 1 21

1.1 Понятие и соотношение текста, гипертекста и тезауруса. 21

1.2. Обзор существующих гипертекстовых систем 22

1.3. Определение этапов построения гипертекста. 30

1.4. Обзор существующих методик автоматизации формирования гипертекстов в целом и методик для каждого из этапов формирования

1.5. Анализ существующих гипертекстовых систем и методов их построения 49

1.6. Постановка задачи. 51

Выводы по первой главе .52

Глава 2 53

2.1. Концептуальная модель текста и гипертекста и тезауруса в ракурсе преобразования первого во второй с использованием третьего и ее математическое описание 53

2.2. Автоматизация выделения терминов предметной области из текста при наличии тезауруса предметной области 60

2.3. Построение частного тезауруса при наличии общего. 63

2.4. Условия возможности построения гипертекстовой системы по частному тезаурусу... 64

2.5. Ограничение применения методики с точки зрения целесообразности 67

2.6. Требования, предъявляемые к частному тезаурусу. 70

Выводы по второй главе

Глава 3 74

3.1. Методики и алгоритмы автоматизированного построения гипертекстовой системы на основе текста тезаурусным методом.. 74

3.2. Построение списка ключевых терминов 77

3.3. Построение общего тезауруса с коррекцией словаря ключевых терминов 84

3.4 Отыскание информационных статей терминов. 116

3.5. Формирование гипертекстовых ссылок 119

Выводы по третьей главе 122

Глава 4

4.1. Программный комплекс TG.

4.2. Структура программного комплекса.

4.3. Получение входных данных

4.4. Формирование частного тезауруса.

4.5. Исследование влияния параметров функций семантических полей на достоверность выборки.

Выводы по четвертой главе.

Заключение

Список использованных источников

Приложения.  

Введение к работе

Автоматизированные системы обработки информации и управления в различных отраслях, и в частности, в полиграфии, как правило, имеют своей составляющей программную компоненту, обеспечивающей автоматическое получение системой информации от датчиков, если такое взаимодействие возможно, реализующую принятие управленческих решений в той части, в какой они могут быть приняты автоматически, и обеспечивающую дружественный интерфейс с пользователем системы с целью либо запроса дополнительной информации, на основе которой системой может быть принято управленческое решение, либо с целью получения управленческого решения от эксперта (пользователя системы) в случае автоматизированного принятия решений системой.

Сами системы автоматизированного управления технологическими процессами и обработки информации, а также их программное обеспечение достаточно сложны. Для сопровождения, модернизации, диагностики такие системы нуждаются в лингвистическом обеспечении, позволяющем пользователю или разработчику понять принципы функционирования системы, а также освоить основные приемы работы с ним.

В настоящее время распространено два вида лингвистического обеспечения систем автоматизированного управления технологическими процессами и обработки информации.

1. Технологическая документация, выполненная на бумажном носителе.

2. Технологическая документация, представленная в электронном виде.

Технологическая документация, выполненная на бумажном носителе, традиционна, она является обязательной составляющей любой автоматизированной системы обработки информации и управления. Помимо технологической документации, выполненной полиграфическим способом, на сегодняшний день большинство создателей автоматизированных систем обработки информации и управления технологическими процессами представляют лингвистическое обеспечение системы также и в электронном виде. При этом электронные версии в большинстве случаев гораздо более популярны у пользователей, чем их полиграфические аналоги. Причины этих тенденций следующие:

1. Использование как минимум персональных компьютеров, а зачастую и сетей, в качестве платформы автоматизированной системы обработки информации и управления, что обеспечивает массовую возможность использования электронных носителей.

2. Относительная дешевизна электронных носителей по сравнению с носителями бумажными, тем значительней проявляющаяся, чем больше (в количестве символов) объем лингвистического обеспечения системы. Поэтому с целью удешевления системы автоматизированной обработки информации или системы автоматизированного управления технологическими процессами разработчики в полиграфической версии технологической документации знакомят пользователя лишь с основными функциями системы, рассматривая второстепенные в электронной версии технологической документации.

3. И третьей немаловажной причиной успешного развития направления электронного документирования лингвистического обеспечения систем автоматизированной обработки информации и управления технологическими процессами являются новые возможности автоматического и автоматизированного поиска лингвистической информации, как по включениям в источник, так и семантического, что повышает скорость и уменьшает трудоемкость работы с системой. К реалиям сегодняшнего дня также следует отнести факт зарождения нового вида полиграфической продукции: электронных изданий, технологическая документация автоматизированных систем управления и обработки информации является одним из видов которых. Существуют технологические процессы создания этого вида полиграфической продукции, ряд этапов этих процессов может быть автоматизирован. Исследованиям области автоматизации технологических процессов создания электронных версий лингвистического обеспечения автоматизированных систем управления технологическими процессами и шире, автоматизации создания электронных изданий, посвящена данная диссертационная работа.

Актуальность темы.

Справочные системы, являясь подсистемами систем автоматизации технологических процессов, а также электронные издания, выпускающиеся отдельно на компакт-дисках или публикующиеся в сети, отличаются по принципу представления информации от своих же полиграфических аналогов.

Это принципиальное отличие в

1. отсутствии последовательной линейной структуры в представляемой пользователю материале.

2. фрагментировании текстового массива на блоки, по размеру соответствующие эргономическим возможностям отображения монитора,

3. наличии связей s между -вышеозначенными текстовыми фрагментами, выражающиеся гиперссылками, то есть возможностью автоматического перехода от термина одного текстового фрагмента, к другому фрагменту, раскрывающему семантику термина перехода. Системы, обладающие описанными свойствами, принято называть гипертекстовыми или гипертекстами.

На сегодняшний день нет единого, признаваемого всеми, работающими в данной области, определения гипертекста. Система может называться гипертекстовой, имея лишь гипертекстовые ссылки внутри единственного линейного текстового фрагмента. Другие исследователи требуют обязательности таких надстроек гипертекстовых систем, как алфавитный указатель и список главных тем.

Однако, с фрагментированием текста или без него, с надстройками или без них, простейшие или качественные сложные, гипертекстовые системы на сегодняшний день стали основой электронных версий как технической документации, так и изданий в самых различных областях науки, промышленности, образования.  

Похожие диссертации на Автоматизация построения гипертекстовых систем на основе текстовой информации тезаурусным методом