Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Разработка и практическое применение методологии семантического анализа в автоматизированных системах обработки научной информации Заличев, Николай Николаевич

Данная диссертационная работа должна поступить в библиотеки в ближайшее время
Уведомить о поступлении

Диссертация, - 480 руб., доставка 1-3 часа, с 10-19 (Московское время), кроме воскресенья

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Заличев, Николай Николаевич. Разработка и практическое применение методологии семантического анализа в автоматизированных системах обработки научной информации : автореферат дис. ... доктора технических наук : 05.13.06;05.13.17 / ВНИИ проблем вычислит. техники и информатики.- Москва, 1994.- 49 с.: ил. РГБ ОД, 9 94-1/860-5

Введение к работе

Повышение эффективности управления во всех отраслях производства, науки и техники - одна из первоочередных задач, стоящих перед нашим обществом на нынешнем этапе его развития.Ее решение неразрывно связано с преобразованием системы управления наукой и производством, т.е. всем механизмом, регулирующим оборот информации, распределяющим средства и направления их приложения.

Научная и производственная деятельность в значительной степени зависят от достоверности прогнозов потребностей общества и возможных путей их удовлетворения. Это обстоятельство ставит проблему разработки методологии семантического анализа в автоматизированных системах обработки научной информации в ряд наиболее актуальных теоретико-прикладных проблем современности.

К сожалению, все существующие методы анализа научной информации в АСУ строятся на синтаксическом, а не семантическом уровне, что не позволяет проводить всесторонний анализ развития научных направлений, включая прогноз возможных скачков в знаниях. Поэтому разработка теории анализа научной информации на семантическом уровне является необходимой и независимой частью решения глобальной проблемы, имеющей непосредственное отношение к идеологии построения АСУ - формализации обработки научной информации на семантическом уровне. Именно эта задача должна быть решена в первую очередь, обеспечив переход от синтаксиса к семантике, дав новые принципы организации и ведения информационных баз данных.

Вторым независимым шагом решения указанной проблемы является совмещение полученных результатов с используемыми средствами вычислительной техники, что, поставит ряд новых независимых и сложных вопросов в области статистической лингвистики и математической логики.

1-І

Актуальность проблемы» При постановке решаемой в диссертации проблемы - разработка теории анализа научной информации на семантическом уровне, устанавливающей новые принципы организации и ведения информационных баз данных, оптимизации информационных массивов, мы исходили из актуальности развития идеологии построения автоматизированных систем переработки информации и управления. Качественный скачок здесь возможен лишь при переходе от синтаксиса к семантике. Только в ятом случае появляется возможность создания единого понятийного языка, обеспечивающего как прогноз хода развития баз данных на семантическом уровне, так и сопоставление интенсивностей развития различных по тематике,либо параллельно существующих массивов информации. Такой единый понятийный язык позволит также увязать на на синтаксическом, а на более высоком семантическом уровне различные АСУ в единую общегосударственную систему сбора и обработки информации.

Цель работы. Основной целью работы является разработка энтропийной теории семантического анализа научной информации, а на ее основе - последовательности рассмотрения информационного массива, принципов организации и ведения баз данных, обеспечивающих как оценку интенсивности развития их семантики, так и возможность прогноза появления принципиально новой информации.

Основные научные результаты. При разработке теоретических и практических основ оценки информации в системах управления на семантическом уровне проведено исследование процесса переработки информации, рассмотрены вопросы, связанные с ее семантической структурой и энтропийным анализом. Отказ от общепринятого синтаксического подхода к информационным массивам позволил установить, какие именно алементы баз данных должны учитываться при их обработке и анализе в АСУ, какие при- ятом аналитические выражения должны использоваться при анализе и оптимизации информационных массивов-.

Обращение к тонкой структуре семантического поля дало возможность сформулировать последовательность рассмотрения информационного массива, принципы организации и ведения баз данных, обеспечивающие как оценку их развития на семантическом уровне, так и возможность прогноза появления принципиально новой информации. Используемый в настоящее время-синтаксический подход к анализу информационных массивов в АСУ этого не обеспечивает.

Рассматривать семантическое поле информации предложено с использованием энтропийного подхода. Показано, что в качестве случайной величины, позволяющей АСУ оценить неопределенность когнитивной /интеллектуальной/ структуры информации, должна быть некая элементарная семантическая единица /ЗСЕ/, мерой которой является ее относительная истинность. Установлено, что ЗСЕ -это законченная мысль в виде утверждения, имеющая непосредственное отошение к данному информационному массиву.

Показано, что распределение степени истинности отдельных ЭСЕ является негауссовым, а распределение числа ЭСЕ одинаковой степени истинности - гауссовым. Найдены параметры этих распределений.

Установлена следующая закономерность: несмотря на уменьшающуюся с ходом исследований энтропию информации /Ш/ отдельных информационных массивов, ЭИ интегрального информационного массива постоянно возрастает. Поэтому прямой анализ в АСУ всей когнитивной структуры научной информации не эффективен. Целесообразно лишь сопоставление фрагментов когнитивного ресурса информации и соответствующих фрагментов действительности, изучению которых посвящены отдельные научные направления. Такое сопоставление /оценка степени их симметрии/ и позволяет оценить ЭИ. Причем относительная ценность и значимость информации не сказывается на величине ее энтропии. Ценность и значимость ска-

зывается лишь на скорости изменения ЭЙ.

Показано, что скачок в знаниях соответствует разрыву непрерывности функции ЭИ во времени в рамках существующей информационной базы и переходу ее в точку S 0,38. Скачок характеризуется "мгновенным" устранением асимметрии информации и появлением ее, но уже в рамках новой парадигмы или теории. Характеризует приближение таких скачков выраженная через квант снижения стохастич-ности /КСС/ тенденция изменения асимметрии информации. При этом КСС отражает минимальную величину взаимного изменения детерминированной /истинной/ и случайной /менее^истинной/ составляющих информационного массива.

Поскольку анализ ЭСЕ когнитивной структуры научной информации предполагает рассмотрение массивов информации, включающих публикации, получены выражения, позволяющие оценить необходимую глубину ретроспективного поиска и минимальный объем информационного массива, подлежащего анализу.

Сформулированы семантические определения логических функций и логических отношений, описывающие развитие степени истинности ЭСЕ с ходом исследований. Теоретически обоснована и практически подтверждена возможность синтеза новой /в семантическом плане/ научной информации. Это дает возможность построения АСУ с информационными массивами, способными к саморазвитию.

Обоснованность результатов и выводов подтверждается эмпирическими выражениями для Ш и распределения Бредфорда, которые получены в диссертации аналитически, а также результатами проверки методологии семантического анализа информации на двух различных вэаишнесвязанных направлениях /радитехника и биология/.

Научная новизна и практическая значимость. Впервые разработана методология семантического анализа в артоматизированных системах обработки научной информации. Это стало возможным благо-дара переводу ряда качественных понятий, имеющих отношение к информационным массивам, на количественный уровень, отражающий семантические, а не синтаксические аспекты информации, т.е. благодаря разработке теории' анализа информации на семантическом уровне, основанной на энтропийном подходе.

Практическая значимость полученных результатов заключается в -возможности:

формализовать в АСУ анализ информационных массивов, осуществляя при этом прогноз путей их развития на семантическом уровне;

разработки системы научно обоснованного информационного обеспечения на основе количественных критериев;

формализовать синтез новой /в семантическом плане/ информации, в том числе в АСУ с информационными массивами, способными

к саморазвитию.

Реализация результатов работы. Полученные в диссертации результаты нашли применение в разработках Научно-исследовательского института прикладной механики и электродинамики при исследовании массивов данных, связанных с электроракетными двигателями, источниками и генераторами плазмы, протяженными механическими устройствами и с проблемами исследования динамики газа и плазмы.

На основе предложенного критерия минимизации энтропии когнитивной структуры информации Государственным Комитетом по печати сформулированы требования и предложения по созданию трех объединений журналов и разработан перспективный план изучения и оптимизации системы научно-технической периодики.

Результаты исследований полностью опубликованы в пяти книгах издательств "Книга" и "Информэлектро".

- 8 -Структура и объем работы. Диссертация состоит из введения, четырех глав, заключения, сшиска .литературы. Общий объем - 224 страницы, в том числе: текст - 200 страниц, 28 иллюстраций и список литературы на 14 страницах, содержащий 164 источника.

Похожие диссертации на Разработка и практическое применение методологии семантического анализа в автоматизированных системах обработки научной информации