Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Исследование и разработка теоретических основ координатного индексирования документов Ханжин, Анатолий Григорьевич

Диссертация, - 480 руб., доставка 1-3 часа, с 10-19 (Московское время), кроме воскресенья

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Ханжин, Анатолий Григорьевич. Исследование и разработка теоретических основ координатного индексирования документов : диссертация ... кандидата технических наук : 05.13.17.- Москва, 1998.- 97 с.: ил. РГБ ОД, 61 99-5/503-6

Введение к работе

Создание большого числа автоматизированных информационно-поисковых систем (ИПС) привело к широкому применению координатного индексирования документов (КИД). Однако применение дорогостоящей техники и привлечение значительного числа индексаторов в таких системах не могли не вызвать вопросы повышения эффективности их функционирования, в частности, эффективности КИД. Поэтому вполне естественно предположить, что расширение сферы применения КИД приведет к интенсивному исследованию этого процесса.

Факты же свидетельствуют, что информатика уже в начале своего развития уделяла большее внимание автоматизации КИД, нежели теоретическому изучению глубинной сущности этого процесса. Отсутствие же теоретического фундамента КИД привело к тому, что до сих пор оно осуществляется интуитивным путем, без необходимой индексаторам научно обоснованной методики. Сегодня не существует ни надежной теории КИД, на основе которой можно было бы разрабатывать методику КИД, ни самой методики, позволяющей целенаправленно выбирать ключевые слова (КС) и компоновать ПОД. Если учесть, что сфера применения КИД расширяется, а требования к качеству индексирования все больше повышаются, то решение этой проблемы становится важным делом для информатики.

В настоящее время КИД чаще осуществляется по правилам, приведенным в документе, выдаваемом индексаторам и называемом обычно инструкцией. В ней приводятся рекомендации по выявлению КС, правила выбора лексических форм КС, правила формирования поискового образа документа (ПОД) и т.д. При этом для нахождения КС в индексируемом документе индексатор может воспользоваться лишь такими признаками, как: КС - "слова и словосочетания документа, существенные для описания содержания документа", или "КС можно найти в таких фрагментах текста, как: заглавие, введение, заключение,..." 1. Если искать по такой рекомендации слова, существенные для описания содержания документа, например, во введении, то у индексатора непременно возникнет вопрос: является ли данное слово существенным. Поскольку других конкретных признаков, по которым он мог бы решать свою задачу, в таких инструкциях нет, то ему остается выбирать КС, полагаясь лишь на свою интуицию. Ясно, что если так осуществлять КИД, то в ПОД могут войти ненужные для поиска слова в качестве КС, а нужные КС - отсутствовать. Но это, как известно, приводит к снижению эффективности функционирования ИПС. Сказанное означает, что в информатике, а точнее в познании КИД, существует проблема. ЦЕЛЬЮ НАСТОЯЩЕЙ ДИССЕРТАЦИОННОЙ РАБОТЫ являются разработка теоретических основ КИД, позволяющих расширить и углубить знания о КИД (в частности, выявить свойства и признаки КС), и разработка методики КИД с использованием полученных знаний.

Временная инструкция по координатному индексированию документов (Служебный материал).- М.: ВИНИТИ, 1983.

Сформулированная цель достигается в настоящей работе решением следующих задач:

1) гносеологический анализ научных работ, в которых приведены
существенные результаты исследований КИД;

  1. методологическое обоснование выбора формы и содержания теории КИД;

  2. уточнение природы и понятия темы;

  3. выявление видов и структур заглавий;

  4. выявление видов и свойств КС, а также их признаков;

6) выявление особенностей и принципов формирования ПОД.
Каждая из этих задач решается в соответствующем параграфе (1-6).

Существование вышеупомянутой проблемы говорит о том, что познание КИД еще не достигло того уровня, при котором становится возможным объяснять неизученные стороны этого процесса, выводить необходимые для практики знания. Ретроспективный анализ развития знания о КИД показывает, что в ходе его изучения была пройдена эмпирическая стадия и начался этап разработки теории КИД. Однако попытки разработать теорию КИД не привели к существенному изменению знания о нем. Это можно объяснить от части тем, что при её разработке слабо учитывались учения методологии науки, достижения смежных наук. Следовательно, для преодоления этого барьера необходимо применить методы и формы познания более высокого уровня по сравнению с ранее использовавшимися. Поскольку полноценную теорию разработать сразу невозможно, то сначала нужно разработать основу теории КИД, а затем постепенно достроить её.

НАУЧНАЯ НОВИЗНА. В данной диссертации впервые сформированы теоретические основы КИД и разработана методика КИД. МЕТОДЫ ИССЛЕДОВАНИЯ. Теоретические основы и методика КИД разработаны с привлечением аксиоматического метода, способствующего получению теории высокого уровня, а также лингвистики текста, психологии, формальной логики.

ПРАКТИЧЕСКАЯ ЗНАЧИМОСТЬ настоящей диссертации состоит в том, что полученные в ней новые знания, на основе которых разработана методика КИД, позволяют решать различные задачи, в частности, подготавливать необходимые для индексаторов практические пособия. СТРУКТУРА И ОБЪЕМ РАБОТЫ. Диссертация изложена на 97 стр. машинописного текста и состоит из введения, шести параграфов и заключения, а также четырех приложений. Последние включают в себя список сокращений, используемых в данной работе, словарь терминов, введенных в данной диссертации, список лексических категорий и методику координатного индексирования документов. По теме диссертации опубликовано 7 статей (см. список в конце данного автореферата). Йл. 4. Табл. 4. Библ. 34.

Похожие диссертации на Исследование и разработка теоретических основ координатного индексирования документов