Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Информационный запрос и его представление для поиска в библиографических и реферативных базах данных Барышева, Ольга Владимировна

Данная диссертационная работа должна поступить в библиотеки в ближайшее время
Уведомить о поступлении

Диссертация, - 480 руб., доставка 1-3 часа, с 10-19 (Московское время), кроме воскресенья

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Барышева, Ольга Владимировна. Информационный запрос и его представление для поиска в библиографических и реферативных базах данных : автореферат дис. ... кандидата филологических наук : 05.13.17 / Всерос. ин-т научной и техн. информации.- Москва, 1997.- 23 с.: ил. РГБ ОД, 9 98-5/660-1

Введение к работе

Одна из ключевых проблем информатики - проблема информационного поиска становится все более значимой для всей системы общественной коммуникации и, в частности, для научной информации. Сегодня необходимым условием нормального развития всех сфер человеческой деятельности является нахождение ігужной информации в кратчайшие сроки. Специалисты различных отраслей знания занимаются разработкой методов и средств обеспечения информационного поиска. Однако решение отдельных задач еще не есть гарантия успеха всего процесса. Приоритет в постановке общей цели, определении конкретных путей ее достижения должен по-прежнему принадлежать информатике. Информационный поиск представляет собой акт коммуникации, в процессе которого в ИПС вводится информационный запрос, выражающий информациошгую потребность. Результат поиска в большой степени зависит от того, насколько точно и грамотно сформулирован запрос.

В начале 60-х гг. уже были определены основные недостатки информационных запросов (полисемия, синонимия, омонимия), но до сих пор актуальной остается задача их обнаружения и исправления. Методы, первоначально предлагаемые для ее решения, были ориентированы на имевшиеся тогда, преимущественно традиционные (ручные) или механизированные ИПС. С появлением автоматизированных информационно-поисковых систем возникают новые способы обработки информационных запросов. Создаются специальные прикладные программы, разрабатываются новые интерфейсы, лингвистические процессоры и экспертные системы.

Практически, работа ведется в двух направлениях: 1) совершенствуются лингвистические процессоры, нацеленные на предпоисковый автоматизированный семантический анализ запросов (типа AQUA - A QUery Analyzer); 2) предпринимаются попытки определить типо-видовую структуру информационных потребностей различных категорий потребителей информации (по специализации) и на ее основе создавать модели наиболее вероятных запросов, предсказывая их содержательное наполнение. В последние годы исследования потребностей пользователей разных информационно-поисковых систем и баз данных, в основном полнотекстовых, проводятся американскими информатиками Н. Белкиным, П. Кантором, П. Нельсоном и др. в рамках регулярных конференций по текстовому поиску TREC (Text REtrieval Conference).

Применяемые методы не оправдывают себя в полной мере. Следует обратить внимание не только на содержание информационных запросов,

но и на их структуру, а также проследить изменение и определить зависимость выдачи от структуры и способа представления информационного запроса.

Критерии оценки результатов поиска, предложенные пионерами информатики, — релевантность и пертинентность - становятся сегодня все более размытыми, чему способствует также терминологическое и межъязыковое несоответствие выражения этих понятий. Недостаточная четкость определения элементов информационного запроса, его параметров для автоматизированной обработки, а также слабая изученность структуры информационных запросов и возможных способов ее унификации снижает эффективность информационного поиска и, соответственно, обедняет возможности освоения мирового информационного пространства. Предварительный анализ показал, что только 21 % запросов можно классифицировать как не требующие дополнительной предпоисковой обработки, а выдача на них более чем в 2 раза отличается по сравнению с выдачей на запросы (79 %), ігужда-ющиеся в формальной или содержательной корректировке. Постановка вопроса о том, как должен формулироваться информационный запрос и как его можно оценить, необходима, далее если окончательное решение проблемы пока и недостижимо. Учитывая массовый спрос на материалы электронных изданий разного вида и отраслевого профиля, улучшение методов поиска становится одной из наиболее актуальных тем.

Анализ информационных запросов до сих пор проводился в связи с выявлением функциональной эффективности информационного поиска и отдельных групп ИПС и редко становится предметом самостоятельных разработок. В 1986-1988 гг. были защищены кандидатские диссертации К. Г. Ка-рапетяна, А. Б. Мыльникова, До Суан Тхо, П. Л. Выханду, в которых на базе отечественных ЭВМ 2-го поколения рассматривались технические методы оптимизации запросов и представления информации в базах данных комплексных АСУ. В диссертациях на соискание ученой степени кандидата филологических наук И. В. Литвиненко и Т. Е. Янко лингвистический компонент в запросах и модели перевода с естественного языка на язык баз данных изучались применительно к фактографическим базам данных и созданию человеко-машинного интерфейса. Нами предпринято исследование этой проблемы на основе изучения синтаксической структуры запросов для поиска в современных библиографических и реферативных базах данных на CD-ROM, т. е. базах со структурированными данными, что определяет его новизну.

Целью настоящей диссертации является разработка методов представления информационных запросов, обеспечивающих при поиске в библио-

графических и реферативных базах данных выдачу с максимальной точностью, а также полнотой, удовлетворяющей потребителя информации.

Для реализации этой цели в диссертационном исследовании решаются следующие задачи:

  1. изучение языковой природы информационного запроса как одного из компонентов системы общественной коммуникации - процесса информационного поиска;

  2. обнаружение основных типов нарушений в первоначальных формулировках информационных запросов;

  3. выявление способов представления информационного запроса, обусловленных его природой и функциями, на разных этапах процесса коммуникации;

  4. определение методов и спектра предпоисковых преобразований информационного запроса;

  5. изучение процесса преобразования информационного запроса в формулу поиска с использованием булевых операторов;

  6. установление основных и производных типов формального представления поисковых предписаний для поиска в библиографических и реферативных базах данных.

Постановка таких задач обусловила основной метод исследования -комплексный анализ информационных запросов, сочетающий изучение количественных характеристик запросов, их синтаксической структуры, изменения показателей выдачи.

Основным материалом стали 4 массива реальных информационных запросов (всего 565), выбранных произвольно в процессе практики информационно-библиографической и библиотечной работы. В ряде случаев привлекались для сравнения материалы из специальной литературы.

Научно-практическая значимость работы. Выводы и наблюдения автора диссертации, теоретические положения и приведенный фактический материал могут быть применены для дальнейшего изучения информационных запросов и потребностей, при построении общих и специальных курсов лекций по информатике, в учебных пособиях. Практическое значение исследования определяется тем, что в нем предлагаются методы анализа и способы корректировки информационных запросов вне зависимости от их содержания. Разработанная методика может быть использована при обучении пользователей, сотрудников информационных служб и библиотек работе по поиску в автоматизированном режиме.

Апробация. Основные положения диссертации обсуждались на семинарах Отделения теоретических исследований по проблемам информатики

ВИНИТИ РАН и Миннауки, на научно-практической конференции "Современные пользователи автоматизированных информационно-библиотечных систем: Проблемы обслуживания, изучения и обучения" в Российской национальной библиотеке (Санкт-Петербург, 25-26 марта 1997), а также на 5-й Конференции с международным участием по искусственному интеллекту (КИИ-96, Казань, 5-8 октября 1996).

Структура диссертации. Диссертация состоит из введения, двух глав -"Способы представления информационного запроса" и "Представление запросов для поиска в автоматизированных ИПС", заключения, списка использованной литературы (137 названий).

Похожие диссертации на Информационный запрос и его представление для поиска в библиографических и реферативных базах данных