Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Комплексное использование лингвистических средств тематического поиска в электронном каталоге библиотеки Скарук Галина Анатольевна

Комплексное использование лингвистических средств тематического поиска в электронном каталоге библиотеки
<
Комплексное использование лингвистических средств тематического поиска в электронном каталоге библиотеки Комплексное использование лингвистических средств тематического поиска в электронном каталоге библиотеки Комплексное использование лингвистических средств тематического поиска в электронном каталоге библиотеки Комплексное использование лингвистических средств тематического поиска в электронном каталоге библиотеки Комплексное использование лингвистических средств тематического поиска в электронном каталоге библиотеки Комплексное использование лингвистических средств тематического поиска в электронном каталоге библиотеки Комплексное использование лингвистических средств тематического поиска в электронном каталоге библиотеки Комплексное использование лингвистических средств тематического поиска в электронном каталоге библиотеки Комплексное использование лингвистических средств тематического поиска в электронном каталоге библиотеки
>

Данный автореферат диссертации должен поступить в библиотеки в ближайшее время
Уведомить о поступлении

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - 240 руб., доставка 1-3 часа, с 10-19 (Московское время), кроме воскресенья

Скарук Галина Анатольевна. Комплексное использование лингвистических средств тематического поиска в электронном каталоге библиотеки : Дис. ... канд. пед. наук : 05.25.03 : Новосибирск, 2003 320 c. РГБ ОД, 61:04-13/950

Содержание к диссертации

Введение

ГЛАВА 1 Лингвистические средства тематического поиска в электронном каталоге: общие и специфические проблемы и тенденции развития 5

1.1 Электронный каталог как специфический информационный ресурс и объект исследования 5

1.2 Основные тенденции развития лингвистических средств тематического поиска в электронном каталоге (по результатам исследования документального потока) 32

1.3 Лингвистические средства электронного каталога в свете концепции поисковых систем, ориентированных на неподготовленного пользователя 47

1.3.1 Основные квалификационные характеристики пользовательской аудитории электронного каталога: содержание, состояние, возможности трансформации 49

1.3.2 Теоретические проблемы оценки функционирования электронного каталога конечными пользователями 57

1.3.3 Проблемы использования лингвистических средств электронного каталога неподготовленными пользователями: подходы к изучению и решению 62

1.4 Анализ свойств информационно-поисковых языков с учетом специфики электронного каталога 73

1.4.1 Информационно-поисковые языки карточных каталогов в электронной среде: свойства и функциональные возможности 77

1.4.2 Специфика использования дескрипторных информационно-поисковых языков в электронном каталоге 88

Выводы к главе 1 94

ГЛАВА 2 Изучение функциональной специфики и принципов использования лингвистических средств тематического поиска в электронном каталоге 98

2.1 Изучение поискового поведения пользователей систематического каталога (на примере систематического каталога Государственной публичной научно-технической библиотеки СО РАН) 99

2.2 Экспериментальное исследование функциональных возможностей языков тематического поиска в электронном каталоге (на примере электронного каталога ГПНТБ СО РАН) 116

2.3 Принципы комплексного использования лингвистических средств тематического поиска в электронном каталоге 157

Выводы к главе 2 160

Заключение 193

Список использованной литературы 199

Список сокращений 239

Введение к работе

Актуальность темы. Ядром и основой функционирования информационно-библиотечных систем, а также одним из основных объектов приложения новых информационных технологий в библиотеке является электронный каталог (ЭК). Эффективность использования информационных ресурсов библиотек и качество библиотечного сервиса как на локальном уровне, так и в режиме сети во многом определяют лингвистические средства тематического поиска в ЭК, обеспечивающие интеллектуальный доступ к документным массивам. Согласованный и обоснованный выбор лингвистического обеспечения (ЛО) - задача, без решения которой создание локальных и распределенных электронных каталогов теряет смысл.

Использование в отечественных ЭК широкого набора разнообразных по структуре, лексическому наполнению, свойствам лингвистических средств представляет собой устойчивую тенденцию. Но при этом разные библиотеки демонстрируют исключительное разнообразие подходов к определению и обоснованию состава и принципов функционирования ЛО. Это вынуждает библиотечное сообщество на новом уровне обратиться к задаче оптимизации комплекса информационно-поисковых языков (ИПЯ), то есть определения состава ЛО и параметров каждого из поисковых языков, необходимых и достаточных для эффективного функционирования системы в целом.

Согласно общим принципам проектирования автоматизированных информационно-поисковых систем (АИПС), эта процедура должна осуществляться на основе анализа следующих факторов: функционально-целевого назначения системы, характера поступающих в нее запросов, способности различных типов ИПЯ обеспечить их реализацию (56, 253). При прямом проецировании этих принципов на задачу формирования ЛО ЭК возникает ряд проблем, обусловленных качественной спецификой данного информационного ресурса. Однако на начальных стадиях создания российских ЭК углубленных исследований на-

званных факторов проведено не было. Возникающие проблемы осознавались и решались в основном на эмпирическом уровне.

Очевидно, что задача оптимизации ЛО ЭК не может быть решена исключительно на базе принципов традиционной каталогизации, так как практически все базовые компоненты анализа претерпели в условиях автоматизации существенные изменения, выразившиеся:

в расширении состава и усилении взаимосвязей и взаимовлияния между различными элементами справочно-поискового аппарата (СПА) библиотеки, а также частичном перераспределении присущих им функций, изменении круга задач, в решении которых задействован ЭК;

изменении в информационном поведении пользователей библиотечных каталогов (198); перераспределении функций между пользователем и поисковой системой; организации сервиса, ориентированного на самообслуживание конечных пользователей (12); росте требований к уровню обслуживания, степени интеллектуальности и аналитичности производимых библиотекой продуктов и услуг (59);

преобразовании технологической среды функционирования библиотечного каталога, при этом традиционные библиотечные технологии приобретают новый вид, а нередко и новое качество (130);

значительном расширении поисковых возможностей языков карточных библиотечных каталогов и возможностей комплекса лингвистических средств в целом.

Названные факторы в совокупности обусловили изменение подходов и требований к составу и свойствам ЛО ЭК, уточнение которых представляет собой актуальную задачу как в теоретическом, так и в практическом плане. Вот почему в условиях трансформации информационно-библиотечной среды неизбежна смена базовых концепций, методологических и методических принципов функционирования ИПЯ в ЭК.

Изученность темы. Проблема комплексного использования ИПЯ до начала эпохи электронных каталогов (90-е годы XX в.) рассматривалась российски-

ми библиотековедами как проблема сосуществования различных типов реальных карточных каталогов (КК). С начала 1970-х гг. утверждается системное восприятие совокупности библиотечных каталогов, формируются подходы к уточнению роли отдельных каталогов в единой системе библиотечных каталогов и картотек (4), взаимосвязях между систематическим каталогом (СК) и предметным каталогом (ПК) (28). При этом не прекращались дискуссии об их функциях и значимости в СПА, то СК объявляли ведущим, а ПК вспомогательным, то наоборот (91). И все же в «доэлектронном» отечественном каталогове-дении доминировало представление о ведущей роли СК, закрепленное утвержденными положениями о каталогах и картотеках (4). К моменту появления электронных каталогов число СК в российских библиотеках, безусловно, многократно превышало число ПК. Основным языком тематического поиска была иерархическая классификация (ИК). Вместе с тем в потоке публикаций всегда присутствовали обоснования целесообразности параллельного использования обоих типов каталогов, основными аргументами в пользу которого служили необходимость учета тенденций интеграции и дифференциации научного знания, удовлетворения различных типов запросов пользователей (73, 144, 186, 223).

Особенно плодотворным для теоретических исследований был период с середины 60-х до середины 80-х гг. XX в. Толчком к развитию этого направления послужило активное внедрение в библиотечное дело положений теории информационного поиска. В это время проблема выявления специфических свойств и функций ИПЯ привлекала пристальное внимание как библиотековедов, так и специалистов в области информационных технологий. Основные положения теории ИПЯ в отечественной печати были сформулированы в работах А. И. Михайлова (149), А. И. Черного (149), Р. С. Гиляревского (61, 149), Дж. Солтона (209) (70-е гг. XX в.), А. Б. Антопольского (6-8), Т. А. Артамонова (8), Г. Г. Белоногова (16), Б. А. Кузнецова (16), А. П. Новоселова (16) (80-е гг.).

По результатам исследований 1960-70-х гг. был сделан вывод о том, что единый ИПЯ, обязательный для всех и удовлетворяющий нужды тематического поиска, создать невозможно. Исследования показали, что конструктивно проблема обеспечения языкового единства может быть решена путем упорядочения существующих языковых средств и создания на этой основе комплекса средств индексирования документов и запросов (55, 81). Задача состояла в «рациональном использовании всего набора различных ИПЯ и выборе такого подмножества из этого набора, которое в лучшей степени отвечает потребностям конкретной предметной области или конкретным задачам, стоящим перед той или иной локальной системой научно-технической информации» (51, с. 38). Таким образом, тезис, первоначально выдвинутый библиотековедами, нашел подтверждение на новом уровне теоретического осмысления.

В середине 1970-х гг. была начата разработка комплекса лингвистических средств автоматизированного поиска в Государственной публичной научно-технической библиотеке СССР (77, 236). В 1976-78 гг. в Государственной библиотеке СССР им. В. И. Ленина проводились исследования по созданию комплекса ИПЯ, интегрирующего в себе такие языки тематического поиска, как Универсальная десятичная классификация (УДК), Библиотечно-библиографическая классификация (ББК), язык предметных рубрик (ЯПР) и предназначенного для решения многоплановых задач. В. А. Мишин, Л. Санчес Мехидо подчеркивали, что создание такого рода языковых комплексов становится особо актуальным именно в АИПС, где появляются принципиально новые возможности интеграции ИПЯ (147). Подробное обоснование необходимости применения комплекса лингвистических средств по отношению к автоматизированной библиотечно-информационной системе (АБИС) было дано Н. И. Гендиной в середине 1980-х гг. По ее утверждению, многообразие задач, обусловленных с одной стороны, мощностью и разнообразием поступающего в библиотеку потока документов, а с другой - широким диапазоном и сложностью информационных потребностей пользователей, ростом их требований к

качеству предоставляемой информации «требует применения комплекса различных по своим функционально-структурным особенностям ИПЯ» (57).

Однако основным предметом интереса в библиотековедении по-прежнему оставалось использование отдельньгх ИПЯ. С применением терминов и подходов информатики происходило осознание специфики классификационных и предметизационных поисковых языков. В 1973 появляется диссертационное исследование Р. Ф. Грининой, посвященное сравнению дескрипторного информационно-поискового языка (ДИПЯ) и ЯПР (74), в 1980-х гг. - работы Е. М. Ручимской, описывающие результаты сопоставления языка предметных рубрик и иерархической классификации (183, 184). Теоретические основы функционирования классификаций рассматриваются в работах М. В. Баграда (12), В. Ю. Эйдельмана (260), Э. Р. Сукиасяна (216-227), языка предметных рубрик - в публикациях С. К Виленской (27-30), Э. Л. Призмента (175), Л. В. Сахарного (193-195).

Признание библиотечного каталога информационно-поисковой системой (ИПС) дало основание для проведения ряда экспериментов, использующих методы и инструменты анализа информатики. В экспериментах Ленинградского государственного института культуры им. Н. К. Крупской, получивших название «Радуга» и «Близнецы» (1960-е гг.), по результатам сопоставления «ручного» поиска посредством ЯПР и ДИПЯ исследователи пришли к выводу об их существенном сходстве (74, 75). Были получены сходные значения показателей информационного шума при более высокой доле потерь информации в результате поиска на ЯПР. Но Р. Ф. Гринина считала, что эти различия могут быть нивелированы в случае отхода от традиционной методики предметизации в пользу более глубокого и детального индексирования (74). В эксперименте, проведенном в 1964-65 гг., сравнивались результаты библиографического разыскания по традиционной систематической картотеке на базе УДК и ИПС, реализованной на суперпозиционных перфокартах и использующей дескрип-торный язык (210). По его итогам также были высказаны претензии в адрес традиционной методики индексирования.

В Государственной библиотеке СССР им. В. И. Ленина на базе автоматизированной «ИПС по новым поступлениям» на массиве описаний диссертаций в пакетном режиме был проведен поиск на языках ББК, УДК, предметных рубрик и с использованием всего комплекса лингвистических средств. Максимальная полнота была достигнута с использованием иерархических классификаций, а максимальная точность - при поиске по логическому произведению всех участвующих в эксперименте ИПЯ (191). В 1983-85 гг. серия экспериментов по автоматизированному была проведена в Государственной публичной библиотеке им. М. Е Салтыкова-Щедрина с целью сопоставления результатов поиска с использованием нормализованной и свободной лексики. Наилучшие результаты были получены при поиске по сочетанию слов из заглавий и предметных рубрик (192, 194).

Появление в российских библиотеках электронных каталогов, как и любой новый этап в развитии поисковых систем, послужило к возобновлению дискуссий о свойствах различных ИПЯ, на этот раз уже в условиях автоматизации. Основной объем документального потока этого периода, как и ранее, составляют публикации, посвященные отдельным ИПЯ. Начало обсуждению проблем использования кодовых иерархических классификаций в автоматизированном поиске положили работы В. А. Мишина (146, 147) (70-е гг. XX в.). Эта тема уже по отношению к ЭК продолжена в публикациях Э. Р. Сукиасяна (216-227), О. Л. Лавреновой (125, 126), А. В. Buxton (283), W. М. High (316), N. J. Williamson (382). Особенности применения в ЭК языка предметных рубрик обсуждаются в работах С. К. Виленской (27, 29), Я. Садовской (190), Л. В. Сахарного (192, 194) (80-е гг.). В последнее десятилетие XX в. и первые годы XXI в. появляются работы по этой теме Н. М. Шиндряевой (250), В. Г. Войскунского (35, 39), С. Б. Голубцова (64 - 67), В. П. Суворовой (214, 215), Е. В. Чернозатонской (242), F. Calderon (284), L. М. Chan (285-287), Т. N. Conell (293, 294), D. S. Jerry (325), W. Studwell (369, 370). Вопросы применения дескрипторного ИПЯ рассматриваются О. Н. Фуралевым (236), Е. М. Ручимской (236). Современную

практику использования ключевых слов в ЭК анализируют Е. М. Зайцева (95, 96), Н. П. Никольцева (157), Г. С. Щербинина (258, 259).

На страницах профессиональной прессы спектр мнений о роли отдельных ИПЯ в составе комплекса достаточно широк. Не менее разнообразны и противоречивы и предложения по преобразованию их лексики, грамматических средств, принципах доступа к авторитетным файлам. При всем этом остается неясным, какие из них следует предпочесть, исходя из специфики ЭК.

На протяжении последнего десятилетия уровень, на котором рассматриваются проблемы ЛО ЭК, практически не меняется. В библиотечной печати декларируется, дискутируется и не находит разрешения один и тот же круг проблем повышения эффективности тематического поиска; приводятся повторяющиеся аргументы по поводу преимуществ отдельных ИПЯ, но ни одному из них не отдается однозначного предпочтения.

По нашему мнению, в основе сложившейся ситуации лежат две основные причины:

отсутствие целостной концепции лингвистического обеспечения

тематического поиска в ЭК, на основании которой можно было бы проводить комплексную оценку высказанных теоретических положений и практических мер с учетом специфики объекта их приложения;

отсутствие достаточной базы для экспериментального доказатель
ства гипотез.

В решении проблемы доступа, одной из ключевых для современной «библиотеки без стен», основной акцент делается на обеспечение физического доступа к информации - возможности оперативно ознакомиться с текстом на том или ином носителе на сколь угодно большом удалении от места хранения. Значительно меньше внимания уделяется проблемам интеллектуального доступа (возможности обнаружить, оценить, отобрать пертинентные документы во все нарастающих информационных массивах, которые библиотека предоставляет пользователям непосредственно или через Интернет), решение которых обеспечивают лингвистические средства ЭК. Это ведет к ограничению функции ориентации пользователей в информационных потоках, особо значимой при

выполнении библиотекой социальной миссии посредничества на пути превращения информации в общественно полезный ресурс (257).

В сложившейся ситуации выделяется концепция моделирования лингвистического обеспечения АБИС на основе технологического подхода, разработанная Н. И. Гендиной (55, 56). На ее основе была решена задача первого этапа: сбор и структурирование информации обо всех используемых в процессах библиотечной технологии лингвистических средствах. Следующая задача - формирование оптимального минимума взаимодополняющих лингвистических средств, необходимых и достаточных для реализации полного комплекса функций ЭК. Для этого требуется сопоставление способности отдельных ИПЯ обеспечить необходимые для реализации конкретных функций параметры качества.

"Проведенные ранее эксперименты по изучению поисковых возможностей ИПЯ не обеспечивают достаточной для решения этой задачи информационной базы по нескольким причинам. Во-первых, экспериментальные поиски проводились преимущественно в монотематических массивах. Однако, по мнению ряда исследователей (Е. Н. Пименова (169), И. Б. Фоминых (235), D. Plasa (353), S. Stebelman (373), Н. R. Tibbo (381)), модели индексирования и поиска информации различны для различных областей знания. При этом особо выделяются: сфера социально-гуманитарных наук, как одна из наиболее слабо структурированных и неупорядоченных в понятийном аспекте предметных областей (353, 373, 381), медицина (169, 235), музыка, лингвистика, вычислительная техника (169). Это означает, что невозможно однозначно распространить результаты анализа на весь массив документов, отраженный в каталоге универсальной библиотеки. Во-вторых, по мнению J. К. Spark, несмотря на объем и разнообразие проводимых экспериментов, по-прежнему неочевидно, какие различия в эффективности поиска значимы для пользователей (371). Безусловно, некоторая часть полученных на предыдущих этапах изучения библиотечных каталогов результатов может быть использована и сегодня (эта тема подробно обсуждается в 1.4), но многие теоретические выводы и эмпирические данные теряют

свою актуальность в связи с изменением как состояния самих поисковых языков, так и среды их функционирования.

Несмотря на очевидные пробелы в теоретических выводах, экспериментов по автоматизированному поиску на базе отечественных классификационных и предметизационных систем в период 1986-2003 гг. было проведено немного (таблицы 1, 2 Приложения 5). Более представителен массив зарубежных публикаций. Они описывают опыт применения в интерактивных каталогах ИПЯ, разработанных в соответствии с принятыми в конкретных странах традициями каталогизации.

Таким образом, основная проблема формулируется следующим образом: во-первых, какие специфические особенности отдельных типов ИПЯ будут особо востребованы в электронном каталоге, во-вторых, насколько изменятся эти особенности в условиях автоматизированного поиска, и в-третьих - какие меры необходимо принять для обеспечения максимально возможной эффективности их комплексного использования.

По истечении более чем десятилетнего периода становления отечественных электронных каталогов задачи оптимизации ЛО по-прежнему далеки от разрешения ввиду отсутствия теоретической и эмпирической базы для обоснованных выводов. В результате мы подходим к решению безусловно актуальных задач высокого уровня сложности (таких как корпоративная каталогизация, каталогизация ресурсов Интернета), не имея достаточной лингвистической базы для осуществления этих процессов.

Налицо явное отставание теории лингвистического обеспечения от реальной практики развития информационно-библиотечных систем (59), в частности, проявившееся в противоречиях:

между повсеместным применением в ЭК нескольких языков тематического поиска и отсутствием единых обоснованных критериев, позволяющих оптимизировать эмпирически сложившиеся комплексы;

изменившимися условиями функционирования ИПЯ в электронной среде и устоявшимися принципами каталогизации;

разнообразием теоретических выводов о функциональных возмож
ностях поисковых языков в ЭК и отсутствием экспериментальной проверки
гипотез на новой технической базе.

Целью диссертационного исследования является определение функциональной специфики и принципов комплексного использования лингвистических средств тематического поиска в электронном каталоге.

Достижение указанной цели обусловило необходимость решить следующие задачи:

охарактеризовать свойства электронного каталога, лежащие в основе специфических требований к ЛО;

выявить и сопоставить основные тенденции использования лингвистических средств тематического поиска в ЭК;

сопоставить специфические требования, предъявляемые к лингвистическим средствам ЭК в рамках различных концепций информационного поиска;

проанализировать наиболее распространенные теоретические положения о функциональных возможностях различных языков тематического поиска в традиционных и электронных каталогах;

изучить отношение пользователей к процессу и результатам поиска в систематическом каталоге ГПНТБ СО РАН с использованием индексов ББК и предметных рубрик алфавитно-предметного указателя (АПУ) к СК;

на базе ЭК ГПНТБ СО РАН провести экспериментальное тестирование возможностей поисковых языков ББК, ГРНТИ, предметных рубрик и ключевых слов из заглавий документов

сформулировать принципы комплексного использования лингвистических средств тематического поиска в ЭК.

Объект исследования: лингвистические средства тематического поиска в электронном каталоге.

Предмет исследования: принципы комплексного использования лингвистических средств тематического поиска в электронном каталоге с учетом их

функциональной специфики.

В качестве методологической основы исследования: использован структурно-функциональный подход к анализу лингвистического обеспечения ЭК. Его приложение к задаче исследования библиотеки как открытой интегрированной системы описано в работах Ю. Н. Столярова. Ю. Н. Столяров характеризует данный подход как совокупность системно-элементного, системно-структурного, системно-функционального аспектов системного подхода (213). Системный подход как общенаучное методологическое направление представлен работами Р. Акоффа, И. В. Блауберга, Э. Г. Юдина. Особенности функционального подхода описаны В. Е. Беспаловым, Л. В. Сальниковым. Возможности синтетического применения структурного и функционального подходов анализируются С. Н. Мищенко.

Основные положения концепций библиотечных каталогов, информационного поиска и информационно-поисковых языков, на которых базируется диссертационное исследование, сформулированы в работах Т. Н. Ахалая, Г. Г. Белоногова, Ф. С. Воройского, Н. И. Гендиной, Р. С. Гиляревского, В. П. Коршунова, В. К. Кричевского, Б. А. Кузнецова, Ф. Ланкастера, Э. Л. Призмента, Е. М. Ручимской, А. Д. Сахарного, А. В. Соколова, Дж. Солтона, Э. Р. Сукиасяна, А. И. Черного, Я. Л Шрайберга.

Комплексный характер рассматриваемых проблем обусловил необходимость применения комплекса общенаучных и специальных библиотековедческих методов.

Библиометрический и контент-анализ документального потока дал возможность определить основные тенденции развития Л О ЭК и выделить проблемы, требующие оперативного разрешения. Метод анкетирования был признан достаточным для исследования поискового поведения пользователей ЭК. Посредством эксперимента на практике исследованы поисковые возможности различных типов ИПЯ. Методы математической статистики использованы для обработки и описания собранных посредством других методов эмпирических данных. В ходе сравнительного анализа сопоставлялись свойства, функ-

ции, общие и специфические тенденции и пропорции развития исследуемых объектов. Использовались также методы моделирования и мониторинга.

Базой исследования послужили: Центральный систематический каталог (ЦСК) Государственной публичной научной библиотеки СО РАН, Алфавитно-предметный указатель к ЦСК Государственной публичной научно-технической библиотеки СО РАН (ГПНТБ СО РАН), электронный каталог ГПНТБ СО РАН, электронные каталоги Российской государственной библиотеки (РГБ), Российской национальной библиотеки (РНБ), Государственной публичной научно-технической библиотеки России (ГПНТБ России), Библиотеки по естественным наукам РАН (БЕН РАН), Всероссийской государственной библиотеки иностранной литературы (ВГБИЛ) им. М. И. Рудомино, Библиотеки Московского государственного технического университета (МГТУ) им. Н. Э. Баумана, Фундаментальной библиотеки Санкт-Петербургского государственного технического университета (СПбГТУ), Научной библиотеки (НБ) Новосибирского государственного технического университета (НГТУ), Новосибирской государственной областной научной библиотеки (ОНБ), Нижегородской государственной областной универсальной научной библиотеки (ОУНБ), Научной библиотеки Южно-Уральского госуниверситета.

Научная новизна и теоретическая значимость работы. Впервые на основе данных библиометрического анализа на временном отрезке 1986 - 2003 гг. оценена степень изученности проблем использования отдельных типов ИПЯ. Выявлено, что основные современные тенденции развития лингвистического обеспечения тематического поиска в ЭК следующие: комплексное использование ИПЯ разных типов, расширение состава ЛО ЭК по сравнению с ЛО карточных каталогов, расширение поисковых возможностей ИПЯ, усиление взаимозависимости лингвистического и программного обеспечения ЭК, использование поисковых языков в режиме предкоординации, отставание в развитии нормативно-методической составляющей ЛО.

Сформулировано заключение о ситуативности и вариативности квалификационных характеристик неподготовленного пользователя и его требований к

процессу и результатам поиска. Доказано, что общим для большинства концепций является требование дифференциации методов и процедур использования ИПЯ в зависимости от характеристик пользователя ЭК. Обоснована целесообразность применения в ЭК принципов адаптивного информационного поиска. Установлена зависимость требований пользователей к процессу и результатам поиска от цели поиска и стадии сбора информации.

Оценены и сопоставлены изменения лексического состава, грамматики, нормативно-методической базы использования отдельных ИПЯ, обусловленные ситуацией автоматизированного поиска на новой программно-технической базе. Подтвержден тезис о сближении свойств и принципов использования предкоординатных и посткоординатных ИПЯ в электронной среде. Установлены характеристики отдельных ИПЯ, определяющие их функциональные различия при использовании в ЭК: принципы образования классов понятий и специфика плана выражения, а также принципы структурной организации нормативных словарей.

Уточнена функциональная специфика и соответствующее функциональное назначение отдельных ИПЯ в составе комплекса лингвистических средств ЭК. Показано, что в процессе оценки ИПЯ на предмет включения в состав ЛО ЭК должны учитываться не только поисковая эффективность языков, но и критерии комфортности поиска, возможности корректировки характеристик ИПЯ программными средствами, типичные для данного языка ошибки индексирования. На этой основе предложена базовая структура ЛО универсальной библиотеки, теоретически обоснована и подтверждена на практике целесообразность совместного использования в ЭК иерархических классификаций и языка предметных рубрик. Впервые логически выведены принципы комплексного использования ИПЯ, позволяющие обеспечить наибольшую эффективность их согласованного применения.

Практическая значимость. Полученные результаты применены для оптимизации использования лингвистического обеспечения электронных каталогов ГПНТБ СО РАН и корпоративной библиотечно-информационной системы

г. Новосибирска. Разработаны методические рекомендации по тематическому поиску в электронном каталоге ГПНТБ СО РАН. Рекомендации могут найти применение при обучении пользователей ЭК, подготовке специалистов в области создания информационных продуктов и услуг. Материалы исследования использованы при разработке курса лекций в системе дополнительного профессионального образования.

Инструментарий для мониторинга ЛО и выработанные меры по оптимизации комплекса лингвистических средств могут быть предложены для использования в ЭК других универсальных библиотек.

На защиту выносятся следующие положения:

  1. Характер проблемных поисковых ситуаций, содержание и приоритетность требований к процессу и результатам библиографического поиска и, соответственно, критерии оценки поисковой системы пользователем динамичны, ситуативны и зависят от характеристик пользователя. Эти характеристики следующие: владение технологией информационного поиска; владение общими методами решения интеллектуальных задач; знание предметной области, в которой осуществляется поиск. На основании этих параметров следует проводить ситуационную диагностику квалификации пользователя ЭК.

  2. Специфические требования к составу ЛО электронного каталога обусловлены типо-видовой и содержательной структурой отражаемого документального потока и его (ЭК) преимущественной ориентацией на пользователя с недостаточной квалификацией.

  3. Совокупные требования к процессу и результатам тематического поиска в ЭК реализуемы только на базе комплекса разнородных лингвистических средств, который должен быть сформирован, исходя из специфических характеристик поступающих в систему запросов; требований пользователей; свойств ИПЯ определенного типа.

4. Наибольшая функциональная эффективность электронного каталога
обеспечивается применением иерархических классификаций и языка предмет-

ных рубрик. Эффективным вариантом их использования является сочетание принципов предкоординации и посткоординации.

5. Комплексное использование ИПЯ должно быть основано на принципах взаимодополнения, дифференциации функций, комплексной оценки каждого ИПЯ, комплексной диагностики запросов, сопряжения, согласованного преобразования ЛО, комплексного контроля качества индексирования, координации методик индексирования.

Апробация работы. Основные положения диссертации докладывались на IV Международном Сибирском научном семинаре «Автоматизация библиотечно-информационных систем» (Новосибирск, 1996), 3-й Международной конференции «НТИ - 97: Информационные ресурсы. Интеграция. Технологии» (Москва, 1997), международной конференции «ББК - новые горизонты организации знаний» (Москва, 1998), научно-практической конференции молодых ученых и специалистов «Библиотека XXI века: Библиотечные каталоги» (Москва, 2000), региональной научно-практической конференции «Научные библиотеки в новом тысячелетии: проблемы взаимоиспользования ресурсов» (Иркутск, 2001). По теме диссертационного исследования автором опубликовано 11 работ.

Структура работы. Диссертация состоит из введения, двух глав, заключения, списка использованной литературы, включающего 261 отечественных, 129 зарубежных источников, списка принятых сокращений, 11 приложений. Работа иллюстрирована 12 рисунками, 16 таблицами.

Электронный каталог как специфический информационный ресурс и объект исследования

Актуальность темы. Ядром и основой функционирования информационно-библиотечных систем, а также одним из основных объектов приложения новых информационных технологий в библиотеке является электронный каталог (ЭК). Эффективность использования информационных ресурсов библиотек и качество библиотечного сервиса как на локальном уровне, так и в режиме сети во многом определяют лингвистические средства тематического поиска в ЭК, обеспечивающие интеллектуальный доступ к документным массивам. Согласованный и обоснованный выбор лингвистического обеспечения (ЛО) - задача, без решения которой создание локальных и распределенных электронных каталогов теряет смысл.

Использование в отечественных ЭК широкого набора разнообразных по структуре, лексическому наполнению, свойствам лингвистических средств представляет собой устойчивую тенденцию. Но при этом разные библиотеки демонстрируют исключительное разнообразие подходов к определению и обоснованию состава и принципов функционирования ЛО. Это вынуждает библиотечное сообщество на новом уровне обратиться к задаче оптимизации комплекса информационно-поисковых языков (ИПЯ), то есть определения состава ЛО и параметров каждого из поисковых языков, необходимых и достаточных для эффективного функционирования системы в целом.

Согласно общим принципам проектирования автоматизированных информационно-поисковых систем (АИПС), эта процедура должна осуществляться на основе анализа следующих факторов: функционально-целевого назначения системы, характера поступающих в нее запросов, способности различных типов ИПЯ обеспечить их реализацию (56, 253). При прямом проецировании этих принципов на задачу формирования ЛО ЭК возникает ряд проблем, обусловленных качественной спецификой данного информационного ресурса. Однако на начальных стадиях создания российских ЭК углубленных исследований названных факторов проведено не было. Возникающие проблемы осознавались и решались в основном на эмпирическом уровне.

Очевидно, что задача оптимизации ЛО ЭК не может быть решена исключительно на базе принципов традиционной каталогизации, так как практически все базовые компоненты анализа претерпели в условиях автоматизации существенные изменения, выразившиеся: - в расширении состава и усилении взаимосвязей и взаимовлияния между различными элементами справочно-поискового аппарата (СПА) библиотеки, а также частичном перераспределении присущих им функций, изменении круга задач, в решении которых задействован ЭК; - изменении в информационном поведении пользователей библиотечных каталогов (198); перераспределении функций между пользователем и поисковой системой; организации сервиса, ориентированного на самообслуживание конечных пользователей (12); росте требований к уровню обслуживания, степени интеллектуальности и аналитичности производимых библиотекой продуктов и услуг (59); - преобразовании технологической среды функционирования библиотечного каталога, при этом традиционные библиотечные технологии приобретают новый вид, а нередко и новое качество (130); - значительном расширении поисковых возможностей языков карточных библиотечных каталогов и возможностей комплекса лингвистических средств в целом. Названные факторы в совокупности обусловили изменение подходов и требований к составу и свойствам ЛО ЭК, уточнение которых представляет собой актуальную задачу как в теоретическом, так и в практическом плане. Вот почему в условиях трансформации информационно-библиотечной среды неизбежна смена базовых концепций, методологических и методических принципов функционирования ИПЯ в ЭК. Изученность темы. Проблема комплексного использования ИПЯ до начала эпохи электронных каталогов (90-е годы XX в.) рассматривалась российскими библиотековедами как проблема сосуществования различных типов реальных карточных каталогов (КК). С начала 1970-х гг. утверждается системное восприятие совокупности библиотечных каталогов, формируются подходы к уточнению роли отдельных каталогов в единой системе библиотечных каталогов и картотек (4), взаимосвязях между систематическим каталогом (СК) и предметным каталогом (ПК) (28). При этом не прекращались дискуссии об их функциях и значимости в СПА, то СК объявляли ведущим, а ПК вспомогательным, то наоборот (91). И все же в «доэлектронном» отечественном каталогове-дении доминировало представление о ведущей роли СК, закрепленное утвержденными положениями о каталогах и картотеках (4). К моменту появления электронных каталогов число СК в российских библиотеках, безусловно, многократно превышало число ПК. Основным языком тематического поиска была иерархическая классификация (ИК). Вместе с тем в потоке публикаций всегда присутствовали обоснования целесообразности параллельного использования обоих типов каталогов, основными аргументами в пользу которого служили необходимость учета тенденций интеграции и дифференциации научного знания, удовлетворения различных типов запросов пользователей (73, 144, 186, 223).

Особенно плодотворным для теоретических исследований был период с середины 60-х до середины 80-х гг. XX в. Толчком к развитию этого направления послужило активное внедрение в библиотечное дело положений теории информационного поиска. В это время проблема выявления специфических свойств и функций ИПЯ привлекала пристальное внимание как библиотековедов, так и специалистов в области информационных технологий. Основные положения теории ИПЯ в отечественной печати были сформулированы в работах А. И. Михайлова (149), А. И. Черного (149), Р. С. Гиляревского (61, 149), Дж. Солтона (209) (70-е гг. XX в.), А. Б. Антопольского (6-8), Т. А. Артамонова (8), Г. Г. Белоногова (16), Б. А. Кузнецова (16), А. П. Новоселова (16) (80-е гг.).По результатам исследований 1960-70-х гг. был сделан вывод о том, что единый ИПЯ, обязательный для всех и удовлетворяющий нужды тематического поиска, создать невозможно. Исследования показали, что конструктивно проблема обеспечения языкового единства может быть решена путем упорядочения существующих языковых средств и создания на этой основе комплекса средств индексирования документов и запросов (55, 81). Задача состояла в «рациональном использовании всего набора различных ИПЯ и выборе такого подмножества из этого набора, которое в лучшей степени отвечает потребностям конкретной предметной области или конкретным задачам, стоящим перед той или иной локальной системой научно-технической информации» (51, с. 38). Таким образом, тезис, первоначально выдвинутый библиотековедами, нашел подтверждение на новом уровне теоретического осмысления.

Теоретические проблемы оценки функционирования электронного каталога конечными пользователями

Тема помощи конечным пользователям ЭК представлена в основном зарубежными источниками - количество зарубежных публикаций почти в три раза превышает число отечественных. Но процентная доля работ этого направления в общем потоке документов, посвященных проблемам пользователей ЭК, оказалась сопоставима для отечественных и зарубежных публикаций (8% отечественных и 11% - зарубежных). Тем не менее, проблемы пользователей американских ЭК в 1997 г.,Т. R. Matthews (340) характеризует как общеизвестные. Причина в том, что формирование концепции систем, ориентированных на неподготовленного пользователя, за рубежом происходило в период создания ЭК второго поколения (1980-е - начало 90-х гг.) и сопровождалось активным обсуждением в печати. Проведенные в тот период мониторинговые исследования пользователей ЭК (например, 264, 269, 355) создали обоснованную базу для проектирования последующих поколений каталогов и обеспечили их эволюцию в системы с разветвленной функцией поддержки процессов поиска. При всем этом сегодня данные, полученные в 1980-х гг., уже признаются недостаточными для разработки ЭК, базирующихся на веб-технологиях, и ставится вопрос о возобновлении исследований (335).

Для отечественных ЭК проблема стояла не столь остро, в частности, благодаря возможности использовать зарубежный опыт. Можно предположить, что этот фактор и обусловил различия в структуре документального потока в России и за ее пределами. Однако на то, что это не совсем так, указывают результаты обследования ЭК, представленных на сайтах крупных российских библиотек (см. 1.2). Оно показало, что в большинстве случаев разработчики ЭК ограничиваются минимумом средств поддержки поиска. Приведенные в таблице сведения можно интерпретировать как косвенное указание на предпочтительные способы решения проблем конечных пользователей: за рубежом преобладают подходы, основанные на автоматической реализации сложных для пользователя поисковых процедур, в российских библиотеках на данном этапе предпочтение отдается обучению пользователей. Но очевидно, что для осуществления любого из подходов необходима информация о проблемах и затруднениях, испытываемых конечными пользователями каталогов, что еще раз подтверждает актуальность исследований в этом направлении.

Квалификационные характеристики второй группы (общие навыки решения интеллектуальных задач), как правило, не выделяют в качестве самостоятельных, а относят к категории операционально-технологических умений и навыков. Хотя именно эти навыки, безусловно, позволяют актуализировать и эффективно применять знания, относящиеся к двум другим группам, они не входят в предмет изучения библиотековедения. Соответственно, задача анализа состояния этих характеристик не ставилась в специальных библиотековедческих исследованиях, что подтверждает отсутствие данных в соответствующей ячейке таблицы 1.4.

Наиболее динамична группа квалификационных характеристик, описывающих познания пользователя в соответствующей предметной области. Это нашло отражение в известном положении о неопределенности информационной потребности. На разных этапах развития оно неоднократно применялось к библиотечным каталогам (53, 248, 254). С этих позиций затруднения, часто квалифицируемые как "неумение" или "нежелание" пользователя формулировать запрос, рассматриваются как следствие объективного свойства информационных потребностей. Тезис о том, что поиск информации - это активный, продолжающийся процесс изменения границ субъективного знания, помогающий восполнить "пробелы", в котором выбор стратегии зависит во многом от личных характеристик пользователя (102, 145, 244, 344), служит обоснованием для применения к ЛО систем, ориентированных на конечного пользователя, комплекса подходов, которые описаны в 1.3.3.

П. Ингверсен, основываясь на эмпирических данных, делает вывод о том, что информационные потребности в конкретных информационно-поисковых ситуациях действительно становятся достаточно стабильными на определенной стадии поиска (102). Но, как свидетельствуют данные, приведенные в работах (282, 372), большая часть (72-79,5%) как опытных, так и неподготовленных пользователей, предпринимая первый сеанс поиска на начальных стадиях исследования, предпочитают использовать именно электронный каталог или сочетание поиска в ЭК и в БД на CD-ROM. Следовательно, велика вероятность, что названное свойство информационной потребности проявится именно при поиске в ЭК. Именно для этих, как правило, творческих этапов интеллектуальной деятельности, по мнению иследователей (244, 249, 279, 328), характерны "нечеткие запросы", отсутствие словесных формулировок, "широкие общеознакомительные запросы", «запросы скорее учебного, нежели научного уровня». Э.Л. Шапиро особо выделял проблему информированности пользователя при поиске за пределами «собственной» области знания и сферы профессиональной деятельности (246). По-видимому, осознание этой проблемы и послужило одной из предпосылок выделения функции помощи в ориентации во теме поиска для лингвистических средств ЭК.

Из приведенных выше положений следует, что в зависимости от характеристик пользователей по каждой из названных позиций меняются характер возникающих затруднений, содержание и приоритетность требований пользователя к процессу и результатам библиографического поиска и, соответственно, меняются критерии оценки поисковой системы.

Изучение поискового поведения пользователей систематического каталога (на примере систематического каталога Государственной публичной научно-технической библиотеки СО РАН)

В главе 1 на основании анализа тенденций и проблем развития лингвистических средств тематического поиска в ЭК, факторов, определяющих их специфические свойства и требования к ним, были получены выводы о целесообразности дифференциации функций отдельных ИПЯ в ситуации их комплексного использования по отношению к отдельным типам поисковых задач. По результатам изучения теоретических материалов выявлены факторы, подлежащие учету при реализации данной процедуры: с одной стороны, это семантическая структура запроса, квалификационные характеристики предъявившего запрос пользователя и параметры поисковой ситуации, с другой - свойства и функциональные возможности ИПЯ, востребованные в решении конкретной поисковой задачи. Для проверки возможности и целесообразности учета перечисленных факторов при поиске в ЭК, а также выявления их специфических проявлений при решении различных типов поисковых задач на базе ГПНТБ СО РАН было проведено комплексное исследование. Краткая характеристика основных его этапов дана в таблице 2.1.

На первом этапе изучалось поведение пользователей при поиске посредством различных типов ИПЯ. Цель исследования состояла в выявлении и структурировании моделей различных типов поисковых задач в зависимости от основных характеристик пользователей. Помимо апробации теоретических положений концепции адаптивного информационного поиска, проведенное исследование было направлено на решение ряда практических задач по совершенствованию системы помощи пользователю электронного каталога, отладке процесса диагностики и диспетчеризации запросов, обращенных к СПА библиотеки.

База исследования: Комплекс «Центральный систематический каталог ГПНТБ СО РАН - алфавитно-предметный указатель к ЦСК» на сегодняшний день мы сочли наиболее пригодным для реализации данной цели, так как он позволяет провести многопрофильное исследование по выбранному направлению.

На его базе можно исследовать поведение пользователей: - в процессе самостоятельного поиска; - в процессе комплексного использования предметных рубрик и индексов РІК. При этом мы учитывали, что используемая в исследуемом комплексе совокупность лингвистических средств составляет основу ЛО ЭК. Поэтому основные выводы по поводу требований и проблем пользователей, полученные на базе СК, можно с определенными оговорками экстраполировать на поисковую ситуацию в ЭК, адаптировав при этом пути решения выявленных проблем с учетом возможностей поиска в электронной среде.

Объем СК на 1 января 2003 г. составлял 2 774 тыс. карточек (166), АПУ -249,5 тыс. карточек (165). Документы для СК систематизируются на основе полных таблиц Библиотечно-библиографической классификации для научных библиотек (22). Основные положения методики создания и актуализации АПУ к СК изложены в пособии (3).

Методы выборочного анкетного опроса, наблюдения, сравнительно-статистического анализа полученных данных мы сочли достаточным для выявления доминирующих тенденций, обнаружения наиболее актуальных проблем, определения направлений, требующих дополнительного изучения.

Текст анкеты приведен в Приложении 7. Анкета включала три блока вопросов, первый из которых имел целью выявить предпоисковые ожидания пользователей. Определялся набор читательских критериев оценки процесса и результатов поиска, а также степень значимости (шкала предпочтений) выдвигаемых требований. В связи с обозначенной в профессиональной литературе проблемой количественно ограничения выдачи с учетом цели поиска мы попытались понять, существуют ли определенные требования к объему выдачи у пользователей каталога. Следующая группа вопросов ориентирована на анализ процесса поиска. В частности, предполагалось определить, какие поисковые стратегии используют читатели, и какие факторы влияют на их выбор, а также выяснить, какие затруднения пользователи испытывают в процессе поиска. Заключительная часть анкеты посвящена оценке результатов поиска. Рассматривались факторы, влияющие на итоговый отбор релевантной информации и общая удовлетворенность пользователей результатами поиска.

Исследование проводилось на основе репрезентативной выборки, в составе которой в равных долях были представлены основные читательские категории ГПНТБ СО РАН: научные работники, специалисты с высшим и средним специальным образованием, студенты вузов. Объем выборки составил 270 человек.

Процедура сбора данных. Бланки анкеты вручались респондентам в зале каталогов ГПНТБ СО РАН. Заполнение ее происходило в несколько этапов. На вопросы первого блока пользователи отвечали перед началом поиска в СК по конкретной теме. Второй блок анкеты заполнялся после завершения поиска и заполнения бланков требований на литературу, третий - после ознакомления респондентов с отобранными в результате поиска документами. Таким образом прослеживался весь путь получения информации по теме и оценивалась степень варьирования пользовательских оценок на различных стадиях этого процесса.

Процедура обработки и анализа данных. Для обработки и описания полученных данных использовались методы математической статистики. Сравнительный анализ проводился посредством простой и перекрестной группировки, ранжирования признаков, расчета коэффициента Юла (показателя парной корреляции признаков), выявления средней тенденции.

Принципы комплексного использования лингвистических средств тематического поиска в электронном каталоге

Основное требование к комплексу ИПЯ еще на начальных этапах становления концепции ЛО АБИС формулировалось как целостность, заключающаяся в максимально возможных взаимодействии и связанности все ИПЯ и сохранении такой связанности при их использовании (51).

Проведенное исследование позволило оценить возможность приложения и степень проявления этого требования к различным объектам и этапам поискового взаимодействия и на этой основе сформулировать некоторые принципы и рекомендации по комплексному использованию лингвистических средств тематического поиска в электронном каталоге.

Результаты эксперимента показали, что принцип взаимодополнения ИПЯ необходимо соблюдать: - при определении состава и параметров ЛО; - при составлении ПОД (с ограничениями, так как в ПОЗ возможно не только комплексное, но и самостоятельное применение отдельных языковых средств); - при составлении ПОЗ. В последнем случае, как видно из выводов 2.1, 2.2, целесообразно применять принцип дифференциации функций отдельных ИПЯ при поиске в зависимости от его функциональных свойств и возможностей, необходимых и достаточных в конкретной поисковой ситуации. С этой целью поисковая ситуация описывается на основании принципа комплексной диагностики, согласно которому процедуру диагностирования должна включать диагностику как самого запроса, так и предъявившего его пользователя. В обоих случаях необходима оценка комплекса характеристик, а именно: - при диагностировании запроса - его отраслевой принадлежности, состава, содержания и объема включенных в него семантических категорий, вида искомых документов; - при диагностировании пользователя - цели поиска, уровня знания темы поиска, наличия поискового опыта. Принцип комплексной оценки свойств и функциональных возможностей отдельных ИПЯ применяется как на уровне конкретного ПП, так и на уровне ЛО в целом. Рассматриваются возможности ИПЯ по обеспечению как эффективности, так и комфортности поиска. С этих позиций оценке подлежат: - свойства самого ИПЯ, в том числе: - семантическая сила ИПЯ (состав и специфичность ЛЕ, состав и функции грамматических средств, наличие механизмов многоаспектного представления содержания документа / запроса средствами ИПЯ); - способность обеспечить результаты требуемого уровня качества для различных типов поисковых запросов; - состояние и содержание методик индексированиям, различных ИПЯ, в том числе: - степень адаптации к ситуации автоматизированного поиска; - степень ориентации на потребности пользователя ЭК; - предусмотренные ограничения в полноте и точности описания содержания документа/запроса; - возможности манипулирования ИПЯ неподготовленными пользовате лями ЭК, в том числе - объем и структурная сложность лексики и грамматики поискового языка; - наличие механизмов экспликации смысла ЛЕ; - наличие механизмов экспликации структуры и состава ИПЯ; - степень соответствия структуры ЛЕ и нормативных словарей ИПЯ естественным речемыслительным структурам; - наличие механизмов уточнения темы запроса; - состав и содержание типичных ошибок при индексировании докумен тов и запросові - возможности представления и коррекции свойств ИПЯ программными средствами, в том числе: - возможности поиска с усечением; - возможности использования в режимах пред- и посткоординации; - возможности доступа к авторитетным файлам ИПЯ. Как составляющую принципа дифференцированного использования можно рассматривать принцип дифференцированного доступа в соответствии с которым экспликация для пользователей состава и структуры ИПЯ должна проводиться по результатам диагностики поисковой ситуации. Проведенное эмпирическое исследование продемонстрировало конкретные возможности применения вышеназванных принципов. В частности, выявлена целесообразность: - использования таблиц иерархических классификаций для уточнения запроса; - применения полного комплекса ИПЯ для реализации поиска с научными целями; - использования ключевых слов из заглавий с последующим обращением к авторитетным файлам контролируемых предкоординатных ИПЯ при поиске с учебными целями; - поиска посредством ИК для обеспечения наибольшей полноты выдачи, а также по запросам социально-гуманитарной тематики, запросам, содержащим сложные / множественные понятия; - поиска на ЯПР с целью обеспечения наибольшей точности, а также по запросам в области техники. Как показал эксперимент, для успешной реализации дифференцированного подхода к ИПЯ в сопряжение отдельных ИПЯ в составе комплекса.

Из принципа комплексной оценки закономерно вытекает принцип комплексного преобразования ЛО ЭК, согласно которому в случае преобразования одного из компонентов ЛО следует оценивать его виляние на все перечисленные при формулировании принципа комплексной оценки характеристики каждого из элементов ЛО, и, при необходимости, осуществлять согласованное преобразование всего комплекса ИПЯ.

Оценку результатов применения названных принципов целесообразно проводить на основе принципа комплексного контроля качества индексирования. Анализ ошибок, допущенных при индексировании документов, позволяет говорить о необходимости в процессе контроля качества результатов семантической обработки соотносить состав и структуру ПОД на различных ИПЯ. Эталоном в этом случае выступает ПОД, в результате декодирования которого получено наиболее полное описание содержания документа. Важно оценить: соотношение смыслов и объемов понятий, полученных в результате декодирования, соотношение количества ЛЕ, использованных для описания основного предмета и аспектов содержания документа. Далее оценивается, имеется ли возможность отразить выявленные пробелы в описании содержания средствами каждого поискового языка и целесообразно ли такое дополнение в ситуации комплексного использования ИПЯ. Правила взаимодополнения индексов на различных ИПЯ должны быть четко регламентированы в соответствующих нормативно-методических документах и учтены затем при составлении ПОЗ.

Из последнего положения следует принцип координации методик индексирования на отдельных ИПЯ с учетом как специфических функций ИПЯ в составе комплекса, так и задач их сопряжения.

По нашему мнению соблюдение вышеназванных принципов будет способствовать эффективному и экономичному использованию комплекса ИПЯ в целом и отдельных поисковых языков в его составе.

Похожие диссертации на Комплексное использование лингвистических средств тематического поиска в электронном каталоге библиотеки