Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Информационно-библиографическое обеспечение специалистов в сетевой среде научных коммуникаций Булдакова Екатерина Владимировна

Информационно-библиографическое обеспечение специалистов в сетевой среде научных коммуникаций
<
Информационно-библиографическое обеспечение специалистов в сетевой среде научных коммуникаций Информационно-библиографическое обеспечение специалистов в сетевой среде научных коммуникаций Информационно-библиографическое обеспечение специалистов в сетевой среде научных коммуникаций Информационно-библиографическое обеспечение специалистов в сетевой среде научных коммуникаций Информационно-библиографическое обеспечение специалистов в сетевой среде научных коммуникаций Информационно-библиографическое обеспечение специалистов в сетевой среде научных коммуникаций Информационно-библиографическое обеспечение специалистов в сетевой среде научных коммуникаций Информационно-библиографическое обеспечение специалистов в сетевой среде научных коммуникаций Информационно-библиографическое обеспечение специалистов в сетевой среде научных коммуникаций
>

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Булдакова Екатерина Владимировна. Информационно-библиографическое обеспечение специалистов в сетевой среде научных коммуникаций : Дис. ... канд. пед. наук : 05.25.03 : СПб., 2005 209 c. РГБ ОД, 61:05-13/1494

Содержание к диссертации

Введение

ГЛАВА I. Интернет как новая информационная среда исследований и разработок. Основные проблемы 15

1.1. Этапы развития технологий информационно-библиографического обеспечения науки 15

1.2. Изменение роли библиотек в информационно-библиографическом обслуживании ученых и специалистов в условиях Использования сетевых технологий 28

1.3. Проблемы систематизации и поиска электронных информационных ресурсов 45

1.3.1. Общие принципы систематизации электронных информационных ресурсов 45

1.3.2. Тематические каталоги на основе поисковых систем 47

1.3.3. Индексные поисковые системы 49

1.3.4. Систематизация Web-страниц, содержащих метаинформацию 53

1.3.5. Предметно-ориентированные информационные шлюзы 57

1.4. Проблемы социализации знаний в сети интернет 66

1.4.1. Вопросы оценки качества сетевой информации 66

1.4.2. Проблемы сохранности документов в сети, цитирования электронных источников и защиты авторских прав ". 71

1.5. WEB-страницы субъектов информационной коммуникации 77

1.5.1. Web-страницы научных организаций и учебных заведений 78

1.5.2. Персональные Web-страницы ученых 82

1.5.3. Web-страницы научных конференций 85

1.5.4. Web-страницы научных проектов 86

Выводы 90

ГЛАВА II. Сравнительный анализ традиционной и электронной информационной среды (на примере предметной области "Лингвистика") 93

2.1. Концептуальная структура предметной области "лингвистика" ... 95

2.2. Отражение концептуальной структуры предметной области "лингвистика" в традиционных системах классификаций 119

2.3. Сравнительный анализ поиска по ключевым словам и классификационным системам в предметной области "компьютерная семантика" 131

2.3.1. Поиск по ключевым словам 131

2.3.2. Анализ классификационных систем сетевых ИПС 139

2.3.3. Проблемы и перспективы информационного поиска в Интернете в предметной области "Компьютерная лингвистика" 145

Выводы 154

Заключение 157

Список литературы ...162

Приложения 181

Введение к работе

Актуальность темы исследования.

В ряду проблем, от решения которых непосредственным образом зависит качество и содержание научного труда, весьма важной считается проблема совершенствования информационного обеспечения исследований и разработок. Полнота, оперативность и доступность научной информации в значительной степени зависят от состояния и развития новых информационных технологий, средств и каналов связи, различных информационных служб.

Слабая координация информационно-обменных отношений, недостаточная управляемость информационными потоками, ограниченность в денежных средствах - вот основные причины отсутствия в научных библиотеках изданий не только зарубежных научных организаций, но и национальных, в первую очередь периферийных НИИ и ВУЗов. Остается невысоким уровень интеграции отечественной науки в международные информационные системы, что обедняет информационное обеспечение ученого, усложняет продвижение новых идей и знаний, их практическое освоение. Серьезное отставание при получении новейшей литературы - такова в наши дни плата за неэффективную информационную систему и те ресурсные ограничения, которые она испытывает. Практически все библиотеки России испытывают трудности в пополнении своих фондов. Вместе с тем сотрудники библиотек сталкиваются с необходимостью удовлетворения информационных потребностей нового типа.

Появление в начале 90-х гг. XX в. мировой компьютерной сети Интернет явилось началом технологической революции и открыло широкие возможности интерактивного доступа к удаленным информационным ресурсам - библиотечным каталогам, банкам данных, информационным системам и сетям. С технической точки зрения Интернет — это совокупность миллионов компьютеров, объединенных в десятки тысяч независимых сетей специальными соглашениями о взаимодействии, называемыми протоколами. С информационной точки зрения Интернет - это совокупность информационных центров (Web-сайтов), содержащих огромное количество разнообразной информации и благодаря

множеству взаимных связей образующих "информационную супермагистраль" или "всемирную паутину".

Объединяя локальные, национальные и глобальные сети, Интернет стал громадным информационным ресурсом, самым динамичным из всех существующих в настоящее время. Считают, что в Интернете сейчас находится от 6 до 10 миллиардов документов и их число возрастает ежедневно.

Сеть Интернет предоставляет пользователям доступ к различным источникам информации: архивам, отчетам, тематикам научных дискуссий, статьям из журналов, справочникам, электронным книгам и т.д. Интерес для ученых представляют также фактографические сведения, информация о международных конференциях, программное обеспечение, информация о публикациях (библиографическая, реферативная, полнотекстовая, адресная информация, а также персональная, включая авторов публикаций, сведения об организациях и фирмах).

Возможности Интернета по удовлетворению информационных потребностей ученых в любых областях наук постоянно растут. Пользователь, получивший доступ в Интернет, за счет колоссального информационного потенциала сети может значительно сократить время, необходимое для поиска того или иного источника. Даже небольшие по масштабам и составу справочно-библиографического фонда библиотеки становятся в состоянии успешно и в максимально сжатые сроки выполнять сложнейшие запросы универсальной тематики, поскольку могут оперативно просмотреть самые авторитетные библиографические источники мира и на их основе составить солидный список литературы. Позитивный эффект сетевой информации состоит в освобождении пользователей от пространственно-временных ограничений. Исследователи из небольших городов имеют возможность круглосуточно получать ту же информацию, что и сотрудники крупных исследовательских учреждений.

Однако эти благоприятные тенденции могут быть использованы в случае реального внедрения новых информационных технологий в практику работы современных библиотек, поскольку сам по себе доступ в Интернет не обеспечивает эффективное использование его ресурсов в связи с огромным объемом

доступной информации и стремительным ростом этого объема. Ориентироваться в таком "море" информации сложно, учитывая дублирование и устаревание информации, реальные ограничения по компьютерным ресурсам и по времени работы в сети, а также недостаточный уровень систематизации информационных ресурсов в сети Интернет.

Следует также отметить ограниченность охвата ресурсов Интернета поисковыми системами, несовершенство поисковых процедур в сети, недостаточную наполненность и систематизацию электронных каталогов даже в крупных библиотеках и т.д. Все эти трудности далеко не сиюминутные, а наверняка долговременные. Поэтому постановка в настоящем исследовании проблемы совершенствования информационного обеспечения в системе электронных коммуникаций является своевременной и актуальной задачей.

Проблемная ситуация. Предметом исследования в настоящей работе является ситуация перехода от традиционных форм научной коммуникации к информационному обмену посредством системы электронных коммуникаций. В этой ситуации можно наблюдать, с одной стороны, увлечение и безоговорочное доверие к новым формам научной коммуникации (характерное для молодого поколения ученых и учащейся молодежи), с другой стороны, неоправданный пессимизм и недооценку возможностей новых форм и методов (характерную для части ученых старшего поколения с устоявшимися навыками работы в традиционной информационной среде). Другой аспект этой проблемы — необходимость модернизации содержания библиотечного образования с учетом интенсивного внедрения в библиотечную практику новых информационных технологий. Исходя из этого основная цель данного исследования - изучить, систематизировать и осмыслить явления и проблемы, возникающие при переходе научного сообщества от работы в одной информационной среде к работе в другой информационной среде; попытаться объективно оценить реальные возможности сетевой информационной среды в ее настоящем состоянии и с точки зрения ее готовности полностью заменить традиционную информационную среду.

Основные задачи исследования:

- анализ и систематизация проблем, возникающих при переходе к информационному обеспечению исследований и разработок через систему электронных коммуникаций;

анализ достигнутого в системе электронных коммуникаций уровня систематизации информационных ресурсов в сопоставлении с опытом систематизации информационных ресурсов в традиционной информационной среде;

выявление новых видов информации, появившихся в сетевой среде, и возможностей их унификации;

оценка эффективности поисковых процедур разного типа в электронной системе научной коммуникации.

Объект исследования - система научных коммуникаций в ее традиционной и электронной формах.

Предмет исследования - состав и содержание новых форм научных коммуникаций в сопоставлении с возможностями традиционной информационной среды; уровень и методы систематизации информационных ресурсов в сетевой среде.

Методика исследования. В настоящее время еще не выработано устоявшихся подходов к методике исследования организации сетевых информационных ресурсов. В данной работе производится

анализ литературы по теме диссертации;

сопоставительный анализ структуры и содержания электронных документов;

анализ элементов концептуального и структурного моделирования предметной области;

сопоставительный анализ поисковых процедур;

статистический анализ полученных результатов;

сопоставительный анализ классификационных систем.

Базы исследования. Основными базами исследования являлись информационные ресурсы сети Интернет, а также крупнейшие универсальные библиотеки С.-Петербурга, такие, как Российская национальная библиотека, Биб-

лиотека Российской Академии наук, Центральная городская публичная библиотека им. В.В. Маяковского, Библиотека Санкт-Петербургского государственного университета культуры и искусств.

Источники исследования. Имеется много публикаций, в которых анализируются отдельные явления и проблемы системы электронных коммуникаций. Однако практически отсутствуют работы, в которых рассматривалась бы вся совокупность проблем формирования сетевой среды информационного обеспечения научных исследований и разработок. Отсутствием именно таких материалов можно объяснить, что данная проблематика слишком медленно внедряется в учебный процесс библиотечной специальности. В работе систематизирован большой объем русскоязычной и англоязычной литературы. Следует отметить значимые для данного исследования работы таких отечественных и зарубежных специалистов, как Ю.М. Арский, Е.Д. Жабко, Р.С. Гиляревский, М.В. Гончаров, Я.Л. Шрайберг, Т.В. Еременко, М.Р. Когаловский, Дж. Солтон, Ф. У. Ланкастер, Ч. Мидоу, Н.Е. Каленов, В.К. Степанов, Э.Р. Сукиасян, D.S. Brandt, J. Edwards, Е. Jul, K.I. Munson, G.R. Notess, M. Tate, J. Alexander, E.J. Valauskas, H.R.Varian, A. Callery, D. Tracy-Proulx, R.B. McGeachin, D. Haynes, D. Streatfield, M. Brichford, W. Maher, J. Beall, A. Dawson, J. Simpson, A.S. Wajen-berg, R. Thompson, K. Shafer, D. Visine-Goetz, D. Hiom, L. Huxley, A. Lafford, O. Stone, M.A.E. Dementi, M. A. Arnzen, A. Harnack, E. Kleppinger.

Новизна исследования. Впервые проведен анализ научной проблематики и структуры предметной области "Лингвистика", показана возможность использования универсальных библиотечных классификаций, в частности УДК, как основы для структурирования сетевых информационных ресурсов, в этой предметной области определены требования к классификационной системе, адекватной как структуре предметной области, так и возможностям современных информационных технологий. Разработаны критерии отбора специализированных сайтов, ориентированных на представление информационных ресурсов по данной предметной области.

Теоретическая значимость исследования. В работе систематизирован опыт развития системы электронных коммуникаций. Раскрыта недостаточность

используемых в сетевой среде средств и методов представления, поиска и систематизации информационных ресурсов науки.

В качестве основного инструмента обоснована и построена фасетная классификационная схема как средство систематизации информационных ресурсов в предметной области "Лингвистика", наиболее адекватное концептуальной структуре научной дисциплины. Определена возможность и целесообразность применения в качестве первого шага на пути к более глубокой систематизации сетевых ресурсов классификационных систем, используемых в традиционных библиотечных технологиях (в частности, УДК).

Разработан и опробован метод непрямой оценки поисковой эффективности сетевых ИПС, основанный на выделении "полезных" сайтов.

Практическая значимость исследования

Разработаны предложения по развитию методов и средств систематизации информационных ресурсов предметной области "Лингвистика".

Разработаны рекомендации по унификации некоторых видов электронных документов (личные Web-страницы ученых, Web-страницы научных организаций, конференций и проектов).

По материалам работы подготовлен и прочитан спецкурс "Информационное обеспечение исследований и разработок в среде Интернет" для студентов специальности "Прикладная информатика" Санкт-Петербургского государственного университета культуры и искусств и аналогичный курс для студентов, обучающихся по программе магистратуры Балтийского государственного технического университета "Военмех" им. Д.Ф. Устинова.

Положения, выносимые на защиту: 1. Возможность использования системы электронных коммуникаций в качестве полноценной информационной среды науки зависит от решения двух групп проблем: переноса в сетевую среду сложившихся методов и процедур социализации знаний и четкой и достаточно детальной систематизации информационных ресурсов. Социализация знаний является одной из важнейших функций традиционной информационной среды науки и имеет главными составляющими: экспертизу полученных научных результатов в профессиональ-

ной среде, обеспечение сохранности документов, защиту авторских прав и приоритетов.

  1. На конкретном материале - на примере такой давно сложившейся и хорошо структурированной дисциплины, как "Лингвистика", показано неудовлетворительное состояние систематизации представленных в сети информационных ресурсов. В настоящее время ни координатный поиск, ни поиск по классификационным рубрикам в этой области не является достаточно надежным средством получения учеными и специалистами информации в системе электронных коммуникаций.

  2. В системе электронных коммуникаций происходят два следующих процесса. С одной стороны, происходит перенос ряда сложившихся форм представления знаний в новую технологическую среду. С другой стороны, формируется новый тип информации, направленный на отображение и поддержку организационной стороны научной деятельности. Фактически речь идет об информационном отображении помимо собственно научной продукции самой структуры науки и процесса научной работы. Это Web-страницы научных организаций, научных конференций, научных проектов, личные Web-страницы ученых.

  3. На основании обобщения изученного фактического материала предлагается типовая структура для указанных в п.З Web-страниц как основа для принятия рекомендательных или нормативных документов.

Результаты исследования докладывались на Российских аспирантских конференциях (Санкт-Петербург, СПбГУКИ, 1998-2000 гг.), международных научных конференциях "Библиотечное дело - 2000" (Москва, МГУКИ, 2000 г.), "Библиотечное дело - 2001" (Москва, МГУКИ, 2001 г.), "Библиотечное дело -2002" (Москва, МГУКИ, 2002 г.), международной научно-практической конференции "Культура, искусство, образование: проблемы, перспективы развития" (Смоленск, СГИИ, 2000 г.), Всероссийской объединенной конференции "Технологии информационного общества — Интернет и современное общество" (Санкт-Петербург, СПбГУ, 2001 г.), международной конференции "Современ-

ные технологии обучения" (Санкт-Петербург, СПбГЭУ "ЛЭТИ", 2004 г.). По теме диссертации опубликовано 14 работ.

Структура диссертации включает введение, две главы, заключение, список использованной литературы и ряд приложений.

В 1 главе проведена систематизация проблем обеспечения информацией ученых и исследователей при переходе от традиционных к сетевым технологиям.

В 1.1. введены основные понятия, связанные с информационным обеспечением ученых и специалистов, и рассмотрены проблемы развития мировой системы научных коммуникаций во второй половине XX в. в процессе перехода от традиционных к новым информационным технологиям.

В 1.2. рассматриваются организационные проблемы, встающие перед библиотеками в связи с необходимостью изменения их роли и функций в условиях быстрого развития сетевых информационных технологий.

В 1.3. анализируются проблемные ситуации, возникающие при систематизации информационных ресурсов в среде электронных коммуникаций.

В 1.4. рассматривается проблема переноса форм и методов социализации знаний, сложившихся в науке, в среду электронных коммуникаций.

В 1.5. исследуется формирование новых видов информационных ресурсов в сети Интернет - Web-страниц субъектов научных коммуникаций, таких, как Web-страницы научных организаций, ученых, научных конференций и проектов.

Во 2 главе на примере научного направления "Компьютерная семантика" проведен анализ состояния систематизации информационных ресурсов в сети Интернет.

В 2.1. рассмотрена концептуальная структура лингвистики в целом и место компьютерной лингвистики и компьютерной семантики в рамках этой дисциплины.

В 2.2. сделан анализ наиболее широко употребляемых классификационных систем и рубрикаторов, показавший, что универсальные библиотечные классификации (УДК, ББК), а также рубрикаторы ГРНТИ и АИСОН в значи-

*

тельной степени отражают концептуальную структуру рассматриваемой предметной области.

В 2.3. представлены результаты информационного поиска по ключевым словам и классификационным системам сетевых ИПС в подобласти "Компьютерная семантика" в ряде современных информационно-поисковых систем и рассмотрены пути его совершенствования с целью установления наиболее эффективных методов систематизации и поиска научных информационных ресурсов в быстро меняющемся пространстве сети Интернет.

Изменение роли библиотек в информационно-библиографическом обслуживании ученых и специалистов в условиях Использования сетевых технологий

Еще несколько лет назад в конце 90-х гг. XX в. среди некоторых специалистов по информатике бытовало мнение, что бурное развитие современных информационных технологий приведет к предстоящей "смерти библиотек", их грядущей ненужности вследствие кажущейся легкости получения любой информации из сети Интернет любым пользователем [22]. При этом предполагалось, что в связи с незначительными затратами на поиск материалов в сети спрос на традиционные библиотечные ресурсы будет снижаться, соответственно будет падать авторитет библиотеки в обществе, а с ним и уровень ее финансирования. В литературе широко обсуждаются вопросы о новых функциях традиционных библиотек в новой информационной среде, о возможности их замещения "виртуальными" (электронными) библиотеками.

Действительно, вот уже в течение нескольких десятков лет наблюдаются отчетливые общемировые тенденции, затрудняющие работу библиотек. В первую очередь, это рост количества научных публикаций. Как отмечается в [7], на рубеже XX и XXI веков в современном мире выходило около 60 тысяч научных журналов по всем отраслям науки и техники, медицины и сельского хозяйства. Тенденция роста числа издаваемых журналов устойчиво сохраняется все последние годы. Так, с 1975 по 1995 г. число американских периодических изданий возросло на 62 %, а количество статей в них на 134 % [101]. Вторая проблема заключается в росте цен на печатные издания. За 20 лет (1970-1990 гг.) индекс цен на научные журналы вырос более чем в 10 раз, опережая темпы роста финансирования библиотек. Это, безусловно, ухудшает комплектование российских научных библиотек как отечественной, так и зарубежной литературой. Несмотря на все эти трудности, появление информации в электронной форме не отменяет и не заменяет сложившейся системы научных публикаций, в первую очередь, научных журналов. Это обусловлено тем, что научные журналы благодаря отлаженной системе рецензирования гарантируют качественный уровень своих публикаций, отсеивают "информационный шум". "Сложившаяся репутация ведущих научных изданий обеспечивает, с одной стороны, концентрацию в них наиболее важных научных результатов, гарантирует фиксацию научного приоритета и юридического авторского права на полученный результат, а с другой стороны, в силу этого факта привлекает к ним первоочередное внимание исследователей" [22, С. 22].

Вместе с тем с развитием сети вширь и вглубь все более весомая доля информационных ресурсов переводится в электронную форму и перемещается в сетевую среду, совершенствуются способы создания, доставки и оплаты электронных документов и, следовательно, увеличивается общее социальное значение информационного потенциала сети Интернет.

Это приводит к изменению функций библиотек. Чтобы отвечать современным запросам читателей, они должны из хранилищ в основном печатных документов превратиться в узлы доступа для поиска электронной информации. Таким образом, в сложившейся ситуации библиотеки перестают быть основными хранилищами научной информации. Именно в этом заключается вызов, создаваемый компьютерными информационными технологиями для библиотеки как общественного института. У специалистов появляется возможность выбора между обращением в реальную библиотеку или обращением к виртуальным ресурсам сетей. Основная задача библиотек - найти свое место во вновь формирующейся информационной среде. Таким образом, библиотеки должны существенно измениться и решить две основные задачи [1]:

Обеспечение пользователям доступа к ресурсам сети Интернет.

Представление в сети собственных информационных ресурсов.

Решение этих задач должно сопровождаться совершенствованием библиотечных технологий [43]. Успех работы библиотек сейчас будет зависеть от того, насколько верно их сотрудники понимают суть необходимых перемен, выбирают необходимые для этого средства, привлекают финансовые ресурсы, переделывают библиотечные структуры. Среди предполагаемых новых качеств библиотекаря, работающего с сетевыми источниками - глубокие знания по выбору качественной информации, знакомство с разными типами информации, широкий опыт в выборе необходимой библиотеке информации, возможность грамотно обучать студентов и преподавателей, умение каталогизировать электронную информацию. Существует мнение о том, что развитие сетевых технологий будет способствовать более тесному сотрудничеству между библиотекарями, преподавателями, специалистами по информационным технологиям и студентами [138].

Таким образом, наряду с нововведениями в машинном и программном обеспечении, а также в инфраструктуре библиотек должна произойти революция и в библиотечной культуре.

Не менее остры и экономические проблемы. В течение последних полутора столетий библиотечные услуги во всем мире были практически бесплатными и это считалось одной из этических ценностей библиотечной профессии. В связи с возрастанием затрат на получение и переработку научными библиотеками современной информации встает вопрос об оплате информационных услуг, хотя это и противоречит существующим представлениям о библиотеке как социальном учреждении. Практическое решение вопроса оплаты услуг может быть достигнуто на основе их деления на библиотечные и информационные [20].

Рассмотрим, как обстоят дела с решением основных задач, стоящих перед библиотеками.

Обеспечение доступа к ресурсам сети Интернет. Для обеспечения доступа пользователей к Интернету необходимо наличие каналов связи и средств на оплату провайдеров. В соответствии с современными требованиями библиотеки при комплектовании обращаются к таким электронным источникам информации как монографические, энциклопедические, справочные и периодические издания, а также базы данных.

Группа удаленных электронных источников информации, собранных и систематизированных в зависимости от потребностей пользователей, составляет онлайновый справочно-библиографический фонд библиотеки. При формировании такого фонда дается более развернутая характеристика каждого ресурса. К библиографическому описанию ресурса, которое готовят каталогизаторы, добавляется информация об объеме и типе ресурса, сроках актуализации, условиях доступа и др. Эта информация готовится специалистами справочных подразделений уже на этапах анализа, отбора и тестирования ресурса. В результате необходимо объединение усилий различных подразделений библиотек, создание рабочих групп, состоящих из комплектаторов, каталогизаторов и библиографов, для обработки и каталогизации внешних электронных ресурсов [37].

Уже в 1998 г. в Интернете насчитывалось около 600 электронных каталогов: от крупнейших книгохранилищ мира до городских публичных библиотек, большую часть из них составляют каталоги библиотек США. Опыт показывает, что самыми информативными, вслед за сводными каталогами национальных библиотек, являются каталоги библиотек крупных университетов [83].

Некоторые библиотечные администраторы, а также другие информационные работники уверены, что публикации, доступные посредством сети Интернет нет необходимости каталогизировать, так как они могут быть найдены через существующие и продолжающие улучшаться поисковые механизмы. Однако следует помнить о том, что ученые и исследователи редко осуществляют поиск информации только в одном формате. Их интересует вся наиболее современная информация в любом формате, и именно этого пользователи ожидают от каталогов библиотек [142]. Вместе с тем реальные технические и финансовые возможности многих библиотек ограничивают активную часть ресурсной базы онлайнового обслуживания, что еще раз подчеркивает необходимость тщательного отбора каталогизируемых документов.

Персональные Web-страницы ученых

В личных Web-страницах ученых содержатся следующие сведения.

1) Ф.И.О. и научный статус исследователя. Большинство изученных Web-страниц ученых содержат четкие сведения о том, какую должность занимает исследователь в научной организации, где он работает.

2) Координаты связи. Наличие координат связи (адрес, телефон, факс, электронная почта) является обязательным. Связь может осуществляться напрямую с помощью гипертекстовых ссылок; в других случаях даются сведения о возможности контакта с ученым без использования сети Интернет.

3) Научная биография. Некоторые из ученых дают сведения о своей научной биографии. Таким образом, можно получить информацию о карьере и занимаемых ученым должностях в конкретные годы.

4) Научные интересы. Сведения о научных интересах даются для того, чтобы пользователь внутри широкой предметной области имел представление о конкретных подразделах, над которыми работает исследователь.

5) Описание проблемы. Иногда в Web-странице исследователя подробно рассматривается проблема, над которой он работает, или дается подробное описание темы проекта, которой посвящены его исследования (4) (Приложение 2). Таким образом, те, кто посещает данную Web-страницу, имеют возможность получить весьма подробное представление о том, над чем конкретно работает ученый.

6) Публикации. Список электронных публикаций ученого может быть более или менее подробным. Например, в (19) дан полный перечень публикаций ученого, подробный список публикаций есть в (15), а некоторые ученые указывают те немногие свои публикации, которые считают нужным (13), (18). Такие немногие публикации могут называться на Web-страницах ученых "недавними" (7), (12), (26), (23) или "главными" (9), (10). Поэтому списки обычно неполные и не дают представления о полном спектре разрабатываемых исследователем вопросов. В (14), (25) содержится обширный список публикаций (сведения о книгах, книгах в печати, статьях и книжных главах, материалах конференций), но только к немногим из них организован электронный доступ. Некоторые публикации доступны пользователю в полнотекстовом формате (21), (25), с другими можно ознакомиться только с помощью аннотаций (15). В (17), (23), (28), (29) имеются и полнотекстовые публикации и рефераты. Иногда на Web-страницах ученых содержатся только упоминания о публикациях (11), (20), (22). Например, в (29) имеется полный список публикаций ученого, но без Web-связей к ним.

7) "Разное". Это может быть информация, не относящаяся к научной деятельности ученого, на Web-странице которого она расположена (в (22) это, например, коллекция шуток, комиксов, составленная автором, а в (29) это - набор полезных Web-связей к ресурсам, представляющим интерес для ученых в определенной предметной области).

8) Обучение. Некоторые исследователи в личных Web-страницах дают сведения о своей преподавательской деятельности. В данном разделе могут содержаться тексты лекций, учебных курсов, проводимых ученым, которые доступны пользователям в электронном виде.

9) Членство в научных организациях. Сведения подобного рода нередко указываются на Web-страницах ученых (4), (5), (9), (10), (11), (15), (19), (21); иногда эти сведения достаточно подробны (24), (29).

10) Сведения об организациях, спонсирующих научные разработки исследователя. Они даются крайне редко (16), (20).

11) Сведения о количестве посетителей. Некоторые Web-страницы ученых (1), (7), (8), (12), (16), (27), (28) содержат данную информацию, что дает пользователям возможность иметь представление о популярности той или иной персональной Web-страницы. В (7) такой счетчик расположен даже в каждой из частей Web-страницы.

12) Web-связи. Большинство персональных Web-страниц ученых имеют внутренние или внешние гипертекстовые ссылки. Внутренние ссылки ведут к различным частям данной страницы и показывают, что сама Web-страница имеет сложную структуру. Внешние ссылки могут вести к семинарам, конференциям, в которых принимал участие исследователь, а иногда и к поисковым системам Интернета, а также к другим сетевым протоколам. Это могут быть связи с коллегами (15), (16), (18), (21), (23) или гипертекстовые связи к Web-страницам научных организаций, университетов, в которых работает исследователь (например, в (2) это - ссылка на место работы - Университет штата Массачусетс (США), отделение информатики), в (11) - на Институт им. Иоффе. Такие ссылки есть также в (20), (21), (22), (23), (25), (29). В некоторых случаях это могут быть связи к проектам, в которых участвовал или принимает участие исследователь (20), (21), (22), (23), (25). В большинстве Web-страниц присутствуют оба типа ссылок, но некоторые страницы имеют только внутренние (9), (10) или внешние (11) ссылки. Могут существовать многоязычные версии Web-страниц ученых, имея при этом некоторые отличия. Так, например, в русской версии есть сведения о научной биографии ученого ("Этапы трудовой деятельности"), а в английской версии их не содержится (9), (10).

Некоторые исследователи поддерживают более одной Web-страницы (например, при работе в двух или нескольких научных организациях) (16), (17).

Концептуальная структура предметной области "лингвистика"

Языкознание (в качестве синонимов используются также термины языковедение, лингвистика) - наука о естественном человеческом языке вообще и о всех языках мира как индивидуальных его представителях [59]. В языкознании сосуществует достаточно большое количество интегральных концепций (моделей) языка, описывающих его устройство с разной степенью конкретности, детальности и, в конечном счете, достоверности. Эмпирически сложившиеся разделы языкознания, частично пересекающиеся и уже потому не образующие единой системы, можно представить как соотносящиеся друг с другом по некоторым различным параметрам.

Как всякая наука, лингвистика возникла в связи с практическими потребностями, но постепенно развилась в сложную и разветвленную систему дисциплин.

Рассмотрим, как подходят к классификации указанных дисциплин известные специалисты в области лингвистики.

По мнению Ю.В. Рождественского [75], лингвистические дисциплины делятся по цели исследования на общее и частное языкознание, а по отношению к общественно-языковой практике - на фундаментальную (теоретическую) и прикладную науку и нормативное научное знание. Третьим критерием классификации является деление по методу исследований. Целью теоретического (фундаментального) исследования является объективное установление состояния отдельного языка, причем вмешательства в общественно-языковую практику не предполагается. Прикладное языкознание занимается применением лингвистических знаний к практической деятельности. Все три критерия классификации дополняют друг друга, поэтому классификационные признаки могут сочетаться между собой.

Ю.С. Маслов [61] сразу делит языкознание на дисциплины теоретического и прикладного характера, причем внутри теоретического языкознания он различает общее и частное языкознание. Общее языкознание изучает общие особенности человеческого языка, а частное языкознание занимается изучением отдельных языков. По В.И. Кодухову [52], языкознание как наука делится на общее и частное, теоретическое и прикладное (практическое). Общее языкознание делится им на три раздела: внешней лингвистики, внутренней лингвистики и сравнительного языкознания. Внешняя лингвистика изучает язык как общественное явление, его социальные и мыслительные функции. Внутренняя, или структурная, лингвистика исследует систему языка, ее единицы и категории, ее уровни (ярусы и их структуру). Сравнительное языкознание изучает структуру конкретного языка или группы языков в сравнении с другими языками.

А.А. Реформатский [74] детализирует теоретическую лингвистику на следующие разделы: фонетику, лексикологию, грамматику. Эти разделы описывают структуры языка, находящиеся на разных уровнях.

Аналогичной точки зрения придерживается в своей монографии И.М. Кобозева [50], давая следующую схему представления уровневой организации языковой структуры:

И.М. Кобозева отмечает также, что нельзя просто расширить рамки данной схемы, добавив к иерархии представленных в ней единиц языка единицы какого-то другого уровня. Действительно, все языковые единицы, представленные в данной схеме, присутствуют в реальных языковых конструкциях.

Существуют разные точки зрения на возможность включения семантики и прагматики в качестве составных частей уровневой структуры языка.

По И.М. Кобозевой, семантику можно считать необходимым дополнением к традиционным лингвистическим дисциплинам, растирающим область их применения.

В [71] авторы считают, что семантика пронизывает все уровни языка и не представляет собой отдельного уровня, эквивалентного организации приведенной выше уровневой структуры.

Ниже будет показано, что семантика непосредственно связана с традиционными разделами уровневой структуры языкознания, однако эта связь выходит за рамки "простого" иерархического строения языковой системы, где единицы каждого уровня получаются в результате членения текста на все более мелкие составляющие.

Под воздействием требований прикладного моделирования в лингвистической семантике проявляются следующие существенные тенденции: расширение круга объясняемых языковых фактов; включение семантики в состав общей теории языка; трактовка семантики как центрального звена в системе лингвистических дисциплин и др. [27].

Таким образом, семантика представляет собой раздел языкознания, неразрывно связанный со всеми дисциплинами, формирующими уровневую структуру языка и выделяющими в семантике несколько самостоятельных дисциплин, имеющих прикладное значение.

Все упомянутые выше разделы языкознания: общее и частное языкознание, теоретическая и прикладная лингвистика, разделы языкознания, ориентированные на изучение отдельных уровней, — представляют традиционную лингвистику, так как они изучались в такой постановке на протяжении почти всего XX в. В связи с широким внедрением начиная с 70-х годов XX в. в науку и производство, в теорию и практику самых разных дисциплин компьютерных технологий можно говорить в возникновении компьютерных версий этих дисциплин, в частности компьютерной лингвистики.

Обобщая мнения ряда известных специалистов по лингвистике, можно назвать следующие основания для деления предметной области "Лингвистика" на несколько относительно самостоятельных разделов:

1) по наличию различных уровней описания языковых явлений - язык как структура, состоящая из отдельных уровней (уровневая структура языка);

2) по широте охвата языковых явлений - общее языкознание и частные науки о языке;

Проблемы и перспективы информационного поиска в Интернете в предметной области "Компьютерная лингвистика"

Наши эксперименты показали, что рассмотренные ИПС при поиске по ключевым словам производят ранжирование сайтов и "полезные" сайты, содержащие самую разнообразную информацию для данной предметной области, концентрируются в начальной части каждого списка. Значительная часть полезных сайтов в разных ИПС не повторяется. В результате каждая система охватывает только определенную часть Интернета, и для получения более полной информации необходимо использование нескольких ИПС. Такие качественные показатели хорошо известны из литературы, например, [10, 150]. Однако динамика изменения числа "полезных" сайтов в зависимости от размера выборки ранее не исследовалась, и это может помочь пользователю Интернета при разработке стратегии информационного поиска по ключевым словам.

Как отмечалось в 2.3.1. доля "полезных" сайтов в начале ранжированной выдачи различных ИПС, составляет в разных системах от 13 до 26%; причем пользователь часто может найти в каждой сотне всего несколько документов, необходимых для работы. Такая ситуация вряд ли может удовлетворить пользователя, и это побуждает разработчиков ИПС к совершенствованию поисковых механизмов. Вместе с тем ознакомление исследователя с большим объемом информации в Интернете дает ему возможность составить представление об инфраструктуре научной деятельности в интересующей его области знания, включая процессы подготовки кадров, формы научного общения, последние достижения ученых, практические результаты и др.

Результаты предметного поиска в тех же самых ИПС, где производился координатный поиск оказались более скромными. Так, в ИПС "Rambler" вообще отсутствует рубрика "Языкознание". В ИПС "Апорт", "Yandex", "Alta Vista" такие рубрики имеются, однако на более мелкие составные части они не делятся и содержат только единичные сайты по компьютерной лингвистике, распределенные по другим предметным рубрикам, в основном "Наука и Образование". Для поиска таких сайтов нужны большие затраты времени, известные навыки и удача. Только ИПС "Google", имеющая более развитую сеть предметных рубрик и в том числе подрубрику "Компьютерная лингвистика", представляет интерес для пользователя.

В целом проведенные исследования показали, что средства поиска информации в Интернете с помощью ключевых слов и классификационных систем необходимо серьезно совершенствовать. Сопоставление этих способов поиска целесообразно сделать с учетом имеющегося опыта их использования в автоматизированных библиотечно-информационных системах, а также в Интернете. При этом представляет интерес эволюция, происшедшая в последние годы во взглядах исследователей на эффективность указанных поисковых механизмов.

В 80-е и 90-е гг. XX в. библиотечные работники считали, что поиск по ключевым словам является более перспективным, чем поиск по предметным рубрикам, особенно для автоматизированных ИПС, в связи с возможностью многоаспектного поиска информации на определенную тему [38, 100]. При этом предполагалось обязательное вдумчивое индексирование документов специалистами-каталогизаторами и использование посткоординационных понятий. Считалось также, что запрограммированная семантическая недостаточность данного метода не будет иметь существенного значения. В [100] отмечено также, что поиск по предметным рубрикам заведомо не годится для глубокого, достоверного тематического поиска вследствие отсутствия у них единой структуры и возможности планирования размера каждой рубрики. Однако Э.Р. Су-киасян отмечает, что оба этих метода поиска в наших условиях малоэффективны, в первую очередь, вследствие отсутствия в них предкоординационных понятий, внедрение которых в практику требует значительных материальных и трудовых затрат [87, 88].

Известный итог дискуссиям об эффективности использования пред- и посткоординационных средств в поисковых системах подвело заседание Ученого Совета ГПНТБ России, состоявшееся в 2003 г. и посвященное проблемам лингвистического обеспечения АБИС (автоматизированных библиотечно-информационных систем) [72]. На заседании присутствовали такие специалисты как А.Б. Антопольский, Ф.С. Воройский, Е.М. Зайцева, Э.Р. Сукиасян и др.

Подробно рассматриваемый вопрос обсуждался в докладе Ф.С. Ворой-ского, который отметил, что использование для предкоординации УДК, Десятичной классификации Дьюи и других классификаций в общем случае не обеспечивает пользователю должной полноты и точности поиска и требует для реализации этой процедуры больших затрат времени и сил. Посткоординация может обеспечить достаточную полноту поиска нормированием лексики с помощью тезауруса или применением ненормированной терминологии, точно характеризующей искомый объект. Однако на практике тезаурусы для широких тематических областей знания создать затруднительно, а применение ненормированной технологии сопровождается большим информационным шумом, т.е. выдачей большого количества нерелевантной информации. Поэтому наиболее рациональным Ф.С. Воройский считает взаимодействие и сосуществование рассмотренных принципов координации, имеющих свои преимущества и недостатки в условиях конкретного поиска.

Похожие диссертации на Информационно-библиографическое обеспечение специалистов в сетевой среде научных коммуникаций