Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Разработка семантико-синтаксических схем индексирования информации в документальных системах : прагматический аспект разработок Пименов Евгений Николаевич

Данная диссертационная работа должна поступить в библиотеки в ближайшее время
Уведомить о поступлении

Диссертация, - 480 руб., доставка 1-3 часа, с 10-19 (Московское время), кроме воскресенья

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Пименов Евгений Николаевич. Разработка семантико-синтаксических схем индексирования информации в документальных системах : прагматический аспект разработок : автореферат дис. ... доктора филологических наук : 10.02.21 / Пименов Евгений Николаевич; [Место защиты: С.-Петерб. гос. ун-т].- Санкт-Петербург, 2007.- 30 с.: ил. РГБ ОД, 9 07-6/3481

Введение к работе

Объектом исследования в диссертации являются вербальные языки индексирования. Предмет составляет прагматика разработки и применения данных ИПЯ Непосредственной целью исследования ставилось-

исследование семантических схем информации и наиболее известной из них - предметно-аспектной модели S-Attr-P-Instr-Loc при разработке дескрипторных языков индексирования Это - задача исследования в узком значении слова,

исследование прагматической стороны разработки вербальных ИПЯ. Это - задача исследования в широком ее понимании диссертантом.

Актуальность и практическая значимость диссертации заключается в том, что в связи с бурным развитием сети Интернет и также активной на переломе веков разработкой в России автоматизированных библиотечно-информационных систем (АБИС, электронные каталоги) объемы индексационных, а также словарных (тезаурусы, авторитетные файлы) работ постоянно растут Вместе с тем наблюдавшееся в 90-е годы прошлого века сокращение исследований и числа публикаций по этой тематике имели следствием уменьшение качества индексирования во многих отечественных ИПС (Ф С Воройский)

Научная новизна диссертации заключается в том, что впервые с позиций лингвистической прагматики описаны все основные виды работ по созданию лингвистических средств ИПС Это - фа-сетный анализ и классификация документов, их индексирование, разработка тезаурусов и других словарей, типизация и обработка информационных запросов Все вышеназванные элементы ЛО в двух разработанных диссертантом системах (по огнеупорам и по сохранности документов) построены на одном лингвистическом основании - схеме анализа информации S-Attr-P-Instr-Loc, что обеспечивает их хорошую согласованность и сбалансированность. Новым является также описание внелингвистических факторов, влияющих на разработку дескрипторных и предметизационных систем

Основные решения и выводы диссертации апробировались на лингвистическом материале двух сравнительно небольших по объемам документального ввода систем Это система по огнеупорам, работавшая в 1976-94 гг. во Всесоюзном институте огнеупо-

ров и БД по сохранности документов, в настоящее время растиражированная на CD-ROM Результаты исследований регулярно докладывались на конференциях по лингвистическому обеспечению ИПС

Методологической основой исследования являются общесистемное положение, согласно которому в языке все взаимосвязано, и некоторые общелингвистические, в основном - синтаксические установки таких крупных лингвистов, как Ф де Соссюр, Ю.Д. Апресян, И.А Мельчук Вторым столь же общим методологическим принципом являлась известная по исследованиям представителей Пражского лингвистического кружка (Ф Данеш и др ) и другим теориям грамматики (А В Бондарко, В Г Гак) идея разграничения центра и периферии языковых единиц, где хорошо структурированным (и структурируемым) является их центральная часть Периферийную часть лингвистических категорий, единиц и структур отличает аморфность, размытость Этот принцип, который мы формулируем также, как "у каждого правила есть исключения", ставит известный предел излишне прямолинейному структурированию информации при разработках ИПЯ Другие методологические установки связаны с семиотической теорией языкового знака, в содержании которого различаются денотат, синтаксис и прагматика, и знаки могут быть нулевыми, словесно не выраженными

Более частный, используемой в диссертации метод, можно определить как фасетный, или категориальный анализ (Ш Ранга-натан, А.В. Соколов, А й Черный и мн др ) с использованием семантической схемы S-Attr-P-Instr-Loc. При обосновании данной модели потребовался выход в теорию предложения (рассмотрение поверхностных и глубинных структур предложения, актуальный синтаксис) и синтаксис связного текста, включая теорию дискурса ТА ван Дейка

На защиту выносятся следующие положения:

1 Изоморфная предложению семантико-синтаксическая модель S-Attr-P-Instr-Loc является универсальной, и универсальность ее проявляется в двух отношениях. Во-первых, эта модель применима для обработки лексического материала систем самого разного профиля и назначения, во-вторых, ее можно использовать не только для индексирования (для структурирования синтагматического плана ИПЯ), но и при создании тезаурусов (для структурирования парадигматических отношений).

  1. Семантически позитивную характеристику в этой модели имеет аспектная часть информации, то есть позиция Р, соответствующая операциям, и обстоятельственные характеристики Loc и Instr. Понятие 'предмет информации' (S) как абстрактная категория семантически позитивного содержания не имеет В конкретных информационных системах ключевые слова, выступающие в функции предметов, не сводимы к какой-то одной лексико-семантичес-кой категории, как, например, категории 'документы', 'вещество', 'оборудование', 'персонал', 'персоналии' в БД по сохранности документов

  2. Семантически негативный характер позиции S объясняется тем, что, являясь одной из исходных и системообразующих для индексирования категорий, это понятие относится к классу таких же нечетких понятий тех дисциплин, объекты (предметы) которых определяют как "черный ящик". Это - такие понятия, как "электричество" в физике, "язык", "фонема" в лингвистике и мн. др , окончательные дефиниции которых едва ли когда-нибудь получены. Отсутствие семантически позитивной характеристики S объясняется также тем, что его содержание лежит в основном в области синтагматики (определяется связью S-P) и лингвистической прагматики Синтагматика и прагматика номинаций "предмет" и "предмет индексирования" накладывают, каждая со своей стороны, ограничения на их содержание, и вследствие этого чрезвычайно широкое и в указанном отношении "пустое" содержание понятия 'предмет' получает свою семантическую определенность

  3. Применительно к ИПЯ за понятием 'нормативность' стоят две взаимосвязанных, но не всегда совпадающих вида оценок Имеется нормативность общеязыковая, определяемая правилами образования единиц естественного, например, русского литературного языка, и есть нормативность внутрисистемная, это - правила построения того или иного тезауруса и других словарей Из-за того, что имеется два разных уровня структурирования языковых единиц (в ЕЯ и ИПЯ), такие оценки в ряде случаев могут не совпадать, а иногда даже противоречить друг другу

Похожие диссертации на Разработка семантико-синтаксических схем индексирования информации в документальных системах : прагматический аспект разработок