Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Исследование взаимозависимости внутренних характеристик текста и его "внешних" параметров (к проблеме эмпирической базы компьютерной лексикографии) Пиель, Елена Шмерлевна

Данная диссертационная работа должна поступить в библиотеки в ближайшее время
Уведомить о поступлении

Диссертация, - 480 руб., доставка 1-3 часа, с 10-19 (Московское время), кроме воскресенья

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Пиель, Елена Шмерлевна. Исследование взаимозависимости внутренних характеристик текста и его "внешних" параметров (к проблеме эмпирической базы компьютерной лексикографии) : автореферат дис. ... кандидата филологических наук : 10.02.19.- Москва, 1992.- 27 с.: ил.

Введение к работе

Актуальность такого исследования мотивирована как практически, так м теоретически. О практической точки зрении, словари современных языков нуасны все в больших количествах и модификациях, поэтому необходимо оптимизировать процесс составления; обновления и издания словарей с помощью вычислительно издательских комплексов. С теоретической точки зрения, - не сформулированы и достаточной степени критерии и способы отбора лексикографически значимой информации из исходний базы данных. Иеолределен вид и статус самой лексикографичес-

-г -

кой базы данных, а такхсе оптимальный' способ записи эмпири
ческого материала. Не выработаны критерии и способы их опре
деления необходимости и достаточности той или иной представ
ляемой в словарях информации.

Цель исследования - обоснование наличия гомоморфных отношений мевду определенными параметрами исходных текстов и параметрами моделируемого компьютерного словаря, установление коррелящи между внутренними (квантитативными) и внешними (априорными) параметрами отдельных текстов.

Задачи, решаемые в ходе проведения исследования, особенно в экспериментальной его части, были весьма разнообразии и требовали комплексного подхода. Основные задачи формулируются следующим образом: 1) инвентаризация* текстовых составляющих на разных уровнях с использованием ЭШ; 2) параметризация текста и установление коррелящи между внешними и внутренними параметрами текста; 3) определение характера отношений меаду метатекстовой информацией и метаязыком словаря.

Методы исследования - компьютерный эксперимент, матема-ческое моделирование, экспертная классификация.

Научная нопзна работы. В диссертации решаются вопросы как теоретического, так и практического плана. Основной теоретический аспект касается наличия и характера отношений

' * 0 понятии лингвистической инвентаризации см. работы Городецкий Б.Ю. К проблеме семантической типологии. - М.: Изд-во МГУ, 1969; Городецкий Б.Ю., Раскин З.В. Методы семантического исследования ограниченного подъязыка. - Ы.: Изд-во МГУ, 1971; Городецкий Б.Ь. Основные понятия лингвистической типологии // Linguistics Oeneraiiu. t» Studies ta Linguistic» Typology. - Prague, 1974. - P.II-I5. Городецкий Б.Ь. Лекси-ко-статистическая инвентаризация комплекса подъязыков // Проблемы теоретической и экспериментальной лингвистики. -М.: Изд-во МГУ, П»77. - C.iJI-42.

- з..-

ыеэвду выводимыми (квантитативными) и априорными параметрами отдельного текста. Данная работа является первььл системно-квантитативным исследованием на материале латышских нехудожественных текстов, проведенным с применением ЭВМ. В русской научной литературе существует традиция квантитативного исследования законченных художественных произведений или произведении одного автора. В латышской научно-исследовательском практике изучались, кроме художественных текстов, отдельные подъязыки как цельные объекты. В концептуальном плане новой является постановка проблемы эмпирической базы компьютерной лексикографии и проведение широкомасштабного компьютерного експерименте по моделированию различных способов представления лингвистической информации. Впервые решается также ряд задач, связанных о автоматизированной обработкой текста и перенесением полученной информации в лексикографическую базу данных.

Научное значение исследования и его практическое применение. Результаты теоретической части проведенного исследования могу? быть использованы и уке применяются при стилистической (тематической а прагматической) атрибуции текста и леки в процессе заполнения словарных статей лексикографической базы данных. Результаты решения прикладных задач используются достаточно широко, в том числе и в пакетах прикладных програш. Так, квантитативная обработка графемного состава латышских текстов (художественных і нехудожественных), а также анализ диграмм и трехбуквенных сочетаний проводились для разработки клавиатуры компьютера, ориентированного на работу о латышским языком. Опыт автоматизированной обработки неразмеченного текста романа А.Упита "Земля зеленая" позволили выработать методику и критерии комплексного оиисания художественных текстов сравнительно-квантитативного характера. Компьитеріая обработка различных баз данных латышского языка легла в основу разработки словарных статей лексикографической базы данных, позволив решить проблему алгоритмического заполнения части позиций (значений параметров) словарной

- 4 -статьи.

Материал исследования. Исследование велось на основе нескольких баз данных, эмпирическим материалом.для которых стали латышские тексты общим объемом 575 тыс. словоупотреблении.

Иа защиту выносятся следующие положения диссертации:

  1. Существует взаимозависимость между внешними'(тематика и ирагчнатшш) и внутренними (квантитатив-ыыи) параметрами тексти.

  2. .Возможно, вследствие указанной взаимозависимости', формальное определение тематики и прагматики нехудожественного текста.

  3. Параметры словаря и параметры текста образуют пересечение.

  4. Оптимальной эмпирической базой компьютерной лексикографии является текстовая база данных с реализованными процессорами морфологического и квантитативного анализа.

Апробация работы. Основные положения диссертации были изложены в докладах и сообщениях на

Второй Всесоюзной конференции ло созданию Машинного, фонда русского языка (Москва, 1987),

рабочем совещании по Машинным фондам языков народов СССР (Таллинн, 1988),

Третьей Всесоюзной конференции по созданию Машинного фонда русского языка (Москва, 1989),

Всесоюзной конференции "Актуальные проблемы компьютерной лингвистики" (Тарту, 1990),

Всесоюзной конференции "Текст. Термин. Словарь" (Киев, 1990), ' -Лексикографической школе-семинаре (Звенигород, 1990). -

Структура работы. Диссертация состоит из введения, трех глав, заключения, списка основной научной литературы и приложений, в которых приведены образцы форм записи языковой информации в базах данных и решения некоторых практических задач.

Похожие диссертации на Исследование взаимозависимости внутренних характеристик текста и его "внешних" параметров (к проблеме эмпирической базы компьютерной лексикографии)