Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Лингвистические методы атрибуции и датировки литературных произведений : к проблеме "Корнель - Мольер" Родионова Елена Сергеевна

Лингвистические методы атрибуции и датировки литературных произведений : к проблеме
<
Лингвистические методы атрибуции и датировки литературных произведений : к проблеме Лингвистические методы атрибуции и датировки литературных произведений : к проблеме Лингвистические методы атрибуции и датировки литературных произведений : к проблеме Лингвистические методы атрибуции и датировки литературных произведений : к проблеме Лингвистические методы атрибуции и датировки литературных произведений : к проблеме Лингвистические методы атрибуции и датировки литературных произведений : к проблеме Лингвистические методы атрибуции и датировки литературных произведений : к проблеме Лингвистические методы атрибуции и датировки литературных произведений : к проблеме Лингвистические методы атрибуции и датировки литературных произведений : к проблеме Лингвистические методы атрибуции и датировки литературных произведений : к проблеме Лингвистические методы атрибуции и датировки литературных произведений : к проблеме Лингвистические методы атрибуции и датировки литературных произведений : к проблеме
>

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Родионова Елена Сергеевна. Лингвистические методы атрибуции и датировки литературных произведений : к проблеме "Корнель - Мольер" : диссертация ... кандидата филологических наук : 10.02.21 / Родионова Елена Сергеевна; [Место защиты: Рос. гос. пед. ун-т им. А.И. Герцена]. - Санкт-Петербург, 2008. - 190 с. : ил. РГБ ОД, 61:08-10/522

Содержание к диссертации

Введение

Глава I. К истории проблемы «Корнель-Молъер» 14

1.1. Проблема авторства пьес, приписываемых Мольеру 14

1.2. Объекты атрибуции 29

1.3. Формирование атрибуционной гипотезы 30

1.4. Выводы 32

Глава II. Методы атрибуции 33

2.1. Субъективные и объективные методы атрибуции 33

2.2. Лексический анализ при исследовании стилистики текстов 41

2.3. Синтаксический анализ с применением теории графов 54

2.4. Применение автоматической обработки данных 62

2.5 Атрибуция текстов методами теории распознавания образов 72

2.6. Выводы 75

Глава III. Атрибуция стихотворных пьес Мольера 77

3.1. Постановка задачи 77

3.2. Определение априорного словаря параметров 77

3.3. Формирование априорного алфавита классов 106

3.4. Определение информативных параметров 109

3.5. Определение координат распознаваемых объектов и эталонов априорных классов 115

3.6. Работа распознающего автомата 123

3.6.1. Детерминированная атрибуция 124

3.6.2. Вероятностная атрибуция 129

3.6.3. Оценка качества классификации 133

3.6.3.1. Оценка качества разбиения на классы множества атрибутируемых объектов 136

3.6.3.2. Оценка однородности априорных классов 138

3.7. Интерпретация результатов атрибуции 149

3.8. Выводы 151

Глава IV. Датировка стихотворных пьес, приписываемых Мольеру 153

4.1. К вопросу о датировке пьес, приписываемых Мольеру 153

4.2. Методы датировки литературных произведений 155

4.3. Математический метод датировки на основе стилеразличающих синтаксических параметров 158

4.4. Датировка пьес, приписываемых Мольеру 160

4.5. Выводы 165

Заключение 166

Список литературы 169

Список источников 169

Приложение 184

Введение к работе

Актуальность темы исследования. Проблема атрибуции какого-либо произведения заключается в определении его автора, причем под произведением может пониматься любой связанный набор знаков, в том числе фильм, картина, аудио-произведение, письмо. Проблема установления авторства в литературе связана с существованием анонимных и псевдонимных текстов и представляет собой одну из древнейших филологических задач, входящих в область текстологии.

До середины XV века, когда было изобретено книгопечатание^ все произведения литературы оставались в виде рукописей, которые только в самых редких случаях были автографами или просмотренными и исправленными автором копиями. Ни одного автографа не дошло до нашего времени от произведений античной литературы, и авторство произведений Платона* и Аристотеля является весьма спорным-. В средневековой литературе почти каждое произведение имело сложную историю текста и целый ряд авторов, причем часто древнейший из дошедших до нас списков отделялся несколькими столетиями от времени создания произведения. Например, «Песнь о Роланде», возникшая в конце XI века, представлена только одним списком конца XII века и большим количеством списков XIII—XIV веков. Существуют различные версии и об авторе величайшего памятника средневековой русской литературы конца XII века «Слова о полку Игореве» [Зализняк, 2007].

После появления книгопечатания проблема атрибуции текстов сохранилась, поскольку значительная часть литературных произведений либо остается ; неопубликованной при жизни автора, либо бывает опубликована с неточностями и искажениями как вследствие небрежности, так и сознательно, например, по условиям цензуры. Отсутствие рукописей, точных данных, необычная биография порождают -множество гипотез об «истинном» авторстве произведений У.Шекспира [Гилилов, 2007]. Неопубликованные в печати произведения часто существуют в ряде списков,

-5-из которых ни один нельзя предпочесть другому по достоверности, как в случае с «Горем от ума» А.С. Грибоедова. В разные годы по биографическим данным и стилистическому анализу анонимные произведения, были приписаны М.В. Ломоносову, А.Н. Радищеву, Н.М. Карамзину.

Решение вопроса об авторстве литературных произведений становится очень важным при создании собраний сочинений писателей, и нередко наиболее спорными становятся публицистические работы. Немало вопросов возникло у различных исследователей при изучении критико-литературного творчества А.С. Пушкина, Ф.М. Достоевского, Н.Г. Чернышевского, В.Г. Белинского.

К спорным произведениям XX века относятся некоторые работы А.П. Чехова, В.В. Маяковского, М.А. Булгакова. Большой общественный резонанс получила атрибуция «Тихого Дона» М.А. Шолохова [В поисках потерянного автора, 2001]. Согласно одной из гипотез литературной мистификацией являются произведения Э. Ажара, под псевдонимом которого работал французский писатель Р. Гари.

Вопрос об авторстве комедий Мольера был поднят в начале XX века, и на сегодняшний день широко обсуждается как во Франции, так и за ее пределами. Согласно существующим гипотезам в число возможных авторов пьес, приписываемых Мольеру, входят такие французские драматурги, как П. Корнель и Ф. Кино. Наиболее жаркие дебаты разгорелись вокруг возможного написания П. Корнелем лучших комедий в стихах Мольера. Гипотеза о принадлежности перу П. Корнеля произведений, приписываемых Мольеру, в трудах различных исследователей стала традиционно обозначаться как проблема «Корнель-Мольер». Одним из последних исследований, результаты которого подтверждают эту гипотезу, стала работа Д. Лаббе, основанная на анализе лексического состава языка писателей [D. Labbe, 2003]. Однако анализ одного лишь лексического уровня не может служить достаточно достоверным критерием атрибуции текстов, поскольку именно лексический состав языка, связанный с темой повествования, лучше

всего поддается имитации. Остальные исследователи творчества Мольера в разные годы приводили различные литературные и биографические доводы, подтверждающие ту или иную точку зрения [Louys, 1919; Poulaille, 1957; Wouters, 1990; Forestier, 2001]. Возникла ситуация, когда лингвистическая задача не может быть решена методами, базирующимися исключительно на филологическом анализе, или с использованием методов количественного описания лексического состава текстов.

Как известно, для признания принадлежности произведения какому-либо конкретному автору необходимо, чтобы аргументы характеризовали его с трех сторон: биографической, идеологической и стилистической, при этом описание и анализ индивидуально-авторских стилей является необходимым этапом любой атрибуции [Берков, 1958]. Главная задача при анализе художественных произведений в процессе атрибуции заключается в выявлении специфических признаков языка автора и сопоставлении, их со специфическими признаками всех предполагаемых авторов., Описание индивидуальных авторских стилей с целью перевода информации, содержащейся в неформализованном виде в! тексте, на* формализованный искусственный язык на основе математической статистики заключается в выявлении специфических языковых признаков текста и использовании строгих- правил параметризации. До 70-х годов в практике атрибуции господствовали историко-документальные и филологические методы исследования, во многом базирующиеся на субъективном восприятии и анализе литературного произведения исследователем. В.В. Виноградов выделил 11 принципов атрибуции анонимных и псевдонимных произведений, разделив их на группу объективных и субъективных. В число объективных принципов им были включены лингвостатистические [Виноградов, 1961]. Математический аппарат и, в частности, лингвостатистические принципы стали широко применяться при атрибуции литературных произведений с 80-х годов. История развития методов атрибуции привела к пониманию того, что эффективный метод

-7-стилистического анализа в целях определения авторства должен охватывать разные уровни языковой системы и включать в себя применение многомерных классификаций. Описание индивидуальных авторских стилей с целью перевода информации, содержащейся в неформализованном виде в тексте, на формализованный искусственный язык на основе математической статистики заключается в выявлении специфических языковых признаков текста и использовании строгих правил параметризации [Морозов, 1915; Виноградов, 1961; Вашак, 1974; Севбо, 1981; От Нестора до Фонвизина, 1994; Сидоров, 2002 и др.]. Параметризация стихотворных текстов XVII века на французском языке с использованием априорного словаря параметров синтаксического уровня представляет собой особую лингвистическую задачу.

Актуальность исследования определяется проблематикой, связанной с разработкой проблем математического моделирования текстов с помощью многомерных классификаций и автоматизацией лингвистических исследований. В диссертации методы математического моделирования, и количественного описания. индивидуально-авторских стилей на синтаксическом уровне нашли свое применение при решении проблемы «Корнель-Мольер». Особое значение работа приобретает в связи с возросшим за последнее время интересом к проблеме «Корнель-Мольер» и большой значимостью вопроса об истинном авторстве комедий, приписываемых Мольеру, как для французской литературы, так и для мировой культуры в целом.

При рассмотрении проблемы авторства пьес, приписываемых Мольеру, неизменно встает вопрос об их датировке. Полная датировка произведения заключается в .установлении времени написания и публикации произведения. В случае с театром Мольера даты написания пьес точно установить невозможно, поскольку не сохранилось ни одной рукописи Мольера. Время написания комедий, составляющих его театр, устанавливается исходя из сведений о первых их постановках, однако действительная

-8-последовательность написания пьес, составляющих театр Мольера, может

несколько отличаться от общепринятой.

При установлении времени написания литературных произведений возможны различные приемы, связанные с графологическим и лексическим анализами [Лихачев, 2001; Taranovsky, 1982]. Однако на сегодняшний день отсутствуют универсальные методики датировки, основанные на математическом описании авторских стилей. Актуальность и новизна настоящей работы связана с разработкой нового математического метода датировки на основе стилеразличающих синтаксических параметров с учетом тренда параметров индивидуального авторского стиля, под которым в данной работе понимается основная тенденция изменения параметров индивидуального авторского стиля на протяжении литературного творчества писателя, очищенная от случайных влияний и индивидуальных особенностей отдельных периодов. С помощью нового метода датировки в работе осуществляется датировка стихотворных пьес, приписываемых Мольеру, и проверяется выдвинутая автором* гипотеза о существовании тренда параметров индивидуального авторского стиля.

*

Таким образом, диссертационная работа, посвященная атрибуции и датировке стихотворных пьес, приписываемых Мольеру, соответствует современной научной проблематике и является актуальной.

Теоретической основой исследования являются следующие положения: Индивидуальный авторский стиль представляет собой сложную иерархическую систему и должен описываться набором стилеразличающих параметров методом многомерной классификации. Проблема атрибуции анонимных и псевдонимных текстов представляет собой одну из задач распознавания образов [С. Ватанабе, М.А. Марусенко].

В настоящее время стиль рассматривается прежде всего как категория структурно-синтаксическая [А.И. Ефимов, И.П. Севбо, Г.М. Мартыненко]. Особенности индивидуального авторского стиля наиболее отчетливо

-9-проявляются в синтаксисе: в отборе конструкций, их расположении и объединении в сложное целое.

Индивидуальный авторский стиль может меняться как с годами, так и в зависимости от жанра [И.П. Севбо, М.А. Марусенко]. Проблема датировки может решаться как задача ранжирования многомерных математических моделей с учетом тренда параметров индивидуального авторского стиля.

Объектом исследования являются характеристики индивидуальных авторских стилей Мольера, П.Корнеля и Ф.Кино.

Предметом.- исследования в данной работе является . установление 'авторства и датировка спорных произведений, приписываемых Мольеру.

В диссертации выдвигаются три гипотезы.

1. Сложная атрибуционная гипотеза:

тексты стихотворных пьес, приписываемых Мольеру, полностью принадлежат Мольеру (нулевая гипотеза);

тексты стихотворных пьес, приписываемых Мольеру, полностью принадлежат П. Корнелю (первый вариант альтернативной гипотезы); *' -

тексты стихотворных пьес, приписываемых Мольеру, являются произведениями П. Корнеля, Ф. Кино и одного или нескольких неизвестных авторов (второй вариант альтернативной гипотезы).

2. Существует тренд параметров индивидуального авторского стиля,
выражающийся в том, что на протяжении литературного творчества писателя
значения параметров устойчиво изменяются в одном направлении.

3. Стихотворные пьесы, входящие в театр Мольера, были написаны
ранее, чем предполагалось.

Основная цель работы состоит в применении математического метода атрибуции анонимных и псевдонимных произведений для решения проблемы «Корнель-Мольер». Другой целью работы является разработка математического метода датировки и установление действительной последовательности написания спорных стихотворных пьес.

-10-Достижение поставленных целей предполагает решение следующих конкретных задач:

  1. провести обзор состояния проблемы «Корнель-Мольер», выбрать объект атрибуции и сформировать атрибуционную гипотезу;-

  2. сравнить и систематизировать существующие лингвистические методы атрибуции с целью- обоснования применения математического метода атрибуции анонимных и псевдонимных произведений, основанного на теории распознавания образов, в данной работе;

  3. сформировать априорные классы и априорный словарь параметров с перечислением правил параметризации стихотворных текстов XVII века на французском языке с примерами для каждого параметра;

  4. с помощью специально разработанного программного обеспечения определить информативный набор параметров, обеспечивающих разбиение объектов на классы, и создать математические модели анализируемых текстов путем описания объектов на языке информативных параметров;

  5. осуществить проверку атрибуционной гипотезы;

  6. изучить- существующие лингвистические методы датировки и разработать универсальный алгоритм датировки ч литературных произведений;

  7. установить последовательность написания стихотворных пьес, приписываемых Мольеру, с помощью нового метода датировки литературных произведений.

Материалом для данного исследования стали следующие тексты:

  1. 13 комедий в стихах, приписываемых Мольеру ("L'Etourdi", "Le depit amoureux", "Sganarelle", "Dom Garcie de Navarre", "L'Ecole des maris", "Les Facheux", "L'Ecole des femmes", "La Princesse d'Elide", "Tartuffe", "Le Misanthrope", "Melicerte", "Pastorale comique", "Les-Femmes savantes");

  2. 11 комедий в стихах П. Корнеля ("Melite", "La Veuve", "La Galerie du Palais", "La Suivante", "La Place royale", "Comedie des Tuileries", "L'lllusion

-11-comique", "Le Menteur"', "La Suite de Menteur", "Don Sanche d'Arago", "Tite et Berenice");

3) 3 комедии в стихах Ф. Кино ("Les Rivales", "L'Amant Indiscret", "La Mere Coquette") .

Методы исследования. В работе изучаются возможности- применения математических и прикладных методов к исследованию языка, и используется семиотическое и математическое моделирование естественного языка на основе теории вероятностей и математической статистки. Кроме того, в работе применяются методы обработки данных, стилеметрии, лингвостатистики, системно-описательный метод, а также методы филологического анализа, в частности методы анализа состава и структуры предложения.

Основные положения, выносимые на защиту.

  1. Стихотворные пьесы, приписываемые Мольеру, являются произведениями П. Корнеля ("Le depit amoureux", "Sganarelle", "L'Ecole des maris", "Les Facheux", "L'Ecole des femmes", "Tartuffe", "Le Misanthrope", "Melicerte", "Pastorale comique", "Les Femmes savantes"), Ф. Кино ("L'Etourdi) и неизвестного автора ("Dom Garcie de Navarre", "La.Princesse d'Elide").

  2. Предложенная методика определения значений параметров на материале текстов XVII века на французском языке позволяет решать задачу определения авторства анонимных и псевдоним ных текстов данного периода.

  3. Существует тренд параметров индивидуального авторского стиля, выражающийся в том, что на протяжении литературного творчества писателя значения параметров устойчиво изменяются в одном направлении.

  4. Метод датировки на основе стилеразличающих синтаксических параметров, предложенный в работе, позволяет решать задачи по установлению последовательности написания литературных текстов и может использоваться в дальнейших исследованиях.

5. В результате датировки спорных пьес, атрибутированных П.Корнелю и Ф.Кино, подтверждена гипотеза о более раннем написании стихотворных пьес, входящих в театр Мольера.

Научная новизна работы заключается в следующем:

осуществлена атрибуция стихотворных пьес, приписываемых Мольеру, методами математического анализа текстов с применением теории распознавания образов;

разработаны, правила параметризации текста на материале текстов XVII* века на^ французском языке;

показана возможность автоматизации-лингвистического исследования в области установления авторства;

разработан метод датировки литературных произведений;

-новый метод датировки применен при установлении, последовательности написания пьес, приписываемых Мольеру.

Теоретическая значимость проведенного исследования; заключается в том; что в нем; решена: проблема авторской принадлежности текстов; классиков французской: литературы. Результаты исследования способствуют-развитию математических и прикладных методов изучения, языка и вносят вклад в развитие теории и практики атрибуции литературных произведений! методами! распознавания образов, а также теории: и практики датировки литературных.произведений математическими методами-.

Практическая значимость, исследования состоит в возможности использования полученных данных о составе априорного словаря параметров' в качестве примера при составлении правил параметризации текстов на французском материале. Полученные данные о существовании тренда: параметров индивидуального авторского стиля могут использоваться в дальнейших работах по определению последовательности написания литературных произведений с целью их датировки.

Рекомендации по использованию результатов: исследования. Результаты исследования^ могут быть, использованы при чтении специальных курсов

-13-«Анализ данных» и «Лингвистические методы атрибуции анонимных и псевдонимных произведений», а также курсов по прикладной лингвистике, квантитативной стилистике и истории французской литературы.

Апробация работы. Основные положения диссертационного исследования обсуждались на заседаниях кафедры математической лингвистики филологического факультета Санкт-Петербургского государственного университета (2005-2007 гг.) и прошли апробацию в ряде докладов, прочитанных на XXXV и XXXVI Международных филологических конференциях (СПбГУ, 2006-2007), на Всероссийской научной конференции «Квантитативная лингвистика: исследования и модели» (Новосибирск, 2005), Всероссийской научной конференции с международным участием «Актуальные проблемы теоретической и прикладной лингвистики и оптимизация преподавания иностранных языков» (Тольятти, 2005), на Международной научной конференции «MegaLing'2007. Горизонты прикладной лингвистики и лингвистических технологий». (Украина, Партенит, 2007), а также получили отражение в 7 публикациях общим объемом 2,0 п.л.

Объем и структура работы. Диссертационное исследование содержит 183 страницы машинописного текста, оно состоит из введения, четырех глав с выводами в конце каждой, заключения, библиографии, включающей 128 наименований, из них 46 на иностранных языках, и списка источников. Основные результаты исследования обобщены в 41 таблице и 1 рисунке. В качестве приложения приводятся таблицы, описывающие состав театров Мольера, П.Корнеля и Ф.Кино.

Построение работы определяется целями, задачами и материалом исследования.

Формирование атрибуционной гипотезы

Проведенный обзор истории вопроса свидетельствует, что на сегодняшний день существует несколько гипотез об истинном авторе пьес, приписываемых Мольеру. Согласно первой выдвинутой гипотезе лучшие пьесы Мольера были написаны известным французским драматургом П. Корнелем [Louys, 1919; D. Labbe, 2003]. По другой версии, в поддержку которой приводятся различные литературные, биографические и языковые доказательства, П., Корнель является автором всех произведений Мольера [Poulaille, 1957; Vergnaud, 1990]. Помимо П. Корнеля, в числе возможных авторов пьес Мольера упоминаются также драматург Ф. Кино, поэт Шапель и другие неизвестные авторы [Wouters, 1990; Boissiers, 2004]. Наконец, существует общепринятая, официальная точка зрения, согласно которой именно Мольер и есть автор своих произведений [Forestier, 2003].

Определение возможных авторов требует критического взгляда на выдвинутые различными исследователями гипотезы. Так, не могут быть включены в число возможных авторов Ф. Понсард и Э. Ожьер, упомянутые П. Луи. По свидетельству Ж.-П. Гужона, П. Луи высказался следующим образом: «не. сложно подчеркнуть выразительность и своеобразие стихов Корнеля и показать, что многие стихи Мольера настолько слабы и банальны, что их можно было бы атрибутировать Понсарду или Эмилю Ожьеру» [Goujon, 1988, р.349]. Очевидно, что эти выдающиеся драматурги не могли быть авторами пьес, приписываемых Мольеру, потому что жили ровно на двести лет позже: Ф. Понсард (1814-1867), Э. Ожьер (1820-1889).

Не является достаточной и аргументация И. Вутера относительно авторства Шапеля. Поэт К. Э. Луи, известный под псевдонимом Шапель, был в хороших отношениях со многими, знаменитостями того времени, в число его друзей помимо Мольера входили Н. Буало, Ж. Лафонтен, Ж. Расин, М.-Ф. Вольтер, С. де Бержерак. Известно, что поэты часто собирались вместе и обсуждали свои будущие работы [Vassor, 2006]. Однако нет никаких оснований полагать, что они встречались «не для того, чтобы развлекаться и выпивать»: предположение о том, что Шапель придумал сюжет пьесы "Tartuffe", не может служить доказательством его авторства [Wouters, 1990, с. 120]. Тот факт, что Шапель писал лишь небольшие стихотворения, но не известно ни одной его пьесы, не позволяет нам включить его в список возможных авторов спорных текстов. Итак, при формулировании атрибуционной гипотезы в число возможных авторов могут быть включены Мольер, П. Корнель, Ф. Кино и неопределенное число неизвестных авторов. В настоящей работе мы имеем дело с проблемой сосуществования противоречащих мнений, и литературно-критическая атрибуционная гипотеза может быть сформулирована следующим образом: Нулевая гипотеза: (Н0): тексты стихотворных пьес, приписываемых Мольеру, полностью принадлежат Мольеру. Альтернативная гипотеза имеет следующий вид: (На): тексты стихотворных пьес, приписываемых Мольеру, полностью принадлежат П. Корнелю; (Н ): тексты стихотворных пьес, приписываемых Мольеру, являются произведениями П. Корнеля, Ф. Кино и одного или нескольких неизвестных авторов. В этом случае необходимо определить число авторов и возможную долю участия каждого из них.

Проведенный обзор истории вопроса атрибуции театра Мольера свидетельствует о все возрастающем интересе к данной проблеме и о существовании разных подходов к ее решению. Изучение документально-исторических фактов и данных филологического анализа позволило сформировать сложную атрибуционную гипотезу, описывающую возможность написания спорных пьес, приписываемых Мольеру, П. Корнелем и Ф. Кино. Исходя из требования соблюдения жанрово-стилевой однородности текстов, в класс атрибутируемых объектов были включены 13 комедий в стихах, приписываемых Мольеру. Обоснование выбора метода атрибуции, с помощью которого будет производиться проверка атрибуционной гипотезы, представлено в следующей главе.

Проблема установления авторства анонимных и псевдонимных текстов связана как с прикладными историко-филологическими дисциплинами, так и с широким кругом естественно-технических наук, среди которых особое значение при решении вопроса об атрибуции принимают статистика, теория вероятностей, семиотика и другие. При этом постановка задачи и применение результатов атрибуции относятся к литературоведческой сфере, а аппарат и методы получения результатов к сфере математической, требующей использования современных научных теорий и вычислительных средств.

В классификации1 методов атрибуции, предложенной академиком В. В. Виноградовым, были противопоставлены субъективные и объективные принципы, применяемые в целях атрибуции [Виноградов, 1961]. В этой классификации все методы, применяемые в целях атрибуции, разделены на группы субъективных и объективных принципов: 1 — субъективные: субъективно-коммерческие, субъективно-конъюнктурные, субъективно-эстетические, субъективно-психологические, субъективно-идеологические; 2 — объективные: документально-рукописные (археологические), исторические (биографии, сведения современников и пр.), историко-идеологические и сопоставительно-идеологические, историко-стилистические, художественно-стилистические, лингвостатистические. На практике степень применения перечисленных методов различна, только в самых сложных случаях при решении вопроса об авторстве спорного произведения необходимо применение всех принципов, атрибуции. Очевидно, что в работе В. В. Виноградова группа объективных принципов выделялась в рамках традиционной лингвистики.

Лексический анализ при исследовании стилистики текстов

С 60-70-х годов XX века при описании индивидуального стиля лингвоматематические методы стали применяться все шире. В различных исследовательских работах применительно к лексике и грамматике применялись методы статистики, благодаря чему накапливались данные о свойствах единиц языка, и формировался специальный научный аппарат атрибуции текстов.

В 1960 А. Л. Гришуниным [Гришунин, 1960] было проведено исследование сравнительной частоты употребления различными авторами дублетов - синонимических языковых средств типа «надо - надобно», «сей -этот». После анализа литературно-критических статьей В.Г. Белинского, Н.А. Некрасова, А.И. Герцена и других авторов, печатавшихся в одно время и в одних И тех же изданиях, был сделан вывод о- предпочтительном, использовании разными авторами тех или иных слов. Метод языковых дублетов получил дальнейшее развитие в, работе. Г.В.Ермоленко, посвященной исследованию- частоты функционирования отдельных языковых единиц [Ермоленко, 1988]. В результате этого,исследования были определены высокочастотнаяи низкочастотная группы лексики, нейтральные слова, речевые параллели и степень спаянности текста.

Т.А. Якубайтис и А.Н. Скляревичем была проведена типология научно-технических поэтических, драматических и других текстов по числу повторений какой-либо части речи [Якубайтис, 1982]. В ходе этой работы были сделаны выводы о структурности системы частей речи, в которой выделяются центральные и периферические связи, а также ядро системы, состоящее из существительных и глаголов. Кроме того, было обосновано утверждение о том, что достоверность атрибуции типов текстов возрастает с ростом количества анализируемых признаков.

Последнее утверждение, сделанное авторами исследования, по нашему мнению, является ошибочным: с увеличением числа анализируемых признаков достоверность атрибуции возрастает далеко не всегда. При использовании большого количества коррелируемых признаков возможно появление «шума», который может затруднять анализ и сильно искажать результаты. Высокая эффективность применения набора диагностирующих признаков может быть достигнута лишь при их независимости друг от друга, то есть при отсутствии между ними сильной корреляции. Для, определения набора информативных параметров требуется специальная процедура, которая во время написания рассматриваемой работы еще не была разработана.

Еще одно; исследование лексики- текста было проведено А.П. Василевичем, опубликовавшим в 1981 году работу, посвященную изучению употребления цветонаименований [Василевич, 1981]. Основой анализа цветоообозначения в поэзии и прозе 19-20 веков стали такие величины, как индекс лексической оригинальности (отношение числа редких к числу частых слов), индекс морфологической- оригинальности (отношение сложных слов, к простым) и индекс насыщенности (частота употребления цветонаименований). По результатам этого лексического- анализа была выявлена следующая тенденция, развития живописности в работах писателей разных лет: относительная неживописность авторов 19 века сменилась яркой живописностью в начале 20 века с постепенным ее угасанием в современной литературе.

Использование специально- разработанных индексов для оценки лексической структуры текста было обусловлено стремлением разработать новый универсальный аппарат для- объективного анализа лексики. Многие ученые продолжают, заниматься разработкой все новых индексов, мер и оценок-лексического состава, отличающихся теми или иными недостатками, и не рассматривают уже готовые, существующие решеншь в смежных областях знания; например в математике, где для описания объектов различной природы давно и успешно применяется теория распознавания образов.

Одно из последних исследований по атрибуции текстов было проведено французским специалистом по анализу речи Д. Лаббе, который вместе с К. Лаббе в 2001 году представил свой новый метод атрибуции, заключающийся в вычислении «межтекстового расстояния» [Labbe С, 2001, рр.213-231]. Вычисление «межтекстового расстояния» подразумевает анализ лексического состава двух текстов и определение меры их близости или удаленности друг от друга. При обосновании этой математической величины Д. Лаббе рассуждает следующим образом:

Определение априорного словаря параметров

Одной из центральных задач распознавания является выбор исходного набора параметров, составляющих в теории распознавания образов исходное описание объекта. Значение термина «параметр» существенно меняется в зависимости от контекста, в котором он употребляется. В общем случае параметром называют «величину, значения которой служат для различения элементов некоторого множества между собой» [БСЭ, 1972, т.21, с. 154], и в данном исследовании необходимо определить такие параметры, которые были бы способны различать два априорных класса (см. п. 3.3.). В более узком смысле термином параметр обозначается «некоторый квант информации о языковой структуре» [Марусенко, 1990, с.203].

На начальном этапе для характеристики анализируемых текстов в априорный словарь параметров необходимо включить достаточно полный набор параметров, используемых различными исследователями для параметризацию стилей в. синтаксическом аспекте. Априорный словарь параметров должен быть составлен без каких-либо ограничений по получению информации, необходимой для исходного описания классов и распознаваемых объектов и «представляет собой в значительной степени стандартизованный набор, полученный путем унификации и стандартизации известных средств, квантитативного описания стилей, предложенных разными авторами» [Марусенко, 1990, сс.66-75].

В настоящей работе инвентарь параметров, составляющих, исходное описание, включает 51 параметр, релевантных для описания, французского языка-(см. табл. 3.1). При этом минимальными единицами параметрического описания априорных классов являются предложения, а язык параметров-представляет собой систему определения, и фиксации ряда наиболее существенных структурных особенностей их организации. Значения параметров, полученные в результате описания априорных классов, являются признаками, характеризующими соответствующие классы.

При параметризации языковых явлений крайне важно, чтобы в основе их анализа лежал единый подход, изложенный в виде строгих однозначных правил соответствия языковых явлений их параметрическому выражению. Благодаря такому систематическому подходу удается минимизировать число случайных ошибок, которые вызываются большим числом отдельных причин, действующих в каждом отдельном измерении различными способами, и учесть наличие систематических ошибок, которые обусловливаются причинами, действующими вполне определенным образом. В данной работе приведены правила параметризации языковых явлений на материале текстов XVII века на французском языке. Методика параметризации текста на материале современных французских текстов была разработана в исследовании В. Чепиги [Чепига, 2007], многие из результатов которого коррелируют с нашими.

Для начала необходимо определить такие понятия, как предложение и слово. Предложение является самой многоаспектной единицей синтаксиса. Характеризующие его признаки можно разделить на три группы: 1. структурные признаки: предложение имеет специфические структурные схемы и особые способы выражения элементов; 2. семантические признаки: предложение имеет модально-временной план (предикативность), является средством общения, может характеризоваться темо-рематическими отношениями; , , 3. интонационные признаки: предложение может иметь интонационный рисунок, способный отражать как структурные, так и семантические признаки предложения [Бабайцева, Максимов, 1981, с.61].

Наиболее полное с точки зрения многоаспектности определение предложения дал В.В. Виноградов, охарактеризовавший предложение как «грамматически оформленную по законам данного языка целостную единицу речи, являющуюся главным средством формирования, выражения и сообщения мысли» [цит. по: Грамматика русского языка, 1960, т. 2, ч. 1, с.65]. А.А. Шахматов выделяет семантический аспект предложения: «предложение - это единица речи, воспринимаемая говорящим и

слушающим как грамматическое целое и служащая для словесного выражения единицы мышления» [Шахматов, 2001, с. 19].

При выделении предложения возможно применение формально-пунктуационного метода структуризации, при котором предложение определяется как «последовательность символьных цепочек и пунктуационных знаков между ними от одного конечного знака до другого, где «символьная цепочка» — это текстовое графическое изображение словоупотребления, а «конечный знак» представляет собой составной пунктуационно-пространственный отрезок текста, позволяющий формально распознавать в строке ситуацию «конец предложения»» [Гринбаум, 1996, с.456].

Рассматриваемые тексты представляют собой стихотворные пьесы XVII века, характеризующиеся специфическими пунктуационными знаками и синтаксисом, и применение формально-пунктуационного подхода показало в данном случае недостаточную лингвостилистическую надежность. В нашем случае в роли «конечных знаков» могут выступать -. такие пунктуационные знаки, как «.», «;», «!» и «?». Знаки «.» и «;» служат символами конца предложения вне зависимости от их правого окружения: они позволяют формально разграничивать предложения вне зависимости от их месторасположения в строке (середина или конец) и от того, с какой буквы (прописной или строчной) начинается следующий фрагмент текста. Знаки «!» и «?» фиксируют конец предложения тогда, когда они оказываются в конце строки. Все те случаи, когда они расположены в середине строки, определяются как неоднозначные, в анализируемых текстах за знаками «!» и «?» в середине строки следуют слова, начинающиеся со строчных букв. Для установления границ предложения в этом случае требуется не формальный, а смысловой подход. Мы не считаем знаки «!» и «?» символами окончания предложений в том случае, если они выделяют одно - два междометия или эмоциональный оборот .речи.

Методы датировки литературных произведений

При датировке литературных произведений в текстологии возможны различные приемы. При наличии авторской рукописи в тех случаях, когда почерк писателя менялся во времени, эффективным может быть графологический анализ. Если литературное произведение может быть датировано только в пределах крупного периода времени, то анализ делается на основе данных языка и орфографии [Лихачев, 2001, с.285].

Лексический анализ с целью датировки как редакций произведения, так и самого произведения проводится практически одними и теми же способами. Датирующие признаки при этом могут быть очень разнообразны: здесь могут приниматься во внимание различные хронологические выкладки и отсчеты времени в тексте, указания на тех или иных лиц как на живых или умерших, упоминание событий или исторических явлений, даты которых установлены, соотношение с другими произведениями (ссылки на произведения, время появления которых известно, следы влияния этих произведений и т. д.), указания на даты празднования переходных праздников (совпадение с воскресеньем какого-либо числа месяца). К датирующим же указаниям относятся сведения о том или ином лице как о живом или как о мертвом. Зная дату смерти этого лица, нетрудно усмотреть в этих сведениях указания на время, когда литературное произведение могло быть создано. Такими же указаниями могут служить сведения о различных явлениях истории, истории культуры, датировка которых уже известна [Лихачев, 2001, с.287].

Изучение стиля писателя может стать одним из эффективных способов датировки его произведений, поскольку стиль одного и того же автора не представляет абсолютного единообразия, а может меняться как в зависимости от жанра, так и с годами [Марусенко, 1990]. В этом случае необходим продуманный подход к организации выборки, поскольку даже в пределах одного произведения способ изложения связан с темой и меняется, следуя за сюжетом и композицией.

При стилистическом анализе синтаксических характеристик авторского стиля Б.Я. Слепак предлагает выделять вариабельность трех порядков [Слепак, 1982, с. 103]. Под вариабельностью первого порядка понимается различие у отдельных авторов статистического набора синтаксических характеристик, существенно отличающих в большинстве случаев одного писателя от другого. Вариабиельность первого порядка используется при решении задачи атрибуции.

При установлении датировки произведений наиболее важной является вариабельность второго порядка, которая отражает существование внутриавторских различий, связанных со статистической эволюцией различных синтаксичсеских элементов художественной формы писателей. Одно и то же явление в частотном отношении может по-разному использоваться автором на протяжении творческой жизни. Существование подобных внутриавторских различий вполне объективно и может быть подтверждено математическим аппаратом.

Вариабельность третьего порядка (внутритекстовая) установлена при изучении функционирования различных синтаксических явлений в отдельных художественных текстах. Она появляется вследствие того, что в большинстве случаев частотное употребление синтаксических единиц есть функция сюжетно-композиционного построения текста. В настоящее время практически отсутствуют работы, посвященные математическому анализу авторского стиля с целью определения его развития во времени. Изучение структуры стихотворных текстов проводилось В.М. Жирмунским и К.Ф. Тарановским [Жирмунский, 1975; Taranovsky, 1982]. Один из анализов, проведенных К.Ф. Тарановским, был посвящен исследованию «Луки Мудищева», приписываемого И.С. Баркову. К.Ф. Тарановский продемонстрировал, что ритмика этой поэмы имеет мало общего с ритмикой И.С. Баркова и его современников, доказав, тем самым, что «Лука» был создан после 1820 г.

Одно из последних исследований с целью атрибуции и датировки литературных произведений было проведено в 1997 году М.И. Шапиром [Шапир, 1997]. Исследователем был сделан сравнительный лингвостиховедческий анализ подлинного и сомнительного Г.С. Батенькова на фоне русской поэтической традиции с измерением метрики и строфики, ритмов ударений и словоразделов, «вертикального» ритма, рифмы, а также изучением связи ритма с морфологией и синтаксисом. Задача работы заключалась в установлении возможностей такого анализа при решении текстологических проблем, связанных с авторством и датировкой, и результаты исследования подтвердили эффективность подобной методики как для различения авторского стиля в стихотворных произведениях, так и для определения эволюции стиля одного автора.

Ввиду отсутствия универсальных методик датировки в рамках настоящей работы был разработан новый математический метод датировки на основе стилеразличающих синтаксических параметров, который и был применен при датировке стихотворных пьес, приписываемых Мольеру.

В основе математического метода дировки на основе стилеразличающих параметров лежит гипотеза о существовании тренда параметров индивидуального авторского стиля, под которым в данной работе понимается основная тенденция изменения параметров индивидуального авторского стиля на протяжении литературного творчества писателя, очищенная от случайных влияний и индивидуальных особенностей отдельных периодов. Метод датировки предусматривает выполнение следующих процедур: отбор объектов, последовательность создания которых надлежит установить (ниже - датируемый объект), отбор информативных параметров, формирование математических моделей датируемых объектов, ранжирование объектов на основании стандартизованной матрицы данных и сопоставление результатов датировки с начальными данными (рис.4.1).

Этапы процедуры датировки При формировании совокупности датируемых объектов одного автора необходимо соблюдать требование жанровой однородности. Полученная совокупность работ одного автора подлежит параметризации с целью установления единого авторского стиля, присущего рассматриваемому автору во всех его работах. Если при решении вопроса об атрибуции осуществляется фиксация стиля атрибутируемого произведения и сопоставление его со стилем предполагаемых авторов, то при датировке литературных произведений одного автора необходимо определить характеристики авторского стиля на материале всех датируемых произведений, а затем провести их сравнение. И в том, и в другом случае, важнейшим этапом исследования является фиксация авторского стиля, которая осуществляется по методу параметризации авторских стилей, предложенному М.А. Марусенко [Марусенко, 1990]. Параметризация авторского стиля заключается в отборе информативных параметров из заранее заданного словаря априорных параметров. Процедура отбора информативных параметров для двух априорных классов была подробно описана в гл. 3 настоящей работы.

Следующим этапом должно стать формирование математических моделей датируемых объектов, которое заключается в описании этих объектов на языке параметров рабочего словаря системы датирования. Результаты отображаются в .виде исходной матрицы данных Z, построенной по средним значениям Xi каждого диагностирующего параметра для датируемых объектов.

Похожие диссертации на Лингвистические методы атрибуции и датировки литературных произведений : к проблеме "Корнель - Мольер"