Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Иерархизация синтаксического анализа на основе свойств линейной структуры русского предложения Кобзарева Татьяна Юрьевна

Иерархизация синтаксического анализа на основе свойств линейной структуры русского предложения
<
Иерархизация синтаксического анализа на основе свойств линейной структуры русского предложения Иерархизация синтаксического анализа на основе свойств линейной структуры русского предложения Иерархизация синтаксического анализа на основе свойств линейной структуры русского предложения Иерархизация синтаксического анализа на основе свойств линейной структуры русского предложения Иерархизация синтаксического анализа на основе свойств линейной структуры русского предложения Иерархизация синтаксического анализа на основе свойств линейной структуры русского предложения Иерархизация синтаксического анализа на основе свойств линейной структуры русского предложения Иерархизация синтаксического анализа на основе свойств линейной структуры русского предложения Иерархизация синтаксического анализа на основе свойств линейной структуры русского предложения Иерархизация синтаксического анализа на основе свойств линейной структуры русского предложения Иерархизация синтаксического анализа на основе свойств линейной структуры русского предложения Иерархизация синтаксического анализа на основе свойств линейной структуры русского предложения
>

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Кобзарева Татьяна Юрьевна. Иерархизация синтаксического анализа на основе свойств линейной структуры русского предложения : диссертация ... кандидата филологических наук : 10.02.21, 10.02.19 / Кобзарева Татьяна Юрьевна; [Место защиты: Рос. гос. гуманитар. ун-т (РГГУ)].- Москва, 2008.- 192 с.: ил. РГБ ОД, 61 08-10/879

Содержание к диссертации

Введение

ПЕРВАЯ ГЛАВА. Автоматический синтаксический анализ русского предложения: история и современное состояние проблемы

1.1. История постановки задачи 21

1.2. Теоретические предпосылки создания автоматического синтаксического анализа. Структурный синтаксис . 22

1.3. Первые работы по синтаксическому анализу русского текста 25

1.4. Современное состояние проблемы 30

1.5.Частные проблемы автоматического анализа 32

1.6. Вероятностные подходы 33

1.7. Выводы 34

ВТОРАЯ ГЛАВА. Свойства проективности и рекурсивности и их роль в иерархизации синтаксического анализа

2.1. Введение 36

2.2. Проективность и рекурсивность подчинительных связей 37

2.2.1. Понятие проективного фрагмента 37

2.2.2. Иерархия предикативных ситуаций в сегменте 39

2.2.3. Место именных и предложных групп в линейной структуре предложения 39

2.2.4. Особенности линейной организации рекурсивной «матрешки» именных и предложных групп 41

2.2.5. Процедура анализа рекурсивных структур. Анализ матрешек именных и предложных групп 46

2.2.6. Типы линейной конфигурации именных и предложных групп 48

2.2.7. Некоторые проблемы, возникающие при анализе согласованного определения в препозиции к хозяину 51

2.2.8. Ограничение зоны поиска хозяина согласованного определения и слуги предлога как фильтр проективности 53

2.2.9. Выводы по разделу 2.2. 54

2.3. Рекурсивность и проективность сочинительных связей в русском тексте 2.3.1. Введение 55

2.3.2. Функциональные особенности структуры сочиненных групп 51

2.3.2.1. Сочинительное сокращение 57

2.3.2.2. Обязательная манифестация сочинения в тексте 58

2.3.2.3. Сочинительное сокращение как фактор недревовидности графа 58

2.3.2.4. Рекурсивность и проективность сочинительных связей. Зоны влияния сочиненных слов 61

2.3.2.5. Рекурсивность и иерархия сочинительных связей 64

2.3.3. Выводы к разделу 2.3. 69

ТРЕТЬЯ ГЛАВА. Общие принципы организации системы, иерархия модулей синтаксического анализа и их задачи

3.1 Уровни анализа и соответствующие им модули СА 70

3.2. Динамическая и статическая компоненты анализа 70

3.2.1. Верификация лингвистических и алгоритмических решений 73

3.2.2. Структура словарей и морфологический анализ

3.2.2.1. Словари 74

3.2.2.2. Морфологический анализ 75

3.2.3. Синтагмы 76

3.2.4. Особенности организации процедуры анализа рекурсивных структур 77

3.3. Задачи модулей 80

3.3.1. Модуль постморфологического анализа 80

3.3.1.1. Числительные 80

3.3.1.2. Названия в кавычках 81

3.3.1.3. Имена собственные лиц 81

3.3.2. Модуль разрешения омонимии частей речи 82

3.3.2.1. Словосочетания 82

3.3.2.2. Частичная омонимия 83

3.3.2.3. Словарь типов омонимии частей речи 85

3.3.3. Модуль предсегментации 89

3.3.3.1. Именные и предложные группы 89

3.3.3.1.1. Поиск хозяина имени собственного 90

3.3.3.1.2. Анализ определительных именных и предложных групп 91

3.3.4. Модуль сегментации 92

3.3.5. Модуль внутрисегментного анализа 96

3.3.6. Межсегментный анализ 99

3.3.7. Анализ кореференции 100

ЧЕТВЕРТАЯ ГЛАВА. Моделирование сегментной структуры русского предложения. Два этапа сегментации . 101

4.1. Омонимия и синонимия знаков препинания в русском тексте 101

4.1.1. Знаки препинания и проективность линейной структуры 101

4.1.2. Омонимия и бифункциональность знаков препинания 103

4.1.2.1.3апятая 103

4.1.2.2. Тире 105

4.1.2.3. Двоеточие 107

4.1.2.4. Скобки 107

4.1.2.5. Точка 108

4.1.3. Омонимия знаков препинания и сегментная омонимия линейной структуры предложения 108

4.1.3.1. Примеры неоднозначности сегментации при определении значения запятой — правой границы сегмента vs. оператора сочинения 108

4.1.3.2. Некоторые неоднозначности интерпретации знаков препинания при определении левой границы вложенных сегментов, вытекающей из омонимии знаков препинания 109

4 Л .4. Синонимия знаков препинания 110

4.2. Грамматика сегментной структуры русского предложения и принципы его сегментации 111

4.2.1. Сегментация как ключевая компонента системы 111

4.2.2. Сегмент в линейной структуре предложения 114

4.2.3. Идеальная модель линейной структуры сегментов в русском предложении 114

4.2.4. Осложнение линейной структуры предложения вложениями 115

4.2.5. Операторы и их функции в предложении: функции запятых и сочинительных союзов 118

4.2.6. Бифункциональность запятой и функциональная неоднозначность операторов 121

4.2.7. Сегментация 123

4.2.7.1. Объект, задача и организация анализа 123

4.2.7.2.Две ступени моделирования сегментной структуры 124

4.2.7.2.1 Стратегия анализа а-сегментов 125

4.2.7.2.2. Процедура формирования а-сегмента 126

4.2.8. Свойство проективности линейной структуры сегментов 131

4.2.9. Семантика сегментной структуры или условия присоединения 134

4.2.9.1. Условия удлинения деепричастных и причастных оборотов 136

4.2.9.1.1. Запреты присоединения 137

4.2.9.1.2. Условия присоединения 137

4.2.9.1.2.1. Присоединение без опоясывания 138

4.2.9.1.2.2. Условия присоединения Р-отрезка по сочинению при разрыве 139

4.2.9.1.2.3. Условия присоединение (3-

отрезка по управлению при разрыве 140

4.2.9.2. Построение а-сегмента — придаточного 140

4.1.9.2. Условия удлинения а-отрезка - придаточного 144

4.2.9.2. Анализ сочинения предикатов при удлинении придаточных 147

4.2.10. Построение р-сегментов 153

4.2.11. Выводы к разделу 4.2. 156

4.3. Второй этап сегментации — построение графа связей сегментов 157

4.3.1.Лингвистический базис построения связей сегментов и некоторые проблемы, возникающие при поиске слова - хозяина сегмента 157

4.3.2. Отношения между сегментами 157

4.3.3. Особенности сегментной структуры предложения, осложняющие поиск межсегментных связей 159

4.3.3.1. Факторы, осложняющие ответ на вопрос, какое слово является хозяином а-сегмента 159

4.3.3.2. Факторы, осложняющие ответ на вопрос, где искать хозяина а-сегмента 159

4.3.4. Проективность межсегментных связей 161

4.3.5. Общие правила проективности межсегментных связей 161

4.3.6. Поиск хозяина деепричастного оборота 162

4.3.7. Специфика поиска хозяина ПП 164

4.3.7.1. Виды ПП 165

4.3.7.1.1. А 165

4.3.7.1.2. В 165

4.3.7.1.2.1. Скрепы 166

4.3.7.1.2.2.Семантика хозяина 1Ш 167

4.4. Выводы к разделу 4.3. 170

Заключение 170

Библиография

Введение к работе

Работа посвящена исследованию свойств линейной структуры русского предложения, важных для организации автоматического синтаксического анализа (СА), и созданию на основе полученных результатов теоретической базы и самой системы синтаксического анализа, экспериментальные реализации которой подтвердили продуктивность найденного подхода.

Этот подход позволил разделить СА на несколько ступеней и построить лингвистически обоснованную и процедурно удобную их иерархию.

Главной особенностью лингвистического базиса системы является такая линейная грамматика сегментной структуры русского предложения, которая позволяет начинать собственно синтаксический анализ с моделирования его сегментной структуры до этапа анализа внутренней структуры сегментов, т.е. до построения большей части связей слов.

Актуальность исследования

Актуальность работы определяется тем, что хотя задача синтаксического анализа, необходимого для всех систем машинного перевода и автоматического понимания текстов, была поставлена более полувека назад, устойчивой и общепринятой системы синтаксического анализа до сих пор не создано. Чтобы продвинуться в ее решении, сегодня необходимо не только совершенствовать имеющиеся наработки, но и находить новые подходы - как в теоретическом плане, так и в плане практическом.

Очевидно, что задача синтаксического анализа, сначала казавшаяся, как и задача машинного перевода, решаемой в обозримое время, является — в силу бесконечной вариативности естественного языка — сложнейшей задачей, допускающей лишь приближенные решения.

Актуальность избранного в диссертации теоретического подхода обусловлена назревшей необходимостью построения для СА особой — систематически описывающей семантику линейного синтаксиса — грамматики, которая позволяет определить иерархию лингвистически обоснованных подзадач СА и которую можно использовать при разных конечных целях анализа.

Компьютерные технологии совершенствуются. Возникла возможность, не боясь усложнения программ, использовать алгоритмические решения, естественно вытекающие из свойств текста и позволяющие упрощать грамматический базис системы, не только не поступаясь сложностью реальной языковой картины, но создавая возможности более полного ее анализа.

Теоретические предпосылки создания автоматического синтаксического анализа. Структурный синтаксис

Одними из наиболее лингвистически продвинутых являются системы МП группы, возглавляемой Ю.Д. Апресяном. Работа этой группы началась в Москве в 1974 году в ИНФОРМЭЛЕКТРО, где были созданы СМП с французского на русский (ЭТАП-1) и с английского на русский (ЭТАП-2).

В системе ЭТАП-1 был реализован перевод через поверхностно-синтаксическую структуру. В ЭТАПе-2 перевод осуществляется на уровне нормализованных синтаксических структур, занимающих промежуточное положение между поверхностно-синтаксической и глубинно-синтаксической структурами.

В описании Этапа-2 речь идет не об анализе русского текста, а о синтезе. Синтаксический этап русского синтеза в большой мере следует идеям И.А. Мельчука и Л.Н.Иорданской. Синтаксический анализ для русского языка разрабатывается в настоящее время в системе МП ЭТАП-3. Эта система работает на базе лингвистически чрезвычайно продвинутого и, соответственно, трудно пополняемого словаря. j

Система французско-русского автоматического перевода (ФРАП), была создана группой Н.Н. Леонтьевой в ВЦП совместно с МГПИИЯ им. М. Тореза в 1976-86 гг. [Леонтьева 1986, 1987], а система анализа политических текстов (ПОЛИТЕКСТ) разработана ею в Центре информационных исследований при ИСКАН в 1991-97 гг. [Леонтьева 1995]. В системе ФРАП был принят подход, отличный от того, на который опирается ЭТАП. Это система с семантическим языком-посредником, и синтаксический компонент в ней может не давать на выходе правильного дерева анализа. В синтаксическом процессоре этой системы уже был введен отдельный этап сегментации французского предложения [Соколова 1987], но задачи построения полной грамматики явлений этого уровня не ставилось. После СА предусматривается этап семантической интерпретации, на вход которого могут подаваться структуры любых уровней полноты и правильности.

Система АОТ группы разработчиков Диалинг была создана в 1998-2001 гг. Фундаментом исследований послужила система ФРАП [Сокирко 2001]. Синтаксический анализатор АОТ [Гершензон 2002] работает на основе результатов морфанализа, где каждая словоформа предложения представлена множеством морфологических омонимов. Спецификой является двунаправленное взаимодействие модуля сегментации1 и модуля построения синтаксических групп слов в предложении. Эти два модуля работают параллельно, обмениваясь накопленными знаниями (сегментация = синтаксис). Таким образом, в этом анализаторе уже есть отдельный модуль сегментации (в принятой в системе терминологии - фрагментации), хорошо работающий для наиболее вероятных сегментных структур русского предложения. Одной из существенных проблем этого синтаксического анализатора в целом является то, что он не может анализировать столь частые в русском предложении разорванные группы.

Разрабатываемая в настоящее время система Treeton [Мальковский 2006, Старостин 2007] предназначена для морфосинтаксического анализа русского текста и использует формальную модель описания синтаксиса, сочетающую в себе формализмы зависимостей и составляющих (в духе А.В.Гладкого). Эта работа продолжает развивать подход Н.В. Перцова и С.А. Старостина [Перцов 1999]. Отличительной особенностью синтаксического анализатора в этой системе является то, что он опирается в основном на морфологические характеристики слов без использования богатой словарной информации о сочетаемости. Набор синтаксических отношений также сознательно сужен. Это продиктовано в первую очередь тем, что не

1 В терминах группы Диалинг — фрагментация (www.aot.ru). существует формализованных словарей достаточно большого объема, в которых описана сочетаемость единиц.

Синтаксический анализатор осуществляет анализ множества аннотаций («тринотаций»), порожденных морфологическим анализатором и привязанных к словам текста. Тринотация — это аннотация, снабженная внутренней структурой — лесом с именованными связями, в узлах которого стоят другие тринотаций, т.е. набор всех тринотаций для данного предложения представляет собою способ представления дерева связей предложения. Исходные тринотаций — результат морфанализа — не имеют никаких связей.

Анализатор работает с множеством синтаксических правил: если в анализируемом множестве морфологических аннотаций встречаются тринотаций, к которым применимо синтаксическое правило, то в ходе анализа эти тринотаций могут быть связаны отношениями, указанными в правиле. Анализатор, обнаружив соответствующую новую тринотацию, каждый раз пересматривает уже построенную структуру на основе фильтров качества структуры и пытается построить оптимальную структуру. В настоящее время основное внимание в системе Treeton уделяется механизмам анализа, работа же над конкретным лингвистическим наполнением только начата.

Особенности линейной организации рекурсивной «матрешки» именных и предложных групп

Приводятся в графическом виде примеры результатов работы парсеров: 1) с круглыми стрелками (кроме двух примеров со ссылкой на [Баталина 2006]) — программная реализация И.М.Ножова [Ножов 2003], с квадратными ломаными стрелками связей — дипломная работа студента ф-та Прикладной математики МАИ Пашковского П.В.

Вершина ИГ; (не «вырожденного» случая ИГ, когда у N нет А-слуг) может быть слугой предлога, при этом ИГ; оказывается внутри ПФ предложной группы. Может появиться ИГі, которое может быть слугою Ап — слуги существительного в ИГ; или слугою Ак - слуги существительного, являющегося слугою предлога, который является слугою Ап , и т.д. То есть анализ структуры ИГ и ПГ представляет собою некоторый комплекс проблем, которые естественно решать одновременно.

Внутри ИГ могут появиться ПФ как ПГ - слуг А, так и ИГ - слуг этого же А. Появление каждой новой ИГ с А-слугою создает предпосылки появления новых вложений ИГШГ — слуг А. У А может появиться слуга — инфинитив, а появление каждого нового Ni внутри ПФ всегда означает возможность появления его слуг - Nj в слабоуправляемом Род.п. или падежах соответствующих валентностей Ni.

(5) Близкое присутствие моря за окном томило его, словно это огромное, липко-блестящее, лунной перепонкой стянутое пространство, которое он угадывал... (Н)

(6) Он вносит посторонние, чуждые этому духовному началу, черты. (Ф)

Таким образом, проблемы возникают, если А - слуга ИГ в препозиции к N - может иметь слуг, причем любых, так как появление любого слуги может инициировать появление слуг следующего уровня вложений.

В каждом очередном вложении ИГ (ИГ без предлога или же ИГ - слуги предлога) с А-слугою потенциально содержится отпредикативная ветка графа, в линейной структуре которой могут появляться все новые и новые вложения ИГ и ПГ. Так, в предложении Булгакова (7) Лежащий на ложе в грозовом полумраке прокуратор сам наливал себе вино в чашу в ПФ, ограниченном связью прокуратор R лежащий, вложены ПФ двух ПГ (Рис.4).

(8) Измяв и отбросив последнюю газету, все высосав, все узнав, сжигаемый неотвязным зудом, желанием принять мне одному понятные меры, я сел

за стол и начал писать (Н).

В (8) способность А=сжигаемый управлять Тв.п. порождает вложение между ним и его хозяином N=# двух сочиненных ИГ, одно из которых — желание — может управлять инфинитивом, а появившийся инфинитив в свою очередь инициирует появление между ним и вершиной ПФ, ограниченного отношением я R сжигаемый, двух вложенных ИГ — слуг этого инфинитива: мне одному и понятные меры. На этапе предсегментации будет построена матрешка ПФ:

Рассмотрим 1) ПФ определительных именных групп (ИГ), границы которых задаются поверхностно-синтаксическим отношением NRA, где N — существительное или его синтаксический аналог и А — полное прилагательное, причастие или их синтаксический аналог в необособленном согласованном определении в пре- или постпозиции или обособленном согласованном определения в препозиции к N и 2) ПФ предложных групп (ПГ), где границы ПГ - связью PRN, где Р - предлог.

ПФ таких ИГ и ПГ можно рассматривать с точки зрения 1. их места в модели общей структуры связей слов в предложении и в архитектуре системы СА и

2. собственно модели линейной структуры ПФ ИГ и ПГ, задающей условия построения определяющих их связей. Обсуждаются некоторые структурные особенности текста, значимые для решения этих вопросов.

В четвертой главе, где рассматривается грамматика сегментной структуры предложения, показано, что для определения семантики

сегментной линейной структуры многосегментного предложения важны функции знаков препинания и сочинительных союзов [Кобзарева 2004, Кобзарева 2005]. Они не являются границами сегмента, если сочиняют слова - не вершины сегментов [Кобзарева 2006-а], при этом чаще всего они сочиняют актанты и сирконстанты предикативных вершин сегментов. Поэтому для анализа сочинения, являющегося одной из опорных составляющих процедуры моделирования сегментной структуры предложения, важно иметь уже построенные ПФ актантов и сирконстантов. Для этого перед сегментацией введен модуль предсегментации [Кобзарева 2007-а], который строит ПФ линейных компонент — единиц анализа при сегментации, вершины которых выступают в роли предикативных вершин (например, ПФ сложных сказуемых) или имен их актантов и сирконстантов: ПФ определительных ИГ и ПГ, конструкций с именами собственными, числами. Построение их на раннем этапе анализа — до сегментации — оправдано и тем, что их можно строить, используя только порядок слов, морфологические характеристики слов и грамматическую модель управления [Кобзарева 2001 -а, Кобзарева 2007-а].

Верификация лингвистических и алгоритмических решений

В системе используются три словаря: словарь основ - VL, словарь таблиц флексий - VT и словарь «псевдоокончаний» (или «хвостов», т.е. концов слов) VF, обеспечивающий возможность анализа продуктивных моделей слов, основ которых нет в VL, с учетом грамматических значений этих «хвостов» в объеме «Грамматического словаря» Зализняка.

Словарная статья VL содержит информацию о грамматической модели управления — способности управлять существительным в Род., Дат., Вин., Тв. падежах, инфинитивом, предложной группой (без лексической конкретизации), подчинительным союзом; при этом различаются управление сильное, сильное альтернативное и условно называемое в системе «среднее» — весьма вероятное, но не сильное, и о семантических классах, к которым относится слово. Используются минимально необходимые для СА классы и подклассы: предметы неодушевленные и одушевленные, среди последних различаем нарицательные имена лиц и не лиц {инспектор — лошадь), собственные имена лиц и не лиц {Пушкин — Барбос), , названия вещества видовые и родовые {сталь - металл), параметры, единицы измерения пространства и времени, процессы, географические названия и др.

Возможностями собственно морфологического анализа определяются задачи и порядок работы первых двух модулей предсинтаксического анализа — постморфологии и модуля снятия омонимии частей речи.

Первый этап — анализ на основе VL и VT, обеспечивающий морфологическую идентификацию словоформ, основы которых есть в VL. Слову ставится в соответствие набор (или несколько наборов) морфологических характеристик, грамматическая модель управления и семантический класс слова. Второй этап морфологического анализа — построение по суффиксам и окончаниям гипотетических характеристик для причастий и деепричастий глаголов, основ которых нет в VL.

Третий этап — построение по обратному словарю «хвостов» (VF) гипотез о части речи и форме словоформ [Кнорина 1972], не идентифицированных на первых двух этапах. Концы слов в объеме словника «Грамматического словаря русского языка» А.А. Зализняка [Зализняк 1980] определяют гипотетические части речи и формы слов [Владимирова 1985]. Хвосты в VF образуют гнезда: каждое гнездо представляет собой группу всех таких концов слов, где каждый очередной более длинный является удлинением справа налево предшествующего и задает морфологические характеристики, отличные от всех, в него вложенных. Для того, чтобы на этом этапе морфанализа не было ошибок, основы словоформ, морфологические параметры которых не совпадают ни с одной из гипотез гнезда, были введены в VL.

Этот этап обеспечивает морфологический анализ несловарных продуктивных словообразовательных моделей, как, например, подчеркнутые слова из прозы О.Мандельштама: такую степень зачеловеческого бытия; в неясных видениях первосонъя; привычными обобщителъными рукоплесканиями; в позе роденовского мыслителя; близехонько от нее. Способность системы их анализировать может быть использована для накопления спецлексикона авторов.

На третьем этапе словам, при попытке анализа которых даже такие продвинутые системы морфанализа как система Starling [http://starling/morpho.php?lan=ru] объявляют, что «слово не найдено», словарь «хвостов» позволяет приписать правильные морфологические характеристики, хотя степень омонимичности частей речи несколько возрастает.

Результаты морфанализа по VF (расшифровка используемых в системе кодов дается в скобках): зачеловеческого - ЧР=6 (прилагательное); РД=5 (мЛср.р.); МР=2,4 (Род\Вин м.р.); СР=2 (Род. ср.р.); первосонья - ЧР=1; РД=15; МР=1,2,4 (Им\Род\Вин м.р.); Р=1; СР=2 (Род.ср.р.); МН=1,4 (Им\Вин мн.ч.); обобщителъными ЧР=6; РД=15; МН=5; роденовского - ЧР=6; РД=5; МР=2,4; СР=2; близехонько - ЧР=16 (наречие);

После этих этапов морфанализа остается проблема морфологической идентификации слов, которые или не могут в результате этих этапов получить правильную морфологическую характеристику, или могут терять морфологическую автономность и соответственно менять морфологический статус [Кобзарева 2004-а]. Этими случаями занимается модуль постморфанализа.

Омонимия и бифункциональность знаков препинания

Чтобы определить функции знака в данном Т, нужно иметь исходный набор его возможных значений и знать, как они могут совмещаться. Можно утверждать, что некоторое значение входит в исходный набор значений рассматриваемого ЗП, если существует линейная структура, где это значение у этого ЗП будет единственным.

В случаях, когда ЗП имеет в Т одновременно два значения, т.е. совмещаются две его функции, будем говорить о бифункциональности ЗП.

Рассмотрим три функции запятой на примерах S1 и S2. Запятая! — левая граница сегмента. Это значение иллюстрирует ситуация, когда это - левая граница сегмента, вложенного в любой другой сегмент. В S1: Процесс одевания, которому предается Акакий Акакиевич, шитье и облачение в шинель на самом деле — его разоблачение, постепенный возврат к полной наготе его Dice призрака. (Н) В S1 - три запятые. Только первая из них-запятая 1.

Запятая2 - правая граница сегмента. Это значение вычленяется в чистом виде в случае вложения сегмента в сегмент, когда сегмент-хозяин разорван. В предложении S2 Прохлада монастырской обители, вьющиеся по стенам розы, измолсденный человек в ермолке, сияющие, свежие краски фрески, над которой он трудится, — вот та рабочая обстановка, о которой мечтал Гоголь.(Н) 7 запятых, из них 6-ая запятая (перед тире) представляет чистый случай правой границы.

ЗапятаяЗ - оператор сочинения внутри сегмента. В S1 только функцию сочинения слов имеет последняя запятая, манифестирующая сочинение вершин именных групп его разоблачение и постепенный возврат к полной наготе его же призрака. В S2 первые 4 запятые — операторы сочинения внутри сегмента. Бифункциональность запятой Бифункциональность 1.

Функции Запятой 1 и Запятой2 могут совмещаться, т.е. запятая одновременно оказывается и левой и правой границей. Например, запятая, разделяющая следующие непосредственно друг за другом простые-главные: Животный страх стучит на машинке, животный страх ведет китайскую правку на листах клозетной бумаги... (М) или вторая и третья запятые в цепочке соподчиненных придаточных: Он увидел, что он давно в Москве, что облако подсвечено золотом, что грузовик его стоит... (Б) Бифункциональность2

Функции запятой2 и запятойЗ могут совмещаться у запятой в ситуации разрыва (третий случай вложения): в S1 в сегмент-хозяин Процесс одевания, шитье и облачение в шинель... , где вторая запятая — запятаяЗ, вложено придаточное ,которому предается Акакий Акакиевич, относящееся к группе Процесс одевания. Это придаточное, в силу свойства операторов сочинения ограничивать в линейной структуре предложения зоны, где могут находиться слуги сочиненных слов, должно быть вставлено между его хозяином и оператором сочинения. И так бы и случилось, если бы оператором был союз и. Т.е., если в сочиненную группу Процесс одевания и шитье вставить придаточное которому предается Акакий Акакиевич, то в Процесс одевания, которому предается Акакий Акакиевич, и шитье..., вторая запятая осталась бы запятой2, так как есть отдельный оператор сочинения и. Если бы строгость записи в естественном языке была такой, как скобочная запись в алгебраических выражениях, то возникла бы запись с двумя подряд стоящими операторами — запятой2 и запятойЗ: Процесс одевания, которому предается Акакий Акакиевич,, шитье... Однако две запятые (в отличие от двух и более скобок подряд в математике) ставить не принято, соответственно две разные их функции исполняет одна запятая, что мы и будем называть ее бифункциональностью.

В рассмотренном случае сочетания [,и] запятая и сочинительный союз и оказываются отдельными независимыми знаками с собственными значениями. Но при определении функции запятой необходимо иметь в виду, что запятая в таком и подобных сочетаниях может терять морфологическую автономность. Это происходит, в частности, при сочинении с итерацией сочинительных союзов и\ или\ да\ либо\ ни\ то\ не то\ то ли\ ли: Он слышал громкий разговор, и шум ветра, и стучащие по крыше капли дождя...

Если же нет ни сочинения с итерацией, ни сочинения в разорванном сегменте, то [,и] чаще всего - бифункциональный знак со значениями запятой 1 и запятой2: Стояло лето Керенского, и заседало лимонадное правительство (М).

Запятая в комбинациях [,а] и [,«#], может выступать в значениях, близких запятой1\2\3 с аналогичной бифункциональностью.

При этом может возникать стяжение запятой2 и [,«]![,а] \[,но] в значении запятой 1: Каменноостровский — это легкомысленный красавец, накрахмаливший свои две единственные рубашки, и ветер с моря свистит в его трамвайной голове (М)

Тиреї и тире2 - аналогично запятой 1 и запятой2 - левые и правые границы любых сегментов: Он вынул из шкафа визитку и в полном вечернем туалете — безупречном от сандалий до тюбетейки — с черными шевиотовыми ластами на белых ляжках вышел.... (М).

При вложении с разрывом (аналогично левой и правой скобкам) тире — левая и правая границы вводного оборота: Концертный морозец пробегал по его сухой коже и — матушка, пожалей своего сына — забирался под воротник. (М)

При этом при вложении без разрыва функцию тире2, как и в случае с уточняющим оборотом, берет на себя идущая следом любая левая граница примыкающего справа сегмента (запятая, точка с запятой, двоеточие) или правые границы предложения (точка, восклицательный или вопросительный знаки), которые при этом оказываются бифункциональны. ТиреЗ и Тире4 - левая и правая границы уточняющего оборота, простого или связанного с хозяином отношением гипонимии: Отчаянно тихо я собрал свои охотничьи принадлежности — сачок, зеленую жестянку на ремне, конвертики и коробочки для поимок — и через окно классной выбрался наружу. (Н)

Если вложение не порождает разрыва, левая граница следующего сегмента, приняв на себя функцию тире4, становится бифункциональной, как, в частности, точка с запятой в следующем примере: Я придумывал разные героические способы спасти ее от ее родителей — господина с нафабренными усами и дамы с овальным...лицом; моя мать спросила про них....(Щ

Тире5 - знак связи подлежащего и сказуемого, т.е. связи слов внутри сегмента, манифестирует проективность сегмента: Каменноостровский — это легкомысленный красавец, накрахмаливший свои две единственные рубашки, и ветер с моря свистит в его трамвайной голове.(ЬЛ). Ваша первая и единственная любовь — продажная женщина, чистота ее — миф. (Н) Тиреб - знак эллипсиса некоторой компоненты при повторе конструкции в одном или разных сегментах. Манифестирует проективность: Из пяти их сестер Наталья была за Петерсоном, Вера — за Пыхачевым, Нила — за бароном Раушем фон Траубенберг, Елизавета — за князем.... (Н); Двадцать лет такого танца составляют эпоху, сорок — историю. (М)

Похожие диссертации на Иерархизация синтаксического анализа на основе свойств линейной структуры русского предложения