Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Математические модели межморфемных отношений и их использование при автоматической обработке русских текстов Булкин, Виталий Иванович

Данная диссертационная работа должна поступить в библиотеки в ближайшее время
Уведомить о поступлении

Диссертация, - 480 руб., доставка 1-3 часа, с 10-19 (Московское время), кроме воскресенья

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Булкин, Виталий Иванович. Математические модели межморфемных отношений и их использование при автоматической обработке русских текстов : автореферат дис. ... кандидата технических наук : 05.25.05.- Харьков, 1993.- 22 с.: ил.

Введение к работе

#?ЗД?^1и?5?ь_.р?ботц. Развитие вычислительной техника па пути улучшения технологической басы ц архитектуру, увеличения производительности и надежности, укепыпеннл разігаров ЭВМ пршстпчосіш нсчорпвло своя возможности. Кроме того, появлэнпэ и широкое распространенно персональних кокоьвтероз поставило на повестку для ршопие задачи, которая ззіслючаотсл в том, чтобы сделать общение с компьютерами для непрограммирующего пользователя столь неаюгнш, чтобн научиться этому іюг каадаИ человек с іинвкзльішзі усилиями. Сделать это иогпо.лшь обеспечив общение массового пользователя с кошыггерог.! па уровне обачного естественного язика. Кроме того, необходимо, чтобы по словесной формулировке задачи, интерэсущой пользователя, кокяызтор !.юг самостоятельно сконструировать иуотув програм;^ к решить задачу.

Ї0Ш2І образом, па кутя широкого распространения Бччпслктелъта: маяин стоит проблема создания штоллектуалыгого шггорфоЁса, обоспечшзапцего для лодеЗ максимально іккїїортшіе условия обрання с кошьэтором. Пря создать штоллэктуалького шггорфоЗса пеобзодшо '-'эакть рад задач. Среди них создание диалоговой систшял общения па ограниченной естественном языке, создание систоиы автоматического синтеза програм из библиотека стандартних і-зодулей, создание базы знаний, в которой хранится вся необходимая для работы интелльктуального тг.герфэйса информация. Создание йптоллоіеті'яльного кчторїоЗса иещду конечним пользователем и ЗШ приобретает все более актуально значение. Очевидно, что эту задачу нэтзшано решггь без форн^іаізаіщз естественного языка. Однако для того, чтобы формализовать се«янтЕ?.у текста, ЕзоСгоднко

"научить" систему понимать смысл отдельно взятого слова.

Целью_работы является разработка и реализация на дШ математических моделей негшрфемзнх отношений производных словоформ е применение их в лингвистической подсистеме интеллектусльного вс-тэственно-язикового интерфейса.

провести анализ существующих кртодоб формалжзацш естественпоі'о языка;

разработать методику фокального описания внутриморфемашс мвябуквонншс связей для всех шрфвм производного слова;

разработать метод математического описания межморфемных отношений синтактика для префиксальных, и суффиксальных цепочек, загруяепннх в регистры префиксального п суффиксального поля.;

разработать принципы математического моделирования медаэр-фвивш семантических связей с целью описания сшсла производного слова;

реализовать на ЭЗУ разработанные модели и внрабоїать рекомендации по кг применению.

рязработина методика математического описания Енутриморфешьа связей для всех ыорфем производного слова;

осуществлена схемная реализация преддкаишх уравнений, описывающих яги связи;

разработана математические модэли мэзморфэкаых отношений синтактика и произведена их схемная реализация;

разработан мзтод описания мейзетрфешнх семантических связей;

получены математические модели сзкааташи производного

слова с учетом явления смоншии и полисемия морфем; полученные модели реализовали па ЭВМ.

Прдктачэскал_цз1шдсть_работу состоит в том, что разработанные на тематические модели внутригдорфемных отношений кснтактлки также кежморфеших отношений скнтактшси и их схемная реализация могут бить использованы при создания отдельных блоков лингвистического процессора, выполпящего Функции тех структур человеческого ытэллектя, которые участвуют в реализации соответствующих сторон языкоеой деятельности человека.

Математические модели мехаорфвмных семантических отношений могу? быть использованы при создании лянгвистаческоа подсистемы интеллектуального остествэнно-лгкссвого интерфейса. Разработанные в диссертационной работе математические модели дают возможность решать широкий круг задач, связанных с машинной обработкой текстовой информации, в том числе - анализ и синтез текстов.

Рвалвзацяядззїльтатов_рзботн. Диссертационная работа выполнена в соответствии с планом научно-исследовйтвльских работ: госбвджетпые темы N 80051472 "Разработка теории прогрвммно-вичислительных средств и лингвистического обеспечения вычислительной техники новых ...сколений", N П02І362 " Разработка теория интеллекта и создание на ее основе проірашно-твхнического обеспечения ЭВМ новых поколений".

Результата диссертационной работы внедрены в производство в состава информационно-поисковой системы учета наличия и движения строительных материалов.Внедрение подтверждено соответствующими документами.

Оя!с?1ие„полдетим1_Еетоси^е_иа_з8гзт1:

- разработка методов моделирования внутрпмор'Текчых ггазбуквэнных

отношений;

- разработка методшся математического описания меяиор-
фемных синтактических отношений;

- разработка принципов математического моделирования
мехморфэмных семантических связей;

- реализация полученных методов.
Ап^обацнй^аботы^ Основные результату диссертационной работы

докладывались и обсуждались яа Всесоюзной конференции " Бионика интеллекта " (Харьков, IS87), "Психологическая бионика" (Харьков,1989), "Бионика интеллекта" (Харьков,1990), 9 Всесоюзном симпозиуме "Эффективность , качество и надежность систем "человек-техника". (Воронеж, 1990), на V Всесоюзной аколе-семинаре с приглашением зарубежных участников ''Бионика интеллекта" (Харьков, 19Э1).

ГЦбяикашяг 1 материалам диссертации опубликовано 8 работ.

Структура е объем работы. Диссертационная работа состоит из введения, пяти глав, выводов, списка литературы и приложений. Общий объем без списка литературы и приложений составляет 145 страниц машинописного текста.

ОЗ-ВІбЛІШ! обоснована актуальность рассматриваемых проблем, сформулирована цель и основные задачи диссертационной работы, раскрыты вопросы научной новизны и практической ценности работы, отмечены основные положения , выносимые на защиту, а также *гка общая характеристика работы, изложено ее краткое содержание.

5__Лервоа_гляве диссертации проведен анализ литературных

источников, обосновала необходимость моделирования естественного языка, дан обзор исследований и разработок в области тделирования ЕЯ. Произведен анализ состояния вопроса, показаны перспективы развитая данного направления. Произведен обзор современных информационных систем, дан обзор разработок по моделированш словообразования. Дана характеристика производных существительных, межлорфзшгоз связи которых являются объектом ^тематического ідоделировашя. Рассмотрены пробле{-.ш, гознихаадие яри моде.шгровании семантики дериватов.

Кшс известно, естественный язык является шегоуровяеЕОй системой . Существует идея, что кяждай уровень языка обладает скоїти синтаксисом, которнй укззнзает, как сочэтять единица отого уровня между собой. Например, синтаксис внелогического уровня содорлшт информацию о том, какие буквы когут сочетаться между собой, а какие нет. Синтаксис на урозпз морфе» указывает, какие морфема вступягат меяду собой в контакт, а некто сочетания пэ-дрцуеттд! и. д. Как показали исследования, значительное члело морфем является кеоднозначньт в семантическом плене единицами, т.е. для них характерны ЯГЛ5БЙЯ смопе-ши И П0ЛПСЄ?.52П. Издастно тагсга, что нрл взакг-юдеа, тага морфем на все семантические роли рядом стоящих шрфом согласуется гкдду собой. Чвсть семантических связей остается не реализованной. При этом существует определенные закономерности, регулнрущиз образование мэаюрфвмяыз семантических связей.

Ийтомэтнческоь снясанае данных закономерностей является основной задачей настоящего исследования. Одебко проядэ чем исследовать семантическую сочетаегдасть гюрфзм, Ееобгодгмо ратютрэть меї:б.уіш&тше евлзл внутри морфем, т.о. Енутрта'орфйкже

отношения контактика, а такте ш2ыорфег.гшз отновеная спнтактшш, опрэделяшцке^каже шрфвьаг когут вступать в контакт между собой, а какао нот. Реизние атих задач позволит, во-пэрвих, откорректировать Бозкожнае ошибка, возЕиказдпэ при зводе информация „ а, во-вторых, установіть Бшрзт за сочетаемость морфем, которцэ па семантическом уровне могут сочетаться, а па уровни сцнтзктики -нот. Это позволит системе избегай, такій ошибок, как сттез проазводоьк тяпа "работателъ" вместо "работник4.

Для решения поставленных задач необходимо вызтъ соотвотетву»-цйй математический аппарат. В качества такого аппарата била вибрана алгебра конечных нреднкатої (ДКІІ), разработанная профессором D.il. Шабаяозым-Кушарекко. Алгебра конечных иредтоатов является универсальным математическим аппаратом для описания дискретних, де-торминЕрсваЕкцх s конечних обьактов к явлений. Поскольку ЄСТ8СЇ-ьэншй язшс является дискретным, детерминированным и конечным объектом^ то он кояот быть описан средствами влгебры коночных предикатов, Алгебру конечных арэдякатов козаи» рассматривать как разновидность булевой алгебры. Ня яиже АІШ колю описывать любые ко-нэчныэ отнойенйя. АКП является развитием аппарата многозначной логики и исчисления прздюштов.

Для математического описания внутрш,юрфб?язых отношений контектикя и мегморфемнкх отношений сштактккн был разработан метод двухслойной декомпозиции предиката, позволяшїий бинарные предиката, ошсыващае тэ ила ьные текстовые отношоняя предотаяпять в виде системы (коньвнкцш) более простых предикатов ВїРя__глаза посвящена разработке математических моделей йнутриаюрфемаых отношений контактакн. Пусть бххнариое отношение xFy описывается предикатом Нг, у). Предикат Г можю представить » виде:

p(x.y) = Q(f(x),a(y», (1)

где U = f(x), 7 = g(y) - RBKOTopue класспфжщрущио функции, предикат Q(U,V) описывает сзязь меаду этими фуншщяш. Представление предиката F(x,y) в ецдэ соотношения (fj можно рассматривать как метод декомпозиции бинарного предшсзта. Будем называть эго иатодои двуслойной декошозицзп предяката.. С потжідьа этого метода продпкат разделяется ня два слоя - нагний, пред-с/явленный функциями /fa:; и gft/j, и верхний, прэдставленний предикатом Q(U,V). С использованием данного кетода било осуществлено математическое списание закономерностей сочетаемости первмвпнш букв лингвистического регистра сепвнтЕрованЕнх прзфзксов (ЛРСП).

Объединение букв в классы эквивалентности осуществляется путем склэивапия строк л столбцов таблицы значений предиката. При этом стрэкп (столбцы) одного и того so состава зйг<зшются одной строкой (столбцом) такого яе состпва. Для того чтобы произвести

СКЛЭИБ8НИ9 СТРОК (СТОЛбЦОВ) б.'ГИЗКПХ ПО СССТаву, ВВОДЯТСЯ ДОПОЛНЕ-

телыше единицы U*,V) так, чтобы сікони (столбцы) максимально близгаїе по своему составу превратить в строга (столбца) одинакового составя.Б дальнейшем ввадоняыз при этом дополнительные овязиг гйззду буквенгадш пэреквв_.дш лингвястячоского регистра исключается с помощью соответствующих лтяушйатпвиых уравнений .Для того-чтобы упростить систему соотношении, представлящиз: исходный бинарный предикат, в таблицу значений предиката Q(U,V} били введены дополнительные единицы (?*,Г) и произведено обьэдшгепко горе-моншх классов зквдзалонтшс-ги U п V и класса классов эквивалентности U| п У,.

Данный метод коало назвать методом трэхслойнои декомпозиции предиката. Сн ноззт использоваться при дэкогяюзицап прэдикатов.

иаэпщх твблзди значений большой размерности. Произведена схемная реализация полученных соотношений. Произведен сравнительный анализ слоаноста систем соотношений и их схемных реализаций, полученных с использованием катоде двухслойной декомпозиции предиката а штода трехслойное декошозицаи предиката.

В данной глаЕЭ произведена разработка математических гадвлей

ВНуїреННей СТРУКТУРЫ КОрнеВІЗ ЫОрфОЫ. Маї8Маї2ЧЄСКИ9 ІЙОДОЛИ

коя^актвкн лингвистического рэгистра сеплэнтЕрованных корней (ЛРСК) описывают более 4400 корневых юрфов русского языка, загруженных но опродоленному правилу в отот регистр.Таблицы значений предикатов, задающих данные отношения, содержат в своих ячейках больше единиц, чем нулей, поэтому при объединении букв в классы- вквивалентЕОсти, т.о. при склеивании строк и столбцов удобно было вводить не дополнительные единицы {1*,1'), а дополнительные нуля (О*.О'), что означает исключение некоторых связей моаду поро-шяниш лингвистического регистра. В дальнейшем эти связи восстанавливались с помощью соответствующих идаликативнах уравнений. йм-нликативноэ разлогопяэ предикатов, задающих свяоь коэду классаш эквивалентности V и V^skgb удобно было производить по кулевым, а нэ но единичжм ячейкам, так как таблицы значений stss предикатов содержат в своих ячейках значительно больше единиц, чей нулей. Была произведена схеиная рэалвзацзя полученных соотношений. Эти со-отноивння бшш реализована с помощью шюгополюсннкоз, называемых элементами I и II рода.

Элемент I рода работает в соответствия с соотношением

следующим образом: рели на вход многополюсники подать сигнал

я» и

X '=1,то элошент формирует отеєїшй сигнал У = 1,1 И,2,...,пі;

в а. а? ап а, а-, а„ вели- У = О, то X ]= X <=...= X п= О, если X ^ X "=...= X п= О,

в в а*

то У = О. При n=f, вела У =1, то X '=1. Элешнт I рода показан

на рясункз 1а.

Элемент II рода (ркс.1)5) действует в соответствий с

соотношешюм:

Y з X ] V Xs ч ... ч Хп.

При входном воздействии X 1= X 2=...= X п= 0 ейходной сигнал

'= х *=...= ;а

в в а1

У = О .Пря n=J, если У =1, то А" '=?.

Поскольку прк склеивании строк и столбцов т вводам дополнительные ^знбуквэшно связи, а затаи исключаем ях, необходшо ввести в рассмотрение так называс?.шй элемент II рода с отрщанием (рис. 1в), который! действует в соответствии С С00ТН0Ш9ПНВМ

У э X ' 7 X ^ V . . . У X п.

а1 s? ап

Пра входном воздействии X =14..= 1 '= 0, выходной ситаал
в в а1

7=1. Прл п = 1, если У = 7, то X =0.

а)

б)

ч /

в)

С использованием метода двуслойной декошозиции предиката были разработаны математические модаш внутришрфомаых отношений контакткки суффиксальных дарфэм, загруженных в лингвистический регистр сетеэнтированных суффиксов. На основания полученных соотношений произведена их схемная реализация с использованием элементов I и II рода, а таюке элементов II рода с отрицанием.

В данной главе ряссштрен тэкеэ вопрос представления тернарных отношений через бинарные. Не примере кеабуквэнннх отношений регистра сегментированных суффиксов показано, что тернарные предикаты, задающие связь мввду всеми тремя буквешшми переменными каадого сегмента ЛРСС у могут быть представлены либо в виде конъюнкция бинарных предикатов, задащих связи между первой л второй и второй и третьей буквенной переменными данного сегмента, либо в виде конъюнкции трех бинарных предикатов, последний из которых описывает связь между первой и третьей буквенными перэкеншш данного сегменте.. В первом случае можно будет, например, отношение S^(y<,y2,y3) = 1 задать систеїшй уравнений, которая будет являться объединением систем уравнений, задаицах отаогаенйя У^У2 s ^2 Схема, реализующая отношение 5](1'\>У2Г^ = 1» **>2&т ^Иїь представлена последовательным соединенней схем, реалЕзущет отношения у^у? и у2%Уз Ф30- 2''

%

Уг Рис. Z

Во втором случав, чтобы воспроизвести отпспогта S^(yvyz,it5) = 1 , необходимо использовать сжеку, показанцув на рт:с.З, гдо Q3 ~ предикат, задашщй связь гацду дерзсЯ п трвтьеЯ букЕвншш пере-цзиніЕлН данного сегкэнта.

Q.

Q~

Рис.з

Тр_э?ья іяава посвящена математическому тдалнровяниш глззз-

морфемянх отношений сиптактшш. Произведена разработка математических моделей сштактшш префиксальных гдарфем глаголов, разрабо-танн математачаскш модели мэзоюрфемных отношений спитактяки суффиксальных морфем глаголышх образований. Формалізованії мезмор-фэмныо отношения скнтактшя суффиксальных иорфэм прилагательных. Разработави математические модели мзвморфемннх отношений синтвк-тикн на КЕогоствв суффиксальных морфам нарэчлй. Для матегштичос-кого описания мвзморфемных спнтактнческнз отнсшенпй необходимо клеть математическую конструкцшз, которая позволяла би зэ каждой шрфвгюй закрепить определенное квото для тсклвявнпя поливаряаит-ііостп толкования той Ела иной морфекы. В качества такой j-жзтематп-чесясй конструкции бая использочэн регистр иорЗэмиого ПОЛЯ.

В частности, регистр префиксального соля состоит пз трех частей Р1, Р2, Р3, так как самая ддинпап префиксальная цепочка co-

держит три префикса, прзЗяксн в регистр префиксального поля загру-saeM так, чтобы есклзчнть случаи повторения одних и тех же префиксов в различных частях регистра. Однако бывает случая, когда один и тот sa префзкс в одной префиксальной Ц8ШЧІСЄ находятся на первом (пэ-psc-c), а другой - на последнем месте (првд-рас-по). Если па каком-то кэств регистра префиксального поля профшс отсутствует, то на етш месте ставится знак пустого префікса или просто пробел (_).

Рассмотрим в качестве примера шашрфемнор отношение P2Q2f3' заданное на декартовом произведения P2xF3 ^210380115 префиксальных морфом, стоїадо на втором и третьем кастах в регистре префіксального поля глаголов. Прбдккат Q^^.JV согласно методу двуслойной дэкомюзицш иродаката mosst быть представлен в слэдущэм саде:

Здесь U2 = f2(^ н ^2 ' ^2^3^ ~ классЕїшцарувдш функции, задашрга разбиение шозэств префиксальных шрфэм Р2 и Р3 на классы _8КБ2Еалэптности. Предикат й(У22.) описывает связь мецду пэреыенвими классами вквцьаяентвоета У2 ш 7Z- Разбиение множеств прз&иісашшх кзр$ем Р2 н Р3 па глассы экгизалентностЕ осуществляем, сквэпвая строїш п столбца значений предиката Q2(PZ,P3). После аслешзания строк функцию /2fP2J можно записать в слэдукдем виде:

при при раз изо со ко вз вы

U2 ~ ?2 v р2 v Р2 v Р2 у р2 v Р2 7 ?2 V Р2 v
s пода подо су sa изо ку вы ягз на

Pz f Рг 7 Р2 v Р2 v Р2 v Р2 v Р2 v Р2 v Р2 v Р2 v

Послэ схленванзя столбцов функция В2(рз^ принимает гад:
зэ за об о о ни на

72 ~ р3 7 р3 ; у2 ~ р3; 72 ~ р3 ;

ПО ПО !!Э В СО ->

у2 ~ р 3; ?3 - р3 ; v3 ~ р3; v3~ р3. В резу.чътатэ нровадешмх действий тейлица значений предиката Q2(P2,?3) оказалась преобразованной в таблицу значений предиката R ^2^2^ списывающего 'связь !ієзд пвременяыш У2 и ^ Производя игдшапсатнвша разложение предиката і?2 по перемэннол tf2, получаем сяздуицув систему имшшкатшжй уравненші:

ппа -< про из -1 во о ->

иг ' э V2; У2 э 72 v V 2 э V2 v V

бЭС С - р8С ПО С -1

У2 з 72 7 7г; У2 о 72 7 72 7 7г;

под за - боз за о на -*

U2 э 72 7 72; D"2 э 72 v 72 vlfj 7 72;

о па по --* за о на по пз с -

[/2 э 72 7 72 7 ?г; г/г э 72 7 7н v 72 v 72 v 72 7 72 v 7г*

ИМаликативнов разлозвшш предиката Bg по шроквнной Т2 даот другой вариант его ошсаипл:

за под баз ~* о во бэз -1

72 э иг 7 Uz 7 у2; v2 э У2 Ug 7 Уг*

на без с - да рао с -*

V2 => У2 ^27?Гг- 72 э у2 vU2vfV
из про - с бео рао -»

V2 => U2 У Us; 72 э У2 v U2 7 иг;

- при про во бэс рао под бэз с -* 72 => У? 7 7 У 2 у У2 7 У2 v ^2 v ^2 т U2 V ff2' На основаная полученных уравнений, используя штцзвти I и II рода, шжао построить схему многополвенияа, реализующего гкэжорфэккоэ

отношение еннтактлкй P2QZP3-

Для математического описания сштактикн суффкксалъшк иорфэм глаголов был использован регистр суффиксального поля глаголов (FCuT), в коториа в определенном порядке sarpysesH суффиксы, входящие в состав суффиксальных цзпочек глаголов. Суффиксы в регистр суффиксального поля глаголов загружаются так, чтобы они как kcsho peso повторялась в различных частях регистра. Аналогичным обрезок производится ісотєжіїичєскоз описание шгморфзмшх отношений сютакткга суффиксальных морфем щшагитальпых, вагруаенннх в регистр суффиксального поля пршюгатвлъннх, в тага» суффиксальных шрфегл парочий, загруженных в соотБэтствукшщй регистр суффиксаль-пого поля. Произведена схемная реализация голученшк соотношений.

В четвертой„глава пропзведопо математическое описание мвь-

корфамьщ семантических отпоезшій. Дани общгэ принципы математического описаная ишморфомпш: семантических свлзой. Получены математические шдолп семантических отношений па кюрфэшюм шве префикс - префикс, произведено штеиатическое описание коЕшрфзиных се».5антическях связей префяксэльно-корпавнх структур, суффиксальных дериватов, а такаэ осуществлено математическое опиг^яиэ семантики суффиксальных цепочек.

Одной кз самых ваггш пройга?4 при создании кнтеллзктуалыюго интерфейса является адекватная нятерпрэтация сшсла сообщений, решение которой невозможно без понимания смысла мова. Как известно, скисл производного слова (а шешю такие слова кш будем рассматривать) в общем случае, нельзя описать как простую сушу смыслов состазштрх ого кгорфов. Для того чтобы лучше понять механизм формирования смысла деривата представляется необходш.шм произвести «.чатематическоо описанио цеяморфемянх семантических связей, ЕОзникЕЕщет в процессе словообразования моэд смезннш

иорфэмама, входящими в состав производного слова.

Пусть имеется г.еїо2естЕо проазгодпах слов, хпадоо 23 которых моиет Сііїь представлено б екдэ:

где P1, P2 - Ерэфиксальвнэ морфзкч, Q - корневая гюрфэка, S1, S? -

суффтксальгага мсрїеад, Л - окончонко.

ймк ? подчязавзот, что медду этпкз - ;.:орЗзкз:.ш усу-аяаажпзяются

опрэдй-гйнну.» сэмытгшшшо связи, которое нэобгодгс.» отесзть

глятоматичвскн.

Если дано кяокоетао U морфем одного типа, та ка ьтом меоеєстеє кошто беэстй свстеку прздакатов S van, чтобы любой врэдакат P(t) е S обращался в 1 на мпогвстав дорфэм с какой-то определенной сьмантичэской ролью н бнл равен О а противном случав. Таким образом,ИЕОяество предикатов S коаво отождествить с множеством семантических ролей данных шрфзн. Каждому элементу А из М соответствует f.siosecTBo предикатов шз S, дашщк 1 прз подстановке А. Следовательно, каадону А е М взаимно однозначно соответствует некоторый одноместный подстаиовочянй предикат .4ft J, где t S. Такий образом, и* получаля мншвство S семантических ролей с определенным на кем многеством 11 праддкат-ов - морфем. Рас-сиотрим теперь два инозаства сомаггппзисих ролей S1 и S2 и два множества предакатов - морфем Ш^ я^- Тогда операция соединения двух морфем, ивогесгва семаптическах ролей которых описывается предикатами F^(t^) и P2(t2,?, будет характеризоваться согласованием определенных семантических ролей этих двух корфзгл. Результатом этого соединения будет множество связей г.!езду семантачвскЕия ролями рядом стоящи морфем. Это множество f«os8P быть задано некоторым бкнараш* предикатом F(l^ ,t2), прччем Pft1,tz) * P](ti)'P2(tz) и.

J. о

если предположить, что возможность установления семантические связей не зависит от вида морфем, то на декартовом произведении Sj х S2 множеств семантических ролей можно за/зть предикат k(t^,t2), прцнимаиций значение 1, если между семантическими ролями t( с S1 и t2 So устанавливаются связи и О - в противном случае. Логическое произведение P^ftj У?2^2^ означа8Т возможность согласования каздоп семантической роли морфемы Р^(11; с каадой семантической рольв шрфокы P2(t2)> Я&ако, в действительности часть семантических ролей рядом стоящих морфем пэ согласуется , поэтощ? опэрацля взаимодействия (*) семантических ролей морфэм запишется -сдодущяы образом:

P:(t^)*F2(t2) = k(t],t2)-P](tl)-P2(tz) , Логическое произведение P}(tj )'P2(t2) ОПИСНВЭЭТ все связи мозду семантическими ролями моргом P\(t\) п Po/^J. а ^^*1 »*2^ исключа8Т то связи, которые при атом не реализуются.

Расаютриы в качестве примера процесс образования производной словоформи "работник", получвныой путем соединения полисемантичной производящей основы "работать" и суффиксального морфа "-ник". В процессе словообразования при взаимодействия корневого морфа производящей основы "раоот-ать" и суффикса "-ник" образуется производное слово "работник". Семантические связи, вознзкавдие при этом, могут бить описаны с пошцьв предикати Р^^з**^

p^(t3,t4) = м13,1А).ру13).г^аА)-

2о Uo S- \U Z, Uo 2/- U, Zc U, So li?

(h *? v h H * h *? v h h v h *4 v h 1П-

Z. Fv So S, ,- U? Uo U, Ur Ib-

.(t3' v t3" у t33 v i34 v t3) (t/ У ї/ У t{' V i V tf) -:

_ *3 , y tZ2 +u3 _ tz4 tb = r3 *4 y *3 M v r3 M

Полученный предикат представляет собой катематяческув модель семантических связей корневого л суффиксального морфов производного слова "работник". Аналогично осуществляется математическое описание секантнчеегшх сплзой префиксальных цепочек, вре-"лкс8льно-корнеЕЖ образований, а также цвпочек суф|;2ксаль«Е1 морфем.

РЕзработзнныо модели позволгп? ?%х?в вычислять семантические значення дагптой корфепюЗ цэпочот, з которых она является синонимичной со всеми остальными цепочками, получавшими на выходе системы. Для этого ^обходило произвести логическое умяоаение предикатов, описывающих семантические значения морфемных цепочек. Следует отметить, что и исходные морфе via в некоторых семантических ролях шгут быть синонимами. Семантические роли, в которых исходные морфемы являются синонимами, можно вычислять производя логическое умножение предикатов, задающих множества семантических ролей этих морфем. Так, например, префиксальные морфемы "при-" и "по-" являются синонимами в семантических ролях х,7 и Хд, так как логическое произведение предикатов, задающих множества семантических ролей млз морфем, имеет вид:

P](t])-P2(ti) » t^1 V t^8, Таким образом, перемножая между собой предикаты, задающие многест-ва семантических ролей исходных морфем, иожно автоматически вычислять семантические роли, в которых данные морфоды являются синонимами.

3_0ятой_главе рассмотрены вопросы практических прилоЕзний результатов исследования. Разработан алгоритм формализации катода

двуслойной декошозвдюа предиката. Данный алгоритм реализован програшно. Дано описание программа, предназначенной для осуществления дакошозицш бинарных предикатов. Програша наткана по ал-горптшчвскок язике Паскаль и работает па IBM - совместимых персональных ЭШ. Разработан алгоритм решения предикатных уравнений, ошсыващнк шяшрфемкыэ семантические отношения на различных ь»а-МОрфеМЕЫХ шах производного слово. Осущэствлэна програшная роали-зацил этого алгоритма. Рассштрешл вопросы схемной реализации по-лученшх кодэл&й, определено место этих моделей в информационных системах.

Похожие диссертации на Математические модели межморфемных отношений и их использование при автоматической обработке русских текстов