Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Управление просодией при синтезе речи по печатному тексту Мещеряков, Роман Валерьевич

Диссертация, - 480 руб., доставка 1-3 часа, с 10-19 (Московское время), кроме воскресенья

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Мещеряков, Роман Валерьевич. Управление просодией при синтезе речи по печатному тексту : диссертация ... кандидата технических наук : 05.13.01.- Томск, 2000.- 157 с.: ил. РГБ ОД, 61 00-5/3203-2

Введение к работе

Актусуіьность тсчы диссертации. Эффективность человеко-машинных систем в последнее время соотносят с использованием каналов речевого ввода-вывода с использованием ЭВМ. При этом особое мссго занимают системы синтеза речи, генерігрующне речевой сигнал по печатном) тексту, которые имеют не монотонный металлический опенок, но интонированный с высокой степенью естественности, позволяющий увеличить количество и качество передаваемой информации.

Проблемой синтеза речи по печатному тексту занимались известные ученые Сорокин В.Н.. Сапожков М.А., Загоруйко Н.Г., Лобанов Б М , Златоустова Л В. и другие. Основным недостатком исследовании являлось отсутствие разграничения того, что определяется языком и что определяется диктором. Чаще всего решались узкие задачи синтеза речи (определение длительностей звуков, транскрибирования), мало уделялось внимания просодии речи. Решаемые вопросы синтеза речи тесно связаны с задачами в смежных областях (машинный перевод, вокодерная связь).

Особое внимание заслуживает исследование и создание моделей, орнснтируюши\ся на синтез речи по правилам, характеризующийся генерацией речи по неизвестному заранее печатному тексту с управлением всеми параметрами речевого сигнала. Входной информацией является орфофафнчески-правильный текст, базы данных соответствующего языка, параметры речеобразования, характеризующие диктора. На выходе должен генерироваться речевой сигнал, соответствующий естественной речи. Отличительной особенностью систем данного вида является моделирование всех этапов процесса речеобразования.

Синтез речи по правилам требует создания моделей формирования просодических характеристик речевого сигнала с учетом влияния параметров речеобразующего тракта и легких.

Целью работы является построение моделей формирования просодии и определение параметров управления просодией при синтезе речи по печатному тексту с учетом особенностей языка и характеристик диктора Поставленная цель достигается решением следующих задач:

  1. Анализ структур описания речи и формирование баз данных па разных уровнях иерархии языка для системы синтеза речи.

  2. Разработка алгоритмов формігроваїшя просодии по печатному тексту с учетом ограничений н особенностей русского языка.

  3. Анализ характеристик диктора влияющих на параметры просодии и определяющих его индивидуальность.

4. Создание модели легких при управлении просодией при синтезе речи по печатному тексту. В качестве основных методов исследовании, использованы следующие: системный анализ, теория иерархических многоуровневых систем, теоретико-множественный подход. В качестве объекта исследования выделим модели формирования просодии по печатному тексту.

Научная новизна работы заключается в следующем: Сформігрована методология построения систем синтеза речи, как части общей системы речевого взаимодействия. Определены основные подходы к построению систем подобного типа. Предложена концептуальная модель синтеза речи по печатному тексту. В основу модели положено мноюуровненос представление речи, выделены этапы синтез ожидаемых (прогнознрусмыч) параметров просодии и управление процессом формирования просодии при генерации реального речевого сигнала. Разработана и исследована модель легких при управлении просодии при синтезе речи по печатному тексту. На основе разработанной методологии предложен комплекс алгоритмов по формированию просодических характеристик. Реализация результатов. Основные результаты работы используются в виде комплекса программ для формирования просодических характеристик речевого сигнала. Входными данными являются орфографически правильный текст, базы данных. В результате работы формируется мелодика и ритмика высказывания, прогнозируемый расход воздуха, моменты перестройки артнкуляторных органов.

Реализовано (]юнстичсскос транскрибирование для русского и английского языков, которое используется на ка<|>сдрс иностранных языков Бнйского технологического института Алтайскою государственного технического университета.

Результаты работы используются в учебном процессе Бийского
технологического института Алтайского государственного

технического университета и Томскою государственного университета систем управления н радиоэлектроники.

Созданы программные средства поддержки логопедии и фоннатрии и проверки слуха. Они используются в рсабнлитаїшонно-днагностнческом центре "Мать и дитя".

Практическая ценность работы. Методология построения систем синтеза речи по печатному тексту позволяет упростить создание систем синтеза речи по правилам, приведены рекомендации разработчикам систем. Разработанные алгоритмы преобразования

печатного текста в речевой сигнала могут быть реализованы в системах синтеза речи для различных сфер человеческой деятельности, трсоиощнх речевой вывод. Прикладные аспекты и теоретические исследования могут быть использованы в системах распознавания речи. машинного перевода, вокодерах, медицинских и лингвистических исследованиях.

Апробация работы. Результаты работы были апробированы на 16 конференциях. Наиболее значительные:

"Сибрссурс" (3 - Красноярск. 4 - Барнаул, 5 - Омск);

Компьютерные технологии в науке. проектировании и производстве (Нижний Новгород 1999, 2000):

III Международной конференции "Методы и средства управления технологическими процессами" (1999);

Международной научно-практической конференции "Языковая картина мира: лингвистический и культурологический аспекты" (г.Бннск, 1998);

Всероссийской конференции "Теория и практика речевых исследований (АРСО-99)". (Москва. МГУ им. М.В. Ломоносова 1999г. 14-18 сентября);

International Workshop "SPEECH AND COMPUTER (SPECOM)" (г. Санкт-Петербург, 1998).

Автор выносит на защиту:

  1. Структуру описания речи, учитывающую особенности языка и конкретного диктора.

  2. Модель легких, отражающая процесс формігровання просодии при генерации речи человеком.

  3. Комплекс методов и алгоритмов формирования ггросоднческлх характеристик речи по печатному тексту.

Публикации. По теме диссертации опубликовано 25 работ. Основные работы приведены в конце автореферата.

Структура и объем работы. Диссертационная работа изложена на 149 страницах и состоит из введения, четырех глав, заключения, списка литературы из 170 наименований, 8 приложений, содержит 24 рисунка, 3 таблицы.

Похожие диссертации на Управление просодией при синтезе речи по печатному тексту