Исследование вокальной речи как нестационарного случайного процесса и разработка критериев объективной оценки певческого голоса Бакаев Александр Васильевич

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Бакаев Александр Васильевич. Исследование вокальной речи как нестационарного случайного процесса и разработка критериев объективной оценки певческого голоса : диссертация ... кандидата технических наук : 01.04.06 / Бакаев Александр Васильевич; [Место защиты: ГНУ "Южный федеральный университет"].- Ростов-на-Дону, 2009.- 138 с.: ил.

Содержание к диссертации

Введение

1. Обзор методов исследования речевых сигналов и моделей формирования речи и слухового восприятия 21

1.1. Модели формирования речевого и вокального звука 21

1.2. Основные характеристики вокальной речи 32

1.3. Об особенностях формирования высокой певческой форманты 39

Выводы по разделу 46

2. Методика и результаты экспериментального анализа певческих голосов на основе коэффициента отношения интенсивностей формант (КОИФ) 47

2.1. Методика спектрального анализа вокальных гласных и оценка погрешностей измерений 47

2.2. Исследование спектров вокальных гласных 52

2.2.1. Исследование музыкальных фраз 63

2.2.2. Исследование формантной структуры основных вокальных гласных на основе КОИФ на всем диапазоне исполнения мужских голосов (бас, баритон, тенор) 68

Выводы по разделу 84

3. Коррекция вокальных гласных непрофессионального исполнителя с помощью КОИФ 86

3.1. Сравнение КОИФ с Коэффициентом звонкости (Кзв) В.П. Морозова...87

3.2. Исследование влияния соотношения высокой и низкой певческих формант на восприятие вокального звука 88

3.2.1. Сопоставление КОИФ для разных певцов. Отличие их голосов в субъективном восприятии 88

3.2.2. Моделирование для одного певца различных соотношений КОИФ 89

3.2.3. Экспертная оценка результатов 91

3.3. Разработка структурной схемы устройства коррекции 93

3.4. Моделирование цифровых полосовых фильтров для выделения областей верхней и нижней формант в устройстве коррекции 94

3.5. Исследование корректирующего устройства 98

3.6. Экспертная оценка скорректированного музыкального фрагмента 103

Выводы по разделу 105

4. Представление вокальной речи как нестационарного случайного процесса. вопросы оценки изменения мгновенной частоты 107

4.1. Вокальная речь как нестационарный случайный процесс 107

4.2. Разработка цифрового метода и алгоритма анализа вокальных акустических сигналов как нестационарного случайного процесса 112

4.3. Интонационный анализ исполнения романса П.И. Чайковского профессиональными вокалистами 128

4.4. Исследование изменения мгновенной частоты основного тона (вибрато) у профессиональных исполнителей 132

Выводы по разделу 135

Заключение 137

Список использованных источников 140

Об особенностях формирования высокой певческой форманты
Исследование формантной структуры основных вокальных гласных на основе КОИФ на всем диапазоне исполнения мужских голосов (бас, баритон, тенор)
Моделирование цифровых полосовых фильтров для выделения областей верхней и нижней формант в устройстве коррекции
Интонационный анализ исполнения романса П.И. Чайковского профессиональными вокалистами

Введение к работе

Актуальность работы. На современном этапе развития техники и технологий методы точных наук все более широко используются в гуманитарных областях. Электроакустические устройства и компьютерная техника применяются также в музыкознании. Не осталось ни одной области музыкальной теории и практики, где нельзя было бы использовать данные музыкальной акустики и ее средства, в частности, современные технологии цифровой обработки сигналов, для объективного изучения тех или иных музыкальных явлений. Традиционной областью применения акустических методов является музыка, в том числе вокальное искусство. Новые возможности компьютерной техники позволяют создавать модели акустических сигналов и разрабатывать алгоритмы их обработки.

Диссертационная работа направлена на исследование радиотехническими методами одного из важнейших коммуникативных сигналов - вокальной речи, которая оказывает на человека значительное эмоциональное воздействие. Научный интерес представляет природа образования высокой певческой форманты, нестационарность процесса звукоизвлечения, а также процессы исполнительской интонации, проявляющиеся в изменении мгновенной частоты акустических вокальных сигналов.

В рамках научного подхода в изучении процессов звукоизвлечения и звуковосприятия за последнее столетие было создано множество акустических, механических, а впоследствии, радиотехнических, в том числе цифровых моделей голосового и слухового трактов (Р. Юссон, Г. Фант, Дж.Ф. Фла-наган, М.А. Сапожков, В.Н. Сорокин, В.П. Морозов, Е.А. Рудаков, Л. Раби-нер, Б. Гоулд, И.А. Алдошина и др.). Данные модели позволяют установить связь физиологических процессов в речеобразовании и слуховом восприятии с соответствующими им электрическими и цифровыми аналогами.

Вокальная речь имеет ряд существенных отличий от разговорной, так как является результатом профессиональной постановки голоса, под которой понимаются специфические музыкальные, физические и дыхательные уп-

5 ражнения и занятия на протяжении нескольких лет под руководством опытных педагогов-вокалистов. В ходе занятий вырабатываются оптимальные условия звукоизвлечения, которые позволяют певцу исполнять произведения любой технической и эмоциональной сложности, не травмируя при этом свой голосовой аппарат, являющийся хрупким музыкальным инструментом.

В.ГТ. Морозов описал основные особенности голоса профессионального певца: звонкость, полетность (возможность певческого голоса «прорезать» оркестр и заполнять большие концертные залы без микрофона) и «серебристость» тембра (по терминологии вокальных педагогов). Эти характеристики обусловлены наличием ярко выраженных максимумов огибающих низкочастотных и высокочастотных составляющих спектра певческого голоса - фор-мантных областей, а также амплитудно-частотной модуляцией звуковых колебаний во времени (вибрато). Высокая певческая форманта — это группа усиленных обертонов в спектре певческого голоса, обладающая высокой интенсивностью у профессиональных исполнителей. Частота области высокой (третьей речевой) форманты лежит в пределах от 1800 Гц до 3500 Гц (в зависимости от типа голоса исполнителя).

Исследованиями особенностей разговорной и вокальной речи, а также процессами ее обработки занимаются многие современные ученые (Ю.А. Кропотов, Е.В. Лаврентьева, И.Б. Старченко, А.В. Харуто, И.А. Алдо-шина и др.).

Вопросам формирования высокой певческой форманты у певцов также уделяется большое внимание со стороны исследователей. Так у Е.А. Рудакова механизмом происхождения высокой певческой форманты является «краевой тон» голосовых связок, образующийся подобно свисту.

По В.П. Морозову звук, порождаемый голосовыми связками, попадая в резонаторы, усиливается, образуя при этом формантные области и, в частности, область высокой певческой форманты.

В данной работе приводится обоснование дополнения этих теорий друг другом с радиотехнической точки зрения путем моделирования механизма образования высокой певческой форманты согласно теории Е.А. Рудакова.

Порой вокальные акустические сигналы нуждаются в коррекции, при которой подразумевается изменение соотношений между спектральными составляющими, для улучшения звучания голоса певца.

Описанные выше модели и способы исследования речи являются детерминированными и не учитывают стохастических и нестационарных свойств разговорной и вокальной речи.

Таким образом, цель диссертационной работы заключается в выявление информативных признаков профессиональной вокальной речи, в частности, экспериментальном исследовании спектров вокальных акустических сигналов профессиональных и непрофессиональных исполнителей, анализе вокальной речи как нестационарного случайного процесса и разработке способа коррекции звучания певческого голоса.

Для достижения поставленной цели необходимо решить следующие задачи:

Исследовать особенности образования высокой певческой форманты на основе физической модели.
Экспериментально исследовать формантные характеристики спектров вокальных гласных профессиональных и непрофессиональных исполнителей во всем диапазоне исполнения, присущем группам мужских голосов.
Провести экспертную оценку полученных результатов.
Разработать метод анализа вокальной речи с учетом ее нестационарности. Исследовать вокальную речь как нестационарный случайный процесс.
Провести интонационный анализ исполнения произведений профессиональными вокалистами на основе анализа изменения мгновенной частоты основного тона.

7 6. Разработать и провести моделирование устройства, позволяющего педагогу-вокалисту производить коррекцию голоса обучающегося певца на основе коэффициента отношения интенсивностей формант. Результаты, выносимые на защиту:

Уточненная модель образования высокой певческой форманты и исследования адекватности модели естественному процессу звукообразования.
Результаты экспериментального анализа спектров голосов профессиональных и непрофессиональных исполнителей на основе введенного коэффициента отношения интенсивностей формант (КОИФ). Экспериментально исследованные закономерности изменения КОИФ.
Результаты программного моделирования устройства коррекции голоса непрофессионального исполнителя.
Результаты экспертной оценки полученных после коррекции акустических сигналов.
Методика анализа вокальной речи как нестационарного случайного процесса.
Результаты корреляционного анализа вокальной речи как нестационарного случайного процесса.
Результаты интонационного анализа исполнения произведений профессиональными вокалистами и певческого вибрато на основе исследования изменения мгновенной частоты основного тона.

Научная новизна:

Обоснована уточненная модель механизма образования высокой певческой форманты (ВПФ) и представлена доказательная база к объединению теорий образования ВПФ В.П. Морозова и Е.А. Рудакова на основе расчета физической модели.
В качестве критерия оценки певческого голоса на основе экспериментальных исследований спектров вокальных гласных профессиональных и непрофессиональных исполнителей введен коэффициент отношения интенсивностей формант (КОИФ).

Выявлена зависимость изменения КОИФ от частоты основного тона для всех типов мужских голосов.
Разработан новый способ корреляционного анализа вокальных акустических сигналов как нестационарных случайных процессов. Получены «нестационарные портреты» голосов профессиональных и непрофессиональных исполнителей.

Практическая значимость:

Результаты исследования позволяют дополнить субъективные оценки голоса начинающего певца объективными характеристиками на основе КОИФ и тем самым уменьшить вероятность ошибочных решений при его обучении.
На основе данных, полученных при экспериментальном исследовании спектров вокальных гласных профессиональных исполнителей, разработан алгоритм и проведено моделирование устройства коррекции певческого голоса с использованием КОИФ. Полученные программные решения могут быть применены в практике обучения вокалистов с целью прогнозирования звучания их голосов в будущем, а также при обработке старых аудиозаписей с грампластинок и в других областях.
Разработанный и экспериментально апробированный метод корреляционного анализа вокальных акустических сигналов как нестационарных случайных процессов позволяет проводить визуальную трактовку результатов без специального технического образования.
Разработана методика анализа изменения мгновенной частоты акустических вокальных сигналов, позволяющая оценить форму и размах певческого вибрато, а также его нестационарный характер.

Методы исследования. Проведенные в работе исследования базируются на применении теории спектрального анализа, теории планирования эксперимента, а также корреляционного анализа случайных процессов. Используются также методы экспериментальных исследований акустических сигналов и методы цифрового моделирования.

9 Внедрение результатов работы. Полученные при выполнении диссертационной работы результаты нашли применение в научных исследованиях и учебном процессе кафедры теоретических основ радиотехники ТТИ ЮФУ в курсах «Акустика» и «Зрительно-слуховое восприятие аудиовизуальных программ», а также в Ростовской государственной консерватории (академии) им. СВ. Рахманинова. Использование новых научных результатов позволило улучшить методическое обеспечение, повысить наглядность и дать новые знания по указанным дисциплинам, а также повысить эффективность учебного процесса у студентов-вокалистов.

Апробация работы. Отдельные результаты работы докладывались и обсуждались на следующих конференциях: VII и VIII Всероссийская научная конференция студентов и аспирантов «Техническая кибернетика, радиоэлектроника и системы управления» Таганрог, ТРТУ, 2004 г., 2006 г.; Международные научные конференции «Оптимальные методы решения научных и практических задач» (2005 г.), «Цифровые методы и технологии», (2005 г.), «Информационные технологии в современном мире» (2006 г.), «Проблемы развития естественных, технических и социальных систем» (2007 г.), «Проектирование новой реальности» (2007 г.); «Информация, сигналы, системы: вопросы методологии, анализа и синтеза» (2008 г.), «Инновации в обществе, технике и культуре» (2008 г.), Таганрог, ТРТУ, ТТИ ЮФУ; Международная научно-техническая конференция студентов, аспирантов и ученых «Молодежь и современные проблемы радиотехники и телекоммуникаций «РТ-2006», Севастополь, СевНТУ, 17-21 апреля 2006 г.; Международная научно-практическая конференция студентов и аспирантов «Музыкальное искусство и наука в современном мире», Астрахань, АГК, 18 мая 2006 г.; Международная научная конференция «Информационная культура общества и личности в XXI веке», Краснодар, КГУКиИ, 20-23 сентября 2006 г.; Всероссийская научная конференция «Психология и фониатрия: их роль в воспитании молодых вокалистов», Астрахань, АГК, 8-9 ноября 2007 г.; LIII научно-техническая конференции профессорско-преподавательского состава, аспи-

10 рантов и сотрудников ТТИ ЮФУ, Таганрог, ТТИ ЮФУ, 2008 г.; Всероссийская научная конференция с международным участием «Исполнительское искусство и музыковедение. Параллели и взаимодействия», Москва, ГКА им. Маймонида, 6-9 апреля 2009 г.; IV Международная научная конференция «Музыка народов мира: проблемы изучения», Москва, МГК им. П.И. Чайковского, 11-12 апреля 2009 г.

Публикации. По теме диссертации опубликовано 16 научных работ, из них 5 статей (3 статьи в центральной печати) и 11 статей и тезисов докладов на научно-технических конференциях.

Структура диссертационной работы. Диссертация состоит из введения, четырех глав, заключения, списка использованной литературы. Содержание диссертации изложено на 146 страницах и включает 105 рисунков, 32 таблицы и список литературы из 65 наименований.

СОДЕРЖАНИЕ РАБОТЫ

Во введении обоснована актуальность темы диссертации, обозначены цель и основные задачи, которые необходимо решить для достижения поставленной цели, показаны научная новизна и практическая значимость работы, сформулированы научные положения, выносимые на защиту, приведено краткое содержание диссертационной работы.

В первой главе рассмотрены основные характеристики и особенности разговорной и вокальной речи. В п. 1.1 описан процесс образования и восприятия речевых сигналов, рассмотрена резонаторная функция речевого аппарата, приведен обзор физических и электрических моделей формирования речевого и вокального звука, а также моделей голосового тракта. В п. 1.2 рассматриваются основные характеристики вокальной речи.

Следствием отличий вокальной речи от разговорной является более широкий частотный диапазон, большой динамический диапазон, особое спектральное распределение мощности и пр.

Субъективные оценки тембра певческого голоса связаны, прежде всего, с его спектральными характеристиками (звонкость, яркость, полетность и др.), которые зависят как от спектрального состава звука, создаваемого голосовым источником, так и от использования резонансных свойств артикуляционных органов. Поэтому особые требования к тембру певческого голоса приводят к особенностям в настройке резонансов голосового тракта, т.е. его формантных частот.

Одним из главных отличий вокальной речи от разговорной является высокая певческая форманта - это группа усиленных обертонов в области 2000-2700 Гц у мужчин и 2700-3500 Гц у женщин, придающих голосу звонкость и полетность. Также в спектре голоса певца присутствуют область низкой певческой (первой речевой) форманты (НПФ) (200 Гц - 1200 Гц) и область средней певческой (второй речевой) форманты (СПФ) (800 Гц - 1800 Гц).

Природа образования НПФ общепризнанна и не подвергается сомнению со стороны исследователей, однако механизм образования ВПФ вызывает споры. В п. 1.3 рассматриваются две основных теории образования высокой певческой форманты: образование ВПФ посредством эффекта «краевых тонов» Е.А. Рудакова и резонансная теория происхождения ВПФ В.П. Морозова.

По мнению Е.А. Рудакова, механизмом происхождения высокой певческой форманты является «краевой тон» голосовых связок, формируемый подобно свисту. В момент фазы смыкания и размыкания голосовых связок между ними на очень короткое мгновение создается небольшое отверстие, через которое прорывается подсвязочное давление, создающее «вихри» и «краевые тоны» с частотой приблизительно около 3000 Гц.

Из этой теории следует, что интенсивность верхней форманты зависит:

от геометрической формы отверстий, возникающих между связками;
от интенсивности подсвязочного давления.

Из этой теории также следует, что верхняя форманта должна представлять собой серии прерывистых, быстро затухающих колебаний. В доказа-

12 тельство этого в его статьях приводились фотографии импульсов верхней форманты на электронном или шлейфовом осциллографе.

В.П. Морозов считает, что края голосовых связок при пении нот разной силы и высоты сильно изменяют свои физические свойства. Это должно было бы сказываться и на изменении частотных характеристик высокой певческой форманты. Однако этого не происходит, и у хороших певцов частота высокой форманты при изменении силы и высоты голоса остается практически неизменной. Поэтому В.П. Морозов говорит «скорее о резонансном механизме ее происхождения».

В диссертации предлагается взгляд на эту проблему с точки зрения теории сигналов.

Модель формирования ВПФ голосовыми связками была представлена в виде периодической последовательности импульсов с огибающей в форме усеченных косинусоид с высокочастотным заполнением.

После расчетов видно, что спектр такой последовательности имеет гармоники (номера гармоник 21 - 28) большой интенсивности именно на частоте высокой певческой форманты. Для вычисления данного спектра частоту основного тона взяли равной 123 Гц (что соответствует si малой октавы), частоту высокочастотного заполнения усеченных косинусоид, равную 3000 Гц.

Анализ голосов профессиональных исполнителей показал, что добротность резонансных полостей, настроенных на область высокой певческой форманты, имеет значения в пределах от 3 до 7. Такие значения добротности резонаторов не могут обеспечить высокую интенсивность ВПФ, которая наблюдается в спектрах голосов профессиональных вокалистов.

Таким образом, при постановке голоса у профессиональных исполнителей возникает механизм образования ВПФ посредством эффекта «краевого тона» с последующим выделением в резонаторной области, поэтому теории образования высокой певческой форманты Е.А. Рудакова и В.П. Морозова являются взаимодополняющими.

Во второй главе описывается методика и приводятся результаты экспериментального анализа певческих голосов на основе коэффициента отношения интенсивностей формант. В п. 2.1 описывается методика спектрального анализа вокальных гласных и производится оценка погрешностей измерений.

Для получения спектра детерминированного сигнала используется дискретное преобразование Фурье.

Однако для нестационарных сигналов типа речевых сигналов преобразование Фурье всей реализации нецелесообразно, так как спектр речи изменяется во времени. Более полезной характеристикой распределения энергии речевого сигнала является преобразование Фурье на коротком интервале (мгновенный спектр).

Для данной работы спектры вокальных гласных были получены с помощью программ Cool Edit Pro 2.0 и Adobe Audition 1.5 с применением быстрого преобразования Фурье. При спектральном анализе в этих программах использовалась весовая функция Блэкмана-Харриса.

В этом подразделе также описывается методика экспериментального исследования голосов профессиональных исполнителей (Н. Гяурова, Б. Христова, Г. Отса, Д. Хворостовского, М. Ланца, С. Лемешева и др.) путем записи фонограммы с аудионосителя на жесткий диск компьютера с применением цифровой обработки аудиосигнала в Windows PCM формат с расширением wave. Описаны характеристики микрофона и персонального компьютера, с помощью которого производились запись и оцифровывание аудиосигналов. Представлены спектры вокальных гласных профессиональных исполнителей. В п. 2.2 представлены результаты экспериментального исследования фор-мантных характеристик спектров вокальных гласных профессиональных и непрофессиональных исполнителей. Исследования проводились для групп мужских голосов «бас», «баритон» и «тенор». Формантные области их голосов следующие: область низкой певческой форманты (НПФ) для баса: (300-700) Гц, для баритона: (380-700) Гц, для тенора: (500-900) Гц; область высо-

14 кой певческой форманты (ВПФ) для баса: (1600-2600) Гц, для баритона: (2000-2700) Гц, для тенора: (2100-2800) Гц.

Определено влияние изменения частоты основного тона на изменение отношения интенсивностей высокой и низкой певческих формант на отдельно взятом произведении для двух вокальных гласных: «А» и «Е» (исполнители: Г. Отс, Н. Гяуров и Д. Хворостовский, произведение - романс П.И. Чайковского «Серенада Дон Жуана»). Гласные взяты из одних и тех же слов, чтобы не нарушать эмоциональный настрой, заложенный в произведении.

Проведено исследование отношения интенсивностей высокой и низкой певческих формант на разных частотах основного тона, распределенных не в отдельных гласных, взятых из разных слов вокального произведения, а по отдельно взятым музыкальным фразам романса П.И. Чайковского «Прими-ренье» в исполнении Е. Образцовой, Д. Хворостовского и С. Лемешева.

Вычислен средний (по диапазону частот) коэффициент отношения интенсивностей высокой и низкой певческих формант для шести гласных на каждой ноте. Для удобства средний коэффициент отношения интенсивностей ВПФ и НПФ для всего диапазона исполнения певца для всех вокальных гласных был назван коэффициентом отношения интенсивностей формант (КОИФ). Полученные данные сведены в таблицы, а также представлены графически. Исследовано поведение КОИФ для трех разных профессиональных исполнителей (Е. Образцовой, Д. Хворостовского и С. Лемешева).

Из проведенного анализа видно, что значение КОИФ, в основном, тем выше, чем выше частота основного тона. Следовательно, будет уместно более подробное исследование поведения коэффициента отношения интенсивностей формант в зависимости от частоты основного тона для всего диапазона исполнения голоса как профессиональных, так и непрофессиональных исполнителей с целью выявления определенных закономерностей и использования последних с практической целью.

Для проведения исследования были выбраны диапазоны исполнения музыкальных звуков, присущие каждой группе мужских голосов (бас, баритон,

15 тенор). Всего по 12 тонов (полутоны нами не учитывались, так как в данном случае принципиального значения это не имеет). На каждой ноте вычислялось значение отношения интенсивностей высокой и низкой певческих формант для каждой из шести основных вокальных гласных (А, Э, И, О, У, Ы) для того, чтобы впоследствии можно было проследить изменение этого отношения в зависимости от частоты основного тона. Также был вычислен средний (по диапазону частот) КОИФ для шести гласных на каждой ноте.

Проведенные исследования выявили закономерность изменения коэффициента отношения интенсивностей высокой и низкой певческих формант в зависимости от частоты основного тона: КОИФ зависит от частоты основного тона и носит возрастающий характер.

В третьей главе рассмотрены вопросы коррекции вокальных гласных непрофессионального исполнителя с помощью КОИФ путем приближения его значения к эталонному. В п. 3.1 производится сравнение КОИФ с Коэффициентом звонкости В.П. Морозова, который определяется как отношение интенсивности ВПФ к общей суммарной интенсивности гласного, в котором эта форманта измеряется. Однако, на восприятие слушателем певца, влияет не только звонкость его голоса, определяемая ВПФ, но и низкочастотные обертоны, принадлежащие области НПФ (грудной резонатор). Исходя из этого, можно сделать предположение, что коэффициент отношения интенсивностей формант является количественной характеристикой этого баланса. Значения КОИФ для профессиональных певцов, как эталонные, можно применить в практике обучения вокалистов, программно или аппаратно изменяя интенсивности певческих формант в спектрах вокальных гласных непрофессиональных исполнителей с целью прогнозирования звучания их голосов в дальнейшем при правильной постановке голоса.

В п. 3.2 исследуется влияние соотношения высокой и низкой певческих формант на восприятие вокального звука. Производится сопоставление КОИФ для разных певцов и рассматривается отличие их голосов в субъективном восприятии. Из статистических данных, приведенных в предыдущем

Об особенностях формирования высокой певческой форманты

На современных этапах развития науки и техники появилась возможность глубокого анализа человеческой речи для выявления особенностей формирования акустических речевых и вокальных сигналов, их характеристик с целью повысить уровень осведомленности о сложном механизме ре-чеобразования для применения этих знаний в различных научных и прикладных областях.

Речевой сигнал является средством передачи разнообразной информации - словесной (вербальной) и эмоциональной (невербальной). Для быстрой передачи информации в процессе эволюции был сформирован структурированный акустический сигнал. Для создания такого специализированного акустического сигнала используется голосовой аппарат, совмещенный с физиологическим аппаратом, предназначенным для дыхания и жевания [1].

Процесс образования и восприятия речевых сигналов, включает в себя следующие основные этапы [1,3]: 1. формулировка сообщения; 2. кодирование в языковые элементы; 3. нейромускульные действия; 4. движения элементов голосового тракта; 5. излучение акустического сигнала; 6. спектральный анализ и выделение акустических признаков в периферической слуховой системе; 7. передача выделенных признаков по нейронным сетям; 8. лингвистический анализ (распознавание языкового кода), понимание смысла сообщения.

Способы звукоизвлечения, которые используются в духовых инструментах, используются и в процессе образования разговорной и вокальной речи, которая имеет большие возможности, недоступные ни одному инструменту.

Исследования голоса проводятся уже больше века. Одним из первых подходов в изучении голосообразования явился физиологический анализ. На рис. 1.1 представлен сагиттальный разрез голосового аппарата человека [39].

Схема голосообразующего тракта человека в сагиттальном разрезе 1 - мягкое небо, 2 - язык, 3 -задняя стенка глотки, 4 - контуры шейных позвонков, 5 - контуры черпаловид-ных хрящей гортани, 6 - подсвязочное пространство, 7 - полость трахеи, 8 - бронхи, 9 - носовая полость, 10 - твердое небо, 11 - зубы, 12 - верхняя губа, 13 - ротовая полость, 14 - полость глотки, 15 - надгортанник, 16 - надгортанное пространство, 17 - голосовые связки

Как показали многие исследования [1-3, 8-11, 51, 52, 55, 65 и др.], звук, который порождают голосовые связки при своем вибрировании, содержит не только один основной тон, но еще и много обертонов различной высоты. Однако связочный звук не похож на звуки речи - гласные и согласные: свой естественный тембр человеческий голос приобретает благодаря системе резонаторов [38-40].

Важнейшими резонаторами в голосовом аппарате человека являются глотка и ротовая полость. При наблюдении за ними при помощи рентгеновского аппарата во время речи или пения, можно наблюдать изменения объема и формы этих резонаторов [38, 65].

При изменениях объема и формы ротового и глоточного резонаторов акустическая настройка их меняется, они участвуют в образовании различных гласных и согласных звуков [39].

Резонатором также служит носовая полость. При неизменном объеме она изменяет тембр голоса и участвует в образовании гласных и согласных. Это осуществляется с помощью мягкого неба, регулирующего степень акустической взаимосвязи носовой полости с рото-глоточным резонатором [40].

Исследователь Л.Б. Дмитриев [40], рассматривая голосовой аппарат певцов при помощи рентгена, обнаружил, что у лучших из них во время пения образуется небольшая надгортанная полость. Сверху эта полость отделяется от гортани сужением, образуемым надгортанником и мягкими тканями чер-паловидных хрящей (см. рис. 1.1). Расчеты В.П. Морозова [39, 40] показали, что размеры этой полости соответствуют резонансу высокой певческой форманты (группы усиленных обертонов в области 2000 - 3500 Гц в зависимости от типа голоса) [38].

Другой точки зрения относительно происхождения высокой певческой форманты придерживался исследователь Е.А. Рудаков [44]. Он считал, что высокая певческая форманта есть результат трения воздушной струи о края голосовых связок, т. е. подобна природе обычного свиста (эффект «краевого тона»). «Именно поэтому, - считает Е.А. Рудаков, - частота высокой певческой форманты не зависит от изменений размеров резонаторов, которые происходят во время пения различных гласных и разных по высоте нот» [44]. Особенности формирования высокой певческой форманты более подробно будут рассмотрены ниже (см. п.п. 1.3).

Исследование формантной структуры основных вокальных гласных на основе КОИФ на всем диапазоне исполнения мужских голосов (бас, баритон, тенор)

Для обеспечения необходимой громкости звучания певческого голоса на фоне аккомпанемента, и, особенно, оркестра, необходимо, развивать значительно более высокий уровень звукового давления (громкость звука), поэтому в процессе многолетнего совершенствования техники пения, прежде всего оперного (итальянского bel canto), были отработаны особые приемы перестройки спектральных характеристик голоса, в частности создание высокой певческой форманты [2, 3, 40, 44].

Алдошина И.А. [1-3] при сравнении расположения формантных частот для одних и тех же гласных в обычной и вокальной речи, выяснила, что для всех гласных положение первой форманты на шкале частот мало изменилось, вторая форманта в случае вокальной речи сдвинута по частоте вниз, значительно изменились положения третьей, четвертой и пятой формант в сторону их совместного сближения [3].

При анализе спектральных огибающих любого из гласных звуков при речи и пении [10-15, 38-40] наблюдается наличие выраженного пика в области 2...3,5 кГц. Этот пик создается в результате объединения третьей, четвертой и пятой формант и является высокой певческой формантой (ВПФ). Такая группа подчеркнутых формант наблюдается только в спектрах хорошо поставленных, в основном оперных, голосов, как показано в работах В.П. Морозова [38-40] и нами [9-12, 14]. При этом центральная частота располагается в зависимости от типа голоса в области: бас и баритон - 2...2,5 кГц, тенор -2,5...2,8 кГц, сопрано - 3...3,5 кГц. Стоит отметить, что ВПФ находится в зоне максимальной чувствительности слуха 2 — 5 кГц [28], что положительно сказывается на ее восприятии.

Морозов В.П. заметил, что «для одного и того же певца эта форманта не смещается по частоте, она стабильно занимает одно и то же положение при пении нот разной высоты или разных гласных» [39].

Интенсивность ВПФ зависит как от амплитуд объединяемых формант, так и от амплитуд соответствующих обертонов в спектре голосового источника. Это, в свою очередь, зависит от особенностей использования голосового источника (в частности, скорости и силы сведения при колебаниях голосовых связок). Алдошина И.А. [3] отмечает: «...поскольку при увеличении громкости огибающая спектра звука голосового источника меняется и увеличивается амплитуда высоких обертонов, то и амплитуда певческой форманты будет в громких звуках выше».

Исследования, выполненные В.П. Морозовым [38, 39], показали, что при прослушивании записей певческих голосов, из которых электрическим путем вырезалась высокая певческая форманта, в голосе теряется звонкость, полетность, чистота и ясность тембра, голос звучит тускло, глухо, невыразительно.

При выделении полосовым фильтром области высокой певческой форманты ее звук воспринимается как звонкий и мелодичный, похожий на свист. Он слышен при исполнении любой вокальной гласной, усиливаясь при увеличении громкости. Эти опыты позволили В.П. Морозову установить, что от наличия и амплитуды высокой певческой форманты зависит звонкость певческого голоса [40]. Алдошина И.А. [3] пишет: «Однако основной причиной использования певческой форманты в оперных голосах является, по-видимому, повышение помехоустойчивости голоса». И объясняет это следующим: «Средний уровень оркестра при достаточно громком исполнении в концертном зале составляет 90...100 дБ. Создание такого среднего уровня выше возможностей человеческого голоса. Кроме того, маскирующее действие оркестра зависит от частотного распределения спектральных уровней. Если сравнить огибающую долговременного спектра для звуков оркестра и для звуков нормальной речи и пения (рис. 1.8), то видно, что максимум энергии в звуках оркестра находится в области 400...500 Гц, затем ее уровень быстро спадает и в области 2,5...3 кГц становится ниже на 20 дБ».

Как уже указывалось выше, в певческом голосе до 50% энергии может быть сосредоточено в певческой форманте в области 2...3,5 кГц, которая совпадает с областью максимальной чувствительности слуха. Такая перегруппировка формант позволяет услышать певческий голос на фоне оркестpa. Это свойство голоса «перекрывать» или «прорезать» оркестр называется «полетностью» [1-3, 38-40].

Как уже указывалось выше, в певческом голосе до 50% энергии может быть сосредоточено в певческой форманте в области 2...3,5 кГц, которая совпадает с областью максимальной чувствительности слуха. Такая перегруппировка формант позволяет услышать певческий голос на фоне оркестра. Это свойство голоса «перекрывать» или «прорезать» оркестр называется «полетностью» [1-3, 38-40].

В.П. Морозов [40] и другие исследователи пришли к выводам, что низкая певческая форманта (НПФ), во-первых, представляет для певческого голоса значительно большую роль, чем это считалось раньше, а во-вторых, -происхождение НПФ связано с резонансной активностью двух наиболее крупных полостей голосового тракта певца: ротоглоточного и трахеобронхиального резонаторов.

Аналогия голосового аппарата и духовым инструментам (труба, корнет, тромбон, валторна, туба и др.) признается многими исследователями [39], поскольку в обоих случаях возбудителем звука служат эластические складки (голосовые связки певца или особым образом сформированные в амбушюре губы музыканта), колеблющиеся под действием тока выдыхаемого певцом или музыкантом воздуха.

Моделирование цифровых полосовых фильтров для выделения областей верхней и нижней формант в устройстве коррекции

Опираясь на полученные результаты, введем так называемый эталонный коэффициент (Кэт), который в дальнейшем потребуется для коррекции вокальных гласных неквалифицированного исполнителя. Возьмем неквалифицированного исполнителя, голос которого принадлежит к группе голосов «баритон». Определим для этой группы голосов эталонный коэффициент, полученный из значений КОИФ для профессиональных певцов (баритонов) Г. Отса и Д. Хворостовского, равный 0,86.

В нашем случае предлагается коррекция уровня ВПФ в зависимости от уровня НПФ и частоты основного (/-го) тона с помощью коэффициента КЭт -,, взятого из таблицы «Усредненные значения КОИФ для шести гласных на каждой ноте» методами цифровой обработки сигналов.

Как уже указывалось выше, КОИФ - это коэффициент отношения ин-тенсивностей высокой и низкой певческих формант в зависимости от частоты основного тона. Он вычислялся путем определения в спектре вокальной гласной максимальных значений интенсивности в областях ВПФ и НПФ для каждого певца и на каждой ноте отдельно. То есть: Чтобы количественно охарактеризовать степень выраженности ВПФ в гласных у различных певцов, В.П. Морозов определил отношение интенсивности ВПФ (Щ) к общей суммарной интенсивности гласного (U), в котором эта форманта измерялась (U// U ). Обе эти величины выражались в милливольтах: Uf измерялось на выходе одного из четвертьоктавных фильтров в полосе 2100-3500 Гц, a Uz — непосредственно на выходе магнитофона [39, 40].

Имея в виду, что ВПФ придает голосу певца, прежде всего такое важное профессиональное качество, как звонкость, процентное содержание ВПФ в спектре голоса певца В.П. Морозов назвал коэффициентом звонкости голоса [39]:

Однако, на восприятие слушателем певца, влияет не только звонкость его голоса, определяемая ВПФ, но и низкочастотные обертоны, принадлежащие области НПФ (грудной резонатор). Сам В.П. Морозов пишет, что «обе певческие форманты оказываются важными для голоса, и нарушение гармонического баланса между уровнями ВПФ и НПФ приводит к ухудшению его эстетических качеств» [40]. Исходя из этого, можно сделать предположение, что коэффициент отношения интенсивностей формант является количественной характеристикой этого баланса. Значения КОИФ для профессиональных певцов, как эталонные, можно применить в практике обучения вокалистов, программно или аппаратно изменяя интенсивности певческих формант в спектрах вокальных гласных непрофессиональных исполнителей с целью прогнозирования звучания их голосов в дальнейшем при правильной постановке голоса.

В.П. Морозов писал, что «коэффициентом звонкости можно определить процентное содержание ВПФ в спектре сигнала, и он более адекватно (на слух) отражает понятие звонкости голоса, чем оценка по соотношению мощности (как квадратичного показателя напряжения) в дБ, т.к. в этом случае большему Кзв будет соответствовать меньшее число дБ со знаком минус» [39]. Однако для коррекции этот коэффициент не удобен, т.к. с помощью него нельзя установить нужный баланс между высокой и низкой певческими формантами.

КОИФ имеет прикладное значение: во-первых, с помощью него можно оценивать профессионализм исполнителя, сравнивая с эталонными значениями, полученными статистической обработкой большого количества во- кальных гласных на всем диапазоне исполнения для всех групп голосов (пока только мужских); во-вторых, с помощью него можно корректировать не только голоса непрофессиональных исполнителей в учебных целях, но и голоса старых исполнителей, взятых с грампластинок, в АЧХ которых наблюдается резкий спад в области высоких частот, захватывающий и область ВПФ. Из статистических данных, приведенных в предыдущей главе, и из рисунка 2.43 отчетливо виден рост коэффициента отношения интенсивностей формант как в зависимости от частоты основного тона, так и в зависимости от типа голоса исполнителя.

Для басов характерен, выражаясь вокальной терминологией, «глубокий звук», и на восприятии слушателем отображается более зычным и насыщенным низкими обертонами звучанием. Это объясняется более выраженной низкой певческой формантой в спектрах вокальных гласных этих певцов, которая образуется в двух наиболее крупных полостях голосового тракта певца - ротоглоточном и трахеобронхиальном (грудном) резонаторах (см. раздел 1.3).

Значение коэффициента отношения интенсивностей формант подтверждает вышесказанное, для басов КОИФ самый невысокий - 0,5.

Для теноров средний по диапазону КОИФ равен 1,04, хотя есть всплески до значения 5,61 (см. рис. 2.21) у С. Лемешева. Наиболее высокие значения КОИФ (для всех трех типов мужских голосов) на гласных «И» и «Ы» (см. таблицы 2.10-2.26), которые, соответственно и воспринимаются слушателем как одни из самых звонких гласных. Баритон по типу голоса находится между басом и тенором, т.е. воспроизводимые частоты основного тона выше, чем у баса, но ниже, чем у тенора, и тембр тоже средний между этими двумя типами голосов (хотя есть средние голоса между баритоном и тенором, например, лирический баритон). Значения КОИФ для баритонов также занимают промежуточное значение между басами и тенорами - среднее значение 0,86.

Интонационный анализ исполнения романса П.И. Чайковского профессиональными вокалистами

Как известно, нестационарные процессы - это процессы, статистические свойства которых меняются во времени. Большая часть физических процессов-носит нестационарный характер. Поскольку вывод о нестационарности процесса является негативным утверждением, которое констатирует отсутствие свойств стационарности, многие процессы произвольно полагаются стационарными только приближенно для упрощения анализа [22].

Если к анализу вокальной- речи применить теорию случайных процессов, то замена нестационарного-процесса стационарным нежелательна, т.к. в этом случае теряется часть полезной информации, содержащая индивидуальные особенности исполнителя. К индивидуальным особенностям исполнителя-вокалиста относятся: 1. Спектральный состав голоса (у каждого певца и на каждой ноте наблюдается разное количество спектральных составляющих в зависимости от высоты тона, гласной и особенностей профессиональной подготовки вокалиста). 2. Высокая певческая форманта (группа высших обертонов, обладающих высокой интенсивностью в диапазоне (1800 - 3500) Гц (в зависимости от типа голоса), находящихся в области максимальной чувствительности слуха). 3. Амплитудная и частная модуляция звуковых колебаний -вибрато. 4. Интонация - изменение мгновенной частоты основного тона. 5. Динамика громкости. 6. Агогика - особенность музыкального- исполнения, заключающаяся в отклонении от темпа и метра в целях художественной выразительности [60]. Все шесть пунктов являются определяющими факторами достижения. максимального эмоционального воздействия.на слушателя, причем 2 и 3 присущи только вокальной речи, а другие имеют для вокальной речи свои особенности. Каждая из характеристик певческого голоса является объектом научных исследований на протяжении последних ста лет, но до сих пор многие результаты и выдвинутые на их основе теории подвергаются критике со стороны других исследователей.

Голос певца не является инструментом с равномерно-темперированным строем и процесс звукообразования при академическом пении сложен и зависит от профессионализма исполнителя и его индивидуальности. Вокалист не может исполнить одну и ту же ноту абсолютно одинаково, то есть с одним и тем же размахом и формой вибрато, с той же высотной интонацией (без отклонения, хотя бы на несколько центов) и с такой же интенсивностью высокой певческой форманты.

При рассмотрении каждой из этих характеристик можно утверждать, что все они носят нестационарный характер, так как их параметры меняются во времени [19]. Например, при таком звуковом эффекте как вибрато отклонение от частоты основного тона может изменяться в пределах от 7 до 240 центов, то есть от пороговой величины различия изменений высоты звука (5-6 центов) до величины большей, чем целый тон [43]. Но это не сказывается негативно на слушателе, так как зритель воспринимает этот звук как «живой» и насыщенный. Это объясняется тем, что при вибрато звук в пределах ±100 центов изменяется непрерывно, без остановок и происходит это настолько быстро (6-7 раз в секунду), что человеческий слух не успевает различить всех происходящих изменений частоты. Однако изменение формы и частоты вибрато не является строго периодической функцией. Она меняется во времени не по гармоническому закону. На рис. 4.1 представлена спектрограмма вокальной гласной «а», исполненной Д. Хворостовским на ноте fa# 1 (ЧОТ 370 Гц) октавы в музыкальной фразе «О, выйди, Нисета, скорей иА балкон» в финальной части романса П.И. Чайковского «Серенада Дон Жуана». Длительность реализации составляет 1,5 секунды (представлена область частот до 4 кГц).

Как видно из рис. 4.1, вибрато не является строго периодической функцией и его можно рассматривать как случайный процесс.

Известно, что автоматическое частотное вибрато, широко используемое в электромузыкальных инструментах и различных программных пакетах обработки звука благотворно сказывается на тембрах многих синтезируемых инструментов, сменяя утомительное для слуха постоянное воздействие тонов их периодическим колебательным движением, захватывающим некоторую зону частотного ощущения для каждого из входящих в спектр звука тонов. Однако для голоса автоматическое вибрато не приемлемо, поскольку исполнительское вибрато представляет осмысленное и основанное на искусстве дополнение и развитие мелодического рисунка и служит средством и элементом художественной выразительности [24]. Поэтому намеренное допущение при анализе вокальной речи того, что она является стационарной, лишает исследователя полезной информации об индивидуальности исполнителя.

В качестве примера представим результаты анализа вокальной речи профессионального вокалиста исполнившего на ноте faU малой октавы гласную «и», избегая при этом вибрато. Спектр этой вокальной гласной представлен на рис. 4.2.

Затем был синтезирован этот же звук путем выделения колебания в пределах одного периода и повторения его до длины исходной реализации. После прослушивания исходного и полученного фрагментов не было замечено какой-либо разницы на слух. Необходимо отметить, что анализируемый звуковой фрагмент был выделен из реализации звуковых колебаний исполнителя без участка атаки звука и его завершения. Спектр синтезированного колебания представлен на рис. 4.3.

Исследование вокальной речи как нестационарного случайного процесса и разработка критериев объективной оценки певческого голоса Бакаев Александр Васильевич

Об особенностях формирования высокой певческой форманты

Исследование формантной структуры основных вокальных гласных на основе КОИФ на всем диапазоне исполнения мужских голосов (бас, баритон, тенор)

Моделирование цифровых полосовых фильтров для выделения областей верхней и нижней формант в устройстве коррекции

Интонационный анализ исполнения романса П.И. Чайковского профессиональными вокалистами

Похожие диссертации на Исследование вокальной речи как нестационарного случайного процесса и разработка критериев объективной оценки певческого голоса