Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Идентификационные характеристики иноязычного говорящего (экспертно-криминалистический аспект) Курьянова Ирина Владимировна

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Курьянова Ирина Владимировна. Идентификационные характеристики иноязычного говорящего (экспертно-криминалистический аспект): диссертация ... кандидата Филологических наук: 10.02.21 / Курьянова Ирина Владимировна;[Место защиты: ФГБОУ ВО «Московский государственный лингвистический университет»], 2019

Содержание к диссертации

Введение

Глава I. Состояние проблемы идентификации говорящего применительно к спонтанной диалогической иноязычной речи 22

1.1. Сущность, понимание и задачи фоноскопической экспертизы применительно к идентификации говорящих по голосу и речи 22

1.2. Современное состояние проблемы идентификации дикторов по голосу и речи применительно к иноязычной речи 34

1.3. Специфика восприятия иноязычной речи в акте коммуникации 43

1.4. Выводы 55

Глава II. Исследование информативных просодических характеристик на материале таджикского и цыганского языков 57

11.1. Лингвистическая информация, необходимая для изучения просодического строя таджикского и цыганского языков 57

11.1.1. Лингвистический паспорт таджикского языка (фонетико-фонологический аспект) 59

11.1.2. Лингвистический паспорт цыганского языка (фонетико-фонологический аспект) 69

11.2. Информативные просодические характеристики неподготовленной речи, применяемые при анализе мелодических контуров 77

11.2.1. Синтагма 82

11.2.2. Ядерный слог и ядерно-заядерный участок 87

11.2.3. Шкала и предшкала 92

11.2.4. Пауза хезитации 95

II.2.5. Максимальный по длительности анализируемый речевой фрагмент (фоноабзац) 96

11.3. Параметры описания типов/подтипов мелодического контура 99

11.4. Принципы сравнения фонограмм методом структурно-мелодического анализа 109

Глава III. Обсуждение результатов исследования идентификации иноязычного говорящего с опорой на просодические параметры 119

111.1. Экспериментальный корпус 119

111.2. Экспериментально-фонетическое исследование речевых высказываний лиц, говорящих на иностранных языках, методом перцептивно-слухового анализа 123

111.2.1. Методика проведения эксперимента №1 (первый этап) 123

111.2.2. Результаты экспериментального исследования №1 (первый этап) 126

111.2.3. Методика проведения эксперимента №1 (второй этап) 132

111.2.4. Результаты экспериментального исследования №1 (второй этап) 138

111.3. Экспериментально-фонетическое исследование речевых высказываний лиц, говорящих на иностранных языках, методом автоматизированного акустического анализа 146

111.3.1. Методика эксперимента №2 146

111.3.2. Результаты экспериментального исследования №2 152

111.4. Выводы 164

111.5. Методические рекомендации по отбору материала для сравнительного исследования 165

Заключение 170

Список литературы 179

Приложение 1 206

Приложение 2 212

Приложение 3 214

Приложение 4 217

Приложение 5 219

Сущность, понимание и задачи фоноскопической экспертизы применительно к идентификации говорящих по голосу и речи

Использование специальных знаний в уголовном судопроизводстве имеет давнюю историю: еще в 1879 году в журнале «Нэйчер» вышла статья Уильяма Хершела о тайне папиллярных линий и возможностях дактилоскопической экспертизы [Торвальд 1991]. Пройдя долгий путь развития от идеи словесного портрета, предложенного Эженом Франсуа Видоком, методов антропометрии, разработанных Альфонсом Бертильоном, и дактилоскопического способа идентификации, воплощенного в жизнь Френсисом Гальтоном и Эдвардом Генри, судебная экспертиза, на сегодняшний день, является самостоятельным научным направлением, которое имеет в своем распоряжении новые высокотехнологичные способы идентификации личности, в частности фоноскопию, которая становится все более востребованной [Голощапова, Курьянова 2011с; Курьянова, Лопаткин 2017; Курьянова 2018].

Впервые судебная экспертиза была представлена как самостоятельная отрасль научного знания в монографии А.И. Винберга и Н.Т. Малаховской «Судебная экспертология (общетеоретические и методологические проблемы судебных экспертиз)» [Винберг, Малаховская 1979]. Дальнейшее развитие судебной экспертизы связано с накоплением эмпирических фактов в различных областях знаний: не только в самой экспертизе, но и в других науках. По замечанию Т. В. Аверьяновой, решение ряда задач, стоящих перед судебной экспертизой, без интегративных связей с различными областями науки было бы просто невозможно: «анализ и синтез фактов, установленных иными науками, их теоретическое осмысление и приспособление к нуждам судебной экспертизы являются объективной основой развития судебной экспертизы как в области теории, так и в области практической экспертной деятельности» [Аверьянова 2012: 29].

Нельзя не согласиться с точкой зрения И. А. Алиева, утверждающего, что новые виды экспертиз, возникшие за последние годы, «заимствуя из накопленного опыта принципы и методологию судебной экспертизы смогли оформиться в качестве самостоятельных в относительно сжатые сроки, избежав при этом “ошибок роста”, чего не удалось сделать их предшественникам» [Алиев, Аверьянова 1992: 23].

На сегодняшний день экспертно-криминалистическое обеспечение оперативно-разыскной и уголовно-процессуальной деятельности основывается на высоком научно-техническом потенциале в области информатики, кибернетики, юриспруденции, языкознания, физики и других современных наук, поэтому деятельность экспертов становится сложнее как только с точки зрения её материально-технического исполнения, так и с точки зрения методологии исследования [Аверьянова 2012].

Интеграционные процессы в научно-практической экспертной деятельности и синтез научных знаний приводят к появлению новых технологически совершенных и надежных методов экспертного исследования. В настоящее время практически нет уголовных дел, при расследовании которых в той или иной форме не использовались бы специальные знания. Все, что позволяет идентифицировать личность – отпечаток пальца, радужная оболочка глаза, голос, устная или письменная речь – поставлено в основу раскрытия и расследования преступлений [Голощапова, Курьянова 2011с; Голощапова, Курьянова 2019].

Распространенное использование звукозаписывающей аппаратуры при проведении оперативно-разыскных мероприятий обусловило резкое увеличение числа фонограмм, приобщаемых в качестве вещественных доказательств для установления фактических данных при расследовании уголовных дел [Галяшина 2014; Курьянова, Лопаткин 2017]. Высокая потребность в производстве судебных экспертиз, содержащих результаты исследования зафиксированного на материальном носителе коммуникативного события, привели к появлению такого понятия, как «судебное речеведение» (термин Е. И. Галяшиной), которое «представляет собой раздел прикладной лингвистики, посвященный изучению речевой деятельности и ее результатов в целях решения родовых задач судебной экспертизы устных и письменных произведений речи» [Галяшина 2003а: 5]. По замечанию Е. И. Галяшиной, «судебное речеведение органически входит в … интегративную область знаний, называемую профессором Р. К. Потаповой “речеведение”, которое характеризуется антропоцентрической доминантой и охватывает не только специальную область ее приложения, регламентированную жесткими правилами юриспруденции, но и расширяет саму сферу знаний о процессе речепроизводства, восприятии и активной интерпретации текста реципиентом с учетом разнообразных экстралингвистических источников информации» [Галяшина 2003а: 5].

Экспертное исследование фонограмм как вещественных доказательств не ново для теории и практики судебной экспертизы. Как отмечает Е. И. Галяшина, «технические, научные и правовые условия возникновения отечественной экспертизы фонограмм к 1964 г. окончательно сформировались» [Галяшина 2014: 186].

Криминалистическое исследование звуковых следов преступной деятельности проводится в настоящее время в системе государственных экспертных учреждений Российской Федерации в рамках фоноскопической (или фонографической) экспертизы. Относительно названия данного вида криминалистических экспертиз существует несколько мнений [Голощапова, Кравчук 2001; Галяшина 2014b; Лебедева 2017]. В отечественной научной литературе, посвященной исследованиям по данному вопросу, в качестве названия рассматриваемого вида экспертизы встречаются такие термины, как «вокалографическая экспертиза» [Meyer, Schyuer 1932], «криминалистическая акустика» [Koristka 1982, Леви 1977], «криминалистическое исследование фонограмм» [Рамишвили 1986; Рамишвили, Чикоидзе 1991]. В ресурсах сети Интернет, посвященных различным вопросам, разрешаемым посредством экспертизы данного вида, можно встретить «лингвистическую экспертизу звучащей речи», «судебно-фонетическую», «фонологическую», «акустическую», «фонетическую» и так далее экспертизы.

В экспертно-криминалистических центрах МВД России данный вид экспертиз обозначается термином «фоноскопическая», в РФЦСЭ Минюста России – «криминалистическая экспертиза видео- и звукозаписей», в Институте криминалистики и специальной техники ФСБ России исследование фонограмм как вещественных доказательств называется «фонографической экспертизой» (исходя из объекта исследования – фонограмма). На протяжении длительного времени обсуждается необходимость приведения названия данного вида экспертизы к единообразному термину, которого до настоящего времени не сформулировано. В связи с этим вопрос о стандартизации терминологии до сих пор актуален: «При назначении экспертиз, связанных с исследованием фонограмм, как с целью решения идентификационных задач, так и диагностических, правоприменитель часто сталкивается с проблемой, как именно назвать экспертизу, которую необходимо назначить» [Лебедева 2017: 116].

По мнению ряда авторов, термин «фоноскопия» («phone» - голос, звук, шум, речь и «skopeo» - смотрю, рассматриваю, наблюдаю), предложенный в 1964 году польским криминалистом А.Шварцем [Czwarc 1988], наиболее полно отвечает задачам криминалистического исследования фонограмм [Ложкевич и др. 1984], так как точнее отражает суть процесса – исследование звука, голоса и речи [Голощапова, Кравчук 2001]. Как справедливо указывает Е. И. Галяшина, «сегодня назрела необходимость использования единого наименования в системе государственной и негосударственной экспертной деятельности в России, в качестве которого целесообразно использовать уже традиционное название “судебная фоноскопическая экспертиза”» [Галяшина 2014: 186]. Поэтому в настоящей работе используется название «фоноскопическая экспертиза».

Фоноскопическая экспертиза – род судебной экспертизы, в основе которой лежит криминалистическое исследование звуковой и речевой информации с целью идентификации человека по голосу и речи, то есть установления тождества или различия речи лиц, зафиксированной на фонограммах, а также установления иных фактов, имеющих значение при доказывании преступлений [Голощапова и др. 2010: 6].

Лингвистический паспорт цыганского языка (фонетико-фонологический аспект)

Цыганский язык относится к индоарийской ветви индоевропейских языков. Сложился в условиях изоляции от близкородственной индоарийской языковой среды, сохранив основной лексический фонд древнеиндоарийских языков и типологическую близость со среднеиндийским и новоиндийским языками [Цыганский язык в России 2013]. Исторически развитие языка цыган (или говора) происходило в виде отдельных диалектов, т.к. цыгане использовали язык и письменность тех народов, среди которых жили [Цыганский язык в России 2013]. Учеными отмечается, что, сохранив типологическую близость со среднеиндийским и новоиндийским языками, этнические группы цыган, пройдя разный миграционный путь, говорят на различных диалектах, в большей или меньшей степени подвергшихся влиянию окружающих языков: «Этногруппы цыган, пройдя разные маршруты миграций, говорят на различных диалектах, которые в большей или меньшей степени отражают влияние окружающих языков в лексике, фонетике и синтаксисе» [Шаповал 2008]. Таким образом, цыганский язык в силу своей разнородности может быть отнесен к мультидиалектной системе, на которую влияют языковые контакты с носителями доминирующего на определенной территории языка.

Цыганский язык так же, как и таджикский, отличается многодиалектностью. В соответствии с общепринятой в последнее время классификацией выделяются следующие диалектные зоны цыганского языка [Черенков 2013]:

1) северо-восточный диалект, включает говоры русских цыган (русска рома), так называемых «польских» цыган (польска рома), сибирских цыган (сибиряки, тоболяки), диалект литовских цыган (лит ска рома), диалект латышских цыган (лотфке рома). В связи с близостью говоров, входящих в данную группу, северо-восточные диалекты классифицируются как русско-цыганский (или северно-русский) макродиалект с локальными разновидностями [Черенков 2013];

2) северо-западный диалект, обладает набором характеристик, присущих диалектам цыган-синти в Германии, Австрии, Северной Италии. Отмечается большое число немецких заимствований и влияние польско-цыганских диалектов, однако северо-западный диалект до настоящего времени недостаточно изучен [Черенков 2013];

3) влашский диалект, включает говоры цыган-сэрвов (сэрвитский), влахов, кэлдэраров, цыган-ловаров.

4) балканский диалект – диалект крымских цыган (крымлыс рома);

5) центральный диалект – диалект цыган-плащунов.

Кроме указанной классификации диалектов существуют и проекты литературного языка, так, на кэлдэрарских диалектах основаны проекты наддиалектного койне – «общецыганского языка» [Цыганский язык в России 2013]. Как правило, все цыгане – билингвы, в ситуации двуязычия некоторые цыганские группы перешли на «чужую» грамматику, сохранив лишь некоторый объем этнической лексики, таким образом, претерпели существенную языковую ассимиляцию [Цветков 2013].

Согласно имеющимся о цыганском языке данным [Цыганский язык в России 2013], наиболее многочисленной в России цыганской группой являются северно-русские цыгане, носители русско-цыганского макродиалекта (по. Л. Н. Черенкову), который лёг в основу представленного лингвистического паспорта цыганского языка. В настоящее время предлагаются разные варианты алфавитов цыганского языка, в том числе экспериментальные [Смирнова-Сеславинская 2013]. В данном диссертационном исследовании принят кириллический вариант представления цыганского алфавита. При анализе и описании качества гласных и согласных звуков цыганского языка, кроме имеющихся в литературе данных и результатов собственного экспериментального исследования, были использованы материалы электронного ресурса Грацкого университета имени Карла и Франца (Karl-Franzens-Universitt Graz, Австрия), опубликованные в проекте «[romani]PROJEKT» [Romani Projekt 2019].

Цыганский вокализм.

Как показывают исследования различных говоров цыганского языка [Цыганский язык в России 2013], звуковой состав цыганского языка несущественно отличается от других языков Европы, что связано, вероятно, с тем, что подавляющее большинство языков Европы относится к индоевропейской семье. Система гласных фонем цыганского языка (русска рома) представлена 6 гласными звуками: [а], [и], [ы], [о], [у], [э], а также 3 дифтонгами, образованных с помощью -неслогового: [а], [о], [у]. Как и в русском языке, цыганские гласные дифференцируются по ряду, подъёму и наличию или отсутствию лабиализации.

Монофтонги цыганского языка:

[а] – нелабиализованный гласный нижнего подъёма, по степени продвинутости языка приближается к гласным переднего ряда (иногда описывается как смешанный ряд); эталонное звучание, в том числе после мягких согласных, сходно с русским [а];

[и] – нелабиализованный гласный верхнего подъёма переднего ряда; эталонное звучание аналогично русскому [и], предшествующий согласный при этом всегда мягкий («биби» - «тетка», «пири» - «горшок»).

[ы] – нелабиализованный гласный среднего ряда верхнего подъёма; эталонное звучание отличается от русского аналога более задней артикуляцией. Дистрибуция цыганских гласных [и] и [ы] такая же, как в русском: [и] встречается после мягких согласных, [ы] после твердых: «пыём» («упал») – «пиём» («пил»);

[о] – лабиализованный гласный заднего ряда среднего подъёма; эталонное звучание отличается от русского аналога более закрытым характером произнесения; [у] – лабиализованный гласный заднего ряда верхнего подъёма; по сравнению с русским аналогом звучит чуть более открыто, чем русский [у];

[э] – нелабиализованный гласный верхнего подъёма среднего ряда, наиболее чётко проявляется после губных и задненёбных согласных, является яркой особенностью цыганского языка, т.к. аудитивно воспринимается носителями русского языка как звук, близкий русскому [ы] (наиболее часто в безударной позиции). В случае, если этому звуку предшествует мягкая аффриката [ч], артикуляция звука становится более передней («чен» - «серьга»). Орфографический гласный переднего ряда «е» после других мягких согласных, согласно приводимым в различных исследованиях цыганского языка текстам [Цыганский язык в России 2013], встречается крайне редко.

Дифтонги цыганского языка [а], [о], [у] возникли в результате межвокального выпадения согласных фонем [Romani Projekt 2019]. Отмечается, что в некоторых диалектных группах цыган этот процесс продолжается, новые дифтонги возникают в результате использования наряду с устоявшимися формами иных вариантов с й-неслоговым, а также в результате языковых контактов (например, дифтонг [а] заменяется в большинстве случаев на дифтонг [э] у цыган-ловарей: «дэй»/«дай» - «мать») [Romani Projekt 2019].

Следует отметить, что система вокализма русского языка не оказала значительного влияния на систему гласных фонем носителей русско цыганского макродиалекта (по Л. Н. Черенкову), проживающих на территории Российской Федерации, т.к. не содержит каких-либо новых для цыганского языка гласных фонем. Основное отличие гласных фонем русского языка от цыганского проявляется в особенностях редукции некоторых безударных гласных: так называемое «аканье» в полной мере не проникло в фонетическую систему цыганского языка, поэтому для устной речи цыган характерно произнесение безударного [о]-образного гласного на месте орфографического «о» и недостаточная редукция гласного [а] в безударных слогах.

Цыганский консонантизм.

Система согласных звуков цыганского языка содержит 26 фонем: [б], [в], [г], [] (обозначается буквой «ґ» в алфавите цыганского языка, созданного на базе северно-русского диалекта [Шаповал 2008]), [д], [ж], [з], [й], [к], [л], [м], [н], [п], [р], [с], [т], [ф], [х], [ц], [ч], [ш], [д ж ], [дз], [кх], [пх], [тх]. Согласные звуки, обозначаемые в цыганском языке буквами /б, в, г, д, ж, з, й, к, л, м, н, п, р, с, т, ф, х, ц, ч, ш/ представлены теми же типами губных, переднеязычных и заднеязычных смычных, переднеязычных щелевых, а также сонантов, что и в русском языке, и не имеют существенных отличий от соответствующих звуков русского языка. Согласные [кх], [пх], [тх] – придыхательные взрывные фонемы, характерные для индийских языков [Romani Projekt 2019]. Звуки [д ж ], [дз] являются звонкими парами для аффрикат [ц], [ч] [Шаповал 2008]. Характеристика согласных звуков составлена на основе специальной литературы [Шаповал 2008; Romani Projekt 2019], а также экспериментальных данных, полученных в ходе выполнения реальных экспертиз.

Принципы сравнения фонограмм методом структурно-мелодического анализа

Сравнение статистических параметров однотипных мелодических структур осуществляется в модуле SIS II автоматически на основе полученных средних значений по каждому параметру типов/подтипов элементов мелодического контура (огибающей ЧОТ). Метод позволяет анализировать и сравнивать основные характеристики мелодических структур, представленные в численном виде как наборы значений параметров ЧОТ. Сравнению подвергаются сопоставимые участки мелодического контура (опорные фрагменты) [Курьянова 2011b; Голощапова, Курьянова 2011а; Курьянова, Елемешина 2012; Голощапова, Курьянова 2012а].

Цель структурно-мелодического анализа состоит в выявлении однотипных мелодических структур в исследуемых фонограммах и сравнении их характеристик для установления степени близости параметров мелодических контуров (огибающей ЧОТ) [Курьянова 2011а]. Данная цель достигается последовательным подбором нескольких реализаций опорных фрагментов по каждому типу/подтипу мелодического контура в сравниваемых фонограммах [Курьянова 2011b; Курьянова 2011а; Курьянова, Елемешина 2012].

Предварительная подготовка фонограмм для сравнения данным методом заключается в получении корректных графиков огибающей ЧОТ. Параметры выделяемых экспертом на графике огибающей ЧОТ однотипных участков контура, сопоставимых с точки зрения реализационной специфики, стилистической и эмоциональной насыщенности, вычисляются автоматически. Для каждой пары сравниваемых значений в модуле SIS II автоматически вычисляется разность значений, которая затем сравнивается с соответствующим порогом [Курьянова 2011b; Голощапова, Курьянова 2011а; Курьянова, Елемешина 2012; Голощапова, Курьянова 2012а].

Порог является условным пограничным значением, отделяющим сходные реализации параметров огибающей ЧОТ от различающихся, он определяет максимально допустимую разницу между значениями параметров сравниваемых фонограмм, до которой фонограммы считаются тождественными. При этом в зависимости от степени информативности параметра значение порога может находиться как внутри области внутридикторской вариативности (для наиболее информативных параметров), так и за ее пределами (для менее информативных параметров, значения которых используются только для подтверждения исключения «чужого диктора») [Курьянова 2011b; Голощапова, Курьянова 2011а; Курьянова, Елемешина 2012; Голощапова, Курьянова 2012а].

Выделение необходимых опорных речевых фрагментов проводится отдельно для каждой из фонограмм. После того как для каждой из исследуемых фонограмм будут составлены таблицы структурного мелодического анализа, эксперт переходит к сравнительному этапу исследования по данному методу.

Степень сходства/ различия вычисляется в процентном соотношении. При совпадении расстояния с порогом степень сходства оценивается в 50%. При превышении порога значения лежат в области менее 50% и убывают по мере удаления от порогового значения. Соответственно, если расстояние меньше порога, то значения превышают 50%. Нулевое расстояние (или полное совпадение) значений параметра дает 100% сходства [Курьянова 2011b; Голощапова, Курьянова 2011а; Курьянова, Елемешина 2012; Голощапова, Курьянова 2012а].

При вычислении общего результата учитываются весовые коэффициенты, приписанные каждому параметру и анализируемому типу фрагмента мелодического контура [Курьянова, Елемешина 2012]. Каждый параметр имеет свой весовой коэффициент, определяющий его долю в общей оценке степени сходства/различия по каждому из задействованных типов/подтипов огибающей ЧОТ. Присвоение весовых коэффициентов просодическим параметрам проводится с учетом степени их реализационной стабильности, с одной стороны, и различающей способности, с другой [Курьянова 2011b; Голощапова, Курьянова 2011а; Курьянова, Елемешина 2012; Голощапова, Курьянова 2012а].

В процессе сравнения для каждого типа/подтипа рассчитываются степень сходства (на основе значений более 50%) и степень различий (на основе значений мене 50%). Далее по этим частным значениям типов/ подтипов аналогичным образом, с учетом весовых коэффициентов, рассчитывается общая оценка сходства/различия сравниваемых фонограмм, на основе которой формулируется общий вывод о сходстве/различии голосов на фонограмме и выводятся вероятности ложного отклонения и ложного принятия «диктора», рассчитанные для данного соотношения сходства/различия сравниваемых характеристик [Курьянова 2011b; Голощапова, Курьянова 2011а; Курьянова, Елемешина 2012; Голощапова, Курьянова 2012а].

Далее результаты сравнения отдельных типов/подтипов суммируются для получения общего решения относительно тождества либо различия голосов: по частным значениям типов, подтипов с учетом весовых коэффициентов рассчитывается общая оценка сходства/различия сравниваемых речевых сигналов (соотношение значений FR и FA), на основе которой формулируется общий вывод о тождестве/различии голоса и речи на фонограммах [Курьянова 2011b; Голощапова, Курьянова 2011а; Курьянова, Елемешина 2012; Голощапова, Курьянова 2012а].

Для принятия обоснованного решения по результатам исследования данным методом рекомендуется использовать не менее 3-х компонентов типов/ подтипов огибающей ЧОТ, например: фоноабзац, синтагма и ядерный слог. В связи с тем, что на экспертизу для проведения идентификационного исследования по голосу и речи зачастую поступают фонограммы, длительность которых не позволяет эксперту выделить максимальный по длительности речевой фрагмент (фоноабзац), для сравнения используются подтипы синтагм, ядерные слоги, шкалы, предшкалы, ядерно-заядерные участки. Оптимальное число опорных фрагментов каждого типа/подтипа для получения статистики при сравнительном анализе мелодического контура в модуле SIS II составляет не менее 5 [Курьянова 2011b; Голощапова, Курьянова 2011а; Курьянова, Елемешина 2012; Голощапова, Курьянова 2012а].

Поскольку в процессе сравнения в модуле SIS II используются средние арифметические значения, полученные в результате обработки массива единичных значений, рассчитанных для каждого конкретного параметра огибающей ЧОТ, важную роль при сравнении играет характер варьирования значений. Варьирование может быть как естественным (в силу индивидуальных особенностей «диктора»), так и «искусственно» привнесенным вследствие каких-либо внешних факторов (например, неточностей, допущенных экспертом при обозначении принадлежности фрагмента огибающей ЧОТ к тому или иному типу) [Научно-технический отчет 2008; Научно-технический отчет 2011]. Поэтому перед стадией сравнительного исследования необходимо проанализировать характер распределения значений для каждого из сравниваемых типов/подтипов фрагментов огибающей ЧОТ на основе статистических параметров, вычисляемых в исследовательском режиме модуля системы. Для получения надежного результата сравнения рекомендуется «вручную» оценить полученный массив значений и при выявлении одиночных «выбросов» значения какого-либо параметра опорного фрагмента огибающей ЧОТ, последние удалить [Курьянова 2011b; Голощапова, Курьянова 2011а; Курьянова, Елемешина 2012; Голощапова, Курьянова 2012а].

Для принятия обобщенного решения в модуле идентификации SIS II вводится понятие отношения правдоподобия (LR – оценки, LR – Likelihood Ratio) [Научно-технический отчет 2008; Научно-технический отчет 2011].

Принцип формирования решения о сходстве или различии лиц на сравниваемых фонограммах осуществлялся по формуле, показывающей отношение вероятности совпадения к вероятности различия: LR=FR/FA, где LR – отношение правдоподобия (LR-оценка), FR – вероятность ложного отклонения «диктора», FA – вероятность ложного принятия «диктора». Если значение LR-оценки больше единицы, то вероятность совпадения «дикторов» на исследуемых фонограммах превышает вероятность их различия. Если значение LR-оценки меньше единицы, то более вероятным становится различие «дикторов» [Научно-технический отчет 2008; Научно-технический отчет 2011].

В настоящее время в системах идентификации «диктора» все чаще применяется концепция доверительности [Shikano 1986; Higgins, Bahler etc. 1992; URL: Speaker Verification Database; URL: Speaker Recognition Database; Андреев 1992], определяющая доверительную вероятность (доверительный интервал), указывающий на надежность полученного результата (оценки), то есть доверительный интервал определяет точность оценки параметра.

Методические рекомендации по отбору материала для сравнительного исследования

Для правильного выявления индивидуализирующих просодических характеристик голоса «диктора», разграничения относительно устойчивых характеристик от неустойчивых и определения степени надежности сделанных выводов, эксперту важно знать теоретические основы идентификации. Знание факторов, влияющих на индивидуальный характер голоса и речи, позволяет выявить идентифицирующие супрасегментные характеристики голоса и речи говорящего и получить оценку тождества либо различия голосов сравниваемых «дикторов».

Из многочисленных научных публикаций, описывающих реализацию коммуникативного акта [Потапова 1997; Потапова 2001 а; Потапова 2002 с; Потапова 2006; Потапова 2010], известно, что на характер речи «диктора», представленной в виде звукового файла, влияют две группы факторов:

- индивидуальные характеристики «диктора» (анатомические, психологические, социальные, коммуникативные особенности, способности, компетенции, состояние, цели, мотивы, установки);

- ситуация, сопровождающая коммуникацию (жанр, время и место разговора, наличие требований и ограничений на поведение говорящих, акустическая среда, особенности звукозаписывающей аппаратуры и канала записи).

При аудитивном анализе голоса и речи идентифицируемого «диктора» факторы обеих групп в той или иной мере проявляются в речи.

Из судебно-экспертной практики известно, что наиболее надежно диагностируемыми индивидуализирующими характеристиками голоса и речи считаются характеристики, обусловленные индивидуальными особенностями речевого аппарата каждого конкретного «диктора», который включает в себя органы с различными физиологическими функциями. В зависимости от выполняемых функций органы, участвующие в звукообразовании, условно можно разделить на 3 крупных блока:

- органы дыхания, участвующие в образовании воздушной струи (традиционно к ним относят легкие с бронхами и трахеей);

- органы, участвующие в образовании звука (включают активные (подвижные: гортань, голосовые связки, язык, губы и т.д.) и пассивные (неподвижные: зубы, твёрдое нёбо, полость носа) органы артикуляции);

- органы, опосредованно воздействующие на качество речевого сигнала (грудная клетка, кости черепа как акустические резонаторы, косвенно влияющие на тембр звука).

Органы, участвующие в звукообразовании, индивидуальны для каждого человека и обладают своими особенностями. Например, размер и форма активных органов речи, присущие конкретному лицу, изменяют объем и форму речевого тракта. У каждого человека индивидуален объем легких, различается размер и форма зубов, каждому характерен определенный прикус и так далее, поэтому сама конфигурация речевого тракта уникальна, отлична от других. Таким образом, речевые навыки «диктора» (его речевая компетенция) наряду с анатомическими особенностями создают достаточно устойчивые индивидуализирующие характеристики голоса и речи.

Для достижения достоверного идентификационного решения методом анализа мелодического контура на незнакомом эксперту языке должны быть соблюдены определенные условия.

Сравнению фонограмм данным методом должен предшествовать тщательный анализ речевого материала. Перед началом сравнительного анализа сравниваемые фонограммы подлежат оценке на предмет их общей сопоставимости по стилю речи, эмоционально-модальной насыщенности и т.д., по результатам чего определяется оптимальный для каждого конкретного случая подход, то есть типы и состав участков мелодического контура синтагмы, которые будут подлежать сравнению.

Подготовка фонограммы к анализу параметров ЧОТ заключается в визуальном анализе полученного в автоматическом режиме рисунка огибающей ЧОТ и корректировке возможных неточностей, посредством наложения рисунка огибающей ЧОТ на кепстр сигнала. Например, удалению подлежат так называемые «ложные максимумы» и «ложные минимумы», которые могут отражаться автоматическим выделителем на непроизвольных голосовых модуляциях при напряжении голосовых связок непосредственно перед началом фонации или при ослаблении напряжения голосовых связок в процессе фонации. Наличие указанных участков существенно влияет на усредненные значения параметров.

Оптимальная минимальная длительность фонограммы для достижения надежного идентификационного решения составляет не менее 40 с для анализа синтагмы и её структурных компонентов; для фоноабзацев длительность исследуемого фрагмента должна составлять не менее 60 с. При этом следует отметить, что для достижения надежного идентификационного решения важна не длительность сама по себе (за исключением фоноабзацев), а представленность анализируемых структур – ядерных тонов, предшкал, шкал, пауз хезитации и так далее. Так, эффективным будет сравнение 5-10 фрагментов, включающих синтагмы с восходящим или нисходящим завершением с полноценной интонационной структурой, то есть содержащих все структурные компоненты синтагмы, отражающие разнообразные значения параметров ЧОТ [Курьянова 2011b; Голощапова, Курьянова 2011а; Курьянова, Елемешина 2012; Голощапова, Курьянова 2012а].

На снижение эффективности описываемого метода влияют высокий уровень фонового шума, затрудняющий адекватное восприятие характеристик голоса; обусловленное коммуникативной ситуацией ускорение темпа речи, которое приводит к обнаружению ложных явлений, связанных с ослаблением артикуляции, не характерных для речи данного «диктора» в привычном темпе; недостаточное количество представленных для сравнения фрагментов огибающей ЧОТ и/или их реализационная непредставительность, то есть невозможность выделения структурных компонентов синтагмы разного типа/подтипа.

При проведении экспериментов были установлены границы применимости метода с точки зрения качества фонограмм. Эффективность метода напрямую зависит от реализационной представительности и сопоставимости фонограмм.

Основными критериями качества фонограмм являются [Курьянова 2011b; Голощапова, Курьянова 2011а; Курьянова, Елемешина 2012; Голощапова, Курьянова 2012а]:

- отношение сигнал/шум;

- уровень реверберации;

- частотный диапазон;

- длительность анализируемых речевых фрагментов идентифицируемого диктора.

Критерии пригодности фонограмм для проведения идентификационных исследований представлены в таблице 7.