Идентификация непрерывных биометрических сигналов на основе нейронных сетей Костюченко Евгений Юрьевич

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Костюченко Евгений Юрьевич. Идентификация непрерывных биометрических сигналов на основе нейронных сетей : диссертация ... кандидата технических наук : 05.13.01 / Костюченко Евгений Юрьевич; [Место защиты: Том. политехн. ун-т].- Томск, 2010.- 171 с.: ил. РГБ ОД, 61 10-5/2781

Содержание к диссертации

Введение

Глава 1. Модель биометрического сигнала и методы его анализа 14

1.1 Получение и предварительная обработка биометрического сигнала 14

1.1.1 Анализ клавиатурного почерка 17

1.1.2 Анализ подписи 21

1.1.3 Анализ речевого сигнала 35

1.2 Анализ цифрового биометрического сигнала 45

1.3 Выбор модели выходного сигнала 54

1.4 Постановка задачи 56

Выводы по главе: 57

Глава 2. Выбор параметров, подаваемых для анализа на входы нейронной сети 58

2.1 Формирование нейронной сети 58

2.2 Оценка информативности параметров при обработке их при помощи нейронной сети 67

2.3 Формирование критерия оценки информативности параметров в зависимости от класса решаемой задачи 72

Выводы по главе: 90

Глава 3. Оценка информативности параметров речевого сигнала при его обработке с применением нейронных сетей прямого распространения 91

3.1 Условия эксперимента 91

3.2 Оценка информативности параметров речевого сигнала по итоговой ошибке обучения нейронной сети 96

3.3 Оценка информативности параметров речевого сигнала по уровню критерия, зависящего от результатов обработки тестовой выборки 100

3.4 Оценка коэффициента корреляции между параметрами и его влияния на совместную информативность применяемых параметров 114

Выводы по главе: 117

Глава 4. Реализация программного комплекса в области анализа речевого сигнала с применением нейронных сетей прямого распространения 118

4.1 Разработка общей архитектуры программного комплекса для анализа биометрических сигналов на примере системы анализа клавиатурного почерка 118

4.2 Структура исследовательского комплекса для анализа речевого сигнала с применением сетей прямого распространения 123

4.3 Применение исследовательского комплекса для анализа речевого сигнала пациентов при реабилитации после операции при лечении рака языка 137

4.4 Применение исследовательского комплекса для анализа электрокардиограммы при тестировании устройства съема суточной электрокардиограммы 141

Выводы по главе 146

Список источников 149

Приложение 161

Анализ речевого сигнала
Формирование критерия оценки информативности параметров в зависимости от класса решаемой задачи
Оценка информативности параметров речевого сигнала по уровню критерия, зависящего от результатов обработки тестовой выборки
Применение исследовательского комплекса для анализа речевого сигнала пациентов при реабилитации после операции при лечении рака языка

Введение к работе

Актуальность работы. Проблема анализа биометрических характеристик человека была и остается актуальной. В настоящее время для идентификации пользователей активно применяются статические биометрические характеристики, такие как геометрия ладони, отпечатки пальцев, структура радужной оболочки глаза. Применение динамических характеристик менее распространении в силу низких достигнутых показателей ошибок первого и второго рода. Однако в ряде случаев, например при компрометации пароля в традиционной парольной защите, только такие методы могут позволить предотвратить доступ злоумышленника.

Для анализа биометрических характеристик могут применяться различные подходы, например, статистический анализ, спектральный анализ, применение скрытых сетей Маркова, нейронных сетей и генетических алгоритмов.

Применение нейронных сетей имеет следующие преимущества: решение задач при неизвестных заранее зависимостях между входными и выходными параметрами, возможность построения нелинейных зависимостей, возможность применения для широкого круга задач, возможность одновременного решения нескольких задач одной нейронной сетью при использовании нескольких выходов, относительная простота используемых алгоритмов, легкость распараллеливания при решении задачи.

Нельзя не отметить и недостатки нейронных сетей: сложность определения набора входных параметров и архитектуры нейронной сети, которые обеспечивали не только оптимальный, но даже и требуемый результат, невозможность перебора всех вариантов из-за огромного их количества («проблема размерности»), сложность интерпретации структуры обученной нейронной сети - как правило, модель используется только в качестве «черного ящика», невозможность определения достаточного для обобщения и последующей успешной работы объема и состава входной выборки.

Значительный вклад в применение нейросетевых алгоритмов и решению проблем, возникающих при их применении, внесли следующие ученые: Ф. Розанблатт, С. Хайкин, МЛ. Минский, С. Пэйперт, Т. Кохонен, Дж. Хопфилд, А.И. Галушкин, А.Н. Горбань, В.В. Круглов, Е.М. Миркес, В.А. Дунин-Барковский.

Одной из наиболее существенных и неформализованных проблем при использовании нейронных сетей является выбор параметров для анализа нейронной сетью. Существующие подходы либо не позволяют полностью формализовать этот процесс, либо не учитывают особенность использования нейронной сети в качестве «черного ящика» и реально достигаемые значения при обработке сигналов при помощи нейронной сети.

Цель исследований: построение методик и алгоритмов оценки информативности параметров при анализе сложной естественной характеристики на примере речевого сигнала.

Для достижения поставленной цели необходимо решить следующие задачи:

анализ текущего состояния в области анализа естественной информации при помощи нейросетевых технологий;
анализ существующих подходов к проблеме оценки информативности параметров;
разработка критерия информативности, учитывающего специфику возможного распределения выходов нейронной сети;
построение алгоритма выбора параметров для передачи на вход нейронной сети с учетом разработанного критерия;
исследование эффективности разработанного алгоритма на примере задачи анализа речевого сигнала и сопоставления результатов работы нейронной сети, полученной на основе разработанного алгоритма и существующих алгоритмов анализа сигнала.

Объектом исследования являются биометрические сигналы вне зависимости от их происхождения (клавиатурный почерк, подпись, речевой сигнал, электрокардиограмма).

Предмет исследования - принципы применения нейронных сетей для анализа биометрических сигналов.

Методы исследований: для решения поставленных задач в работе применялись методы системного анализа, теории вероятностей и математической статистики, цифровой обработки сигналов и численных методов.

Достоверность полученных в работе результатов подтверждается:

экспериментальными данными, подтверждающих правильность

теоретических выкладок;

- сравнением полученных на основе эксперимента данных с данными,
получаемыми при помощи других методов.

Научная новизна полученных в работе результатов заключается в следующем:

обоснован новый критерий информативности параметров, который использует результаты обработки тестовой выборки при помощи нейронной сети, отличающийся от существующих учетом особенностей распределения значений ошибок на выходах нейронной сети и учитывающий возможные приоритеты ошибок;

разработан алгоритм выбора параметров для обработки их нейронной сетью при решении задачи анализа биометрической информации с использованием нового критерия;

показана необходимость учета значения критерия информативности и коэффициента корреляции между параметрами нейронной сети при использовании нескольких параметров, позволяющая получать лучшие результаты на анализе биометрического сигнала по сравнению с классическими решениями.

Практическая значимость работы заключается в разработанном программном комплексе, позволяющем на основе разработанных критерия и алгоритмов осуществлять разработку программного обеспечения, предназначенного для анализа биометрического сигнала с применением нейросетевого подхода.

Применение программного комплекса, реализующего предложенные в диссертационной работе подходы, позволило решить ряд практических задач, а именно:

сократить время по оценке разборчивости речи на 74% в рамках задач НИИ онкологии СО РАМН и обеспечить накопление речевых сигналов пациентов для дальнейшего исследования;

автоматизировать процесс тестирования устройств для съема суточной электрокардиограммы «Биоток-3000», позволив в автоматическом режиме осуществлять выделение участков кардиограммы для дальнейшего анализа, что позволило сократить общее время тестирования на 9%.

Положения, выносимые на защиту:

критерий информативности, основанный на результатах обработки обученной нейронной сетью тестовой выборки, который позволяет осуществлять ранжировки и выбор параметров для передачи на входы нейронной сети и отличается от существующих большей гибкостью за счет учета весовых коэффициентов значимости ошибок первого и второго рода и возможной нелинейности критерия;

алгоритм ранжировки параметров по информативности на основе разработанного критерия;

алгоритм выбора параметров для обработки нейронной сети с учетом коэффициента корреляции между ними, позволяющий повысить итоговое значение критерия информативности на 5%.

Внедрение результатов. Результаты работы внедрены в деятельность подразделений ООО «Энергометаллургический завод», НИИ Онкологии СО

РАМН, 000 НПФ «Информационные системы безопасности», 000 «Л.М.Э. «Биоток», в учебный процесс ТУСУР.

Апробация работы. Основные результаты по теме диссертационной работы отражены в 24 публикациях (из них 4 в журналах, рекомендованных ВАК). По результатам работы получено 2 свидетельства о регистрации в Отраслевом фонде алгоритмов и программ (свидетельства №7356 от 18.12.2006 и №8164 от 25.04.2007). Результаты работы представлялись на: XVIII и XIX сессиях Российского акустического общества (Москва, 2006 и 2007 гг.); Всероссийской научно-технической конференции студентов, аспирантов и молодых специалистов «Научная сессия ТУСУР'2003» -«Научная сессия ТУСУР'2008», семинарах Томской секции ШЕЕ.

Личный вклад. В диссертационной работе использованы результаты, в которых автору принадлежит определяющая роль. Некоторые из опубликованных работ написаны в соавторстве с сотрудниками научной группы. В совместных работах диссертант принимал участие в непосредственной разработке подходов к применению нейронных сетей для выделения признаков фонем и их групп, разработке интерпретатора выходов нейронных сетей, теоретических расчетах, постановке и проведении вычислительных экспериментов, в интерпретации результатов. Постановка задачи исследований осуществлялась научным руководителем, к.т.н., доцентом Р.В. Мещеряковым и д.т.н., профессором В.П. Бондаренко.

Структура и объем работы. Диссертация состоит из введения, четырех глав, заключения, списка литературы из 88 наименований и 1 приложения. Общий объем работы составляет 171 страницу, в том числе 47 рисунков и 17 таблиц.

Анализ речевого сигнала

Рассмотрим более подробно анализ биометрической голосовой информации как информации более сложной организации. Проблемы, связанные с распознаванием и машинной обработкой речи берут свое начало еще в 30 годах прошлого столетия. На тот момент необходимо было решать следующие основные задачи:

- фундаментальные (изучение принципов процессов речеобразования и речевосприятия);

- автоматизация управления, связанная с необходимостью освобождения рук оператора от управления автоматизированным процессом. К 70 годам 20 столетия проблема автоматизации управления была практически полностью решена на том уровне, который был необходим в данное время. Это означало возможность управления процессами при помощи сильно ограниченного числа простейших команд (например, «вперед», «стоп» и т.д.), однако достаточного для эффективного решения поставленных задач.

Однако, движение науки и техники вперед поставило новые задачи перед исследователями речи. Эти задачи связаны в основном со снятием ограничений, например, управление процессами не только путем жестко ограниченного набора команд, возможность использования их сочетаний, независимость процесса распознавания от голоса, распознавание слитной речи и т.д. Кроме того, все большую значимость стали приобретать задачи, связанные с определением параметров самого диктора (например, определение пола диктора, идентификация диктора).

На настоящий момент времени основные задачи, связанные с распознаванием речи могут быть разделены на следующие группы:

- распознавание речевого сигнала с целью определения точного способа кодирования;

- распознавание речевого сигнала с целью определения его смыслового характера;

- распознавание сигнала с целью определения различных характеристик диктора.

Несмотря на большое количество работ, ведущихся в данных направлениях, полученные системы имеют ряд существенных недостатков:

- недостаточная точность распознавания;

- ограниченный объем словаря;

- ограниченное множество дикторов;

- высокая трудоемкость вычислений, невозможность работы в реальном времени.

При распознавании речи могут быть использованы следующие параметры:

- частоты расположения формант;

- динамика изменения частоты форманты во времени;

- частота основного тона;

- динамика изменения интенсивности основного тона во времени;

- суммарная энергия спектра речевого сигнала;

- отношения интенсивностей гармоник к интенсивности основного тона;

- длительность сегмента;

- наличие/отсутствие вокализации на сегменте;

- распределение интенсивностей по частотному спектру.

Это далеко не полный список параметров, которые можно использовать. Однако, проблемы связаны не только с большим числом параметров, но и с тем, что довольно сложно организовать процесс точного определения этих параметров по речевому сигналу, особенно в реальном времени.

Анализ структуры речевого сигнала носит иерархический характер: сперва определяется наличие речевого сигнала в звуковом, далее осуществляется анализ на уровне звуков (фонем). Потом осуществляется их группировка (анализ на уровне групп фонем), следующие идут уровни слов, словосочетаний, предложений и т. д. Верхние уровни анализа речи не рассматриваются по причине их некритичности в случаях отсутствия автоматических средств анализа переходов между нижними уровнями. Общий вид различных уровней анализа речевого сигнала и переходов между ними демонстрирует Рис. 1.10.

При записи исходный речевой сигнал подвергается оцифровке. Запись осуществляется на основании измерения давления на мембрану микрофона, оцифровке этого значения и сохранения его в файл. Шаг квантования выбирается на основании качества записи и на практике определяется размером используемой памяти для хранения данных об отсчетах. В настоящее время на практике используется 8-битное, 16-битное и 32-битное квантование уровня звукового сигнала. В крайне редких случаях при использовании специальной звукозаписывающей аппаратуры для высокоточного анализа сигналов применяется 64-битное квантование по уровню, однако применительно к задачам анализа речи и идентификации диктора применение такого количества уровней квантования не требуется и ограничиваются 32-битным квантованием. Шаг квантования по времени определяет качество получаемой записи и выбирается на основании дальнейшего ее использования в соответствии с теоремой Котельникова. Согласно данной теореме для получения при анализе сигнала информации относительно спектральных характеристик сигнала, ограниченных сверху частотой Fe необходимо, чтобы шаг квантования по времени dT удовлетворял соотношению (1.6) [53]

Формирование критерия оценки информативности параметров в зависимости от класса решаемой задачи

Задачи классификации с применением нейронных сетей можно условно разделить на 2 группы:

- задачи поиска цели, например, поиск ключевого слова в звуковом сигнале;

- задачи идентификации, например, идентификация диктора при входе в систему.

Основное отличие этих двух групп при анализе ошибки выхода нейронной сети заключается в отличии значимости ошибок в зависимости от значения обучающего набора. Поясним на примере. Рассмотрим идеальный поток значений положения ключевого слова, в котором 1 соответствует наличию ключевого слова в данный момент времени в потоке и 0 -отсутствию ключевого слова, совместно с потоком значений выходов нейронной сети, избавленным от неопределенных промежуточных состояний, т.е. приведенным к значениям 0 и 1, согласно приведенной выше интерпретации. Рассмотрим диаграмму, иллюстрирующую данный процесс и представленную на Рис. 2.1.

Однако, на практике для задачи «Поиск цели» ошибка «Пропуск цели» более весома, нежели ошибка «Ложное срабатывание», так как последняя может быть обнаружена и устранена при дальнейшей обработке на основе результатов, полученных нейронной сетью. Устранение ошибки «Пропуск цели» без повторного анализа исходного сигнала не представляется возможным. Кроме того, для реальных задач, например, задачи поиска ключевых слов в слитной речи, поиска фрагмента речи, принадлежащего заданному диктору, которые могут применяться для противодействия терроризму, последствия пропуска цели более весомы, нежели последствия ложного срабатывания.

Исходя из этого, следует ввести весовой коэффициент А для ошибки «Пропуск цели», чтобы на этапе обучения добиться более низкого уровня данной ошибки, по сравнению с ошибкой «Ложное срабатывание». Тогда формула примет вид

Для практической реализации имеет смысл преобразовать формулу, устранив условие выбора. Учитывая тот факт, что на практике для рассматриваемых задач /; может принимать только значения 0 и 1, исключая промежуточные значения, можно ввести весовую функцию F(Ii), такую что F{\)=A и і7(0)=1. Тогда формула (2.20) преобразуется к виду: F(Ij) примем линейной, как простейшую непрерывную функцию. В случаях, когда /, может принимать промежуточные значения, выбор функции F(Ij) зависит от распределения этих значений и весомости соответствующей этим значениям ошибки. Для линейной функции: F{I }=k It+b коэффициенты могут быть определены как

Вероятности ошибок первого рода применительно к биометрическим методам идентификации на основе анализа динамических характеристик обычно измеряются единицами процентов, вероятности ошибок второго рода десятыми долями процента соответственно. При рассмотрении комбинации различных методов идентификации, полагая их результаты независимыми, можно установить следующее: надежность идентификации с точки зрения ошибок второго рода будет возрастать. Итоговая вероятность ошибки второго рода

Так, приняв вероятность ошибки первого рода для системы из пяти компонентов для каждого компонента равной 0,01 (отличный практический показатель, например, для задачи идентификации по клавиатурному почерку), получим итоговую вероятность ошибки первого рода равную уже 0,05, а на практике вероятность ошибки первого рода может составлять и 0,03-0,05, что делает невозможным использование подобных компонент в формировании системы [45].

Выходом из данной ситуации является модификация критерия таким образом, чтобы значение ошибки второго рода несколько уменьшалась по сравнению с вероятностью ошибки первого рода. Таким образом, определение значимости ошибок первого и второго рода зависит не только от класса решаемой задачи, но и от дальнейшего использования результата работы нейронной сети, а именно от того, является ли результат окончательным или предполагается его дальнейшая обработка.

На этапе интерпретации выходов нейронной сети, когда у нас есть готовые для обработки фильтром вектор выходов, можно сказать, что итоговые значения ошибок первого и второго рода будут зависеть от значений параметров интерпретатора

Возникает проблема выбора критерия, позволяющего оценить правильность работы нейронной сети и определить значения параметров интерпретатора р и w в зависимости от требуемого уровня ошибок первого и второго рода. Существуют следующие критерии оценки правильности работы обученной нейронной сети на основе ошибок первого и второго рода [41, 63]: EER (Equal error rate) - уровень равной ошибки. Уровень, при котором в системе частота появления ошибки первого рода равна частоте появления ошибки второго рода.

Значение находится в диапазоне [-1; 1]. Значения 1 1 = 1 соответствуют линейной зависимости между полученным результатом и желаемым, вырождающейся в крайнем случае в совпадение. В случае если используемый параметр позволяет достигнуть желаемого результата, он абсолютно информативен с точки зрения рассматриваемого критерия. В противном случае данный критерий отражает степень соответствия результатов и, как следствие, значение информативности исследуемого параметра.

+ Учитывает реальные результаты работы.

+ Критерий прост и интуитивно понятен, значение получается простой оценкой корреляции.

- Нет учета приоритета ошибок первого и второго рода, введение весовых коэффициентов затруднительно.

Оценка информативности параметров речевого сигнала по уровню критерия, зависящего от результатов обработки тестовой выборки

После неудачного подхода определения количественного значения информативности параметров на основе обученности нейронной сети было сделано предложение об определении информативности параметров речевого сигнала путем прямой оценки ошибки обученной нейронной сети на двух выборках: 25 сигналах, входящих в обучающую выборку и 25 сигналах, не входящих в обучающую выборку. При исследовании использовалось 4 различных значения коэффициентов к и s критерия, определяющих взаимную значимость и нелинейность итогового значения критерия.

Приведем методику проведения эксперимента:

1) проводилось обучение нейронной сети на каждом из параметров, получаемых из 25 речевых сигналов;

2) после обучения осуществлялся анализ обученной нейронной сетью трёх различных выборок сигналов и одной объединенной выборки:

- 25 речевых сигналов, участвовавших в обучении, однако анализ проводился с шагом 60 отсчетов (5 мс). Эта выборка включает в себя обучающую выборку, но содержит и промежуточные значения параметров (расширенная обучающая выборка);

- 25 речевых сигналов, не участвовавших в обучении (тестовая выборка);

- 50 речевых сигналов, представляющих собой объединение двух предыдущих групп сигналов (расширенная обучающая и тестовая выборки);

- 25 сигналов, не участвовавших в обучении и не задействованных в предыдущих этапах (контрольная выборка);

3) на основе работы нейронной сети на данных выборках осуществлялся подсчет количества примеров, на которых наблюдаются ошибки первого и второго рода Л/ и п2 с точки зрения решения задачи поиска вокализованных участков;

4) осуществлялся расчет абсолютных частот встречаемости ошибок первого и второго рода г / и г 2 по отношению к общему количеству примеров Л :

5) определялись частоты встречаемости примеров первого и второго рода (вокализованных и невокализованных) в анализируемых выборках V/ и v?;

6) оценивались доли ошибок первого и второго рода по отношению ко встречаемости соответствующих сегментов Ші=г і / V/ И ПІ2=Г 2/ V2.

Оценки, полученные таким образом будут находиться в диапазоне [0; 1]. При этом следует учитывать, что теоретически данные оценки могут принимать значение 1 одновременно (инверсия правильной сегментации речевого сигнала), на практике же при достижении 1 одним из значений второе значение оказывается равным 0 (признание сигнала полностью вокализованным или невокализованным). По сути, при увеличении количества экспериментов значения ті и т2 стремятся к вероятностям ошибок первого и второго рода;

7) для получения итоговой оценки в соответствии со значимостью ошибок первого и второго рода были получены значения критерия (2.40) на основе обработки тестовой выборки для следующих значений коэффициентов критерия:

- квадратичный критерий, значимость ошибок первого рода в 10 раз выше по сравнению с важностью ошибок второго рода: =10, s=2;

- квадратичный критерий, значимость ошибок второго рода в 10 раз выше по сравнению с важностью ошибок первого рода: h=l0, s=2;

- квадратичный критерий, ошибки первого и второго рода равнозначимы: A=l, 5=2;

- линейный критерий, ошибки первого и второго рода равнозначимы: Jt=l,s=l.

На основе данной методики проведена серия из 20 экспериментов для каждого из параметров, в рамках каждого из которых проводилось создание и обучение новой нейронной сети, с целью получения выборки оценок информативности на основе анализируемого критерия с целью последующей статистической обработки.

Результаты экспериментов для сегментации сигнала на вокализованные и невокализованные участки для 10 экспериментов представлены в Табл. 3.3.

Общее число обучений нейронной сети для каждого из параметров составило 20 раз. На основе этих данных определены такие параметры значений критерия как: среднее значений mean, дисперсия disp, медиана median и минимальное наблюдаемое значение min. Итоговые результаты экспериментов для оценки значений перечисленных характеристик наблюдаемых значений критерии информативности представлены для различного приоритета ошибок первого и второго рода в Табл. 3.4, для одинакового приоритета, но различном характере нелинейности критерия в Табл. 3.5.

Способ получения конкретных значений параметров информативности зависит от цели, с которой эти значения рассчитываются. Можно выделить следующие 3 группы целей оценки параметров информативности: единичное обучение. На практике встречается редко в силу невозможности объективно судить об информативности параметров по результатам измерения. В качестве оценки может быть применено только единственное рассчитанное значение критерия информативности

Применение исследовательского комплекса для анализа речевого сигнала пациентов при реабилитации после операции при лечении рака языка

В НИИ онкологии СО РАМН ведутся работы по реабилитации пациентов после оперативного вмешательства при лечении рака органов, участвующих в процессе речеобразования. Один из видов таких заболеваний — рак языка — может привести к ампутации части языка, что приводит к необходимости работы с логопедом для восстановления речи. В процессе реабилитации перед логопедом стоит проблема объективной оценки качества речи и динамики его изменения в ходе занятий.

Ранее оценка качества речи велась субъективно специалистом-логопедом. Была поставлена задача по исследованию спектра с целью выявления особенностей изменения речевого сигнала сразу после оперативного вмешательства и в процессе реабилитации. Для решения поставленной задачи было принято решение использовать разработанный программный комплекс для выявления особенностей речевого сигнала пациентов. На Рис. 4.13 представлен фрагмент окна исследовательского комплекса, иллюстрирующий спектр сигнала здорового человека (сверху) и пациента А после операции непосредственно перед началом занятий с логопедом (снизу). Фраза «Прикосновение было болезненным».

Записи проводились с использованием одного и того же оборудования в одинаковых начальных условиях. Сразу бросается в глаза срез верхней частоты спектра на уровне 1-1,5 кГц. Данная особенность присутствует на всех записях пациента А, сделанных до начала занятий с логопедом. После проведения занятий с логопедом спектр скорректировался. Спектр речевого сигнала после реабилитации представлен на Рис. 4.14. Виден существенный подъем верхней частоты спектра.

Данная особенность изменения спектра согласуется с теорией речеобразования, в соответствии с которой при образовании речевого сигнала верхние частоты в сигнале появляются при прохождении верхних участков речеобразующего тракта, в частности, ротовой полости [2].

Ампутация фрагмента языка приводит к уменьшению препятствий на пути прохождения сигнала, что приводит к сокращению ширины спектра. В процессе реабилитации пациент получает навыки образования речевого сигнала в новых условиях, что приводит к частичной коррекции спектра.

Однако, имеющийся в настоящий момент объем записей пациентов с исследуемым дефектом речи не позволяет провести детальный анализ изменений для подтверждения обнаруженной зависимости и ее подтверждения и получения объективной оценки качества речи. Для разрешения выявленной трудности было принято решение дополнить существующий программный комплекс подсистемой, предназначенной для оценки качества речи по методике [16]. Данная методика требует участия логопеда в оценке качества речи, однако, кроме получения требуемого логопедам результата, при оценке осуществляется запись фрагментов, пригодных для дальнейшего анализа с применением программного комплекса и изучения динамики изменения речевого сигнала в процессе реабилитации. Внешний вид подсистемы приведен на Рис. 4.15.

Разработанная подсистема позволяет осуществлять оценку слоговой, фразовой, селективной разборчивости и разборчивости методом парных сравнений. Поддерживается ведение историй болезни пациентов и отслеживание изменения разборчивости в динамике. Кроме того, все записи, полученные при работе с пациентами сохраняются, и могут быть при необходимости прослушаны в будущем, а также проанализированы с применением программного комплекса и поддерживаемых им алгоритмов.

Применение программного комплекса позволило сократить время на оценку разборчивости речи, по методике, представленной в [16] на 74% по сравнению с ручной оценкой, используемой на ранних этапах, и предоставило средство для накопления и дальнейшей обработки речевых сигналов в рамках исследований, проводимых в НИИ онкологии СО РАМН.

Идентификация непрерывных биометрических сигналов на основе нейронных сетей Костюченко Евгений Юрьевич

Анализ речевого сигнала

Формирование критерия оценки информативности параметров в зависимости от класса решаемой задачи

Оценка информативности параметров речевого сигнала по уровню критерия, зависящего от результатов обработки тестовой выборки

Применение исследовательского комплекса для анализа речевого сигнала пациентов при реабилитации после операции при лечении рака языка

Похожие диссертации на Идентификация непрерывных биометрических сигналов на основе нейронных сетей