Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Исследование влияния эхосигналов на качество телефонной передачи в условиях применения методов эффективного кодирования Федоткин Николай Николаевич

Исследование влияния эхосигналов на качество телефонной передачи в условиях применения методов эффективного кодирования
<
Исследование влияния эхосигналов на качество телефонной передачи в условиях применения методов эффективного кодирования Исследование влияния эхосигналов на качество телефонной передачи в условиях применения методов эффективного кодирования Исследование влияния эхосигналов на качество телефонной передачи в условиях применения методов эффективного кодирования Исследование влияния эхосигналов на качество телефонной передачи в условиях применения методов эффективного кодирования Исследование влияния эхосигналов на качество телефонной передачи в условиях применения методов эффективного кодирования Исследование влияния эхосигналов на качество телефонной передачи в условиях применения методов эффективного кодирования Исследование влияния эхосигналов на качество телефонной передачи в условиях применения методов эффективного кодирования Исследование влияния эхосигналов на качество телефонной передачи в условиях применения методов эффективного кодирования Исследование влияния эхосигналов на качество телефонной передачи в условиях применения методов эффективного кодирования
>

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Федоткин Николай Николаевич. Исследование влияния эхосигналов на качество телефонной передачи в условиях применения методов эффективного кодирования : Дис. ... канд. техн. наук : 05.12.13 : Москва, 2004 136 c. РГБ ОД, 61:04-5/3837

Содержание к диссертации

Введение

Глава 1. Анализ современного состояния проблемы борьбы с мешающим влиянием токов электрического эха 11

1.1. Анализ основных причин возникновения и мешающего влияния электрического эха в телефонных каналах 11

1.2. Сравнительный анализ основных методов борьбы с явлением электрического эха 20

1.3. Анализ основных требований к параметрам эхоподавляющих устройств 26

Выводы — 31

Глава 2. Анализ особенностей мешающего влияния эхосигналов при использовании методов эффективного кодирования речевых сигналов 32

2.1. Анализ различных алгоритмов сокращения информационной избыточности с целью сжатия речевых сигналов 32

2.1.1. Групповое кодирование 34

2.1.2. Кодирование по алгоритму Хаффмана 35

2.1.3. Дельта-кодирование.. 36

2.1.4. Метод Зива-Лемпела-Велча 37

2.1.5. Адаптивная дифференциальная ИКМ 39

2.2. Анализ методов кодирования речи с линейным предсказанием 40

2.2.1. Метод MP-MLQ и ACELP 40

2.2.2. Метод сжатия с малой задержкой LD-CELP 44

2.2.3. Алгоритм алгебраического линейного предсказания по методу кодового возбуждения на сопряженных структурах CS-ACELP 47

2.3. Анализ причин и механизмов мешающего влияния эхосигналов на корректность работы основных алгоритмов сжатия 50

2.3.1. Анализ потенциального качества телефонной передачи, обеспечиваемого при использовании сжатия речи 50

2.3.2. Анализ влияния средств повышения эффективности передачи телефонного трафика на степень мешающего воздействия эффекта электрического эха 52

2.3.3. Анализ механизмов влияния эхосигналов на процессы сжатия речи 54

Выводы 59

Глава 3. Разработка модели и методики исследования влияния характеристик эхосигналов на функционирование средств, использующих эффективные методы кодирования речи 62

3.1. Общие положения методики исследования 62

3.1.1. Метод исследования и условия эксперимента 62

3.1.2. Исследуемые характеристики 63

3.1.3. Учет влияния характеристик сети 64

3.1.4. Общая модель исследования 65

3.1.5. Разброс значений параметров ^

3.2. Методика и модель исследования влияния характеристик эхосигналов на передачу речи при применении систем, использующих алгоритмы статистического сжатия 67

3.2.1. Исследование влияния характеристик эхосигналов на статистические характеристики смеси передаваемого речевого сигнала и эхосигнала 68

3.2.2. Исследование влияния характеристик эхосигналов на статистику пауз в передаваемом речевом сигнале 69

3.2.3. Исследование влияния характеристик эхосигналов на статистические характеристики сигнала при использовании дельта-кодирования 70

3.3. Методика и модель исследования влияния характеристик эхосигналов на передачу речи при применении систем, использующих предиктивные алгоритмы сжатия речи 70

3.4. Модель влияния эхосигналов на процессы преобразования речи в системе кодер-декодер CS-ACELP... 74

Выводы 81

Глава 4. Анализ результатов влияния характеристик эхосигналов на передачу речи при использовании методов эффективного кодирования исследований путем имитационного моделирования 84

4.1. Анализ результатов исследований влияния характеристик эхосигналов на передачу речи при применении систем, использующих алгоритмы эффективного кодирования 84

4.1.1. Анализ результатов исследования влияния характеристик эхосигналов на среднюю мощность смеси передаваемого речевого сигнала и эхосигнала 84

4.1.2. Анализ результатов исследования влияния характеристик эхосигналов на пиковые характеристики мощности смеси сигнала и эхосигнала 85

4.1.3. Анализ результатов исследования влияния характеристик эхосигналов на статистику пауз в передаваемом сигнале 86

4.1.4. Анализ результатов исследования влияния характеристик эхосигналов на статистические характеристики сигнала при использовании дельта-кодирования 90

4.2. Анализ результатов исследования влияния характеристик эхосигналов на передачу речи при применении систем, использующих предиктивные алгоритмы сжатия речи 96

4.2.1. Анализ результатов исследования влияния процедур сжатия и восстановления на характеристики одиночного речевого сигнала 96

4.2.2. Анализ результатов исследования влияния процедур сжатия и восстановления на характеристики смеси передаваемого речевого сигнала и эхосигнал 98

4.2.3. Анализ результатов исследования влияния эхосигналов на характеристики восстановленного сигнала 104

4.2.4. Анализ результатов исследования по оценке влияния эхосигналов на характеристики разностного сигнала 107

Выводы 121

Заключение 123

Список литературы 126

Приложение

Введение к работе

у *y "^ '

Актуальность проблемы. На современном этапе развития средств телекоммуникаций широко используется оборудование и алгоритмы повышения эффективности передачи речевых сообщений

Системы сжатия речи используют два основных принципа устранения избыточности соотношения информационной емкости канала и речевого сигнала - статистическое уплотнение и дифференциальное кодирование с предиктивным механизмом. В настоящее время промышленностью выпускаются серийно как чисто предиктивные системы (например, оборудование «Passport» фирмы Nortel), так и чисто статистические (например, оборудование «Эффект» производства ЗАО «Инженерный центр»), а также комбинированные (например, оборудование серии DTX фирмы ECI).

Общим для всех алгоритмов сжатия речи и пакетной передачи является блочный принцип обработки, приводящий к задержке сигнала и увеличению вероятности появления в каналах связи эффекта электрического эха недопустимой величины. При этом помимо традиционного проявления эхосигналов как эффекта электрического эха, их влияние в системах сжатия речи и пакетной передачи имеет еще один важный аспект - повышение загрузки обратного направления передачи при одностороннем разговоре, что в системах сжатия речи приводит к статистическим перегрузкам, а в системах с пакетной коммутацией - к снижению пропускной способности сетей.

Влияние эхосигналов на качество телефонной передачи в системах повышения эффективности передачи телефонного трафика следует рассматривать в двух аспектах.

Первый аспект заключается во влиянии характеристик средств повышения эффективности передачи телефонного трафика (за счет введения дополнительных задержек) на степень мешающего воздействия электрического эха.

Второй аспект заключается в обратном влиянии, т.е. влиянии эхосигнала на функционирование средств повышения эффективности передачи телефонного трафика.

Сведения о количественном влиянии характеристик эхосигналов на качество телефонной передачи, организованной с использованием средств повышения эффективности передачи телефонного трафика, не нашли достаточного отражения ни в научных публикациях, ни в руководящих документах отрасли, регламентирующих правила использования средств повышения эффективности передачи речи на телекоммуникационных сетях.

Решением проблем электрического эха в телефонных каналах плодотворно занимались многие специалисты и ученые, такие как, Жарков МА, Баєва Н.Н., Тетерев В.Н., Цыбулин М.К., Шаврин С.С., Снегов А.Д., Иванов В.И., Кунегин СВ., Запорощенко Е.К., Лихачев Н.И., Шевелев СВ. и др., однако их исследования в основном относились к разработке методов и средств борьбы с мешающим влиянием токов электрического эха в каналах дальней связи, использующих традиционные аналоговые и цифровые системы и методы передачи.

ЯОС НАЦИОНАЛЫ!*» | SMCJIHOTIM 1 . snasm

Целью диссертации является исследование влияния эхосигналов на качество телефонной передачи в условиях применения на телекоммуникационных сетях систем, использующих методы эффективного кодирования.

Методы исследования. Для решения поставленных задач использовались методы статистической радиотехники, математической статистики, вычислительной математики и имитационного моделирования Научная новизна работы заключается в следующем:

впервые проведено исследование влияния эхосигналов на качество передачи телефонных сигналов при использовании алгоритмов сжатия речи и на функционирование систем сжатия; показано, что при использовании предиктивных алгоритмов сжатия речи в составе выходного сигнала помимо исходного речевого сигнала и эхосигнала появляется некоторый разностный сигнал, который не является линейной комбинацией полезного речевого сигнала и эхосигнала;

доказано, что разностный сигнал является самостоятельным мешающим фактором, придающим «металлический» характер звучания сигналу на приеме;

определено, что мощность разностного сигнала может превышать мощность эхосигнала, а пиковые значения могут превышать средний уровень не только эхосигнала, но и передаваемого речевого сигнала;

разработана математическая модель влияния эхосигналов на процессы преобразования речи в кодеках с предиктивным механизмом сжатия речи, учитывающая корректность вычисления значения фазы (частоты) основного тона в условиях воздействия эхосигнала; показано, что возникающая ошибка вычисления частоты основного тона приводит к погрешности восстановления частоты передаваемого сигнала, причем эта погрешность имеет стохастический знакопеременный характер;

модель и методика имитационного моделирования в сочетании с

пакетом специальных программ позволяют проводить исследования

перспективных кодеков не только в части энергетических

характеристик, но и в части субъективного восприятия

восстановленного сигнала с учетом воздействия эхосигналов.

Личный вклад автора. Теоретические и практические исследования,

расчеты и имитационное моделирование, а также выводы и рекомендации

получены автором лично.

Практическая ценность и реализация результатов работы. Практическая ценность диссертационной работы заключается в следующих выводах, положениях и рекомендациях:

каналы, организованные с применением предиктивных алгоритмов сжатия речи, должны оборудоваться эхоподавляющими устройствами с целью устранения мешающего воздействия эффекта электрического эха и металлического призвука в режиме встречного "разговора;

в реальных условиях эксплуатации систем, использующих алгоритмы чисто статистического сжатия, эхосигнал не будет оказывать существенного влияния на статистические перегрузки кодера и сопутствующие искажения сигнала;

при оценке загрузки телекоммуникационных систем следует учитывать общий средний уровень смеси полезного передаваемого сигнала и эхосигнала;

специальные программы, разработанные в процессе имитационного

моделирования, могут использоваться в процессе разработки и

исследования вновь разрабатываемых кодеков.

Результаты диссертационной работы могут быть использованы операторами

связи и организациями, занимающимися разработкой, внедрением

эхоподавляющих устройств и перспективных высокоэффективных цифровых

технологий передачи телефонного трафика по телекоммуникационным сетям.

Результаты научных исследований внедрены в ОАО «Комет» и в учебном процессе МТУ СИ, что подтверждено соответствующими актами.

Апробация работы. Основные положения диссертационной работы были представлены и обсуждены на научных конференциях "Телекоммуникационные и вычислительные системы" в рамках Международных форумов информатизации (МФИ - 2002 и 2003 гг.), научно-технических конференциях профессорско-преподавательского состава МТУСИ (2002 и 2004 гг.), на заседаниях кафедры многоканальной электросвязи МТУСИ.

Публикации. Основные результаты диссертации опубликованы в 11 печатных работах, в том числе 7 работ без соавторства. Основные положения, выносимые на защиту.

1. Наличие эхосигналов помимо обычного мешающего воздействия приводит к снижению эффективности применения алгоритмов статистического сжатия речи и существенному ухудшению качества передачи в случае применения предиктивных алгоритмов сжатия.

2. Наличие эхосигналов при применении кодеков, использующих
предиктивные алгоритмы сжатия, приводит к погрешности восстановления
частоты передаваемого сигнала, причем эта погрешность носит стохастический
знакопеременный характер.

  1. Наличие эхосигналов приводит в случаях применения предиктивных методов сжатия речи к специфическим искажениям, выражающимся появлением на выходе канала разностного сигнала и проявляющимся в «металлическом» характере звучания сигнала на приеме в режиме встречного разговора.

  1. Разностный сигнал не является линейной комбинацией исходного речевого сигнала и эхосигнала, а значения его энергетических параметров могут превышать значения аналогичных параметров сигнала и эхосигнала.

  2. Каналы, организованные с применением предиктивных алгоритмов сжатия речи, должны оборудоваться эхоподавляющими устройствами вне зависимости от их протяженности, причем установка ЭПУ должно обеспечивать подавление эхосигналов до входа кодера.

Структура и объем работы. Диссертация состоит из введения, четырех глав, заключения, списка литературы и приложений. Работа изложена на 131 страницах, содержит 2 таблицы, 61 рисунков.

Сравнительный анализ основных методов борьбы с явлением электрического эха

Прежде чем рассмотреть возможные способы борьбы с мешающим действием токов электрического эха, рассмотрим влияние этих: токов на качество телефонного разговора.

Обратимся еще раз к упрощенной схеме телефонного канала и рассмотрим возможные пути распространения эхосигналов. Предположим, что разговор начал вести абонент А. часть разговорного тока достигла абонента Б, а другая часть отразившись, возвратилась в виде токов электрического эха к говорящему абоненту А. Если время между посланной абонентом А фразой и возвратившимся к нему же эхосигналом значительно, то эхосигнал может быть воспринят абонентом А как ответная фраза абонента Б. Такой эхосигнал принято называть первым эхом говорящего. При малом затухании на пути токов электрического эха процесс отражения повторяется многократно, и за первым эхом говорящего появляется второе, третье, и т.д. В отдельных случаях повторенные эхосигналы прослушиваются до 8-9 раз.

Остановимся подробнее на известных в настоящее время методах борьбы с мешающим действием токов эха. Ослабить или вообще исключить мешающее действие токов электрического эха в телефонных каналах можно путем либо уменьшения времени распространения электрических сигналов в линиях связи до величины менее 30 мс, либо увеличения затухания на пути токов эха аэ. Первый путь практически не реализуем, так как скорости распространения электромагнитной волны в различных средах имеют конечную величину. Второй же путь широко используется на практике.

Самым эффективным способом устранения мешающего действия токов эха явился бы переход от телефонного канала, представляющего собой замкнутую систему, к каналу с разделенными прямым и обратным трактами передачи, т.е. на четырехпроводную систему связи с устраненной акустической связью между микрофоном и телефоном абонентского аппарата. Однако на данном этапе такой переход экономически неоправдан, так как стоимость линейных сооружений канала составляет значительную часть (порядка 60%) общей его стоимости. Поэтому изыскиваются технические возможности увеличения затухания на пути токов электрического эха. Величина такого затухания по отношению к говорящему абоненту определяется выражением: где # ,- затухание абонентского тракта, агпр аго6р- остаточные затухания между точками п и к, к и n; AtAc- затухание несогласованности дифсистемы слушающего абонента; Аетж Л - затухание несогласованности в точках п и т.

Как видно из формулы, затухание на пути токов эха зависит от затухания абонентских трактов, остаточных затуханий прямого и обратного направлений передачи и от затуханий несогласованности двухпроводного тракта дальнего (слушающего) абонента. Рассмотрим за счет каких составляющих возможно увеличить аэг. Естественно, что последнее нельзя делать за счет устройств, которые включены в тракт прямого (неотраженного) информационного сигнала (а-ат агпр). Следовательно, увеличить затухание на пути эхосигналов возможно за счет затуханий Аедс,

Ает, Аея и aro6p. Остаточное затухание агп6р желательно увеличивать только для сигналов электрического эха и оставлять постоянным для информационного сигнала слушающего абонента. Практически такой способ, получивший название компенсационного, реализуем, но связан с большими техническими трудностями.

Одновременное увеличение агобр для эхосигналов и информационных сигналов обеспечить проще, но при этом возникают некоторые неудобства при ведении двустороннего разговора (оба абонента говорят одновременно — режим перебоя). Эти неудобства состоят в том, что при увеличении затухания ага6р телефонный канал на время ведения дополнительного затухания превращается из двустороннего в односторонний, а это затрудняет прерывание говорящего абонента слушающим. В данном случае слушающий, абонент может говорить лишь в моменты межслововых или межфразовых пауз другого абонента. С целью обеспечения возможности быстрого перебоя предусматривают снижение затухания ar до его первоначального затухания (7 дБ) в момент появления информационного сигнала от перебивающего абонента. При этом одновременно с полезным сигналом будут приниматься и эхосигналы, воздействующие на абонента. как помеха. Влияние такой помехи зависит от уровня сигнала перебоя. Однако, как показывает практика, оно незначительно из-за стремления перебивающего абонента повысить голос при перебое. Рассмотренный выше способ получил название эхозаградительного. Итак, подводя итог, можно выделить три основных метода борьбы с мешающим: воздействием токов электрического эха: 1. метод самобалансирующейся дифсистемы (увеличение затухания несогласованности Ае1)с); 2. компенсационный (увеличение остаточного затухания обратного направления передачи агвЪр только для сигналов электрического эха); 3. метод заграждения (увеличение остаточного затухания обратного направления передачи aroSp для отраженного и информационного сигналов).

Метод самобалансирующейся дифсистемы. При этом методе на пути токов электрического эха вносится дополнительное затухание за счет увеличения затухания несогласованности Aslic определяемое выражением:

Анализ выражения показывает, что увеличить балансное затухание дифсистемы возможно либо за счет согласования характеристических сопротивлений в точках отражения киї, либо за счет увеличения затухания абонентского тракта а"ат, что крайне не желательно, так как это обстоятельство приведет к снижению громкости разговора. Наиболее эффективно повышение затухания Аек. Если принять условие, что либо а = от, либо А , = «з, то А , = А ,,.

Анализ причин и механизмов мешающего влияния эхосигналов на корректность работы основных алгоритмов сжатия

Рассмотренные методы сжатия речи используются в различных системах передачи и обработки речевой информации. Выбор того или иного алгоритма зависит от предъявляемых к системе требований с учетом возможной деградации качества и задержки, вносимой в процессе обработки сигнала.

Методы кодирования волновой функции речевого сигнала просты в реализации и обеспечивают хорошее качество восстановленной речи. Однако такие методы не обеспечивают высокой эффективности передачи телефонного трафика, поскольку не в должной мере устраняют содержащуюся в речевом сигнале избыточность. Устранение избыточности из речевого сигнала до определенного момента не влияет, на субъективное восприятие речевого сигнала человеком. Из-за простоты реализации методы кодирования волновой функции речевого сигнала получили большое распространение на сетях связи и в устройствах обработки речевого сигнала.

Параметрическое кодирование речевого сигнала, то есть кодирование не волновой функции речевого сигнала, а определенных его параметров, отвечающих за формирование речевого сигнала и его разборчивость, позволяет в значительной степени снизить скорость цифрового потока, необходимую для передачи речи с требуемым качеством. Особенно эффективно параметрическое кодирование в сочетании с кодированием волновой функции речевого сигнала - гибридное кодирование. Оно позволяет получить низкие скорости цифрового потока и хорошее качество восстановленной речи.: Среди кодеров, анализирующих и кодирующих различные параметры речевого сигнала, наиболее эффективными являются: кодеры, использующие принцип линейного предсказания речи. Они позволяют наиболее точно определить и передать параметры речевого сигнала. Речь, восстановленная после кодирования по методу линейного предсказания, имеет хорошее качество, сопоставимое с качеством, полученном при использовании кодирования волновой функции речи.

Как уже отмечалось, сжатие речевого сигнала ведет к потере качества восстановленной речи. Поскольку человек как получатель информации является ключевым элементом любой телекоммуникационной системы, качество сигнала обычно оценивается по субъективному восприятию речи. Качество сигнала чаще всего измеряется по пятибалльной шкале средней субъективной оценки MOS (mean opinion score). В таблице 2.1 приведены оценки MOS для. различных методов кодирования речи. Хотя качество сигнала по большей части напрямую связано со скоростью битового потока, более сложные алгоритмы способны обеспечить более высокие значения отношения показателя качества к скорости битового потока.

Влияние характеристик средств повышения эффективности передачи телефонного трафика на степень мешающего воздействия эффекта электрического эха должно учитываться при решении вопроса о необходимости оборудования каналов (направлений) связи эхоподавляющими устройствами. Решение о необходимости включения в канал (направление) эхоподавляющих устройств должно выноситься на основе анализа значения общего времени распространения сигнала по каналу с учетом дополнительных задержек, вносимых в сигнал всеми видами оконечного и транзитного оборудования, составляющего канал (соединение) [24]. Рекомендуемые для рассматриваемых целей значения времени задержки, вносимой оборудованием, реализующим сжатие речевого сигнала, приведены в таблице 2.2.

В целях обобщения методов исследования влияния эхосигналов на работу средств и алгоритмов повышения эффективности передачи телефонного трафика в рамках настоящей работы предлагается ввести следующую классификацию алгоритмов сжатия речи, акцентирующую прикладной аспект их использования в системах связи.

Под алгоритмами; статистического сжатия (АСС) далее следует понимать алгоритмы сжатия речи без потерь качества, обеспечивающие полное восстановление: переданного сигнала на приемной стороне при; отсутствии ошибок передачи. К АСС относятся рассмотренные ранее алгоритмы группового кодирования, кодирование по методам Хаффмана и Зива-Лемпела-Велча, а также АДИКМ при передачи кодированного сигнала по сетям и трактам с динамически распределяемой пропускной способностью; эти алгоритмы в чистом виде получили наиболее широкое распространение в статистических системах передачи, например, в оборудовании «Эффект», выпускаемом ЗАО «Инженерный центр».

Под алгоритмами, использующими предиктивный принцип сжатия речи (ПАСР), следует далее понимать алгоритмы сжатия речи с потерями качества, не допускающие полного восстановления исходного сигнала на приемной стороне даже при отсутствии ошибок передачи. К алгоритмам ПАСР будем далее относить рассмотренные ранее алгоритмы ACELP, MD-MLQ, LD-CELP, CS-ACELP, PCELP, RPE, VSELP и др; а также алгоритм АДИКМ при передаче кодированного сигнала по каналам с фиксированной пропускной способностью, соответствующей номинальной для данной разновидности АДИКМ скорости передачи. Алгоритмы ПАСР в чистом виде получили наиболее широкое распространение в оборудовании систем передачи со сжатием, например, в оборудовании системы «Passport» выпускаемом фирмой Nortel,..., выпускаемой фирмой Tellabs и др.

Методика и модель исследования влияния характеристик эхосигналов на передачу речи при применении систем, использующих алгоритмы статистического сжатия

В соответствие с результатами анализа механизмов влияния эхосигналов на сжатие речи алгоритмами. АС С, проведенного в главе 2, воздействие эхосигналов в системах, использующих алгоритмы АСС, следует рассматривать в двух аспектах: влияние эхосигналов на качество телефонной передачи, выражающееся в повышении вероятности статистических перегрузок кодера; влияние эхосигналов на эффективность сжатия.

Последний фактор относится к использованию алгоритмов АСС в системах с ограниченной пропускной способностью, и, в частности, в системах пакетной передачи.

В рамках настоящей работы предлагается по сугубо технологическим соображениям объединить исследование влияния характеристик эхосигналов на вероятность статистических перегрузок кодера и на эффективность сжатия в одном цикле экспериментов.„Предлагаемый цикл исследований будет включать: исследование влияния характеристик эхосигнала на среднюю и пиковые мощности смеси полезного передаваемого речевого сигнала и эхосигнала, а также ее пикфактор; исследование влияния характеристик эхосигналов на статистику пауз в речевом сигнале; исследование влияния характеристик эхосигналов на статистические характеристики дельта - кодированного сигнала для простейшей системы линейного предсказания первого порядка.

Исследование влияния характеристик эхосигналов на статистические характеристики смеси полезного передаваемого речевого сигнала и эхосигнала требует подготовки сигналов, представляющих собой полезный передаваемый речевой сигнал и эхосигнал,: которые имели бы близкие статистические характеристики. В этом случае значение затухания, вносимого в эхосигнал, будет обеспечивать представление о соотношении мощности полезного речевого сигнала и мощности эхосигнала в их смеси.

Характеристики пиковой мощности: должны учитывать два аспекта восприятия: речи - заметность ее всплесков как невнятной помехи (усреднение на интервале 2мс) и ее заметность как внятной помехи (усреднение на интервале 50мс), обладающей примерно на 14дБ большим мешающим воздействием по сравнению с невнятной. В процессе экспериментов целесообразно исследование влияния эхосигналов на все виды мощности смеси - средней и два вида пиковой мощности, усредненной на соответствующих интервалах.

Суммирование эхосигнала и полезного передаваемого речевого сигнала осуществляется в формате INTEL специально разработанной для этой цели программой sum_pcm.exe; текст программы sumjpcm.for на языке ФОРТРАН приведен в Приложении 1.

Исследование влияния характеристик эхосигналов на статистику пауз в передаваемом речевом сигнале производится на специальном сигнале, рекомендованном МСЭ-Т. Одним из главных свойств этого сигнала является отсутствие шумов в паузах речи, что в значительной степени облегчает процесс их исследования и универсализирует полученные результаты, абстрагируя их от влияния характеристик детекторов речи, используемых для обнаружения пауз — таких, как пороговый уровень, время срабатывания и время отпускания.

Статистика пауз исследуется в том числе и в форме интегрального закона, обладающего для поставленных целей большой наглядностью по сравнению с функцией плотности распределения вероятностей.

Исследование статистик пауз осуществляется с помощью программ det_pau.exe и gist.exe, специально разработанных для этой цели; тексты программ det_pau.for и gist.for на языке ФОРТРАН приведены в Приложении 1.

Исследование влияния характеристик эхосигналов на статистические характеристики дельта - кодированного сигнала предлагается ограничить неадаптивным линейным предсказанием- первого порядка; результаты такого исследования обеспечат наглядность выявленных закономерностей влияния, качественная картина которых должна сохраняться и в других алгоритмах. АСС, использующих дельта - представление. Формирование: дельта - кодированного сигнала осуществляется с помощью программы deltaxxe, специально разработанной для этой цели; текст программы delta.for на языке ФОРТРАН приведен в Приложении 1.

Анализ результатов исследования влияния характеристик эхосигналов на передачу речи при применении систем, использующих предиктивные алгоритмы сжатия речи

Анализ предиктивных принципов сжатия речи показывает, что механизмы влияния эхосигналов на процессы кодирования и восстановления сигналов имеют много общего для основных рассмотренных алгоритмов ПАСР; отличие влияния будет иметь главным образом количественный характер для разных алгоритмов. С этой точки зрения представляется: допустимым ограничить проведение экспериментальных исследований одним из алгоритмов ПАСР, имея в виду отсутствие принципиальных: отличий влияния эхосигналов на процедуры преобразования, используемые в других алгоритмах.

В рамках настоящей работы: в качестве алгоритма, подлежащего подробному исследованию, предлагается использование алгоритма CS-ACELP [50], получившего наиболее широкое распространение на сетях связи за несколько последних лет. Главным достоинством предлагаемого к исследованиям алгоритма заключается в обеспечении высокой - как правило, восьмикратной, - степени сжатия речи при наиболее высоком по сравнению с другими известными алгоритмами сжатия качества телефонной передачи.

В качестве программного обеспечения, имитирующего работу кодера и декодера CS-ACELP, предлагается использование рекомендованного МСЭ-Т программного обеспечения, предназначенного для аттестационных проверок и калибровки вновь разрабатываемых кодеров.

Модель исследования влияния эхосигналов на процессы кодирования и восстановления сигналов алгоритмами ПАСР несколько сложнее, чем модель, рассмотренная для алгоритмов АСС. Как было отмечено ранее, воздействие эхосигнала в режиме встречного разговора в -системе кодирования и восстановления речи процедурами ПАСР будет заключаться в нарушении адекватности восстановления сигнала. Неадекватность восстановления, в свою очередь, будет выражаться в том, что продукт преобразования в системе кодер -декодер смеси полезного передаваемого сигнала с эхосигналом не будет соответствовать сумме продукта преобразования полезного- сигнала и продукта преобразования эхосигнала. Обозначая функцию преобразования сигнала в системе кодер (К) — декодер (Д) как Ф, можно записать:

В рамках настоящей работы предлагается в качестве объекта исследования, характеризующего влияние эхосигналов на процессы кодирования и восстановления сигнала. речи в системе кодер - декодер, использовать характеристики разностного сигнала:

Для оценки искажений, вносимых в передаваемый сигнал процедурами кодирования и восстановления речи вследствие мешающего воздействия эхосигналов, предлагается использовать характеристики восстановленного полезного передаваемого сигнала:

Поскольку алгоритмы ПАСР не претендуют на точную передачу мгновенных значений сигнала через систему кодер - декодер, использование каких бы то ни было совместных линейных операций над мгновенными значениями входных и выходных отсчетов сигналов для оценки погрешности восстановления не представляется возможным.

Общая модель исследования влияния характеристик эхосигналов на характеристики преобразования сигнала в системе кодер - декодер в рамках предлагаемого подхода примет вид схемы рис.3.2.

Необходимым условием правомерности предложенного подхода к оценке влияния эхосигналов на качество передачи речи в системах, использующих алгоритмы ПАСР, является отсутствие в системе кодер — декодер принципиальной нелинейности и параметрических регуляторов, например систем автоматической регулировки уровней (АРУ). Для проверки выполнения этого условия необходимо исследовать пропорциональность изменений уровня (мощности) сигнала U; изменениям значения затухания сигнала Ам в отсутствии эхосигнала и шума. Целесообразно исследования пропорциональности изменений (линейности) оценивать для всех трех типов мощности сигнала — средней и пиковых, усредненных на принятых временных интервалах.

Значимо важным представляется также сравнительное исследование влияния процессов кодирования и декодирования на статистические характеристики сигнала и смеси сигнала с эхосигналом — такие, как средняя и пиковые мощности, а также слуховой анализ влияния.

В целях сокращения объемов вычислений представляется целесообразным основные сигналы, - исходные, эхосигналы, ослабленные затуханиями Ам и Аэ сигналы хие.а также суммы сигналов х и е - хранить в форме файлов, многократно используемых в процессе исследований.

Формирование суммы сигнала и эхосигнала в формате, принятом для представления сигналов в рамках предложенной методики, осуществляется с помощью программы sum_pcm.exe, специально разработанной для этой цели.

Похожие диссертации на Исследование влияния эхосигналов на качество телефонной передачи в условиях применения методов эффективного кодирования