Помощь в написании студенческих работ
Антистрессовый сервис

Разработка новых методов и алгоритмов компьютерной обработки речевых данных в информационно-телекоммуникационных системах

ДиссертацияПомощь в написанииУзнать стоимостьмоей работы

Применяемые (в основном в телекоммуникациях) в настоящее время решающие процедуры обнаружения пауз основываются на использовании так называемых фильтров линейного предсказания. Среди несовершенств такого подхода можно выделить: принципиальную невозможность построить фильтр линейного предсказания конечного порядка для «белого» шуманаличие в решающей функции «мертвых зон», когда изменение одних… Читать ещё >

Разработка новых методов и алгоритмов компьютерной обработки речевых данных в информационно-телекоммуникационных системах (реферат, курсовая, диплом, контрольная)

Содержание

  • Глава 1. Хранение и передача речевых данных в информационнотелекоммуникационных системах
    • 1. 1. Обзор использования существующих информационно- телекоммуникационных систем для обмена речевыми сообщениями и хранения речевых данных
    • 1. 2. Анализ свойств речевых сигналов и восприятия звука слухом человека
    • 1. 3. Компьютерная обработка речевых сигналов в информационно-телекоммуникационных системах
    • 1. 4. Задачи исследования
  • Глава 2. Частотный анализ речевых сигналов
    • 2. 1. Методы частотного анализа-синтеза речевых сигналов
    • 2. 2. Разработка нового алгоритма вычислений долей энергии отрезков речевых сигналов, соответствующих заданным частотным диапазонам (частотный анализ).'
    • 2. 3. Оптимальные алгоритмы субполосного преобразования

В настоящее время значительно возрос интерес специалистов к проблеме обработки в информационно-телекоммуникационных системах (ИТС) речевых данных, это во многом обусловлено развитием технологий глобальных и корпоративных компьютерных сетей, позволяющих обмениваться речевыми сообщениями, которые часто целесообразно архивировать.

Необходимость в хранении данных речевого обмена возникает при проведении между удаленными участниками аудиоконференций, которые могут продолжаться длительное время, что требует специальных процедур уменьшения объемов битовых представлений сохраняющихся машинных кодов (сжатие данных). Другим достаточно важным примером может служить хранение звукозаписей выступлений лекторов, театральных постановок и т. п.

Стоит так же отметить развивающуюся в настоящее время такую Интернет-услугу, как голосовая электронная почта, что в целях экономии затрат на реализацию трафика так же требуют применения сжатия передаваемых данных (сигналов).

Проблема сжатия речевых данных рассматривается в работах многих авторов, особенно специалистов в телекоммуникациях. При этом отмечаются два основных аспекта: необходимость удаления пауз, возникающих между отдельными словами и в режиме диалога занимающих до 60% длительности исходных звукозаписей, и сокращение объемов битовых представлений собственно звуковых данных.

В первом случае задача сводится к построению решающей процедуры, позволяющей на основе предварительно (при отсутствии звуков речи) оцененных вероятностных характеристик последовательностей данных в паузе (шумов) определить является ли анализируемый отрезок порбждением шума или содержит аддитивную смесь сигнал+шум.

Применяемые (в основном в телекоммуникациях) в настоящее время решающие процедуры обнаружения пауз основываются на использовании так называемых фильтров линейного предсказания. Среди несовершенств такого подхода можно выделить: принципиальную невозможность построить фильтр линейного предсказания конечного порядка для «белого» шуманаличие в решающей функции «мертвых зон», когда изменение одних параметров компенсируется изменениями другихвозможное совпадение максимумов энергетических спектров шума и звука, что приводит к совместному их подавлению и ошибочному отнесению анализируемого участка к паузе.

Можно указать и другие особенности использования фильтров линейного предсказания, которые для повышения достоверности принятия решения о наличии паузы приводят к необходимости анализа достаточно больших отрезков (до 0,6 с), что не позволяет достигать максимального сжатия данных.

Поэтому целесообразно разрабатывать более совершенный метод обнаружения пауз, что можно сделать за счет более тонкого учета различий в распределении энергий шумов и звуковых данных в частотной области. Для этого необходимо создать метод точного вычисления долей энергии анализируемых отрезков, соответствующих заданным частотным интервалам.

Другим важным применением этого метода будет служить построение так называемых спектрограмм (сонограмм), которые к настоящему времени приобрели статус стандартных процедур анализа речевых сигналов, в том числе в задачах распознавания.

Для сжатия участков звуковых данных так же разработаны различные процедуры обработки, в основном применяемые для уменьшения объемов трафика в телекоммуникациях. Основой этих процедур служат необратимые преобразования исходных данных либо за счет более грубого квантования по уровню, либо путем построения моделей генерации, позволяющих осуществить их воспроизведение (вокодеры). Наибольшей степени сжатия удается достичь в случае применения вокодеров. Однако, при этом, наряду с разборчивостью воспроизводимой речи существенно искажается тембр и другие характеристики, что неприемлемо для качественного воспроизведения звукозаписей и аудиоконференций.

Поэтому представляется целесообразным при сжатии звуковых данных использовать процедуру квантования по уровню, т.к. тогда появляется возможность варьирования количеством сохраняемых двоичных разрядов для достижения приемлемого качества звучания воспроизводимой речи. Реализуемость такого подхода обеспечивается тем, что обработку звукозаписей можно осуществлять после их окончания (в отличие от передачи в темпе реального времени).

Существующие методы сжатия звуковых данных с использованием грубого квантования по уровню основываются на психоакустической модели, что приводит к необходимости применения так называемых субполосных преобразований отрезков (векторов) отсчетов речевых сигналов, позволяющих получить другие векторы, подвекторы которых отражают частотные свойства исходного вектора в выбранных диапазонах оси частот. Именно компоненты этих подвекторов подвергаются квантованию по уровню с различными шагами, чем достигается учет частотно-избирательных свойств человеческого слуха.

В настоящее время для субполосного преобразования принято использовать процедуру прореживания выходных последовательностей КИХ-фильтров (фильтров с конечной импульсной характеристикой), настроенных на соответствующие участки оси частот. После квантования этих данных по уровню они могут либо сохраняться, либо подвергаться статистическому обратимому кодированию для достижения большей степени сжатия. Восстановление исходных данных для воспроизведения речи принято осуществлять с использованием специально рассчитанных КИХ-фильтров.

Не вдаваясь в подробности, можно отметить, что такая процедура субполосного преобразования не является оптимальной в смысле минимума погрешностей аппроксимации спектров исходных векторов в выбранных частотных диапазонах, что приводит к увеличению погрешностей восстановления данных по квантованным значениям и, как следствие, к ухудшению качества воспроизводимой речи.

Поэтому представляется целесообразным разработать метод обратимого субполосного преобразования, оптимальный в смысле минимума погрешностей аппроксимации спектров исходного вектора в выбранных частотных диапазонах.

Дальнейшее заключается в разработке на основе новых подходов к обнаружению пауз и субполосному преобразованию процедуры сжатия речевых данных, позволяющей варьировать количество уровней квантования.

Целью работы является совершенствование методов частотной обработки речевых данных в задачах сжатия объемов их битовых представлений в информационно-телекоммуникационных системах.

Для достижения этой цели на основе анализа состояния вопроса были сформулированы и решены следующие задачи:

1. Разработка метода и алгоритмов точного вычисления долей энергий анализируемых отрезков речевых данных в заданных частотных интервалах.

2. Разработка метода обнаружения пауз в речевых данных на основе сравнения распределения энергий шума и смеси сигнал+шум по заданным частотным интервалам.

3. Разработка оптимальных алгоритмов обратимого субполосного преобразования отрезков речевых данных.

4. Разработка информационной технологии сжатия-восстановления речевых данных с использованием метода обнаружения пауз и квантования по уровню компонент векторов оптимального субполосного преобразования.

5. Создание программно-алгоритмической поддержки информационной технологии сжатия-восстановления речевых данных.

Методы исследований.

Методы системного анализа и синтеза на основе использования вариационных принципов.

Методы цифровой обработки сигналов.

Вычислительный эксперимент.

СОДЕРЖАНИЕ РАБОТЫ.

Диссертация состоит из Введения, четырех глав, Заключения и Приложений, в которых приведены результаты исследования свойств собственных векторов рассматриваемой в работе матрицы специального вида, полученные в результате вычислительных экспериментов спектры различных звуков речи и документы, подтверждающие внедрение результатов работы.

4.5. Основные результаты и выводы главы.

1. Разработана процедура сжатия-восстановления речевых данных.

Разработка данной процедуры предполагает объединение разработанных в работе методов:

— точного вычисления долей энергии анализируемых отрезков, соответствующих заданным частотным интервалам;

— обнаружения пауз, за счет более тонкого учета различий в распределении энергий шумов и звуковых данных в частотной области;

— обратимых субполосных преобразований, оптимальных в смысле минимума погрешностей аппроксимации спектров исходного вектора в выбранных частотных диапазонах, с квантованием по уровню с различными шагами компонент полученных подвекторов. Указанная процедура состоит из нескольких этапов:

— кодирование пауз с использованием учета различий в распределении энергий шумов и звуковых данных в частотной области;

— обратимого субполосного преобразования, оптимального в смысле минимума погрешностей аппроксимации спектров исходного вектора в выбранных частотных диапазонах;

— квантования по уровню компонент векторов субполосного представления;

— восстановления исходных данных.

2. Разработан программно-алгоритмический комплекс сжатия-восстановления речевых данных состоящий из двух модулей:

— модуля построения спектрограмм, позволяющего осуществлять частотный анализ речевых сигналов;

— модуля сжатия-восстановления речевых данных, позволяющего осуществлять сжатие WAV-файлов с использованием метода кодирования пауз и квантования по уровню компонент подвекторов субполосного преобразования.

3. Проведенные вычислительные' эксперименты показали, что качество воспроизведения восстановленных речевых данных зависит от выбора параметров процедуры сжатия-восстановления — длины анализируемого отрезка N, количества частотных интервалов R и количества разрядов квантования т. Для использования данной процедуры могут быть рекомендованы значения //=200+500 отсчетов, R=+50 интервалов и т= 1,2, 3 разряда, а так же знаковое квантование.

4. Применение данного программно-алгоритмического комплекса позволяет достичь 20-тикратного уменьшения объемов битового представления речевых данных при достаточно высоком качестве воспроизведения речи.

5. На указанную информационную технологию сжатия-восстановления речевых данных получено свидетельство о регистрации в Отраслевом фонде алгоритмов и программ Федерального агентства по образованию № регистрации 6845 (приложение 3).

ЗАКЛЮЧЕНИЕ

.

В ходе выполнения диссертационного исследования были получены следующие результаты:

1. Разработан алгоритм точного вычисления долей энергий анализируемых отрезков речевых данных в заданных частотных интервалах, который позволил разработать более совершенный метод обнаружения пауз, за счет тонкого учета различий в распределении энергий шумов и звуковых данных в частотной области и процедуру построения спектрограмм речевых сигналов.

2. Разработан метод обнаружения пауз в речевых данных на основе сравнения распределения энергий шума и смеси сигнал+шум по заданным частотным интервалам.

3. Разработаны оптимальные, в смысле минимума погрешностей аппроксимации спектров исходного вектора в выбранных частотных диапазонах, алгоритмы обратимого субполосного преобразования отрезков речевых данных, позволяющие минимизировать количество уровней квантования.

4. Разработана информационная технология сжатия-восстановления речевых данных с использованием метода обнаружения пауз и квантования по уровню компонент векторов оптимального субполосного преобразования.

5. Создана программно-алгоритмическая поддержка информационной технологии сжатия-восстановления речевых данных.

6. Исследования с использованием вычислительных экспериментов показали, что указанный подход позволяет достичь 20-тикратного уменьшения объемов битового представления речевых данных при достаточно высоком качестве воспроизведения речи.

7. Использование разработанной информационной технологии сжатия речевых данных повышает их скрытность, в том смысле, что для их восстановления необходимо использовать специальные алгоритмы и программную поддержку.

Показать весь текст

Список литературы

  1. , И. Основы психоакустики. Слух и речь. Часть 1 Текст. / И. Алдошина // Информационно-технический журнал «Звукорежиссер». -2002. -№ 1.- С.38−44.
  2. , И. Основы психоакустики. Слух и речь. Часть 2 Текст. / И. Алдошина // Информационно-технический журнал «Звукорежиссер». 2002. — № 3. — С.54−58.
  3. , И. Основы психоакустики. Слух и речь. Часть 3 Текст. / И. Алдошина // Информационно-технический журнал «Звукорежиссер». 2002. — № 4. — С.38−44.
  4. , И. Основы психоакустики. Слух и речь. Часть 4 Текст. / И. Алдошина // Информационно-технический журнал «Звукорежиссер». 2002. — № 5. — С.44−50.
  5. , И. Основы психоакустики. Слух и речь. Часть4 Текст. / И. Алдошина // Информационно-технический журнал «Звукорежиссер». 2002. — № 8. — С.60−68.
  6. , Т. Статистический анализ временных рядов Текст.: Пер. с англ. / Т. Андерсон- под. ред. Ю. К. Беляева. М.: Мир, 1976. — 755 с.
  7. , В.Ю. Передача информации в системах подвижной связи Текст. /
  8. B.Ю.Бабков, М. А. Вознюк, В. А. Петраков, А. Е. Рыжков, М. А. Сивере. СПбГУТ, СПб, 1999.-152 с.
  9. , А.В. Исследование применения банков фильтров для сжатия изображений Текст. / А. В. Батлук, М. К. Чобану // Научно-технический журнал Цифровая обработка сигналов. 2005. — № 4 (16). — С. 29−41.
  10. , Дж. Цифровая телефония Текст.: Пер. с англ. / Дж. Беллами. М.: Радио и связь, 1986. — 544 с.
  11. , Р. Быстрые алгоритмы цифровой обработки сигналов Текст. / Р. Блейхут- пер. с англ. И. И. Грушко. М.: Мир, '1989. — 448 е.: ил.
  12. , С.Ф. Цифровая телефония Текст. / С. Ф. Быков, В. И. Журавлев, И. А. Шалимов. М.: Радио и связь, 2003. — 144 е.: ил.
  13. , П.П. Цифровые фильтры, блоки фильтров и полифазные цепи с многочастотной дискретизацией Текст.: метод, обзор / П. П. Вайдьнатхан // ТИИЭР, 1990. Т. 78, № 3. — С. 77−120.
  14. , В.Н. Цифровая обработка сигналов и сигнальные процессоры в системах подвижной радиосвязи Текст. / В. Н. Васюков. Новосибирск: Изд-во НГТУ, 2003. 120 с.
  15. , В. В. Вычислительные основы линейной алгебры Текст. / В. В. Воеводин. -М.: Наука, 1977.-304 с.
  16. , В. В. Вычислительные процессы с теплицевыми матрицами Текст. / В. В. Воеводин, Е. Е. Тыртышников. М.: Наука, 1987. — 319 е.: ил.
  17. , В. В. Матрицы и вычисления Текст. / В. В. Воеводин, Ю. А. Кузнецов. -М.: Наука, 1984.-318 с.
  18. Вокодерная телефония. Методы и проблемы Текст. / Под ред. А. А. Пирогова М.: Связь, 1974.-246 с.
  19. , Э. И. Аналоговая и цифровая звукозапись Текст. / Э. И. Вологдин. СПб.: СТ «Факультет ДВО», 2004. — 52 с.
  20. , Э. И, Слух и восприятие звука Текст.: учеб. пособие / Э. И. Вологдин. -СПб.: СТ «Факультет ДВО», 2004. 52 с.
  21. , В.И. Теория и практика вейвлет-преобразования Текст. / В. И. Воробев, В. Г. Грибунин. СПб.: Изд-во ВУС, 1999. — 204 с.
  22. , Д. Кодирование речи в цифровой телефонии Текст. / Д. Ворсано // Сети и системы связи. -1996. № 8. — С. 24−27.
  23. , В. И. О моторной теории восприятия звуковых сигналов Текст.: Вопросы бионики / В. И. Галунов, В. В. Люблинская, JI. А. Чистович М.:Наука, 1967. — 286с.
  24. , Г. Оптимизация обработки данных в реальном масштабе времени для систем VoIP Текст. / Г. Гардишян // Научно-технический журнал Цифровая обработка сигналов. 2005. — № 1 (15) — С. 36−41.
  25. , С.А. Слух: Введение в психологическую и физиологическую акустику Текст. / С. А. Гельфанд. М.: Медицина, 1984. — 350 с.
  26. , И. И. Теория случайных процессов Текст. / И. И. Гихман, А. В. Скороход. -М.: Наука, 1971.-644 с.
  27. , Б. Цифровая обработка сигналов Текст.: пер. с англ. / Б. Голд, Ч. Рейдер. М.: Сов. радио, 1973.-376 с.
  28. , JI. М. Цифровая обработка сигналов Текст.: справочник / JI. М.
  29. , Б. Д. Матюшкин, М. Н. Поляк. М.: Радио и связь, 1985. — 308 с.
  30. , Л. М. Цифровая обработка сигналов Текст.: учеб. пособие / JI. М. Гольденберг, Б. Д. Матюшкин, М. Н. Поляк. 2-е изд., перераб. и доп. — М.: Радио и связь, 1990.-256 с.: ил.
  31. Гольдштейн, B.C. IP-Телефония Текст. / B.C. Гольдштейн, А. В. Пинчук, АЛ.Суховицкий. М.: Радио и связь. 2001. — 336с.: ил.
  32. , Ф.Р. Теория матриц Текст. / Ф. Р. Гантмахер. М.: Физматлит, 2004. -560с.
  33. , В. Н. Многоканальные телекоммуникационные системы. Учебник для вузов Текст. / В. Н. Гордиенко, М. С. Тверецкий. М: Горячая линия-Телеком, 2005. -416 е.: ил.
  34. , Е.И. Оптимизация банка фильтров в задачах субполосного кодирования: тематический обзор Текст. / Е. И. Гусинская, А. А. Зайцев // Научно-технический журнал Цифровая обработка сигналов. 2004. — № 3(12). — С. 18−29.
  35. , Г. Спектральный анализ и его приложения Текст.: Пер, с англ. / Г. Дженкинс, Д. Ватте- под ред. В. Ф. Писаренко. М.: Мир, 1971. — 316 с.
  36. Дьяконов, В.П. MATLAB. Обработка сигналов и изображений. Специальный справочник Текст. / В. П. Дьяконов. СПб.: Питер, 2002. — 608 с.
  37. Дьяконов, В.П. Matlab Текст. / В. П. Дьяконов. СПб.: Питер, 2001. — 553 с.
  38. , Е.Г. Вариационные методы частотного анализа звуковых сигналов Текст. / Е. Г. Жиляков, С. П. Белов, Е. И. Прохоренко // Труды учебных заведений связи. СПб, 2006.-№ 174.-С.163−170.
  39. , Е.Г. О кодировании пауз в речевых сигналах Текст. / Е. Г. Жиляков, С. П. Белов, Е. И. Прохоренко // Материалы Шестой Международной научно-технической конференции «Проблемы техники и технологии телекоммуникаций». -Уфа, 2005.-С. 73−74.
  40. , Е.Г. Программная система цифровой обработки речевых данных / Е. Г. Жиляков, С. П. Белов, Е. И. Прохоренко. Отраслевой фонд алгоритмов и программ «Государственный координационный центр информационных технологий», 2006.-№ 50 200 601 604.
  41. , Е.Г. Методы и алгоритмы обработки экспериментальных данных в атомно-абсорбционной спектрометрии Текст. / Е. Г. Жиляков, Н. И. Корсунов, Д. П. Лагода. -Киев: Наукова думка, 1992. -125 с.
  42. , Е.Г. О субполосном кодировании сигнала Текст. / Е. Г. Жиляков, И. Г. Попов, И. И. Чижов // Вестник национального технического университета «ХПИ». -2004.-№ 46.-С.
  43. , Е.Г. Частотный анализ речевых сигналов Текст. / Е. Г. Жиляков, Е. И. Прохоренко // Научные ведомости Белгородского государственного университета. Белгород, 2006. — № 2(31), выпуск 3. — С. 201−208. — (Серия: информатика и прикладная математика).
  44. , Е.Г. Статистики максимальной чувствительности в задаче обнаружения изменений параметров процессов авторегрессии Текст. / Е. Г. Жиляков, Э. К. Шпилевский // Заводская лаборатория. -1992. № 7. — С.31 -34.
  45. , Н. Г. Методы распознавания и их применение Текст. / Н. Г. Загоруйко. -М.: Сов. радио, 1972. 206 с.
  46. , С.Ю. Система автоматического распознавания речи SPIRIT ASR Engine Текст. / С. Ю. Иконин, Д. В. Сарана // Научно-технический журнал Цифроваяобработка сигналов. -2003. -№ 4 (10). С. 2−13.
  47. , Ю.К. Разборчивость речи в цифровых вокодерах. / Ю. К. Калинцев. М.: Радио и связь, 1991. — 220 е.: ил.
  48. , М. Дж. Многомерный статистический анализ и временные ряды Текст.: Пер. с англ. / М. Дж. Кендалл, А. Стьюарт- под ред. А. Н. Колмогорова, Ю.
  49. B.Прохорова. М.: Наука, 1976. — 736 с.
  50. , С.Н. Проектирование банков фильтров на основе теории кратномасштабного анализа Текст. / С. Н. Кириллов, С. В. Зорин // Научно-технический журнал Цифровая обработка сигналов. 2005. — № 4 (16). — С. 9−16.
  51. , Ю.А. Цифровое кодирование звуковых сигналов Текст. / Ю. А. Ковалгин, Э. И. Вологодин. СПб: Корона-принт, 2004. — 240 е.: ил.
  52. , М.А. Оценка эффективности использования технологий VoIP и VAD в корпоративных IP-сетях Текст. / М. А. Кораблин, А. В. Мороз // Электросвязь. 2004. -№ 8.-С. 15−18.
  53. , Г. А. Анализ и синтез речевого сигнала методом линейного предсказания Текст./ Г. А. Коротаев // Зарубежная радиоэлектроника. -1990. № 3. — С. 31 -52.
  54. , Г. А. Некоторые аспекты линейного предсказания при анализе речевого сигнала Текст. / Г. А. Коротаев // Зарубежная радиоэлектроника. 1991. — № 7.1. C.13−31.
  55. , В. И. Влияние фазовых соотношений в спектре речи на ее восприятие Текст. / В. И. Куля // Электросвязь. -1970. № 7. — С. 23−31.
  56. , М.С. Цифровая обработка сигналов Текст. / М. С. Куприянов, Б. А. Матюпткин. С-Пб.: Питер, 1998. — 416 с.
  57. , В. К. Модели механизмов слуха Текст. / В. К. Лабутин, А. П. Молчанов. -М.: Энергия, 1973. 200 с.
  58. , А. А. Передача информации о состоянии фильтра-предсказателя с помощью спектральных пар Текст. / А. А. Ланнэ, Д. А. Улахович // Радиоэлектроника и связь. -1991.-№ 1.-С. 43−47.
  59. , К. Практические методы прикладного анализа Текст.: справ, рук. / КЛанцош — пер. с англ. М. 3. Кайнера. М.: Физматгиз, 1961. — 524 с.
  60. , А.Ю. Субполосная адаптивная фильтрация в задачах обратногомоделирования Текст. / А. Ю. Линович, В. В. Витязев // Научно-технический журнал Цифровая обработка сигналов. 2004. — № 1 (11). — С. 31−38.
  61. , Дж. Линейное предсказание речи Текст.: Пер. с англ. / Дж. Маркел, А.Х.Грэй- под ред. Ю. Н. Прохорова и B.C. Звездина. М.: Связь, 1980. — 308 с.
  62. , П.В. Специфика детектора речи для системы верификации диктора по голосу Текст. / П. В. Мартынович // Научно-технический журнал Цифровая обработка сигналов. 2004. — № 3 (12). — С. 43−47.
  63. Методы сжатия данных: устройство архиваторов, сжатие изображений и видео Текст. / Д. Ватолин, А. Ратушняк, М. Смирнов, В. Юкин. М.: ДИАЛОГ-МИФИ, 2003.-384 с.
  64. , С.А. Кодер АДИКМ аппаратуры цифровой спутниковой связи Текст. / С. А. Минин // Электросвязь. -1992. № 11. — С. 32−44.
  65. , В.Г. Измерение параметров речи Текст. / В. Г. Михайлов, Л.В.Златоустова- под ред. М. А. Сапожкова. М.: Радио и связь, 1987. -168 е.: ил.
  66. , Х.З. Методы цифровой обработки и передачи речевых сигналов Текст. / Х. З. Назаров, Ю. Н. Прохоров. М.: Связь, 1982. — 236с.
  67. , С. М. Квадратурные формулы Текст. / С. М. Никольский. М.: Наука, 1988.-256 е.: ил.
  68. , Г. Быстрое преобразование Фурье и алгоритмы вычисления сверток Текст. / Г. Нуссбаумер — ред.: В. М. Амербаев, Т. Э. Кренкель — пер. с англ.: Ю. Ф. Касимов, И. П. Пчелинцев. М.: Радио и связь, 1985. — 248 с.: ил., табл., граф.
  69. , Ф. Преобразование Фурье распределений и их обращения Текст.: табл. / Ф. Оберхеттингер- пер. с англ. М. С. Никулина. М.: Наука, 1979. — 248 с.
  70. , А.В. Цифровая обработка сигналов Текст.: Пер. с англ. / А. В. Оппенгейм, Р.В. Шафер- под ред. С. Я. Шаца. М.: Связь, 1979. — 416 с.
  71. Основы цифровой обработки сигналов Текст.: курс лекций: учеб. пособие / А. И. Солонина, Д. А. Улахович, С. М. Арбузов и др. СПб.: БХВ-Петербург, 2003. -608 с.: ил.
  72. , Л.В. Качество передачи речи при использовании низкоскоростных кодеков на абонентских линиях Текст. /Л.В. Перцева//Электросвязь. -1987. № 8. — С. 48−64.
  73. , Б.И. Речевая связь в искусственных атмосферах Текст. / Б. И. Петленко,
  74. JI.C. Бутырский- под ред. И. Т. Турбовича. М.: Связь, 1978. — 144 с.
  75. , А.А. Низкоскоростной вокодер с моделью речеобразования «гармоники + шум» Текст. / А. А. Петровский, В. В. Серков // Цифровая обработка сигналов. -2002. № 2. — С.2−12.
  76. Применение цифровой обработки сигналов Текст. / С. JI. Фрини, Дж. Ф. Кайзер, X. С. Макдональд и др.- пер. с англ. А. М. Рязанцева- под ред. Э. Оппенгейма. М.: Мир, 1980.-552 с.
  77. , Дж. Цифровая связь Текст. / Дж. Прокис- под ред. Д. Д. Кловского. М.: Радио и связь, 2000. — 800 с.
  78. , Е.И. Метод обнаружения пауз в речевых сигналах Текст. / Е. И. Прохоренко // Вестник московской академии рынка труда и информационных технологий. Москва, 2006. — № 4(26). — С.13−20.
  79. , Е.И. О пакетной передаче речи Текст. / Е. И. Прохоренко // Вестник национального технического университета «ХПИ». Харьков, 2004. — № 46. — С. 5661. — (Сборник научных трудов. Тематический выпуск: Информатика и моделирование).
  80. , Ю.Н. Статистические модели и рекуррентное предсказание речевых сигналов Текст. / Ю. Н. Прохоров. М.: Радио и связь, 1986. — 316 с.
  81. , JI.P. Цифровая обработка речевых сигналов Текст.: Пер. с англ. / Л. Р. Рабинер, Р.В. Шафер- под ред. М. В. Назарова, Ю. Н. Прохорова. М.: Радио и связь 1981.-495 с.
  82. , Л. Теория и применение цифровой обработки сигналов Текст. / Л. Рабинер, Г. Годц. М.: Мир, 1988. — 512 с.
  83. , А. Компьютерная обработка звука Текст. / А. Радзишевский. М.: Нолидж, 2000.-240 с.
  84. , Г. С. Автоматическое распознавание говорящего по голосу Текст. / Г. С. Рамишвили. М.: Радио и связь, 1981, — 224 с.
  85. Росляков, А.В. IP-телефония Текст. / А. В. Росляков, М. Ю. Самсонов, И. В. Шибаева.- М.: Эко-Тредз, 2001. 250 с.
  86. , В.В. Автоматическая обработка речи по критерию минимума информационного рассогласования на основе метода обеляющего фильтра Текст. / В. В. Савченко // Радиотехника и Электроника. 2005. Том 50. — № 3. — С. 309−315.
  87. , В.В. Метод переопределенного словаря в задаче распознавания речевых сигналов Текст. / В. В. Савченко, П. Г. Лукин // Радиотехника и Электроника. 2006.- Том 51. № 2. — С. 202−207.
  88. , М. А. Речевой сигнал в кибернетике и связи Текст. / М. А. Сапожков. -М.: Связьиздат, 1963.-452 с.
  89. , М.А. Вокодерная связь Текст. / М. А. Сапожков, В. Г. Михайлов. М.: Радио и связь, 1983.-248 с.
  90. , Дж. Линейный регрессионный анализ Текст.: Пер. с англ. / Дж. Себер- под ред. М. Б. Малютова. М.: Мир, 1980. — 456 с.
  91. , Н.Ю. Обработка звука на PC Текст. / Н. Ю. Секунов. СПб.: БХВ-Петербург, 2001.-1248 с.
  92. , А. Б. Цифровая обработка сигналов Текст.: учеб. пособие для студ. вузов / А. Б. Сергиенко. СПб.: Питер, 2002. — 603с.: ил. — (Учебник для вузов).
  93. Сжатие данных в системах сбора и передачи информации Текст. / В. И. Орищенко, В. Г. Санников, В.А. Свириденко- под ред. В. А. Свириденко. М.: Радио и связь, 1985. -184 е., ил.
  94. , У. Преобразование стимула в периферической слуховой системе Текст. / В кн.: Распознавание образов: Пер. с англ./ У. Сиберт- под ред. Л. И. Титомира. М.: Мир, 1970.-236 с.
  95. Слуховая система Текст. / Сб. статей под ред. Я. А. Альтман. Л.: Наука, 1990. -620 с.
  96. , Д.В. Аудиосистема PC Текст. / Д. В. Смирнов. СПб.: Питер, 1999. -384с.
  97. , В. Н. О роли подглоточной области в процессе речеобразования Текст. / В кн.: Проблемы построения систем понимания речи. / В. Н. Сорокин. М.: Наука, 1980.-354 с.
  98. , В. Н. Потери в речевом тракте Текст. / В. Н. Сорокин // Акустический журнал. 1977. — Т. 23. — № 6. — С. 939−946.
  99. Спектральные методы сокращения избыточности высококачественных звуковых сигналов Текст. / В. М. Колесников, М. У. Банк, А. М. Синильников, В. А. Сучилин // Радио и телевидение ОИРТ. 1989. -№ 1. — С. 36−39. -№ 2. — С. 35−39.
  100. , Е. Введение в теорию интеграла Фурье Текст. / Е. Титчмарш — пер. с англ. Д. А. Райкова. М.: ОГИЗ Гостехиздат, 1948. — 479 с.
  101. , Г. Акустическая теория речеобразования Текст. / Г. Фант. М.: Наука, 1964. -283 с.
  102. Физиология речи. Восприятие речи человеком Текст. / Л. А. Чистович и др.— М.:1. Наука, 1976−386 с.
  103. , Дж. Анализ, синтез и восприятие речи Текст.: Пер. с англ. / Дж. Фланаган- под ред. А. А. Пирогова. М.: Связь, 1968. — 396 с.
  104. , Р. Матричный анализ Текст. / Р. Хорн, Ч. Джонсон. М.: Мир, 1989. — 395 с.
  105. , Я. И. Финитные функции в физике и технике Текст. / Я. И. Хургин, В. П. Яковлев. М.: Наука, 1971. — 408 е.: ил.
  106. , Э. Ухо как приемник информации Текст.: Пер. с нем./ Э. Цвикер, Р. Фельдкеллер- под ред. Б. Г. Белкина. М.: Связь, 1971. — 256 с.
  107. , О.И. Цифровая обработка и передача речи Текст. / О. И. Шелухин, Н.Ф.Лукьянцев- под ред. О. И. Шелухина. М.: Радио и связь, 2000. — 456с.: ил.
  108. , В.И. Основы теории передачи информации Текст.: Учебное пособие / В. И. Шульгин. Харьков: Нац. аэро-косм. ун-т. «Харьк. авиац. ин-т», 2003. — 102 с.
  109. , S. 32 kbit/s toll quality ADPCM codec using a single chip processor, IEEE Int. Text. / S. Aikoh, T. Nishitani, K. Ozawa, R. Marita // Conf. Acoust. Speech. Sig. Process. Paris, France, 1982. — Vol. 2. — P. 960−963.
  110. Alrera Devices. -15.06.2004. http://www.altera.com/products/devices/dev-index.jsp.
  111. Atol, B.S. High quality speech at very low bit rates: multipulse and stochastically excited linear predictive coders Text. / B.S. Atol // Proc. of the Int. Conf. on ASSP, 1986. -P.1065−1069.
  112. Alessandro, C. Effectiveness of a periodic and aperiodic decomposition method for analysis of voice sources / C. Alessandro, V. Darsinos, B. Yegnanarayana // IEEE Transactions on Speech and Audio Pr6cessing. -1998. vol.6 — № 1. — P. 12−23.
  113. DARPA TIMIT Acoustic-Phonetic Continuous Speech Corpus, Department of Commerce, NIST. Springfield, Virginia, 1990.
  114. Gardner, W.R. Theoretical analysis of the high-rate vector quantization of LPC parameters. / W.R. Gardner, B.D. Rao // IEEE Transactions on Speech and Audio Processing. 1995. — vol.3. — № 5. — P. 367−381.
  115. Gersho, A. Vector quantization and signal compression. / A. Gersho, R. Gray. Boston, Kluwer Academic Publishers, 1992.
  116. Gray, A.H. Distance measures for speech processing. / A.H. Gray, J.D. Markel // IEEE Transactions on Acoustics, Speech and Signal Processing. 1976. — vol.24. — № 5. — P. 380−391.
  117. Griffin, D.W. Multiband excitation vocoder. / D.W. Griffin, J.S. Lim // IEEE Transactions on Acoustics, Speech and Signal Processing. 1988. — vol. 36. -№ 8. — P. 1223−1235.
  118. Itakura, F. Line spectrum representation of linear predictive coefficients of speech signals.
  119. F. Itakura, J. Acoust. Soc. America, 1975. — vol. 57. -35 p.
  120. ITU-T Recommendation G.721 32 kbit/s Adaptive ADPCM. 1990. — 43 p.
  121. ITU-T Recommendation G.726 40, 32, 24, 16 kbit/s Adaptive Embedded ADPCM. -1990.-68 p.
  122. ITU-T Recommendation G.726. 40, 32, 24, 16 kbit/s Adaptive Differential Pulse Code Modulation (ADPCM). -1990. 47p.
  123. ITU-T Recommendation G.727 5-, 4-, 3-, 2-Bit Sample Embedded ADPCM. -1994. -47p.
  124. Jackson, P.J.B. Pitch-scaled estimation of simultaneous voiced and turbulence-noise components in speech. / P.J.B. Jackson, C.H. Shadle // IEEE Transactions on Speech and Audio Processing. 2001. — vol.9. -№ 7. — P. 713−726.
  125. Jayant, N. Digital Coding of Waveforms: Principles and Applications to Speech and Video. / N. Jayant, P. Noll. New Jersey, 1984. — 320 p.
  126. Kim, S.-J. Split vector quantization of LSF parameters with minimum of dLSF constraint / S.-J. Kim, Y.-H. Oh, // IEEE Signal Processing Letters. 1999. — vol. 6. — № 9. — P. 227 229.
  127. Kondoz, A.M. Digital speech: coding for low bit rate communication systems. / A.M.Kondoz. John Wiley & Sons, Inc., NY, 1996. — 442 p.
  128. Linde, Y. An algorithm for vector quantizer design. / Y. Linde, A. Buzo, R.M. Gray // IEEE Transactions on Communications. -1980. vol. COM-28. — P. 84−95.
  129. Mitsubishi Electric Corporation. The characteristics of the turbulences appeared in objective test and voice signal transmission of Rec. G.726, COTT contribution D. 301/XV, 1991.-39 p.
  130. National P/N TP11368 Octal Adaptive Differentia. PCM Processor. — 12.08.2003. http://ww.mtioml.com/pfiTP/TPl 1368. html
  131. Palival, K.K. Efficient vector quantization of LPC parameters at 24 bits/frame. / K.K.Palival, B.S. Atal // IEEE Transactions on Acoustics, Speech and Signal Processing. 1993. — vol.1.-№ 1.-P. 3−14.
  132. Peifomiance of various ADPCM algorithms with very high speed modems, ITU-T Contribution No. COM 15-D.9,1994. 34 p.
  133. Petrovsky, A. Tonal and noise components separation based on a pitch synchronous DFTanalyzer as a speech coding method. / A. Petrovsky, P. Zubricki, A. Savicki //i
  134. Proceedings European Conference on Circuit Theory and Design. Cracow, Poland, 2003.-vol.3.-P. 169−172.
  135. Stylianou, Y. Applying the harmonic plus noise model in concatenative speech synthesis. / Y. Stylianou // IEEE Transactions on Speech and Audio Processing. 2001. — vol. 9. -№ 1.-P. 21 -29.
  136. Xilinx Home: Products and Services: Spartan-11 fPGAs. 11.06.2004. http://www.xilirLx.com/xlnx/xil prodcat landingpage. jsp?title=Spartan-l 1.
  137. Yegnanarayana, B. An iterative algorithm for decomposition of speech signals into periodic and aperiodic components. / B. Yegnanarayana, C. d’Alessandro, V. Darsinos. // IEEE Transactions on Speech and Audio Processing. -1998. vol.6. -№ 1. — P. 1−11.
Заполнить форму текущей работой