Методы вычисления параметров устойчивой модели и признаков в задаче распознавания речевого сигнала

ДиссертацияПомощь в написанииУзнать стоимостьмоей работы

Методы вычисления параметров устойчивой модели и признаков в задаче распознавания речевого сигнала (реферат, курсовая, диплом, контрольная)

Содержание

ГЛАВА 1. МЕТОДЫ АКУСТИЧЕСКОЙ ОБРАБОТКИ СИГНАЛОВ В ЗАДАЧЕ АВТОМАТИЧЕСКОГО РАСПОЗНАВАНИЯ РЕЧИ (ЛИТЕРАТУРНЫЙ ОБЗОР)
- 1. 1. Архитектура и задачи систем обработки речи. Место алгоритмов акустической обработки
- 1. 2. Акустическая модель речеобразования
- 1. 3. Алгоритмы получения акустических признаков
  - 1. 3. 1. Анализ временных параметров
  - 1. 3. 2. Кратковременный спектральный анализ [29, 30, 38]
  - 1. 3. 3. Гомоморфная обработка [61]
  - 1. 3. 4. Параметрическое моделирование: авторегрессионная модель и линейное предсказание [34, 35, 41, 42]

Речевой сигнал как средство передачи информации используется для создания естественных интерфейсов связи с машиной, что упрощает решение многочисленных задач в разнообразных приложениях. Одна из главных возникающих при этом трудностей связана с построением комплексной системы обработки речевых данных, дающей корректный устойчивый результат независимо от возможных искажений сигнала. Основной функцией систем обработки речевого сигнала является распознавание произнесенной фразы и извлечение смысла принятого сообщения, достаточного для принятия решения и генерации соответствующего ответа.

Первичной процедурой в задаче обработки речевого сигнала является акустическая обработка, которая заключается в сопоставлении каждому фрагменту сигнала некоторого набора признаков, в которых закодирована фонетическая информация, содержащаяся в данном фрагменте сигнала. Среди вопросов, относящихся к акустической обработке сигналов, одним из важнейших является вопрос устойчивого кодирования сигнала в условиях искажений и различного рода помех[1−9, 34]. Задача обнаружения сигнала в помехах и его извлечения имеет большое практическое значение для проектирования систем обработки речевых данных [10−16, 52]. Большинство существующих систем построены по модульному принципу, поэтому получаемая с помощью процедуры акустического кодирования информация в том или ином виде используется всеми остальными процедурами, и ошибки, допущенные на начальном этапе обработки, приводят к снижению эффективности работы системы в целом [10,13]. Результат работы методов акустического кодирования определяет качество работы всей системы, поэтому особое внимание уделяется разработке методов, чувствительных к изменениям фонетической структуры, и в то же время устойчивых к шумовым искажениям сигнала. Устойчивость к шумовым искажениям означает, что изменение уровня помех не приводит к существенному изменению вычисляемых признаков. В случаях, когда в структуре помехи наблюдается некоторая закономерность, достаточно легко подобрать метод компенсации такой помехи в сигнале и отфильтровать ее на этапе предобработки сигнала. В случаях, когда данные о помехе отсутствуют, и компенсирующий алгоритм подобрать затруднительно, фильтрация сводится к отбрасыванию всех данных кроме тех, которые соответствуют полезному сигналу. Фильтрация помех также является задачей акустической обработки.

Известно, что необходимая для распознавания фонетическая информация в речевом сигнале в значительной степени представлена его вокализованной частью. Таким образом, важной задачей алгоритмов акустической обработки является кодирование фонетической информации для вокализованных фрагментов речевого сигнала, устойчивое к наличию в нем вариаций произношения, а также помех.

Этап акустической обработки в системах распознавания речевого сигнала представлен целым семейством алгоритмов, основная цель которых заключается в оценке огибающей мгновенного спектра сигнала, содержащей фонетическую информацию [10,13,14,35,61]. Современные методы обработки вокализованных сигналов подразумевают использование для этих целей линейных параметрических моделей, позволяющих эффективно моделировать гармоническую структуру сигнала и потому более предпочтительных. В данном случае параметры модели рассматриваются как акустические признаки. С параметрическими моделями тесно связана задача определения порядка модели. Неверные значения порядка приводят к потере полезной либо к внесению паразитной информации в оценки параметров, что отрицательно сказывается как на оценках вычисленных признаков, так и на качестве работы использующих их методов в целом. Существующие в настоящее время методы определения порядка модели дают, как правило, заниженные значения и не обеспечивают требуемой точности решения, потому в большинстве существующих систем используются некоторые усредненные значения порядков, установленные экспериментально.

Таким образом, важной задачей акустической обработки сигнала является формирование устойчивых акустических признаков на основе линейной параметрической модели.

Целью диссертационной работы является определение устойчивых акустических признаков речевых сигналов на основе методов линейного предсказания, разработка методов и алгоритмов вычисления этих признаков, исследование эффективности разработанных методов и алгоритмов на модельных и реальных данных. В задачи работы входит:

1. Разработка метода формирования устойчивых признаков речевых сигналов на основе линейной модели авторегрессии — скользящего среднего (АРСС) и методе модифицированного линейного предсказания.

2. Разработка методов определения порядка используемой линейной модели.

3. Анализ и алгоритмов устранения искажений признаков, связанных с обработкой немодельных речевых сигналов.

4. Исследование эффективности работы реализованных методов и алгоритмов по отношению к помехам высокого уровня для модельных и реальных вокализованных речевых сигналов.

Актуальность работы состоит в том, что использование устойчивых акустических признаков в распознающих и кодирующих системах является ключевым фактором повышения эффективности этих систем, что в свою очередь обеспечивает возможность применения этих систем в более широком диапазоне условий. Вместе с тем в настоящий момент отсутствует универсальный подход к созданию оптимальной системы акустических признаков. Поиск новых методов и алгоритмов формирования акустических признаков, эффективно решающих те или иные классы задач, составляет в настоящее время одно из важных направлений в области обработки речевых данных.

Научная новизна работы состоит в том, что создан новый метод формирования и вычисления устойчивых акустических признаков, основанный на представлении вокализованного речевого сигнала в виде суммы гармонических составляющих в белом шуме и использовании модели Писаренко сигнала вместо традиционно используемой авторегрессионной модели. Этот метод обладает свойством информационной оптимальности и тем самым гарантирует максимальную информационную эффективность в классе линейных моделей. Для данного метода разработан алгоритм определения порядка используемой модели, учитывающий специфику анализируемого сигнала и дающий устойчивый результат.

Практическая ценность работы состоит в том, что разработанные алгоритмы могут быть использованы в современных системах обработки речевых сигналов, как на основе существующей структуры и состава этих систем, так и путем включения в эти системы дополнительных блоков, реализованных программным или аппаратным образом.

Апробация работы.

Основные результаты диссертационной работы докладывались и обсуждались: на Научной всероссийской конференции «Информационные системы и технологии» (Нижний Новгород, НГТУ, 2002,2003, 2005 гг.), на Научной конференции «Роль молодых ученых в развитии информационных технологий и подготовке специалистов» (Нижний Новгород, 2002), на V-й Международной конференции «Цифровая обработка сигналов и ее применение» (Москва, 2003), на И-й Всероссийской научной конференции «Проектирование научных и инженерных приложений в среде MATLAB» (Москва, 2004), на VI-й, VIII-й, IX-й Научной конференции по радиофизике (Нижний Новгород, Радиофизический факультет ННГУ, 2002, 2004, 2005 гг.), на Конференции МэИнфо-2005 (Зеленоград, МИЭТ, 2005), на V-й Международной научно-технической конференции «Электроника и информатика — 2005» (Зеленоград, МИЭТ, 2005), на XXIV-x научных чтениях имени академика Н. В. Белова (Нижний Новгород, 2005).

Публикации.

Основные результаты, полученные в диссертации, опубликованы в 12-ти работах, в том числе в 5-ти статьях, среди которых статьи в журналах:

Вестник нижегородского университета им. Лобачевского, серия радиофизика, 2004,.

Радиотехника и электроника", 2005, «Радиофизика», 2006.

Основные положения, выносимые на защиту.

1. Метод формирования устойчивых признаков речевых сигналов на основе модифицированной линейной модели.

2. Результаты исследования на признаки реальных помех. Применение методов фильтрации в пространстве признаков для повышения их устойчивости.

3. Методы определения порядка используемой линейной модели.

4. Результаты исследования эффективности разработанных методов в условиях высоких уровней помех и меняющихся помех.

Содержание работы.

Диссертационная работа состоит из введения, пяти глав, заключения, списка используемых литературных источников и двух приложений.

Заключение

Разработан и реализован метод формирования устойчивых признаков речевых сигналов на основе модифицированной модели авторегрессиискользящего среднего. В качестве набора параметров этой модели используются значения собственного вектора разложения автокорреляционной матрицы сигнала при минимальном собственном числе. Коэффициенты линейного прогнозирования для этой модели рассчитываются с помощью модифицированного метода линейного предсказания. В качестве акустических признаков используются кепстральные коэффициенты, рассчитываемые на основе полученных коэффициентов прогнозирования. Полученные признаки слабо зависят от уровня помех в сигнале, не содержат лишней информации и позволяют эффективно кодировать формантную структуру речевых вокализованных сигналов.

Исследовано влияние на вычисляемые акустические признаки различных помех и искажений. Установлено, что среди присутствующих в звукозаписи помех, преимущественно выделяются слабокоррелированные широкополосные помехи и линейный тренд, состоящий из постоянной составляющей и гармоник низкой частоты, с периодом, превышающим длину анализируемого фрейма сигнала. Для устранения линейного тренда реализован алгоритм, заключающийся в вычитании из сигнальной последовательности сформированной оценки линейного тренда, вычисляемой по исходному сигналу традиционными методами. Визуальный анализ спектра и распределения собственных чисел сигнала без тренда и сигнала с удаленным трендом показал их неразличимость, что свидетельствует о качественном устранении тренда выбранным алгоритмом.

Для коррекции спектра, в котором энергия сосредоточена преимущественно в низкочастотной области, реализован алгоритм предварительного контрастирования, усиливающего вклад высоких частот. Усиление вклада высоких частот позволяет вскрыть тонкую структуру в автокорреляционной последовательности и построить более точную формантную картину.

Для ослабления влияния широкополосных помех реализован метод фильтрации автокорреляционной функции речевого сигнала на базе сингулярного разложения. Экспериментально установлено, что использование алгоритма коррекции входного сигнала обеспечивает большую устойчивость работы предлагаемого метода вычисления акустических признаков. Таким образом, использование реализованных методов коррекции входного сигнала обеспечивает большую устойчивость работы предлагаемого алгоритма вычисления акустических признаков как по отношению к различным помехам, так и по отношению отклонениям сигнала от модельного представления.

Разработаны и реализованы методы определения порядка АРСС-модели, ориентированные на формантные свойства вокализованного речевого сигнала. Первый метод основан на сравнении амплитудных оценок спектров, построенных по параметрам моделей смежных порядков. В его основу положено наблюдающееся для вокализованных сигналов свойство соответствия спектральных оценок смежных порядков и их соответствие формантной картине при значении порядка, равному истинному порядку модели. Второй метод основан на сравнении набора коэффициентов традиционного линейного предсказания и набора первичных параметров, вычисляемых предлагаемым методом. В его основе лежит свойство сходства векторов коэффициентов традиционного и модифицированного линейного предсказания. На основании исследования эффективности работы методов в зависимости от уровня шумов показано, что предлагаемые методы дают верное значение порядка модели в широком диапазоне значений соотношения сигнал/шум, что обеспечивает возможность их использования в составе разработанного метода вычисления устойчивых акустических признаков. Данные методы могут быть также использованы для определения вокализованных и невокализованных фрагментов речевого сигнала.

Полученный комплексный метод вычисления акустических признаков, имеющий в своем составе все методы, описанные выше, был протестирован на сформированном фонетическом алфавите. На основании проведенных сравнительных исследований устойчивости кодирования традиционным и предложенным методами показано, что акустические признаки, вычисленные предложенным методом, менее подвержены изменениям, связанным с наличием в сигнале помех. Таким образом, использование акустических признаков, рассчитанных в соответствии с предлагаемым методом, позволит обеспечить стабильность акустического кодирования вокализованного речевого сигнала в условиях его искажения и наличия помех различного уровня.

Показать весь текст

Список литературы

Обнаружение радиосигналов. / П. С. Акимов, Ф. Ф. Евстратов, С. И. Захаров и др. — Радио и связь, 1989. -288 с.
Рабинер Л., Гоулд Б. Теория и применение цифровой обработки сигналов: Пер. с англ. М.: Мир, 1978. -848 с.
Голд Б., РэйдерЧ. Цифровая обработка сигналов / Под ред. М. Трахтмана. — М.: Сов. радио, 1973. -367 с.
Рабинер JI.P., Шафер Р. В. Цифровая обработка речевых сигналов. М: Радио и связь, 1981.-496 с.
Цемель Г. И. Опознавание речевых сигналов. М.:"Наука", 1971. -с.34−125.
Madisetti V.K., Williams D.B. The digital signal processing handbook. CRC Press., 1998.-pp.1500.
Назаров M.B., Прохоров Ю. Н. Методы цифровой обработки и передачи речевых сигналов. М.: Радио и связь, 1985. — 176с.
Уидроу Б., Гловер Д. Ю., Маккул Д. и др. Адаптивные компенсаторы помех. Принцип построения и применения // ТИИЭР. 1975. -№ 12. Т.63 -С. 69−98.
Методы автоматического распознавания речи: В 2-х кн./Под. ред.: У. А. Ли, Э. П. Нейбург, Т. Б. Мартин и др.- Под ред.У.Ли- Пер. с англ. О. В. Александровой под ред.А. А. Воронова.-М.:Мир, 1983. -327 с.
Сердюков В.Д. Опознавание речевых сигналов на фоне мешающих факторов. Тбилиси.: Наука, 1987, -142с.
Сапожников М.А. Речевой сигнал в кибернетике и связи. -М.: Связьиздат, 1963.-с.135−357.
Редди. Машинное распознавание речи. Обзор. // ТИИЭР. -т.64, № 4. -1976.
Reddy D.R. Computer recognition of connected speech. // J. Acoust. Soc. Amer., vol.46, no.2, Aug. 1967. -pp.329−347.
Потапова P.K. Речь: коммуникация, информация, кибернетика. Изд. 2-е, доп. М.: Эдиториал УРСС, 2001. — 568с.
Rabiner L., Juang В. Fundamentals of Speech Recognition. Prentice Hall PTR, 1993.-p.496.
Flanagan J.L. Speech analysis, synthesis and perception, 2-nd ed. Springer-Verlag, New York, 1972. -p.444.
Косарев Ю.А. Естественная форма диалога с ЭВМ. -М.: Машиностроение, Ленингр. отд., 1989. -142с.
Баранов А. Н. Категории искусственного интеллекта в лингвистической семантике. Фреймы и сценарии. М., 1987.
Барченков С.А. Человек разговаривает с машиной. (Автоматическое распознавание и воспроизведение речи) -М.: Воениздат, 1974.-134с.
Фант Г. Акустическая теория речеобразования. Пер с англ. М: Наука, 1964.-284с.
Фант Г. Анализ и синтез речи. Пер. с англ. B.C. Лозовского и Н. В. Бахмутовой под ред. Н. Г. Загоруйко. Новосибирск, -М.: Наука, 1970. -167с.
Сорокин В.Н. Теория речеобразования. -М.: Радио и связь, 1985. -312 с.
Гудонавичюс Р.В., Кемешис П. П., Гитавичюс А. Б. Распознавание речевых сигналов по их структурным свойствам. Л.: Энергия, 1977. -148с.
Бондарко Л. В. Осциллографический анализ речи. Л., 1965.
Динамические спектры речевых сигналов. / Деркач М. Ф. и др. -Л.:Вища школа, 1983.-168с.
Деркач М. Ф. и др. Восприятие речи в распознающих моделях. Львов, 1971.-186 с.
Voice Extensible Markup Language (VoiceXML) Version 2.0. Scott McGlashan, Daniel C. Burnett, Jerry Carter, et all. http://www.w3 .org/TR/voicexml20/
Гольденберг Jl.M., Матюшкин Б. Д., Поляк M.H. Цифровая обработка сигналов. М.: Радио и связь, 1990. -256 с.
Голд Б., Рэйдер Ч. Цифровая обработка сигналов: Пер. с англ. М.: Сов. радио, 1973.-368 с.
Robinson Т. Speech Analysis. http://svr-www.eng.cam.ac.uk/~ajr/SpeechAnalysis/
Венцов А.В., Касевич В. Б. Современные модели восприятия речи: критический обзор. http://www.csa.ru/Minerva/ch9/ch949.html
Сергиенко А.Б. Цифровая обработка сигналов. СПб.:Питер, 2002. -608с.
Цифровой спектральный анализ и его приложения. Марпл.-мл. С. Л. Пер. с англ. М: Мир, 1990. -584с.
Маркел, Джон Д., Грей, Августин.Х. Линейное предсказание речи. М.: Радио и связь, 1980. -248 с.
Бочаров И.В., Акатьев Д. Ю. Распознавание речевых сигналов на основе корреляционного метода. // Электронный журнал «Исследовано в России», 148, 2003. http://zhurnal.ape.relarn.ru/articles/2003/148.pdf
Савченко В.В. Различение случайных сигналов в частотной области // Радиотехника и электроника.-№ 4. Т.42. -1997. -с.426−429.
Кей С. М, член ИИЭР- Марпл мл. С.Л., член ИИЭР. Современные методы спектрального анализа: Обзор. // ТИИЭР, т.69,№ 11, ноябрь 1981. — с.5−51
Бендат Дж., Пирсол А. Прикладной анализ случайных данных: Пер. с англ. М.: Мир, 1989. -540 с.
Макс. Ж. Методы и техника обработки сигналов при физических измерениях: В 2-х томах. Пер. с франц. М.: Мир, 1983. -568с.
Макхол Дж. член ИИЭР. Линейное предсказание: Обзор. // ТИИЭР -т.63 № 4 апрель 1975.-с.20−44.
Маркел Джон Д., Грэй, Августин.Х. Линейное предсказание речи /пер. с англ. под ред. Ю. Прохорова, B.C. Звездина-М.:Мир, 1983. -308с.
Зиновьева Н.В. Механизмы извлечения лингвистической информации из спектрального представления речевого сигнала. / МГУ им. М. В. Ломоносова. М., 1986.
Оппенгейм А.В., Шафер Р. В. Цифровая обработка сигналов: Пер. с англ. -М.: Связь, 1979. —416с.
Pisarenko V.F. The retrieval of harmonics from a covariance function. // Geophys. J.R. Astron. Soc. Vol.33, 1973. pp 347−366.
Минеев C.A., Морозов O.A., Плеханов A.A., Солдатов Е. А. Линейное предсказание на основе решения задачи на собственные числа автокорреляционной матрицы. //Известия вузов. Радиофизика. -T.XLII. № 1.-2000.-С.66
Бартлетт М.С. Введение в теорию случайных процессов.-М., 1958. -384с.
Harma A., Laine U.K. Linear predictive coding with modified filter structures. // IEEE Trans. Speech and Audio Processing, -vol.9, no.8. -2001. -pp.769 777.
Прохоров Ю.Н. Статистические модели и рекуррентное предсказаниеречевых сигналов. М.: Радио и связь, 1984, -240 с.
Owsley N.L. Adaptive data orthogonalization // Proc. IEEE ICASSP Tulsa, Okla., April 1978.-pp. 109−112.
Kay S.M. Modern Spectral Estimation, Theory and Application. Prentice-Hall, Inc. Englewood Cliffs, N.J., 1987.
Тюхтин B.C. Теория автоматического опознавания и гносеология. М.: Наука, 1976,-190с.
Mansfield A.J., Wayman J.L. Best Practices in Testing and Reporting Performance of Biometric Devices. Report for CESG and Biometrics Working Group, August 2002. http://www.npl.co.uk/scientificsoftware/publications/biometrics/ bestpracv2l. pdf
Моррис У.Т. Наука об управлении. Байесовский подход. Пер. с англ. -М.:Мир, 1971.-302с.
Рамишвили Г. С. Автоматическое опознавание говорящего по голосу. М.: Радио и связь, 1981, -224 с.
Рамишвили Г. С. Речевой сигнал и индивидуальность голоса. Тб.: Мецемереба, 1976. — 183 с.
Ватанабе С. Разложение Карунена-Лоэва и факторный анализ. Теория и приложения. Сборник переводов. М: Мир, 1969. -308с.
Kumaresan R., Tufts D.W. Data-adaptive principal component signal processing. // in Proc. 19th IEEE Conf. Decision and Control (Albuquerque, NM),-1980.-pp. 949−954.
Мартин H., Ингленд Дж. Математическая теория энтропии. Пер. с англ. -М.:Мир, 1998. -350 с.
Кульбак С. Теория информации и статистика. М.: Наука, 1967. -408с.
Чайлдерс Д. Дж., Скиннер Д. П., Кемерейт Р. Ч. Кепстр и его применение при обработке данных. Обзор. // ТИИЭР. -Т. 65, № 10. -1977. -С.5.
Atal B.S. Effectiveness of linear prediction characteristics of the speech wave for automatic speaker identification and verification. // J. Acoust. Soc. Am. -vol.55, № 6. -1974. pp.1304−1312.
Акатьев Д.Ю., Бочаров И. В. Распознавание дикторов по методу обеляющего фильтра. // Электронный журнал «Исследовано в России». -№ 4. -2001.-С. 1693−1700. http://zhurnal.ape.relarn.ru/articles/2001/147.pdf
Акатьев Д.Ю., Пучков С. Н. Исследование метода обеляющего фильтра в задаче распознавания речевых сигналов. // Электронный журнал «Исследовано в России». -№ 5. -2002. -С. 289−294. http://zhurnal.ape.relarn.ru/articles/2002/026.pdf
Smaragdis P.J. Efficient blind separation of convolved sound mixtures. // Cambridge- Machine Listening Group. -1992. -pp. 1−5.
Smaragdis P.J. Information Theoretic Approaches to Source Separation. Boston- Berklee Colege of Music. -1995. -p.88.
Mermelstein P. and Qian Y. Nonlinear filtering of the LPC residual for noise suppression and speech quality enhancement. // IEEE Speech Coding Workshop, -1997, -pp. 49−50.
Akaike, H. Power Spectrum Estimation through Autoregression Model Fitting. //Ann. Inst. Stat. Math, -vol.21. -1969. -pp.407−419.
Akaike, H. A new look at statistical model identification. // IEEE Trans. Automat. Contr. -vol.AC-19. -1974. -pp.716−723.
Rissanen J. A Universal Prior for the Integers and Estimation by Minimum Description Length. // Ann. Stat. -vol. 11, -1983. -pp. 417−431.
Ulrych T.J., Clayton R.W. Time Series Modeling and Maximum Entropy. // Phys. Eart Planet Inter, -vol. 12. -1976. -pp. 188−200.
Ulrych T.J., Bishop N.N. Maximum entropy spectral analysis and autoregressive decomposition. Rev. // Geophys. Space Phys. -vol. 13. -1975. -pp. 183−200.
Berryman J.G. Choice of operator length for maximum entropy spectral analysis. // Geophysics, -vol. 43. 1978. -pp. 1384−1391.
Jones R.H. Autoregression order selection. I I Geophysics. vol. 41. -1976. -pp. 771−773.
Применение факторного анализа для определения и кодирования смысловой составляющей речевого сигнала. А. В. Герасимов. // Тезисы докладов научной всероссийской конференции Информационные системы и технологии ИСТ-2003, Нижний Новгород, 2003
Применение метода формантного анализа для извлечения информации из акустического сигнала в задачах распознавания речи. А. В. Герасимов. // Доклады 5-й международной конференции Цифровая обработка сигналов и ее применение, Москва, 2003
Применение метода модифицированного линейного предсказания для устойчивого акустического кодирования речи. А. В. Герасимов, О. А. Морозов, Е. А. Солдатов, В. Р. Фидельман. // Радиофизика, 2006. T. XLIX, № 7.
Адаптивная избирательная цифровая фильтрация и анализ речевых сигналов. А. В. Герасимов // Сборник научных трудов учащихся физико-математических классов средних школ Нижнего Новгорода, студентов и аспирантов РРГУ, Нижний Новгород, 2002.
К проблеме выделения сигнала из общего потока в задачах анализа и распознавания речи. А. В. Герасимов, Н. С. Будников // Доклады секции: Роль молодых ученых в развитии информационных технологий и подготовке специалистов. Нижний Новгород, 2002
Применение методов классического и модифицированного линейного предсказания для определения порядка линейной модели в задаче акустического кодирования речи. А. В. Герасимов, В. Р. Фидельман. //
XXIV научные чтения имени академика Николая Васильевича Белова. Тезисы докладов, 2005.
Применение метода модифицированного линейного предсказания к задачам выделения акустических признаков речевых сигналов. А. В. Герасимов, О. А. Морозов, В. Р. Фидельман. // Радиотехника и электроника, 2005. т.50. № 8. с.1−5.
Применение информационного подхода к акустическому кодированию речевых сигналов. А. В. Герасимов, В. Р. Фидельман. //Электроника и информатика 2005. V-я Международная научно-техническая конференция: Материалы конференции, 2005.
Kauppinen I. Methods for detecting impulsive noise in speech and audio signals. // 4th International Conference on Digital Signal Processing, DSP 2002, vol.2, 2002, pp. 967−970.
Murhti M.N., Kleijn W.B. Regularized linear prediction all-pole models. In IEEE Workshop on Speech Coding Proceedings, Lake Lawn Resort, Delavan, Wisconsin, USA, Sept. 2000, pp.96−98.
Murhti M.N., Rao B.D. All-pole modeling of speech based on the minimum variance distortionless response spectrum. // IEEE Trans. Speech and Audio Processing, -vol.8, no.3, -2000. -pp.221−239.
Norden F., Eriksson T. Time evolution in LPC spectrum coding. // IEEE Transactions on Speech and Audio Coding. -2004. pp.290−301.
Selouani S., O’Shaugnessy D. Investigation into a mel subspace based front-end processing for robust speech recognition. IEEE-International symposium in signal processing and Information Technology, ISSPIT'04, Roma, -2004. -pp.187−190.
Tufts D., Kumaresan R. Singular value decomposition and improved frequency estimation using linear prediction. // IEEE Trans. Acoust. Speech Signal Process, -vol. ASSP-30, No. 4. -1982. -pp.671−675.
Алдошина И. Основы психоакустики. Тембр. 4.1. //Звукорежиссер. Информационно-технический журнал. № 2. — 2001. — С.40−45.
Якобсон Р., Фант Г., Халле М. Введение в анализ речи. Различительные признаки и их корреляты // HJI. Вып. II. М., 1962.
Родионова, Г. Г., Трунин-Донской, В.Н. Акустические корреляты фонетических категорий русского языка. М.:ВЦ АН СССР, 1986. -32с.
Трубецкой Н. С. Основы фонологии. М.: Аспект Пресс, 2000. -352с. ЮЬМандель И. Д. Кластерный анализ. М.:Финансы и статистика, 1988.176с.
Ю2.Хорн Р., Джонсон Ч. Матричный анализ. Пер с англ. М.: Мир, 1989. -655с.
ЮЗ.Кендалл М., Стюарт А. Многомерный статистический анализ ивременные ряды. -М.: Наука, 1976. 736с. Ю4. Кендалл М., Стюарт А. Статистические выводы и связи. — М.: Наука, 1973.-899с.
Noble В., Daniel J.W. Applied Linear Algebra. Prentice-Hall, Inc., Englewood Cliffs, 1977. — p.477.
ISIP automatic speech recognition system. http://www.isip.msstate.edu/projects/speech/software/asr/download/asr/index. html, Institute for Signal and Information Processing, Mississippi State University, Mississippi State, Mississippi, USA, May 2001.

Заполнить форму текущей работой