Методы вычисления параметров устойчивой модели и признаков в задаче распознавания речевого сигнала
Диссертация
Разработан и реализован метод формирования устойчивых признаков речевых сигналов на основе модифицированной модели авторегрессиискользящего среднего. В качестве набора параметров этой модели используются значения собственного вектора разложения автокорреляционной матрицы сигнала при минимальном собственном числе. Коэффициенты линейного прогнозирования для этой модели рассчитываются с помощью… Читать ещё >
Список литературы
- Обнаружение радиосигналов. / П. С. Акимов, Ф. Ф. Евстратов, С. И. Захаров и др. — Радио и связь, 1989. -288 с.
- Рабинер Л., Гоулд Б. Теория и применение цифровой обработки сигналов: Пер. с англ. М.: Мир, 1978. -848 с.
- Голд Б., РэйдерЧ. Цифровая обработка сигналов / Под ред. М. Трахтмана. — М.: Сов. радио, 1973. -367 с.
- Рабинер JI.P., Шафер Р. В. Цифровая обработка речевых сигналов. М: Радио и связь, 1981.-496 с.
- Цемель Г. И. Опознавание речевых сигналов. М.:"Наука", 1971. -с.34−125.
- Madisetti V.K., Williams D.B. The digital signal processing handbook. CRC Press., 1998.-pp.1500.
- Назаров M.B., Прохоров Ю. Н. Методы цифровой обработки и передачи речевых сигналов. М.: Радио и связь, 1985. — 176с.
- Уидроу Б., Гловер Д. Ю., Маккул Д. и др. Адаптивные компенсаторы помех. Принцип построения и применения // ТИИЭР. 1975. -№ 12. Т.63 -С. 69−98.
- Методы автоматического распознавания речи: В 2-х кн./Под. ред.: У. А. Ли, Э. П. Нейбург, Т. Б. Мартин и др.- Под ред.У.Ли- Пер. с англ. О. В. Александровой под ред.А. А. Воронова.-М.:Мир, 1983. -327 с.
- Сердюков В.Д. Опознавание речевых сигналов на фоне мешающих факторов. Тбилиси.: Наука, 1987, -142с.
- Сапожников М.А. Речевой сигнал в кибернетике и связи. -М.: Связьиздат, 1963.-с.135−357.
- Редди. Машинное распознавание речи. Обзор. // ТИИЭР. -т.64, № 4. -1976.
- Reddy D.R. Computer recognition of connected speech. // J. Acoust. Soc. Amer., vol.46, no.2, Aug. 1967. -pp.329−347.
- Потапова P.K. Речь: коммуникация, информация, кибернетика. Изд. 2-е, доп. М.: Эдиториал УРСС, 2001. — 568с.
- Rabiner L., Juang В. Fundamentals of Speech Recognition. Prentice Hall PTR, 1993.-p.496.
- Flanagan J.L. Speech analysis, synthesis and perception, 2-nd ed. Springer-Verlag, New York, 1972. -p.444.
- Косарев Ю.А. Естественная форма диалога с ЭВМ. -М.: Машиностроение, Ленингр. отд., 1989. -142с.
- Баранов А. Н. Категории искусственного интеллекта в лингвистической семантике. Фреймы и сценарии. М., 1987.
- Барченков С.А. Человек разговаривает с машиной. (Автоматическое распознавание и воспроизведение речи) -М.: Воениздат, 1974.-134с.
- Фант Г. Акустическая теория речеобразования. Пер с англ. М: Наука, 1964.-284с.
- Фант Г. Анализ и синтез речи. Пер. с англ. B.C. Лозовского и Н. В. Бахмутовой под ред. Н. Г. Загоруйко. Новосибирск, -М.: Наука, 1970. -167с.
- Сорокин В.Н. Теория речеобразования. -М.: Радио и связь, 1985. -312 с.
- Гудонавичюс Р.В., Кемешис П. П., Гитавичюс А. Б. Распознавание речевых сигналов по их структурным свойствам. Л.: Энергия, 1977. -148с.
- Бондарко Л. В. Осциллографический анализ речи. Л., 1965.
- Динамические спектры речевых сигналов. / Деркач М. Ф. и др. -Л.:Вища школа, 1983.-168с.
- Деркач М. Ф. и др. Восприятие речи в распознающих моделях. Львов, 1971.-186 с.
- Voice Extensible Markup Language (VoiceXML) Version 2.0. Scott McGlashan, Daniel C. Burnett, Jerry Carter, et all. http://www.w3 .org/TR/voicexml20/
- Гольденберг Jl.M., Матюшкин Б. Д., Поляк M.H. Цифровая обработка сигналов. М.: Радио и связь, 1990. -256 с.
- Голд Б., Рэйдер Ч. Цифровая обработка сигналов: Пер. с англ. М.: Сов. радио, 1973.-368 с.
- Robinson Т. Speech Analysis. http://svr-www.eng.cam.ac.uk/~ajr/SpeechAnalysis/
- Венцов А.В., Касевич В. Б. Современные модели восприятия речи: критический обзор. http://www.csa.ru/Minerva/ch9/ch949.html
- Сергиенко А.Б. Цифровая обработка сигналов. СПб.:Питер, 2002. -608с.
- Цифровой спектральный анализ и его приложения. Марпл.-мл. С. Л. Пер. с англ. М: Мир, 1990. -584с.
- Маркел, Джон Д., Грей, Августин.Х. Линейное предсказание речи. М.: Радио и связь, 1980. -248 с.
- Бочаров И.В., Акатьев Д. Ю. Распознавание речевых сигналов на основе корреляционного метода. // Электронный журнал «Исследовано в России», 148, 2003. http://zhurnal.ape.relarn.ru/articles/2003/148.pdf
- Савченко В.В. Различение случайных сигналов в частотной области // Радиотехника и электроника.-№ 4. Т.42. -1997. -с.426−429.
- Кей С. М, член ИИЭР- Марпл мл. С.Л., член ИИЭР. Современные методы спектрального анализа: Обзор. // ТИИЭР, т.69,№ 11, ноябрь 1981. — с.5−51
- Бендат Дж., Пирсол А. Прикладной анализ случайных данных: Пер. с англ. М.: Мир, 1989. -540 с.
- Макс. Ж. Методы и техника обработки сигналов при физических измерениях: В 2-х томах. Пер. с франц. М.: Мир, 1983. -568с.
- Макхол Дж. член ИИЭР. Линейное предсказание: Обзор. // ТИИЭР -т.63 № 4 апрель 1975.-с.20−44.
- Маркел Джон Д., Грэй, Августин.Х. Линейное предсказание речи /пер. с англ. под ред. Ю. Прохорова, B.C. Звездина-М.:Мир, 1983. -308с.
- Зиновьева Н.В. Механизмы извлечения лингвистической информации из спектрального представления речевого сигнала. / МГУ им. М. В. Ломоносова. М., 1986.
- Оппенгейм А.В., Шафер Р. В. Цифровая обработка сигналов: Пер. с англ. -М.: Связь, 1979. —416с.
- Pisarenko V.F. The retrieval of harmonics from a covariance function. // Geophys. J.R. Astron. Soc. Vol.33, 1973. pp 347−366.
- Минеев C.A., Морозов O.A., Плеханов A.A., Солдатов Е. А. Линейное предсказание на основе решения задачи на собственные числа автокорреляционной матрицы. //Известия вузов. Радиофизика. -T.XLII. № 1.-2000.-С.66
- Бартлетт М.С. Введение в теорию случайных процессов.-М., 1958. -384с.
- Harma A., Laine U.K. Linear predictive coding with modified filter structures. // IEEE Trans. Speech and Audio Processing, -vol.9, no.8. -2001. -pp.769 777.
- Прохоров Ю.Н. Статистические модели и рекуррентное предсказаниеречевых сигналов. М.: Радио и связь, 1984, -240 с.
- Owsley N.L. Adaptive data orthogonalization // Proc. IEEE ICASSP Tulsa, Okla., April 1978.-pp. 109−112.
- Kay S.M. Modern Spectral Estimation, Theory and Application. Prentice-Hall, Inc. Englewood Cliffs, N.J., 1987.
- Тюхтин B.C. Теория автоматического опознавания и гносеология. М.: Наука, 1976,-190с.
- Mansfield A.J., Wayman J.L. Best Practices in Testing and Reporting Performance of Biometric Devices. Report for CESG and Biometrics Working Group, August 2002. http://www.npl.co.uk/scientificsoftware/publications/biometrics/ bestpracv2l. pdf
- Моррис У.Т. Наука об управлении. Байесовский подход. Пер. с англ. -М.:Мир, 1971.-302с.
- Рамишвили Г. С. Автоматическое опознавание говорящего по голосу. М.: Радио и связь, 1981, -224 с.
- Рамишвили Г. С. Речевой сигнал и индивидуальность голоса. Тб.: Мецемереба, 1976. — 183 с.
- Ватанабе С. Разложение Карунена-Лоэва и факторный анализ. Теория и приложения. Сборник переводов. М: Мир, 1969. -308с.
- Kumaresan R., Tufts D.W. Data-adaptive principal component signal processing. // in Proc. 19th IEEE Conf. Decision and Control (Albuquerque, NM),-1980.-pp. 949−954.
- Мартин H., Ингленд Дж. Математическая теория энтропии. Пер. с англ. -М.:Мир, 1998. -350 с.
- Кульбак С. Теория информации и статистика. М.: Наука, 1967. -408с.
- Чайлдерс Д. Дж., Скиннер Д. П., Кемерейт Р. Ч. Кепстр и его применение при обработке данных. Обзор. // ТИИЭР. -Т. 65, № 10. -1977. -С.5.
- Atal B.S. Effectiveness of linear prediction characteristics of the speech wave for automatic speaker identification and verification. // J. Acoust. Soc. Am. -vol.55, № 6. -1974. pp.1304−1312.
- Акатьев Д.Ю., Бочаров И. В. Распознавание дикторов по методу обеляющего фильтра. // Электронный журнал «Исследовано в России». -№ 4. -2001.-С. 1693−1700. http://zhurnal.ape.relarn.ru/articles/2001/147.pdf
- Акатьев Д.Ю., Пучков С. Н. Исследование метода обеляющего фильтра в задаче распознавания речевых сигналов. // Электронный журнал «Исследовано в России». -№ 5. -2002. -С. 289−294. http://zhurnal.ape.relarn.ru/articles/2002/026.pdf
- Smaragdis P.J. Efficient blind separation of convolved sound mixtures. // Cambridge- Machine Listening Group. -1992. -pp. 1−5.
- Smaragdis P.J. Information Theoretic Approaches to Source Separation. Boston- Berklee Colege of Music. -1995. -p.88.
- Mermelstein P. and Qian Y. Nonlinear filtering of the LPC residual for noise suppression and speech quality enhancement. // IEEE Speech Coding Workshop, -1997, -pp. 49−50.
- Akaike, H. Power Spectrum Estimation through Autoregression Model Fitting. //Ann. Inst. Stat. Math, -vol.21. -1969. -pp.407−419.
- Akaike, H. A new look at statistical model identification. // IEEE Trans. Automat. Contr. -vol.AC-19. -1974. -pp.716−723.
- Rissanen J. A Universal Prior for the Integers and Estimation by Minimum Description Length. // Ann. Stat. -vol. 11, -1983. -pp. 417−431.
- Ulrych T.J., Clayton R.W. Time Series Modeling and Maximum Entropy. // Phys. Eart Planet Inter, -vol. 12. -1976. -pp. 188−200.
- Ulrych T.J., Bishop N.N. Maximum entropy spectral analysis and autoregressive decomposition. Rev. // Geophys. Space Phys. -vol. 13. -1975. -pp. 183−200.
- Berryman J.G. Choice of operator length for maximum entropy spectral analysis. // Geophysics, -vol. 43. 1978. -pp. 1384−1391.
- Jones R.H. Autoregression order selection. I I Geophysics. vol. 41. -1976. -pp. 771−773.
- Применение факторного анализа для определения и кодирования смысловой составляющей речевого сигнала. А. В. Герасимов. // Тезисы докладов научной всероссийской конференции Информационные системы и технологии ИСТ-2003, Нижний Новгород, 2003
- Применение метода формантного анализа для извлечения информации из акустического сигнала в задачах распознавания речи. А. В. Герасимов. // Доклады 5-й международной конференции Цифровая обработка сигналов и ее применение, Москва, 2003
- Применение метода модифицированного линейного предсказания для устойчивого акустического кодирования речи. А. В. Герасимов, О. А. Морозов, Е. А. Солдатов, В. Р. Фидельман. // Радиофизика, 2006. T. XLIX, № 7.
- Адаптивная избирательная цифровая фильтрация и анализ речевых сигналов. А. В. Герасимов // Сборник научных трудов учащихся физико-математических классов средних школ Нижнего Новгорода, студентов и аспирантов РРГУ, Нижний Новгород, 2002.
- К проблеме выделения сигнала из общего потока в задачах анализа и распознавания речи. А. В. Герасимов, Н. С. Будников // Доклады секции: Роль молодых ученых в развитии информационных технологий и подготовке специалистов. Нижний Новгород, 2002
- Применение методов классического и модифицированного линейного предсказания для определения порядка линейной модели в задаче акустического кодирования речи. А. В. Герасимов, В. Р. Фидельман. //
- XXIV научные чтения имени академика Николая Васильевича Белова. Тезисы докладов, 2005.
- Применение метода модифицированного линейного предсказания к задачам выделения акустических признаков речевых сигналов. А. В. Герасимов, О. А. Морозов, В. Р. Фидельман. // Радиотехника и электроника, 2005. т.50. № 8. с.1−5.
- Применение информационного подхода к акустическому кодированию речевых сигналов. А. В. Герасимов, В. Р. Фидельман. //Электроника и информатика 2005. V-я Международная научно-техническая конференция: Материалы конференции, 2005.
- Kauppinen I. Methods for detecting impulsive noise in speech and audio signals. // 4th International Conference on Digital Signal Processing, DSP 2002, vol.2, 2002, pp. 967−970.
- Murhti M.N., Kleijn W.B. Regularized linear prediction all-pole models. In IEEE Workshop on Speech Coding Proceedings, Lake Lawn Resort, Delavan, Wisconsin, USA, Sept. 2000, pp.96−98.
- Murhti M.N., Rao B.D. All-pole modeling of speech based on the minimum variance distortionless response spectrum. // IEEE Trans. Speech and Audio Processing, -vol.8, no.3, -2000. -pp.221−239.
- Norden F., Eriksson T. Time evolution in LPC spectrum coding. // IEEE Transactions on Speech and Audio Coding. -2004. pp.290−301.
- Selouani S., O’Shaugnessy D. Investigation into a mel subspace based front-end processing for robust speech recognition. IEEE-International symposium in signal processing and Information Technology, ISSPIT'04, Roma, -2004. -pp.187−190.
- Tufts D., Kumaresan R. Singular value decomposition and improved frequency estimation using linear prediction. // IEEE Trans. Acoust. Speech Signal Process, -vol. ASSP-30, No. 4. -1982. -pp.671−675.
- Алдошина И. Основы психоакустики. Тембр. 4.1. //Звукорежиссер. Информационно-технический журнал. № 2. — 2001. — С.40−45.
- Якобсон Р., Фант Г., Халле М. Введение в анализ речи. Различительные признаки и их корреляты // HJI. Вып. II. М., 1962.
- Родионова, Г. Г., Трунин-Донской, В.Н. Акустические корреляты фонетических категорий русского языка. М.:ВЦ АН СССР, 1986. -32с.
- Трубецкой Н. С. Основы фонологии. М.: Аспект Пресс, 2000. -352с. ЮЬМандель И. Д. Кластерный анализ. М.:Финансы и статистика, 1988.176с.
- Ю2.Хорн Р., Джонсон Ч. Матричный анализ. Пер с англ. М.: Мир, 1989. -655с.
- ЮЗ.Кендалл М., Стюарт А. Многомерный статистический анализ ивременные ряды. -М.: Наука, 1976. 736с. Ю4. Кендалл М., Стюарт А. Статистические выводы и связи. — М.: Наука, 1973.-899с.
- Noble В., Daniel J.W. Applied Linear Algebra. Prentice-Hall, Inc., Englewood Cliffs, 1977. — p.477.
- ISIP automatic speech recognition system. http://www.isip.msstate.edu/projects/speech/software/asr/download/asr/index. html, Institute for Signal and Information Processing, Mississippi State University, Mississippi State, Mississippi, USA, May 2001.