Разработка и исследование математических моделей обработки и распознавания речи на основе множественных баз признаков
Диссертация
Акустический процессор (АП) рассматривается как составная часть АСР и от системы к системе обладает различным уровнем сложности. Как правило, АП состоит из двух функционально различных систем. Первая часть АП это подсистема предварительной обработки акустического 7 сигнала. Это может быть обычный аналого-цифровой преобразователь, спектроанализатор либо сложное устройство, предназначенное для… Читать ещё >
Список литературы
- Прием сигналов при наличии шума //Сб. статей. Пер. с англ., Под ред. Проф. JI.C. Гуткина, Изд. Ин. Лит-ра, Москва 1960.
- И.А. Большаков Статистические проблемы выделения потока сигналов из шума // Изд-во «Советское радио», 1969.
- J.-B.Puel and R. Andre-Obrecht. Robast signal prosessing for HMM speech recognition in adverse condition. In Proc. IEEE Int.Conf. on Spoken Language Processing, pages 259−262, Yokohama, Japan, Sep. 1994. ICSLP'94.
- J.-B.Puel, D. Saint-Joan. Speech Activity Detection: a Fuzzy Expert System. In Proc. Int. Conf. Speech and Computer, pages 79−84, St. Petersburg, Russia, 28−31 oct. 1996. SPECOM'96
- Э. Камке Справочник по обыкновенным дифференциальным уравнениям, Из. «Наука», М. 1971.
- А.В. Аграновский, Д. А. Леднов, Б. А. Телеснин Сегментация речи (математическая модель)// Информационные технологии N9, 1998 г, стр.24−28.
- Я.Ш.Вахитов Слух и речь // Конспект лек. По курсу «Электроакустика» (Раздел 2), Ленинград 1973
- Физиология сенсорных систем. 4.2. В серии «Руководство по физиологии». 1972. Изд-во «Наука», Ленингр. Отд.140
- Narada Dilp Warakagoda «A Hybrid ANN-HMM ASR system with NN based adaptive preprocessing"// M.Sc. Thesis, Norges Tekniske Hogskole, Institutt for Teleteknikk, Transmisjonsteknikk, May 19, 1996
- A.H. Собакин Об определении фармантных параметров по речевому сигналу с помощью ЭВМ Акустический журнал АН СССР, в. 18 № 1,1972, стр. 106−114.
- А.Н. Собакин Основной тон и метод его исследования. // XI сессия Рос. Ак. Общ. «Современные речевые технологии», Сб. трудов, Москва, 26−28 января 1999, стр.47−50.
- H.W. Strube. Determination of the Instant of Glottal Closure from the Speech Wave. JASA, v.56, #5, Nov. 1974, pp. 1625−1629.
- H. Bourlard and N. Morgan «Continuous speech recognition by connectionist statistical methods» // IEEE Trans. On neural networks, vol. 4, N 6, pp. 893−909, Nov. 1993.
- Вокодерная телефония. Методы и проблемы // Под редакцией А. А. Пирогова, М. Связь, 1974.
- Р.В.Хемминг Цифровые фильтры: Пер. с англ./ Под ред. A.M. Трахтмана.-М.: Сов. Радио, 1980.
- Н.В. Барклаевская, Н. Н. Лизунов, В. В. Фильчаков Алгоритмы фильтрации речевых сигналов//Автом. Распозн. И Синтез реч. Сигналов: Сб. науч. Трудов. Киев 1989
- Ivan Kopecek Automatic Segmentation into Syllable Segments http:// www.fi.muni.cz/kopecek/
- Hiroyuki Tsuboi and Other. Speaker-Adaptive Connected Syllable Recognition Based on the Multiple Similarity Method// Proc. Of ICASSP 86, Tokyo 1986
- J. Makhoul Линейное предсказание. Обзор// ТИИЭР т.63, № 4, стр. 2044
- Biing-Hwang Juang and Kuldip К. Paliwal «Hidden Markov models with first-order equalization for noisy speech recognition» // IEEE Trans. On signal processing, vol. 40, N 9, pp. 2136−2143, Sep. 1992.141
- Yoshiaki Ohshima Environmental Robustness in Speech Recognition using Physiologically-Motivated Processing// DPh. Thesis, Carnegie Mellon University, Pittsburgh, Pennsylvania 15 213
- Gold B. Computer program for Pitch Extraction.-«JASA», 1962, v.32, N7, pp.916−921
- Manley HJ. Analysis-Synthesis of cjnnected Speech in Terms of orthogonalised Exponentially Damped Sinusoid.-«JASA», 1963, N4, v.35, pp. 464−474
- Fu-Hua Liu and other. Signal Processing for Robust Speech Recognition// Proc. of EUROSPEECH'97., Rhodes, Greece, 22−25 Sep., 1997.
- Л.Рабинер, Б. Голд Теория и применение цифровой обработки сигналов// Изд-во «Мир», Москва 1978
- D.A.Lednov, A.V.Agranovsky, Variation of the Fundamental Tone Characteristics with the Emotional Changes in Man // Proc. SPECOM'96, St. Petersburg. Russia, Oct. 21−23,1996, pp 186−187
- D.A.Lednov, A.V.Agranovsky, O.Y.Berg The Research of correlation between pitch and skin galvanic reaction from another at changing of human emotional state. // Proc. of EUROSPEECH'97., Rhodes, Greece, 22−25 Sep., 1997, pp 1556−1559
- И.О. Архипов, В. Б. Гитлин Оценка точности выделения основного тона методом GS // XI сессия Рос. Ак. Общ. «Современные речевые технологии», Сб. трудов, Москва, 26−28 января 1999, стр. 38−42
- М.Е. Hernandez-Diaz Huici and J.V. Lorenzo Ginori Combined algorithmLfor pitch detection of speech signals// Electronics Letters 5 January 1995, Vol. 31, No. 1.
- F. Jelinek «Continuous speech recognition by statistical methods"// Proc. IEEE, vol. 64, pp. 532−556, Apr. 1976.
- L.R. Bahl, P.F. Brown, P.V. de Souza, R. L. Mercer, M.A. Picheny, A Method for the construction of acoustic Markov models for words. IEEE TRANSACTOINS ON SPEECH AND AUDIO PROCESSING, vol. 1, no. 4, october 1993.142
- М.В.Фролов Контроль функционального состояния человека оператора, М.:Наука 1985,
- М.В.Фролов Дифференцирование степени и знака эмоционального напряжения у человека по изменению интонационной характеристики речи, Физиологические особенности положительных и отрицательных эмоций. М.: Наука 1972 с. 128−132.,
- М.В.Фролов и др. Частотный спектр речи как показатель степени и характера эмоционального напряжения человека, Журн. высш. нерв. деятельности 1971, Т.21, вып. 1, сс. 104−109
- Э.А.Нушкиян Информативная значимость просодических средств в синтезе эмоциональной речи, Сб. науч. трудов Автоматическое распознавание и синтез речевых сигналов, Киев 1989.
- Arnfield, S., Roach, P., Setter, J., Greasley, P., and Horton, D., «Emotional Stress and Speech Tempo Variation», in Proceedings of ESCA-NATO Tutorial and Research Workshop on Speech Under Stress. Lisbon 1995.
- P. Greasley, C. Sherrard, M. Waterman, J. Setter, P. Roach, S. Arnfield and D. Horton, «The Perception of Emotion in Speech», to appear in XXVI International Congress of Psychology Montreal, 1996.
- C. Sherrard and P. Greasley, «Lexical valency in emotional speech», to appear in XXVI International Congress of Psychology Montreal, 1996.
- M. Waterman and P. Greasley «Development of a Qualitative Instrument for Coding Cognitive Antecedents of Emotional Responses» to appear in XXVI International Congress of Psychology Montreal, 1996.
- Ming-Shih Chen, Pie-Hwa Lin and Hsiao-Chuan Wang, «Speaker Identification Based on a Matrix Quantization Method» IEEE Trans. On Signal Proc., vol. 41, no. 1. Jan. 1993.143
- S. Furui, «Cepstral analysis technique for automatic speaker verification» IEEE Trans. Acoust., Speech, Signal Process., vol. ASSP-29, pp. 254−272, Apr. 1987.
- D.A.Lednov, A.V.Agranovsky System of the Speaker Identification // Proc. of SPECOM'97, Cluj-Napoca, Romania, Oct 21−23, 1997, pp. 95−97
- B.H. Сорокин Новые концепции в автоматическом распознавании речи // XI сессия Рос. Ак. Общ. «Современные речевые технологии», Сб. трудов, Москва, 26−28 января 1999, стр.50−57.
- В.К.Маслов, В. Н. Торопов, У. Ф. Фейзханов «Время-частотные распределения нестационарных гидроакустических сигналов» // НПО ВНИИФТРИ Проблемы изм. параматров гидроак. и гидрофиз. полей и обр. информ., Сб. науч. трудов, Москва 1992
- L.R. Rabiner and S.E. Levinson «A speaker-independent, syntax-directed, connected word recognition based on hidden Markov models and levelbuilding» // IEEE Trans. Acoustic, Speech and Signal Processing, vol. ASSP-33, pp. 561−573,June 1985.
- Дж. Турин Лекции о цифровой связи//И: Мир 1972
- D.G. Forney Алгоритм Витерби, ТИИЭР т. 61, N3, с.12−25
- D.A. Lednov, B.A.Telesnin, K.A.Teleshin, Hierarchical System of Decoding Devices for the Decision of Problems of Recognition of Speech // 4th Int. Cong, on Sound and Vibration, St. Petersburg. Russia June 24−27, 1996, pp. 1445−1448.
- D.A. Lednov, A.V.Agranovsky, B.A. Telesnin, Training and Operation of Pulse Decoder Devices for Speech Recognition//Proc. SPECOM'96, St. Petersburg. Russia, Oct. 21−23, 1996, pp. 126−128
- G. Somjen Sensory coding in the mammalian nervous system. Appleton-Century-Crofts Educational Division Meredith Corporation, New York, 1972
- M.А. Исакович. Общая акустика. Из-во «Наука», М., 1973.
- В.Н. Сорокин Теория речеобразования. Из-во «Наука», М., 1985.144
- А.В. Аграновский, Д. А. Леднов Распознавание речи с использованием протяженных контекстов // Информационные технологии N7, 1997 г., стр 21−25
- Т.К. Винцюк Сравнение ИКДП- и НММ-методов распознавания речи. Сб. Методы и средства информ. речи. Киев 1991.
- Xuedong Huang, Kai-Fu Lee, On Speaker-Independent, Speaker-Dependent, and Speaker-Adaptive Speech Recognition. IEEE TRANSACTORS ON SPEECH AND AUDIO PROCESSING, vol. 1, no. 2, april 1993.
- Jang B.H. On the Hidden Markov Model and Dynamics Time Warping for Speech Recognition-A Unified View // ATT Bell Lab. J. 1984, 63, N7, pp. 1213−1260
- Levinson S.E. Structural Method in Automatic Speech Recognition// Proc. IEEE 1985, 73, N 11, pp. 1625−1650
- А.А. Харкевич Борьба с помехами, Изд. Второе, Из. «Наука», М. 1965.
- А.В. Аграновский, Д. А. Леднов Использование речевого интерфейса в программах обучающих иностранным языкам // Тез. докл. межвуз. н.-мет. конф. «Информатизация базового гуманитарного образования в высшей школе», г. Сочи, 29 мая-2 июня 1995 г., стр. 33−34.
- Д.А. Леднов Определение динамических состояний для скрытых моделей Маркова в задачах распознавания речи. // Сб. тез.145
- DA.Lednov Encoding of simple two-dimentional visual images. RNNS/IEEE Symposium on Neuroinformatics and Neurocomputers, Rostov-on-Don, Russia, Oct 7−10 1992, pp. 1017−1020.
- H. Ney The use of one-stage dynamic programming algorithm for connected word recognition // IEEE Trans. Acoust., Speech Signal Processing, vol. ASSP-32, pp. 263−272, 1984.
- H. Ney and A. Noll, Phoneme modeling using continuous mixture densities // in IEEE Proc. 1990 Int. Conf. ASSP, vol. 1, New York, 1988, pp. 437 440.
- Г. Фант Акустическая теория речеобразования. М., «Наука», 1964
- Д.Л. Фланаган Анализ, синтез и восприятие речи. М., «Связь», 1968
- AJ.Viterbi, Error bounds for convolutional codes and an asymptotically optimal decoding algorithm, IEEE Trans. Inform. Theory, vol IT-13, pp. 260−269, Apr. 1967.