Разработка и математическое моделирование алгоритмов обнаружения речевой активности на фоне интенсивных шумов
Диссертация
Первые работы по обнаружению разладки принадлежат А. Н. Колмогорову, А. Н. Ширяеву и А. Вальду. Большой вклад в решение этой проблемы внесли А. А. Бутов, Э. Л. Пресман, Г. Роббинс, И. В. Семушин, А. И. Яшин и другие. Обнаружению именно речевого сигнала препятствует сложная структура и высокая нестационарность. Этой проблеме посвящены работы Ю. Жао, Ф. Мекурла, О. Мизуно, Д. Нельсона, В. Г… Читать ещё >
Список литературы
- Альтман Я.А. Слуховая система. — JL: Наука, 1990. 620 с.
- Бабин Д.Н., Уранцев А. В., Мазуренко И. Л., Холоденко А. Б. Способ идентификации факта речевой активности оператора. Патент RU 2 148 505 С1
- Беллман Р., Заде JI. Принятие решений в расплывчатых условиях. // Вопросы анализа и процедуры принятия решений. — М. Мир, 1976. С. 172 — 215.
- Блауэрт И. Пространственный слух. М.: Энергия, 1979. — 224 с.
- Богуславский И.А., Владимиров И. Г. Адаптивное оценивание вектора сдвига // Техническая кибернетика, N4, 1990. с. 47−64.
- Бутов А.А., Волков М. А., Санников И. А. Математические модели биологических процессов. Ульяновск: УлГУ, 2001. — 37 с.
- Вальд А. Последовательный анализ. — М.: Наука, 1960.
- Васильев К.К., Крашенинников В. Р. Статистический анализ многомерных изображений. Ульяновск, УлГТУ, 2007. — 170 с.
- Вартанян И.А. Слуховой анализ сложных звуков. JL: Наука, 1978. -151 с.
- Воробейчиков С.Э., Кабанова Т. В. Обнаружение момента разладки последовательности независимых случайных величин // Радиотехника и электроника, 2002, том 47, № 10. с. 1198 1203.
- Воробьев В.И., Грибунин В. Г. Теория и практика вейвлет-преобразования. С-Пб.: ВУС, 1999. — 204 с.
- Галунов В.И. Речь как система. // Труды XIII сессии РАО, т. 3, 2003. -С. 19−21.
- Гмурман В.Е. Теория вероятностей и математическая статистика. — М.: Высш. шк., 1998. 479с.
- Горелик A. JL, Скрипкин В. А. Методы распознавания. М: Высшая школа, 2004.-261 с.
- Добеши И. Десять лекций по вейвлетам. Ижевск: НИЦ «Регулярная и хаотическая динамика», 2001. — 464 с.
- Зубов А.Г., Петров А. И. Оценивание в нелинейных стохастических системах при внезапных изменениях структуры и координат состояния // Изв. АН СССР. Техн. киберн. 1990. № 4. С. 64 77.
- Калинин Л.В. Последовательное обнаружение и диагностика нарушений в гауссовской марковской модели движения. // Диссертация на соискание ученой степени кандидата технических наук. Ульяновск, 1997. -124 с.
- Клигене Н.И., Телькснис Л. А. Методы обнаружения моментов свойств случайных процессов // АиТ. 1983. № 10. С. 5 — 56.
- Крашенинников В.Р. Основы теории обработки изображений. -Ульяновск: УлГТУ, 2003. 151 с.
- Крашенинников В.Р., Армер А. И. Зашумление эталонов в задачах обнаружения и распознавания сигналов на фоне помех // Вестник УлГТУ. Апрель-июнь (26) 2/2004, Ульяновск: УлГТУ, 2004. С. 54 — 57.
- Крашенинников В.Р., Армер А. И. Распознавание речевых сигналов на фоне шумов // «Распознавание образов и анализ изображений: новые информационные технологии». Труды седьмой международной конференции РОАИ-7, С-Пб, 2004. С. 752 — 755.
- Крашенинников В.Р., Армер А. И., Крашенинникова Н. А., Хвостов А. В. Распознавание речевых команд на фоне интенсивных помех с помощью авторегрессионных портретов // Наукоемкие технологии. — Москва, 2007, № 9.-С. 65−74.
- Крашенинников В.Р., Калинов Д. В. Спиралевидная авторегрессионная модель квазипериодического сигнала, связанная с изображением на106цилиндре // Вестник УлГТУ. Сер. Информационные технологии, № 3, 2000. -С. 4- 10.
- Крашенинников В.Р., Ташлинский А. Г., Армер А. И. Устройство распознавания речевых команд в условиях шумов // Патент РФ № 2 267 820 от 10.01.2006.
- Крашенинников В.Р., Хвостов А. В. Комбинированный детектор речевой активности. // «Электронная техника». Межвузовский сборник научных трудов. Выпуск седьмой. Ульяновск, 2005.-С.45 — 48.
- Крашенинников И.В. Периодическое комплексирование речевых сигналов в изображение // Труды Международной конференции «Методы исредства преобразования и обработки аналоговой информации», т. 3. -Ульяновск: УлГТУ, 1999. С. 56 — 58.
- Лабутин В.К., Молчанов А. П. Слух и анализ сигналов. М.: Энергия, 1967.-79 с.
- Лабутин В. К. Молчанов А.П. Модели механизмов слуха. — М.: Энергия, 1973.- 200 с.
- Левин Б.Р. Совместно оптимальные алгоритмы обнаружения сигналов и оценивания их параметров // Радиотехника и электроника. 1994. Т.22. № 11. С.2239−2256.
- Липейка А.К. Об определении момента изменения свойств авторегрессионной последовательности // Статистические проблемы управления. Вильнюс: Институт математики и кибернетики АН Лит. ССР, 1979. Вып. 39. С.9−23.
- Мазуренко И.Л. Компьютерные системы распознавания речи. // Интеллектуальные системы, т.З. вып. 1 2 — Москва, 1998. — С. 117 — 134.
- Мазуренко И.Л. Одна модель распознавания речи. В сб.: Компьютерные аспекты в научных исследованиях и учебном процессе М.: Издательство Московского университета, 1996. — с. 136 — 147.
- Маркел Дж. Д., Грэй А. Х. Линейное предсказание речи / Пер. с англ. -М.: Связь, 1980.-308 с.
- Михайлов В.Г. К теории восприятия звучащей речи: соотношение акустических и перцептивных параметров // Акустический журнал, т. 43, № 2, 1997.-С. 219−224.
- Михайлов В.Г., Златоустов Л. В. Измерение параметров речи. М.: Радио и связь, 1987. — 167 с.
- Моттль В.В., Мучник И. Б. Скрытые марковские модели в структурном анализе сигналов. М.: Физматлит, 1999. — 352 с.
- Никифоров И.В. Последовательное обнаружение изменения свойств временных рядов. М.: Наука, 1985. 276 с.
- Обнаружение изменения свойств сигналов и динамических систем: Пер с англ. /М.Бассвиль, А. Вилски, А. Банвенист и др.- Под ред. М. Бассвиль, А. Банвениста.- М.: Мир, 1989. 278 с.
- Обработка нечеткой информации в системах принятия решений / Борисов А. В., Алексеев А. В., Меркурьева Г. В. и др. — М.: Радио и связь, 1989 -304 с.
- Поляк Б.Т., Цыпкин Я. З. Оптимальные псевдоградиентные алгоритмы адаптации // Автоматика и телемеханика, N 8, 1980. — с. 74−84.
- Потапова Р.К. Речь: коммуникация, информация, кибернетика. М.: Радио и связь, 1997. — 568 с.
- Пресман Э.Л., Сонин И. М. Последовательное управление по неполным данным. -М.: Наука, 1982.
- Проблемы построения систем понимания речи. // Под ред. Цемель Г. И., Сорокина В. Н. М.: Наука, 1980. — 144 с.
- Прохоров Ю.Н. Статистические методы и рекуррентное предсказание речевых сигналов. — М.: Радио и связь, 1984. — 240 с.
- Прохоров Ю.Н. Рекуррентное оценивание параметров. В кн.: Проблемы построения систем понимания речи — М.: Наука, 1980. — С. 97 — 109.
- Рабинер Л.Р., Шафер Р. В. Цифровая обработка речевых сигналов: Пер. с англ. под ред. М. В. Назарова, Ю. Н. Прохорова. М.: Радио и связь, 1981.-495 с.
- Репин В.Г., Тартаковский Г. П. Стохастический анализ при априорной неопределенности и адаптация информационных систем. М.: Советское радио, 1977.-432 с.
- Роббинс Г., Сигмунд Д. Чао И. Теория оптимальных правил остановки.-М.: Наука, 1977.
- Розов А.К. Обнаружение, классификация и оценивание сигналов: Последовательные процедуры. — СПб.: Политехника, 1999. 206 е.: ил.
- Санников В.Г. Устойчивый алгоритм статистической идентификации авторегрессионной модели речевого сигнала. // Цифровая обработка сигналов № 2, 2001. С. 10−14.
- Сапожков М.А. Речевой сигнал в кибернетике и связи. — М.: Связьиздат, 1963.-452 с.
- Сорокин В.Н. Теория речеобразования. — М.: Радио и связь, 1985. -312 с.
- Семушин И.В. Адаптивные схемы идентификации и контроля при обработке случайных сигналов. — Саратов: СГУ, 1985. — 180 с.
- Серебренников М.Г., Первозванский А. А. Выявление скрытых периодичностей. М.: Наука, 1965. — 244 с.
- Торговицкий И.Ш. Методы определения моментов изменения вероятностных характеристик случайных величин // Зарубежная радиоэлектроника. 1976. № 1. С. 3 52.
- Уидроу Б., Стирнз С. Адаптивная обработка сигналов / Пер. с англ. под ред. В. В. Шахгильдяна. М.: Радио и связь, 1989. — 440 с.
- Фант Г. Акустическая теория речеобразования. — М.: Наука, 1964. — 283 с.
- Физиология речи. Восприятие речи человеком / Под ред. JI.A. Чистович. Д.: Наука, 1976. — 386 с.
- Фланаган Дж. Анализ, синтез и восприятие речи // Пер. с англ. М.: Связь, 1968.-396 с.
- Хабиби А. Двумерная байесовская оценка изображений // ТИИЭР, 1972, № 5, с. 113−120.
- Хайдер А.С. Математические модели и комплекс программ для автоматического распознавания дикторов // Автореферат диссертации на соискание ученой степени кандидата технических наук. — Санкт-Петербург: ЛЭТИ, 2004.- 17 с.
- Харкевич А.А. Борьба с помехами. М.: Наука, 1965. — 277 с.
- Чучупал В .Я., Чиганов А. С., Маковкин К. А. Цифровая фильтрация зашумленных речевых сигналов. — М.: Вычислительный центр РАН, 1998. -51 с.
- Ширяев А.Н. Некоторые точные формулы в задаче о разладке // Теория вероятности и ее применение. — М: ТВП, т.10,в.2, 1965. -С.380 385.
- Ширяев А.Н. Об оптимальных' методах в задачах скорейшего обнаружения// Теория вероятности и ее применение. М: ТВП, т.8,в.1, 1963. -С.26 — 51.
- Ширяев А.Н. Статистический последовательный анализ. М.: Наука, 1976.
- Яшин А.И. Теоретические и прикладные задачи оценивания скачкообразных процессов. —М.: Институт проблем управления, 1978.
- Allen, G. D. (1973) 'Segmental Timing in Speech Production', J. Phonetics, Vol. 1, No. 3. pp. 219 237.
- Atal B. Effectiveness of Linear Prediction Characteristics of the Speech Wave for Automatic Speaker Identification and Verification // J. Acoust. Soc. Amer., Vol. 55, 1974.-pp. 1304- 1312.
- Anderson D.V., McGrath S., Truong. K. Speech activity detector for use in noise reduction system, and methods therefor. US Patent № 6,453,285 B1
- Brodsky B.E. and Darkhovsky B.S. «Nonparametric Methods in Change-Point Problems». Kluwer Academic Publishers, The Netherlands, 1993.
- Basseville M., Nikiforov I. Detection of Abrupt Changes: Theory and Application. IRISA/CNRS, Rennes, France, 1999. 447 p.
- Benyassine A., Shlomot E. System for detecting voice activity and background noise/silence in a speech signal using pitch and signal to noise ratio information. US Patent № 6,275,794
- Chow Y-L., Staats E.P. Method and appratus for detecting speech activity using cepstrum vectors. US № 5,596,680.
- Chow Y-L., Staats E.P. Method and appratus for detecting end points of speech activity. US Patent № 5,692,104.
- Duncan A.J. Quality control and industrial statistics. N.Y.: Irwin, 1974.
- Endo K., Ota Y. Speech detecting device and speech detecting method. US2002/138 255 Patent Al.
- Gass R., Atzenhoffer R. Method of detecting voice activity in a signal, and a voice signal coder including a device from implementing the method. US2002/188 442 Patent Al.
- Girshick M.A. and Rubin H. A Bayes approach to a quality control model. Annals Mathematical Statistics, vol.23, 1952, pp.114−125.
- Graumann D.L. Voice activity detector for half-duplex audio communication system. US Patent № 5,737,407.
- Kelleher H.L., Pearce D.J.B. Voice activity detector and validator for noisy environments. WO 03/63 138 Al.
- Krishnaiah P. and Miao B. Review about estimation of change-points. In: Handbook of Statistics, 1988, v.7. pp.375 -402
- LaMarche R.E., May C.J., Zebo T.J. Digital Speech Detector. US Patent № 4,028,496.
- Lockwood P., Lubiarz S. Method for detecting speech activity. US № 6,658,380 Bl.
- Marchall P.T. Audio and amplitude modulated photo data collection for speech recognition. US Patent № 5,473,726.
- Mekurla F. Method and apparatus for detecting voice activity. US Patent № 6,182,035.
- Mizuno O. Method for speech detection in a high-noise environment US Patent № 5,732,392.
- Nelson D.J., Smith D.C., Townsend J.L. Voice activity detector. US Patent № 6,556,967 Bl.
- Page E.S. Continuous inspection schemes. Biometrika, 1954, v.41, No. l, pp.100−115.
- Page E.S. «A test for a change in a parameter occurring at an unknown point». Bioinetrica, 1955, v.42, No.4, pp.523−527.
- Robbe F., Dartois L. Method of using a dominant angle of incidence to reduce acoustic noise in a speech signal. US Patent № 5,539,859.
- Semoushin I.V., Krasheninnikov V.R., Sunoplya M.S., Martyanov A.I.,
- Khvostov A.V. Kalman Filter Based Speech-Like Signal Detection Within a Noisy• th
- Environment // Proceedings of the 19 International Conference on Systems Research, Informatics and Cybernatics, InterSymp-2007. Advances in Intelligent Decision Systems, vol. VIII, No. l, pp. 59−66.
- Shaban S. Change-point problem and two-phase regression: annotated bibliography. International Statistical Review, 1980, v.48, pp.83−86
- Shannon С. E. «A Mathematical theory of communication», Bell System Tech. J., Vol.27, October, 1968. pp. 623 656.
- Sonale E. Method and device for detecting voice activity. US Patent № 6,154,721.
- Valve P., Hakkinen J. Detection of the speech activity of a source. US Patent № 6,707,910 Bl.
- Zhao Y., Junqua J-C. Speech detection for noisy conditions. US Patent № 6,480,823 Bl.