Структурно-аппроксимационные методы распознавания речевых образов и их применение в тренажно-моделирующих системах
Диссертация
Представлена программная реализация полуавтоматической технологии формирования эталонов голосовых команд КРИ, и описан технологический процесс настройки эталонов. Особенностью предложенной технологии является участие оператора в процессе формирования эталонов, которое позволяет контролировать при формировании эталона результаты автоматической сегментации, выделения границ PC и исправлять ошибки… Читать ещё >
Список литературы
- Леонович, А.А. Современные технологии распознавания речи / А. А. Леонович // Компьютерная лингвистика и интеллектуальные технологии: Труды международной конференции «Диалог'2005″ (Звенигород, 1−6 июня, 2005 г.) / Под ред. И. М. Кобозевой,
- A.С. Нариньяни, В. П. Селегея. М.:Наука, 2005. — 616 с.
- Методы автоматического распознавания речи: в 2-х книгах. Пер. с англ. / Под. ред. У. Ли.-М.: Мир, 1983.-Т. 1.-328 с.
- Методы автоматического распознавания речи: в 2-х книгах. Пер. с англ./ Под. ред. У. Ли.-М.: Мир, 1983.-Т. 2.-392 с.
- Обжелян, Н. К. Речевое общение в системах „Человек-ЭВМ“ / Н. К. Обжелян, В. Н. Трунин-Донской. Кишинев: „Штиинца“, 1985.-176 с.
- Козадаев, Б.П. Теоретико-методологические основания проблемы автоматического распознавания и понимания речи / Б. П. Козадаев. М.: ВЦ АН СССР, 1991.- 64 с.
- Вопросы кибернетики. Анализ и синтез речи в системах управления / Под ред. В. Н. Емельянова. -М.: Изд. ВИНИТИ, 1981. 152 с.
- Speech recognition: Wikipedia, The free encyclopedia Электронный ресурс. / Электрон, дан. Режим доступа: http://en.wikipedia.org/wiki/Speechrecognition/, свободный.
- The CMU Sphinx Group Open Source Speech Recognition Engines Электронный ресурс. / Sphinx Group, Carnegie Mellon University Электрон, дан. — Режим доступа: http://cmusphinx.sourceforge.net/html/cmusphinx.php/, свободный.
- Современные тренажерные технологии Электронный ресурс. / ЗАО „КоШэ“. Электрон. дан. — Режим доступа: http://www.traintech.ru/, свободный.
- Центр речевых технологий Электронный ресурс. / Электрон, дан. Режим доступа: http://speechpro.ru/, свободный.
- Потапова, Р.К. Речевое управление роботом: лингвистика и современные автоматизированные системы / Р. К. Потапова. М. гКомКнига, 2005. — 328 с.
- ГОСТ 26 387–84. Система человек-машина. Термины и определения. / Государственный комитет СССР по стандартам. М., 1984.
- Тренажерные комплексы и тренажеры. Технологии разработки и опыт эксплуатации /
- B. Е. Шукшунов, В. В. Циблиев, С. И. Потоцкий и др. Под ред. В. Е. Шукшунова. М.: Машиностроение, 2005. — 384 с.
- Huang, X. Spoken Language Processing: a guide to theory, algorithm, and system development / X. Huang, A. Acero, H.-W. Hon. USA, New Jersey: Prentice-Hall, 2001. — 980 c.
- Харт, Дж. М. Системное программирование в среде Microsoft Windows / Дж. М. Харт — М.: Вильяме, 2005. 592 с.
- AudiTech, Ltd (ООО „ОДИТЕК“) Электронный ресурс. / Электрон, дан. Режим доступа: http://www.auditech.ru/, свободный.
- Научно-производственный центр „Истра-Софт“ Электронный ресурс. / Электрон, дан. Режим доступа: http://www.istrasofit.ru/, свободный.
- Philips Speech Recognition Электронный ресурс. / Электрон, дан. — Режим доступа: http://www.speechrecognition.philips.com/, свободный.
- Microsoft Speech Technologies Электронный ресурс. / Электрон, дан. Режим доступа: http://www.microsoft.com/speech/, свободный.
- Nuance Communications Электронный ресурс. / Электрон, дан. Режим доступа: http://www.nuance.com/, свободный.
- BBN Technologies Электронный ресурс. / Электрон, дан. Режим доступа: http://wvvw.bbn.com/, свободный.
- AT&T Lab Research. Watson ASR Электронный ресурс. / Электрон, дан. Режим доступа: http://www.research.att.com/, свободный.
- Voice Recognition. 21st Century Eloquence, Inc. Электронный ресурс. / Электрон, дан. -Режим доступа: http://www.voicerecognition.com/, свободный.
- Стэл Компьютерные Системы. Распознавание речи, речевые технологии Электронный ресурс. / Электрон, дан. — Режим доступа: http://www.stel.ru/speech/, свободный.
- Wang, Y.-Y. Is word error rate a good indicator for spoken language understanding accuracy / Y.-Y. Wang, A. Acero, C. Chelba // IEEE Workshop on ASRU '2003, 30 Nov.-3 Dec. 2003 -p. 577−582.
- Soft-Forum. Обзоры программного обеспечения. Электронный ресурс. / Электрон, дан.- Режим доступа: http://www.soft-forum.ru/forum/, свободный.
- Софт-боард. Обзоры программного обеспечения. Электронный ресурс. / Электрон, дан. Режим доступа: http://www.softboard.ru/forum/, свободный.
- Речевые технологии. Информационный портал. Электронный ресурс. / Электрон, дан.- Режим доступа: http://speech-soft.ru/, свободный.
- Форум глухих, слабослышащих и всех. Электронный ресурс. / Электрон, дан. Режим доступа: http://www.deafnet.ru/forum/, свободный.
- Информационное агентство „Пари“ Электронный ресурс. / Электрон, дан. Режим доступа: http://www.pari.ru/, свободный.
- Макс, Ж. Методы и техника обработки сигналов при физических измерениях: В 2-х томах. Пер. с франц. / Ж. Макс. М.: Мир, 1983. — Т.1 — 312 с.
- Златоустова, JI. В. Общая и прикладная фонетика. Учебное пособие / JI. В. Златоустова, Р. К. Потапова. В. Н. Трунин-Донской М.: Изд-во МГУ, 1986. — 304 с.
- Pickles, J.O. An Introduction to the Physiology of Hearing / J.O. Pickles USA, New York: „Academic Press“, 1983. — 311 c.
- Применение цифровой обработки сигналов / Под ред. А. Оппенгейма. М.: Мир, 1 980 552 с.
- Потапова, Р.К. Речь: коммуникация, информация, кибернетика: Учебное пособие. Изд. 3-е, стереотипное / Р. К. Потапова М.: Едиториал УРСС, 2003. — 568 с.
- Рамишвили, Г. С. Автоматическое опознавание говорящего по голосу / Г. С. Рамишвили -М.: Радио и связь, 1981.-224 с.
- Фланаган, Д.Л. Анализ, синтез и восприятие речи. Пер. с англ. / Д. Л. Фланаган. М.: Связь, 1968.-198 с.
- Горелик, A.JI. Методы распознавания. Учеб. пособие для вузов / A. JL Горелик, В. А. Скрипкин. М.: „Высш. Школа“, 1977. -222 с.
- Горелик, A. J1. Современное состояние проблемы распознавания: Некоторые аспекты / A.JI. Горелик, И. Б. Гуревич, В. А. Скрипкин. М.: „Радио и связь“, 1985. — 160 с.
- Загоруйко, Н. Г. Методы распознавания и их применение / Н. Г. Загоруйко -М.:"Советское радио», 1972. 208 с.
- Винцюк, Т.К. Анализ, распознавание и интерпретация речевых сигналов / Т. К. Винцюк. -Киев: «Наук. Думка», 1987. 264 с.
- Renals, S. Using Speech Recognition / S. Renals // ITNOW.- 1996 № 38 (6).- c. 27−72.
- Itakura, F. Minimum prediction residual principle applied to speech recognition / F. Itakura // IEEE Trans. Acoustics, Speech, and Signal Proc. 1975. — vol.23.- c. 52−72.
- Фу, К. Структурные методы в распознавании образов. Пер с англ./ К. Фу М.: Мир, 1977.-320 с.
- Brown, P.F. Class-based n-gram models of natural language / P.F. Brown, V.J. Delia Pietra, P.V. deSouza, J.C. Lai, R.L. Mercer. // Computer Linguistics.-1992.-№ 18(4).-c. 467−479.
- Круглов, В.В. Искусственные нейронные сети. Теория и практика / В. В. Круглов, В. В. Борисов -М.: Горячая линия-Телеком, 2001.-382 с.
- Шевелев, А. Нейронные сети и распознавание образов / А. Шевелев // Программист. — 2001.-№ 10. с. 54−66.
- Уоссерман, Ф. Нейрокомпьютерная техника: теория и практика / Ф. Уоссерман М.: Мир, 1985.-с. 294.
- Рутковская Д. Нейронные сети, генетические алгоритмы и нечеткие системы / Д. Рут-ковская, М. Пилиньский, JI. Рутковский М.: Горячая линия-Телеком, 2007 — 452 с.
- Schmid, Н. Part-of-Speech Tagging with Neural Networks Электронный ресурс. / H. Schm-id // Proceeding of COLING-1994, ppl72−176 / Электрон, дан. Режим доступа: http://acl.ldc.upenn.edu/C/C94/C94- 1027. pdf, свободный. — Электрон, версия печ. публикации.
- Sameti, Н. HMM-Based Strategies for Enhancement of Speech Signals Embedded in Nonsta-tionary Noise / H. Sameti. H. Sheikhzadeh, L. Deng, L. Brennan // Trans, of IEEE on Speech and Audio Processing. 1998.-№ 5 (9), vol. 6- c. 445−455.
- Rabiner, L.R. A Tutorial on Hidden Markov Models and Selected Application in Speech Recognition / L.R. Rabiner // Proc. of IEEE. -1989.- № 77 (2).-c. 257−286.
- Pylkkonen, J. Duration Modeling Techniques for Continuous Speech Recognition / J. Pylkkonen, M. Kurimo // Proc. of the 8th ICSLP'04 (Interspeech 2004), October 4−8.-Jeju Island, Korea, 2004 c. 385−388.
- Ostendorf, М. From HMM’s to Segment Models: A Unified View of Stochastic Modeling for Speech Recognition / M. Ostendorf, V.V. Digalakis, O.A. Kimball // Trans, of IEEE on Speech and Audio Processing.- 1996.-№ 5 (9), vol. 4.- c. 360−378.
- Гавриков, M.M. Метод структурной аппроксимации в обработке сигналов и экспериментальных кривых / М. М. Гавриков, А. Н. Иванченко // Изв. вузов. Электромеханика.-1992.-№ 5.-с. 67−79.
- Гавриков, М.М. Конструирование алгоритмов структурной аппроксимации сигналов / М. М. Гавриков. А. Н. Иванченко // Изв. вузов. Электромеханика.-1995.-№ 1−2.-с. 104 112.
- Гавриков, М.М. Оптимизационная процедура синтеза структурно-аппроксимационной модели сигнала на основе вероятностных критериев / М. М. Гавриков, А.Н. Иванченко- Новочерк. гос. техн. ун-т.-Новочеркасск, 1995.-9 с.-Деп. В ВИНИТИ 13.03.95. №−662-В95.
- Гавриков, М.М. Автоматизация процессов обработки информации в кабинетах функциональной диагностики / М. М. Гавриков, Н.Д. Листопад- Юж.-Рос. гос. техн. ун-т. Новочеркасск, 2000.-18 с.-Деп. в ВИНИТИ 24.04.2000 г. №−1145-ВОО.
- Гавриков, М.М. Структурная аппроксимация и распознавание одномерных временных образов. Концепция и применения / М. М. Гавриков // Изв.вузов. Электромеханика. -2003.-№−6.-с. 52−60.
- Гренадер, У. Лекции по теории образов. Пер. с англ. В 2-х томах / У. Гренадер М.: Мир, 1976-Т.1 -382 с.
- Гренадер, У. Лекции по теории образов. Пер. с англ. В 2-х томах / У. Гренадер М.: Мир, 1976-Т.2−446 с.
- Пелед, А. Цифровая обработка сигналов: Теория, проектирование, реализация: Пер. с англ / А. Пелед, Б. Лиу Киев: Вища школа. Головное изд-во, 1979. — 264 с.
- Цифровая обработка сигналов: Справочник / Л. М. Голденберг, Б. Д. Матюшкин, М. Н. Поляк. М.: Радио и связь, 1985. — 312 с.
- Гавриков, М.М. Алгоритмическая и численная реализация структурно-аппроксимационного метода распознавания речевых образов / М. М. Гавриков, P.M. Си-нецкий // Изв. вузов: Электромеханика. 2007.-№ 2. — с 51−59.
- Арис, Р. Дискретное динамическое программирование. Введение в оптимизацию многошаговых процессов. Пер. с англ. / Арис Р, под ред. Б. Т. Поляка.-М.:Мир, 1969.-172 с.
- Беллман, Р. Введение в теорию матриц / Р. Беллман М.: Наука, 1976. — 375 с.
- Гавриков, М.М. Технология синтеза структурно-аппроксимационных эталонов речевых образов в командно-речевых интерпретаторах / М. М. Гавриков, P.M. Синецкий // Изв. вузов. Электромеханика. 2005. — № 1.-е. 40−46.
- Оппенгейм, А. В. Цифровая обработка сигналов: Пер. с англ./ А. В. Оппеигейм, Р. В. Шафер, под ред. А. С. Ненашева. М.: Техносфера, 2006. — 856 с.
- Маклаков, С. В. Моделирование бизнес-процессов с AllFusion Process Modeler / С. В. Маклаков М.: Диалог-Мифи, 2002. — 240 с.
- Феллер, В. Введение в теорию вероятностей и ее приложения. В 2-х томах. Пер. с англ./ В. Феллер. М.: Мир, 1984.-Т. 1−528 с.
- Левин, Б.Р. Теоретические основы статистической радиотехники. В трех томах / Б. Р. Левин. М.: «Сов. радио», 1975. — Т.2 — 392 с.
- Левин, Б.Р. Теоретические основы статистической радиотехники, В трех томах / Б. Р. Левин. М.: «Сов. радио», 1976. — Т. З — 288 с.
- Ерохин, А.Н. Обнаружение сигнала на фоне пуассоновской помехи / А. Н. Ерохин, И. В. Тиме // Автоматика и телемеханика.-1987.-№ 5.-с.174−178.
- Борисенко, В.И. Сегментация изображения (состояние проблемы) / В. И. Борисенко, А. А. Златопольский, И. Б. Мучник // Автоматика и телемеханика.-1987.-№ 7.-с.З-56.
- Коган, И.А. Оптимальная сегментация структурных экспериментальных кривых на основе метода динамического программирования / И. А. Коган // Автоматика и телемеханика.-! 983 .-№−7.-с. 146−156.
- Воробьев, С.А. Алгоритмы выделения и классификации фрагментов повторяющейся формы на экспериментальных кривых / С. А. Воробьев // Автоматика и телемеханика — 1985.-№−8.-с.89−93.
- Боденштайн, Г. Выделение признаков из электроэнцефалограммы методом адаптивной сегментации / Г. Боденштайн, X. М. Преториус // ТИИЭР 1977-№ 5(65). — с. 59−72.
- Златопольский, А.А. Сегментация изображения по границам с разрывами / А.А. Злато-польский // Автоматика и телемеханшса.-1985.-№ 9.-с. 109−117.
- Рабинер, Л. Р. Цифровая обработка речевых сигналов: Пер. с англ./ Л. Р. Рабинер, Р. В. Шафер / Под. ред. М. В. Назарова и Ю. Н. Прохорова. М.: Радио и связь, 1981. — 496 с.
- Моттль, В.В. Сегментация структурных кривых на основе метода динамического программирования / В. В. Моттль, И. Б. Мучник // Автоматика и телемеханика—1985.—№−1.— с.101−108.
- Моттль, В.В. Оптимальная сегментация экспериментальных кривых / В. В. Моттль, И. Б. Мучник, В. Г. Яковлев // Автоматика и телемеханика.-1983.-№ 8.-с.84−98.
- Моттль, В.В. Алгоритмическая реализация лингвистического подхода к анализу экспериментальных кривых / В. В. Моттль, И. Б. Мучник, В. Г. Яковлев // Автоматика и теле-механика.—1984-№ 4.-с.5−25.
- Сорокин, В.Н. Сегментация и распознавание гласных / В. Н. Сорокин, А. И. Цыплихин // Информационные процессы, — 2004- № 2, т. 4.-е. 202−220.
- Валуева, Н.М. Автоматическая сегментация речевого сигнала по динамической спектрограмме / Н. М. Валуева, Е. Б. Каничева М.: ВЦ АН СССР, 1988.- 12 с.
- Залманзон, JI. А. Преобразования Фурье, Уолша, Хаараи их применение в управлении, связи и других областях / J1.A. Залманзон М.:Наука.Гл.ред.физ.-мат.лит., 1989. — 496 с.
- Нуссбаумер, Г. Быстрое преобразование Фурье и алгоритмы вычисления сверток: Пер. с англ./ Г. Нуссбаумер М.: Радио и связь, 1985.-248 с.
- Лайонс, Р. Цифровая обработка сигналов: второе издание. Пер. с англ. / Р. Лайонс М.: ООО «Бином-Пресс», 2006. — 656 с.
- Марпл, С. Л.-мл. Цифровой спектральный анализ и его приложения: Пер. с англ. / С. Л. Марпл-мл. М.: Мир, 1990. — 584 с.
- Блейхут, Р. Быстрые алгоритмы цифровой обработки сигналов: Пер. с англ. / Р. Блейхут -М.: Мир, 1989.-448 с.
- Маккделлан, Дж. Г. Применение теории чисел в цифровой обработке сигналов: Пер. с англ. / Дж. Г. Маккделлан, Ч. М. Рейдер / Под ред. Ю. И. Манина. М.: Радио и связь, 1983.-264 с.
- Бахвалов, Н.С. Численные методы. В 2-х томах. / Н. С. Бахвалов — М.: Наука, 1975. — Т.1 632 с.
- Березин, И.С. Методы вычислений. В 2-х томах / И. С. Березин, Н. П. Жидков М.: Физматит., 1966. — Т.1 — 632 с.
- Холл, М. Комбинаторика. Пер. с англ. / М. Холл М.: Мир, 1970. — 424 с.
- Intel, Inc. Электронный ресурс. / Электрон, дан. Режим доступа: www.intel.com, свободный.
- Multiple Channel Audio Data and WAVE Files Электронный ресурс. / Электрон, дан. -Режим доступа: http://vvvvw.niicrosoit.coni/vvhdc/device/audio/multichaud.mspx, свободный.
- Орлов, С. Технологии разработки программного обеспечения. 3-е изд. / С. Орлов -СПб.: Питер, 2004. 527 с.
- Дейт, К. Дж. Введение в системы баз данных, 6-е издание: Пер. с англ. / К. Дж. Дейт -К., М., СПб.: Издательский дом «Вильяме», 2000. 848 с.
- Тутевич, В.Н. Телемеханика. Изд. 2. / В. Н. Тутевич М.: Высшая школа, 1985. — 424 с.