Разработка методики использования широких фонетических категорий в задачах верификации диктора
Диссертация
В компании ООО «Стэл — КС»: в научно-техническом отчете по СЧ НИР «Проба2К» (Госконтракт с ФГУП «НИИ Квант» № 028/23-К2 от 01.07.2008 г.), в научно-техническом отчете по НИР «Шпала» (Госконтракт с государственным учреждением «Войсковая часть 35 533» Ы70/2009;6200к от 10 апреля 2009 г.) использован проведенный анализ информативных параметров речевого сообщения, используемых для формирования… Читать ещё >
Список литературы
- Advances in Speech Signal Processing / ed. by Sadaoki Furui, M. Mohan Sondhi. New York: Marcel Dekker, Inc, 1991. — 871 p.
- Bernard Widrow, Michael A. Lehr, 30 Years of Adaptive NeuralNetworks: Perceptron, Madaline, and Backpropagation //Artificial Neural Networks: Concepts and Theory, IEEE Computer Society Press, 1992, pp.327−354.
- C.Cortes, V. Vapnik, Support Vector Networks // Machine Learning 20(3): 273 297, 1995.
- C.-W. Hsu and C.-J. Lin. A comparison of methods for multi-class support vector machines // IEEE Transactions on Neural Networks, 13(2):415−425, March 2002.
- Christopher J.C. Burges, A Tutorial on Support Vector Machines for Pattern Recognition // Data Mining and Knowledge Discovery, 2(2): 121−167, 1998.
- Christopher M. Bishop, Neural Networks for Pattern Recognition, Oxford University Press, 1995.
- D.K.Burten Text Independent Speaker Verification Using Vector Quantization Source Coding // IEEE Trans. ASSP-35.
- Doddington G.R., Flanagan G.L., Lummis R.C. Automatic speaker verification by non-linear time alignment of acoustic parameters. Патент США № 3 700 815. 1972
- Doddington G.R., Przybocki M.A., Martin A.F., Reynolds D.A. The NIST speaker recognition evaluation: Overview, methodology, systems, results, perspective // Speech Communication. 2001. V. 31. P. 225−254.
- Furui S. Cepstral analysis technique for automatic speaker verification // IEEE Trans. Acoust., Speech, Signal Process. Apr. 1987. V. ASSP-29. P. 254−272.
- Furui Sadaoki Digital speech processing, synthesis and recognition / Sadaoki Furui. 2nd ed., rev. and expanded. — New York: Marcel Dekker, Inc, 2001. -452 p.
- He J., Liu L., Palm G. A new codebook training algorithm for VQ-based speaker recognition // IEEE Proc. of International Conference on Acoustics, Speech and Signal Processing. Munich, 1997. V. 2. P. 1091−1094.
- L.R. Rabiner, B.H. Juang Fundamentals of speech recognition. Englewood Cliffs, New Jersey: Prentice-Hall, Inc, 1993. — 507 p.
- Lawrence R. Rabiner, A Tutorial on Hidden Markov Models and Selected Applications in Speech Recognition, Proceedings of IEEE, vol.77, no.2, p.257−285, 1989.
- Ming-Shin Chen, Pie-Hwa Lin, Hsiao-Chuan Wang. Speaker Identification Based on a Matrix Quantization Method // IEEE Trans. On Signal Proc. Jan. 1993. V. 41. № 1.
- N. Cristianini, J. Shawe-Taylor, An Introduction To Support Vector Machines (and other kernel-based learning methods), Cambridge University Press, 2000
- Nuttakorn Thubthong, Boonserm Kijsirikul Support vector machines for Thai phoneme recognition // International Journal of Uncertainty, Fuzziness and Knowledge-Based Systems. October, 2001.
- Roman Jakobson, C. Gunnar, M. Fant, Morris Halle, Preliminaries to speech analysis. The distinctive features and their correltes, «Technical Report», № 13, June 1955, chap. II, p. 16—55.
- Rosenberg A E., Soong F.K. «Evalution of a Vector Quntization Talker Recognition System in Text Independent and Text Dependet Modes». Computer Speech and Language, v.2, pp. 143−157, 1987.
- V.Vapnik, An Overview of Statistical Learning Theory, IEEE Transactions on Neural Networks, 10(5):988−999, September 1999.
- V.Vapnik, Statistical Learning Theory, Wiley, 1998
- Xuedong H., Acero A., Hon H. Spoken language processing: a guide to theory, algorithm, and system development. New Jersey: Printice Hall PTR, 2001, 472 p.
- Аграновский A.B., Леднов Д. А. Теоретические аспекты алгоритмов обработки и классификации речевых сигналов. Москва: Изд-во «Радио и связь», 2004. 164 с.
- Аграновский А.В., Леднов Д. А., Репалов С. А. Метод текстонезависимой идентификации диктора на основе индивидуальности произношения гласных звуков // Акустика и прикладная лингвистика: Ежегодник РАО. Вып. 3. М., 2002. С. 103−115.
- Барабаш Ю.Л., Варский Б. В., Зиновьев В. Т., Кириченко B.C., Сапегин В. Ф. Вопросы статистической теории распознавания / Под ред. Б. В. Барского. М.: Советское радио, 1967. -399 с.
- Бондарко Л. В. Звуковой отрой современного русского языка. М., 1976.
- Бочаров И.В., Акатьев Д. Ю. «Распознавание речевых сигналов на основе корреляционного метода». Электронный журнал «Исследовано в России».
- Быков С.Ф., Журавлев В. И., Шалимов И. А. Цифровая телефония: Учеб. пособие для вузов. М.: Радио и связь, 2003. — 144 с.
- Вапник В. Н., Червоненкис, А .Я. Теория распознавания образов. Статистические проблемы обучения (статистические проблемы обучения). -М.: Наука, Гл. ред. физ.-мат. лит., 1974. -416 с.
- Вапник В.Н., Червоненкис А. Я., Теория распознавания образов, М., Наука, 1974.
- Винцюк Т.К. Сравнение ИКДП- и НММ методов распознавания речи // Методы и средства информ. речи. Киев, 1991.
- Галушкин А.И. Теория нейронных сетей. Кн. 1.: Учеб. пособие для вузов -М.: ИПРЖР, 2000.-416 с.
- Галяшина Е. Речь под микроскопом // «Компьютерра» № 15 от 12 апреля 1999 года.
- Горелик А. Л., Скрипкин В. А. Методы распознавания: Учеб. пособие. -2-е изд., перераб. и доп. —М.: Высш. шк., 1984. -208с.
- Гудонавичюс Р. В., Кемешис П. П., Читавичюс А. Б. Распознавание речевых сигналов по их структурным свойствам. // Б-ка по автоматике. Вып. 578. Л.: Энергия, 1977. 64 с.
- Д.А. Лузин алгоритм начальной оценки основного тона речи для выделителя основного тона речи по методу gs. // Сборник трудов XVIII сессии Российского акустического общества. Т. 3. М.: ГЕОС, 2006.
- Дьяконов В.П., Круглов B.B. Matlab 6.5 SP1/7/7 SP1/7 SP2 + Simulink 5/6: Инструменты искусственного интеллекта и биоинформатики. -М.: Солон-пресс, 2006. -456 с.
- Журавлев Ю.И., Рязанов В. В., Сенько О. В. Распознавание. Математические методы. Программная система. Практические применения. -М.: Фазис, 2005. 159с.
- Идентификация- лиц по фонограммам русской речи на автоматизированной системе «Диалект»: Пособие для экспертов / Н. Ф. Попов, А. Н. Линьков, Н. Б. Кураченкова, Н.В. Байчаров- Под ред. A.B. Фесенко. -М.: Войсковая часть 34 435, 1996: — 102 с.
- Кей А. «Искусственные нейронные сети», Открытые системы, 9, 2006.
- Кудрявцев В. Б., Андреев А. Е., Гасанов Э. Э. Теория тестового распознавания. М.: ФИЗМАТЛИТ, 2007. — 320с. — ISBN 978−5-92 210 872−0.
- Кучеров В. Я., Лобанов Б. М. Синтезированная.речь в, системах массового обслуживания. М.: Радио и связь, 1983. — 132 с.
- Лобанов Б.М. Анализ и синтез речи. Сборник научных трудов /АН БССР Институт технической кибернетики. Науч. Ред. Лобанов Б: М'. Минск, 1991,-86 с.
- Максимов Е.М., Ромашкин Ю. Н., Лопатина С. А. Актуальные задачи речевой акустики // Речевые технологии. № 2. М!, 2008. С. 66−70.
- Макул Д. Векторное квантование при кодировании речи. // ТИИЭР. -1985. Т. 73, № 11.-С. 19−61.46: Математические методы распознавания образов. // 13-я Всероссийская конференция: Сборник докладов. М.: МАКС Пресс, 2007. — 668 с.
- Медведев B.C., Потемкин В. Г. Нейронные сети. MATLAB 6 / Под общ. ред. к.т.н. В. Г. Потемкина. -М.: ДИАЛОГ-МИФИ, 2002. 496с.
- Милошенко A.A. Особенности анализа лингвистических параметров речевых сигналов // Тезисы докладов научно-технической конференции в/ч 33 965, 3−5 февраля 2010, г. Москва.
- Милошенко A.A., Чапак A.C., Шалимов И. А. Просодический облик говорящего из оценки частоты основного тона // Тезисы докладов научно-технической конференции в/ч 33 965, 3−5 февраля 2010, г. Москва.
- Милошенко A.A., Шалимов И. А. Нейросетевой критерий распознавания диктора на основе широких фонетических категорий // Труды НИИР № 2, М: МТУСИ, 2010. С. 5−12.
- Михайлов В.Г., Златоустова JI.B. Измерение параметров речи / Под ред. М. А. Сапожкова. -М.: Радио и связь, 1987. 168 с.
- Нейронные сети. Statistica neural networks. Методология и технология современного анализа данных. -2-е изд., перераб! и доп. / Под ред. В. П. Боровикова -М.: Горячая линия Телеком, 2008. — 392 с.
- Обжелян Н.К., Трунин-Донской В.Н. Машины, которые говорят и слушают. / Под. ред. Ю. И. Журавлева. -Кишинев: Штиинца, 1987. -175 с.
- Оппенгейм А. В., Шафер Р. В. Цифровая обработка сигналов: Пер. с англ ./Под ред. С. Я. Шаца.-М.: Связь, 1979.-416с., ил.
- Осовский С. Нейронные сети для обработки информации / Пер. с польского И. Д. Рудинского. М.: Финансы и статистика, 2002. — 344 с.
- Панов М.В. Современный русский язык. Фонетика. М., 1979.
- Пилипенко В.В. Распознавание ключевых слов в потоке речи при помощи фонетического стенографа// Речевые технологии. № 1 2009. с. 75−79
- Попов Э.В. Общение с ЭВМ на естественном языке. М., 1989.
- Прикладные нечеткие системы: Пер. с япон. / К. Асаи, Д. Ватада, С. Иваи и др.- под редакцией Т. Тэрано, К. Асаи, М. Сугэно. М.: Мир, 1993. — 368 е., ил.
- Р.К. Потапова, В. В. Потапов О дальнейшем развитии систем идентификации говорящего по голосу и речи // Сборник трудов XVIII сессии Российского акустического общества. Т. 3. М.: ГЕОС, 2006.
- P.J1. Григорян, С. А. Репалов Исследование влияния динамических характеристик на точность идентификации дикторов для методов, основанных на векторном кантовании // Сборник трудов XVIII сессии Российского акустического общества. Т. 3. М.: ГЕОС, 2006.
- Рабинер JI. Р. Скрытые марковские модели и их применение в избранных приложениях при распознавании речи: Обзор // ТИИЭР, Т. 77, № 2, февраль 1989.-С. 86−120
- Рабинер JT. Р., Шафер Р. В. Цифровая обработка речевых сигналов: Пер. с англ./Под ред. М. В. Назарова и Ю. Н. Прохорова. -М.: Радио и связь, 1981.-496 е., ил.
- Рабинер Л., Гоулд Л. Теория и применение цифровой обработки сигналов. Пер. с англ. А. Л. Зайцева, Э. Г, Назаренко, H.H. Тетёкина /Под ред. Ю. Н. Александрова -М.: Мир, 1978. -848 е., ил.
- Рамишвили Г. С. «Речевой сигнал и индивидуальность голоса». Изд-во «МЕЦНИЕРЕБА», Тбилиси, 1976, стр. 1−183
- Рамишвили Г. С., Чикоидзе Г. Б. Криминалистическое исследование фонограмм речи и идентификация личности говорящего. Тбилиси: «Мецниереба», 1991. 265 с
- Рамишвили, Г. С. Автоматическое опознавание говорящего по голосу / Г. С. Рамишвили М.: Радио и связь, 1981 224 с.ил.
- Садыхов Р.Х., Ракуш В. В. Модели гауссовых смесей для верификации диктора по произвольной речи // Доклады БГУИР. № 4. октябрь-декабрь 2003 / Белорусский государственный университет информатики и радиоэлектроники. Минск, 2003. С. 95−103
- Сапожков М. А., Михайлов В. Г. Вокодерная связь. —М.: Радио и связь, 1983.-248 с.
- Сапожков М.А. Речевой сигнал в кибернетике и связи. -М.: Связьиздат, 1963.-453 с.
- Секунов Н. Ю. Обработка звука на PC. СПб.:БХВ-Петербург, 2001. -1248 е.: ил.
- Соболев В.Н. Информационные технологии в синтетической телефонии. -М.: Ириас, 2007.-360 с.
- Сорокин В.Н. Синтез речи. -М.: Наука Гл. ред. физ.-мат. лит., 1992. 392 с.
- Сорокин В.Н. Теория речеобразования. -М.: Радио и связь., 1985. -312 с.
- Справочная система пакета прикладных программ MatLab. Версия 7.6.0.324
- Фант Г. Акустическая теория речеобразования. Пер. с англ. Л. А. Варшавского, В. И. Медведева / Под ред. B.C. Григорьева. -М.: Наука Гл. ред. физ.-мат. лит., 1964. 284 с.
- Финк Л. М. Сигналы, помехи, ошибки . Заметки о некоторых неожиданностях, парадоксах и заблуждениях в теории связи.-2-e изд., перераб. и доп.-М.: радио и связь, 1984.-256 е., ил.
- Фланаган Д. Л. Анализ, синтез и восприятие речи: Пер. с англ./Под ред. А. А. Пирогова. -М.: Связь, 1968.-396 с.
- Фомин Я. А., Тарловский Г. Р. Статистическая теория распознавания образов : научное издание. М.: Радио и связь, 1986. — 264 с.
- Фукунага К. Введение в статистическую теорию распознавания. М.: Наука, 1979
- Хайкин С. Нейронные сети: полный курс, 2-е издание.: Пер. с англ. М.: Издательский дом «Вильяме», 2006. — 1104 с. о
- Харкевич A.A. Спектры и анализ. .-4-е изд. -М.: Физ.-мат. лит., 1962. 236 с.
- Харламов A.A., Кнеллер Э. Г. Распознавание ключевых слов в потоке' слитной речи на основе нейросетевых технологий. Нейрокомпьютеры разработка применение. Интегральный робот, 2005- 8−9: 88−97.
- Харламов A.A., Самаев Е. С., Джураев Э. Ш., Сухоносенко К. В. Фильтрация текстовой информации с помощью нейросетевых алгоритмов. Информационные технологии, 2003, 3:9−13
- Худсон Д. Статистика для физиков: Пер. с англ. —2-е изд., перераб. и доп.— М.: Мир, 1970.-297 с.
- Цифровая обработка сигналов / А. Б. Сергиенко СПб.:Питер, 2002.-608 е.: ил.
- Чедд Г. Звук. Пер. с англ. Г. И. Кузнецова. Ред. и предисл. С. Б. Гуревича. М.: «Мир», 1975. 206 с. с илл. (В мире науки и техники)
- Шалимов И. А., Милошенко А. А. Исследование возможности применения лингвистических параметров речи в системах идентификации по голосу // «Вестник ИКСИ», М., 2010.
- Шалимов И. А., Милошенко А. А. Обзор моделей идентификации и информативные параметры речевого сигнала // Специальная техника № 5 2009. С. 37−46.
- Шелухин О. И., Лукьянцев Н. Ф. Цифровая обработка и передача речи. -М.: Радио и связь, 2000. 456 с.
- Шемакин Ю. И. Начала компьютерной лингвистики: Учеб. пособие. М.: Изд-во МГОУ, А/О «Росвузнаука», 1992. — 81 с.
- Шемакин Ю.И. Основы информатики и вычислительной лингвистики. — М., 1983.
- Шмелева А. «Правда о распознавании речи», Компьютер-пресс, 1, 1998.
- Якобсон Р., Фант Г. М. и Хале М. Введение в анализ речи. Различительные признаки и их корреляты // Новое в лингвистике. Выпуск II.-М.: 1962, с. 173 -231.