Разработка методики использования широких фонетических категорий в задачах верификации диктора

ДиссертацияПомощь в написанииУзнать стоимостьмоей работы

В компании ООО «Стэл — КС»: в научно-техническом отчете по СЧ НИР «Проба2К» (Госконтракт с ФГУП «НИИ Квант» № 028/23-К2 от 01.07.2008 г.), в научно-техническом отчете по НИР «Шпала» (Госконтракт с государственным учреждением «Войсковая часть 35 533» Ы70/2009;6200к от 10 апреля 2009 г.) использован проведенный анализ информативных параметров речевого сообщения, используемых для формирования… Читать ещё >

Разработка методики использования широких фонетических категорий в задачах верификации диктора (реферат, курсовая, диплом, контрольная)

Содержание

ГЛАВА 1. ОБЗОР СУЩЕСТВУЮЩИХ МЕТОДОВ РАСПОЗНАВАНИЯ ДИКТОРОВ
- 1. 1. Информативные параметры речевого сообщения
  - 1. 1. 1. Акустические признаки
  - 1. 1. 2. Лингвистические признаки
- 1. 2. GMM модель
- 1. 3. SVM модель
  - 1. 3. 1. Нелинейная SVMмодель
  - 1. 3. 2. Многоклассовый классификатор
  - 1. 3. 3. Двоичное кодирование
  - 1. 3. 4. Каждый против всех.'.!:.'Л!
  - 1. 3. 5. Као/сдый против каэюдого.:
  - 1. 3. 6. Алгоритм голосования (Max Wins).:.'л.-."л.ч (
  - 1. 3. 7. Направленный нециклический граф принятия решения (Decision Directed Acyclic Graph (DDAG))
- 1. 4. Распознавание с использованием искусственных нейронных сетей
- 1. 5. СММ модель
- 1. 6. Метод векторного квантования
  - 1. 6. 1. Алгоритм Ллойда (алгоритм К-средних)
  - 1. 6. 2. Алгоритм Linde, Buzo, Gray (LBG)
- 1. 7. Тестовое распознавание
- 1. 8. Метод текстонезависимой системы идентификации на основе индивидуальности произношения гласных звуков
- 1. 9. Выводы по главе
ГЛАВА 2. МЕТОДИКА ИСПОЛЬЗОВАНИЯ ШИРОКИХ ФОНЕТИЧЕСКИХ КАТЕГОРИЙ В ЗАДАЧАХ ВЕРИФИКАЦИИ ДИКТОРА
- 2. 1. Широкие фонетические категории.:'
- 2. 2. Модель математической интерпретации математической интерпретации лингвистических признаков в задачах верификации диктора
- 2. 3. Методика использования широких фонетических категорий в задачах распознавания диктора
- 2. 5. Выводы по главе
ГЛАВА 3. ПРАКТИЧЕСКАЯ РЕАЛИЗАЦИЯ МОДЕЛИ РАСПОЗНАВАНИЯ ДИКТОРА НА ОСНОВЕ ШИРОКИХ ФОНЕТИЧЕСКИХ КАТЕГОРИЙ
- 3. 1. Описание эксперимента
- 3. 2. Построение модели распознавания диктора на основе искусственной нейронной сети
  - 3. 2. 1. ЬУдсеть
  - 3. 2. 2. Многослойный персептрон
- 3. 3. Оценка качества работы сети в зависимости от выбранного правила обучения на реализациях тестовой фразы
- 3. 4. Оценка репрезентативности полученных результатов
- 3. 5. Влияние шума на качество распознавания диктора
  - 3. 5. 1. Влияние «коричневого» шума
  - 3. 5. 2. Влияние «белого» шума
- 3. 6. Выводы по главе

Актуальность темы

Возможность общения с ЭВМ на естественном языке давно интересовала исследователей. С развитием уровня техники потребности современного общества диктуют новые требования к эргономичности систем и их безопасности. Таким образом, возникает необходимость в распознавании речевых сигналов. Это касается и вопросов пограничного контроля, криминалистической экспертизы, контроля и управления банковскими операциями, контроля доступа к охраняемым объектам и информационным системам, обслуживания и регистрации пассажиров, проведения оперативно-розыскных мероприятий.

Верификация, речи диктора, являясь одной из разновидностей задачи распознавания, устной: речи, используется в> системах контроля доступаВ общем случае, распознавание речи может состоять из нескольких задач: распознавание текста, распознавание диктора, определение его эмоционального состояния, возраста. и полараспознание языка произношения говорящего и др. Все они относятся-к статистической теории распознаванияобразов [25- 83- 29-. 82- 38- 46] и могут быть решены с: помощью соответствующего математического аппарата. Однако стоит отметить, что в системах распознавания речи: нашли применение и такие: модели, как: модель гауссовых смесей- (ОММ модель) — модель опорных векторов (8УМ модель), распознавание с использованием искусственных нейронных сетейскрытая Марковская модель (НММ модель), метод векторного квантования, тестовое распознавание (на основе аппарата' логических тестов), метод нечеткого сопоставления образов, 'метод! текстонезависимой системы идентификации диктора на основеиндивидуальности — произношения гласных звуков идр. Все перечисленныемодели используют в. качестве, априорного словаря признаков некие? параметры речевого' сигнала, вычисленныена> его отдельных достаточно! коротких фрагментах, характеризующихся стационарнарностыо. Признаки,' связанные с анатомическими особенностями голосового тракта принято называть акустическими. Возможности систем распознавания с использованием акустических параметров достигли своего предела. Признаки, отражающие индивидуальные особенности речевой активности, обусловленные работой центральной нервной системы человека — называют лингвистическими. Трудность их использования в задачах распознавания заключается в том, что они характеризуются значительной вариативностью, и множества значений для различных дикторов имеют существенное пересечение. Возможности систем распознавания с использованием физических параметров достигли своего предела [44], и дальнейшее их усовершенствование представляется в совместном использовании лингвистических и спектрально-временных признаков.

Рассматривая речевое сообщение как последовательность сменяющихся звуков и пауз можно определить понятие широких фонетических категорий. В отечественной и зарубежной литературе выделяют следующие категории: гласные, носовые (назальные), плавные, шипящие, аффрикаты, взрывные, паузы [13- 54- 73].

Таким образом, использование широких фонетических категорий, в частности изменение во времени признака тон/шум, а также пауз речевого сообщения, для задач распознавания диктора является актуальным.

Цель работы заключается в разработке методики использования широких фонетических категорий речевого сообщения (распределения признаков тон/шум и пауз на фрагментах речи) в задачах верификации диктора.

Задачи исследования. Для достижения поставленной цели в работе решены следующие задачи:

1. Анализ характеристик речевых сообщений, используемых при распознавании речи;

2. Анализ моделей и методов, используемых при распознавании;

3. Построение модели математической интерпретации лингвистических признаков в задачах верификации диктора;

4. Исследование возможности применения различных идентификационных параметров для верификации диктора в разработанной модели;

5. Разработка методики использования широких фонетических категорий в задачах верификации диктора;

6. Исследование влияния шума на надежность верификации диктора с использованием широких фонетических категорий;

7. Оценка репрезентативности полученных результатов распознавания диктора;

8. Обобщение и оценка результатов исследований по проблеме верификации диктора с использованием широких фонетических категорий.

Объект исследования. Процессы формирования и обработки устной речи.

Предмет исследования. Принципы, способы, методы, модели, алгоритмы, методики распознавания речи дикторов.

Исходная основа диссертации. Диссертация основывается на результатах:

— работ теории распознавания образов Ю. JL Барабаша, В. Н. Вапника, К. Фукунаги, А. JI. Горелика.

— теоретических и прикладных исследований по цифровой обработке речевых сообщений В. М. Величко, Т. К. Винцюка, Н. Г Загоруйко, Г. С. Слуцкера, A.A. Пирогова, М. А. Сапожкова,, Г. Е. Кедровой, JI.A. Чистовича, Ю. А. Косарева, В. Н. Сорокина, В. И. Галунова,.

A.B. Аграновского, В. П. Бондаренко, A.A. Харламова, Р. К. Потаповой,.

B.Я. Чу чу пал а, В. Н. Сорокина, П. А. Скрелина, В. Г. Михайлова, Б. М. Лобанова, Н. К. Обжеляна, В.Н. Трунина-Донского, Г. С. Рамишвили, JI.P. Рабинера, Г. М. Фанта, Р. В. Шафера, Р. Якобсона, Г. Чедда,.

Г. Р. Доддингтона, С. Фуруи, Л. Фланагана, Г. В. Горелова, А. Ф. Фомина, Л. А. Баранова, И. А. Шалимова.

Методы исследования. В работе использовались метод структурного системного анализа, методы цифровой обработки сигналов, математического и компьютерного моделирования, методы обработки экспериментальных данных, методы распознавания образов, статистического анализа, методы спектрального и корреляционного анализа.

Научная новизна и основные положения, выносимые на защиту состоят в следующем:

1) Предложена математическая интерпретация идентификационной информативности лингвистических признаков посредством последовательности изменяющихся во времени акустических параметров речи диктора.

2) На основе результатов исследования существующих моделей и методов распознавания дикторов, разработана модель математической интерпретации лингвистических признаков в задачах верификации диктора.

3) Создана методика использования широких фонетических категорий в задачах верификации диктора.

4) Получена экспериментальная оценка надежности распознавания диктора, с использованием разработанных модели и методики.

Основные положения, выносимые на защиту состоят в следующем:

1) Модель математической интерпретации лингвистических признаков в задачах верификации диктора.

2) Методика использования широких фонетических категорий в задачах верификации диктора.

Практическая ценность работы.

1) Обеспечение возможности верификации диктора по каналу связи с вокодерной передачей без восстановления исходной формы речевого сигнала.

2) Верификация диктора на основе широких фонетических категорий инвариантна к сигналам, подвергнутым вокодерным преобразованиям, что позволяет повысить надежность системы верификации при использовании предложенной методики.

3) Реализованная в пакете прикладных программ Ма^аЬ модель математической интерпретации лингвистических признаков в задачах верификации диктора, и методика использования широких фонетических категорий в задачах верификации диктора используется при проведении лабораторных работ по исследованию систем распознавания в рамках дисциплины «Цифровая телефония».

Реализация результатов работы.

1. В компании ООО «Стэл — КС»: в научно-техническом отчете по СЧ НИР «Проба2К» (Госконтракт с ФГУП «НИИ Квант» № 028/23-К2 от 01.07.2008 г.), в научно-техническом отчете по НИР «Шпала» (Госконтракт с государственным учреждением «Войсковая часть 35 533» Ы70/2009;6200к от 10 апреля 2009 г.) использован проведенный анализ информативных параметров речевого сообщения, используемых для формирования априорного словаря признаков, а также показана возможность идентификации диктора посредством широких фонетических категорий.

2. В учебном процессе на кафедре 723 ИКСИ в курсе лекционных, лабораторных и практических занятий по дисциплине «Цифровая телефония» используются результаты анализа информативных параметров речевого сообщения, существующих методов и моделей, используемых при распознавании дикторов и реализованная в пакете прикладных программ MatLab модель математической интерпретации лингвистических признаков в задачах верификации диктора.

Апробация результатов работы. Результаты диссертационного исследования были апробированы на IX Международной научно-технической конференции «Физика и радиоэлектроника в медицине и экологии» (ФРЭМЭ'2010) (29 июня — 2 июля 2010 года, ВлГУ, г. Владимир), VIII Межведомственной научно-технической конференции (3−5 февраля 2010, в/ч 33 965, г. Москва), Юбилейной научно-технической конференции специалистов и молодых ученых (27−28 мая 2009, в/ч 35 533, г. Москва), 6-ой Всероссийской научной конференции «Проблемы развития технологических систем государственной охраны, специальной связи и информации» (5−6 февраля 2009, Академия ФСО России, г. Орел), а также в ходе проведения научных семинаров на базе Института криптографии связи и информатики Академии ФСБ России и в/ч 35 533.

Публикации. По материалам диссертации опубликовано 9 работ, три из которых в изданиях, входящих в Перечень ведущих рецензируемых научных журналов и изданий, формируемый Высшей аттестационной комиссией.

Содержание работы.

Во введении обоснована актуальность диссертационного исследования, сформулированы цель и основные задачи, решение которых необходимо для достижения поставленной цели. Кратко изложены основное содержание работы.

В первой главе проведен обзор, анализ и систематизация используемых для распознавания дикторов информативных параметров речевого сообщения, существующих методов и моделей, используемых при распознавании дикторов.

Во второй главе строится модель математической интерпретации лингвистических признаков и разрабатывается методика использования широких фонетических категорий в задачах верификации диктора.

В третьей главе приводится описание исследований структуры искусственной нейронной сети для реализации предложенной методики и условий ее применимости. Исследуется влияние шума на надежность распознавания диктора. Дается оценка репрезентативности полученных результатов.

3.6 Выводы по главе.

Представленная во второй главе модель математической интерпретации лингвистических признаков в задачах верификации диктора распознавания диктора на основе широких фонетических категорий получила свою практическую реализацию. Для принятия решения о принадлежности диктора тому или иному классу построен классификатор на основе аппарата искусственных нейронных сетей [53], который был апробирован на реальных данных и уточнен соответствующим образом. Проведенная оценка репрезентативности полученных данных показала, что использование многослойного персептрона в качестве решающего правила для верификации диктора на основе широких фонетических категорий является применимым. При этом с вероятностью 0,95 среднее процентное соотношение верно распознанных дикторов в каждой серии испытаний к их общему числу составляет 86 ±4,7%, при усреднении полученных результатов в каждой серии испытаний и 86 ± 7,6% при усреднении значений по каждому диктору по результатам всех испытаний.

Влияние шума оказало существенное воздействие на качество распознавания, что является ограничением используемых алгоритмов выделения пауз и определения вокализованности фрагментов. Однако стоит отметить, что величина шумовой составляющей являлась критической, когда исходное речевое сообщение при использовании «белого» шума оказалось на границе порога слышимости.

ЗАКЛЮЧЕНИЕ

В ходе проведения исследований в работе решены следующие задачи:

1. Проведен анализ систем распознавания речи, отмечена ограниченность современных подходов, не использующих лингвистическую информацию.

2. Построена модель математической интерпретации лингвистических признаков в задачах верификации диктора.

3. Произведена оценка информативности различных параметров устной речи применительно к разработанной модели.

4. Определена структура и параметры модели распознавания диктора на основе искусственной нейронной сети.

5. Разработана методика использования широких фонетических категорий в задачах верификации диктора.

6. Разработанная модель математической интерпретации лингвистических признаков в задачах верификации диктора реализована в пакете прикладных программ Ма^аЬ.

7. Исследовано влияние шума на надежность верификации диктора с использованием широких фонетических категорий.

8. Разработанная модель математической интерпретации лингвистических признаков обеспечивает возможность верификации диктора по каналу связи с вокодерной передачей без восстановления исходной формы речевого сигнала.

9. Получена экспериментальная оценка надежности распознавания диктора с использованием разработанных модели и методики. Проведена оценка репрезентативности полученных результатов. При этом с вероятностью 0,95 среднее процентное соотношение верно распознанных дикторов в каждой серии испытаний к их общему числу составляет 86 ± 5%.

Решение поставленных задач привело к следующим новым научным результатам:

1) Разработана модель распознавания диктора на основе широких фонетических категорий;

2) Разработана методика использования широких фонетических категорий в задачах верификации диктора;

3) Интерпретация информационной информативности фонетических категорий посредством последовательности изменяющихся во времени акустических параметров диктора.

Применение акустических параметров речевого сообщения для задач распознавания дикторов достигло своего предела, и дальнейшее повышение эффективности представляется в совместном использовании спектрально-временных и акустических признаков. Проведенное исследование показало, что, в частности, для этих целей возможно использование широких фонетических категорий. Применение в качестве решающего правила нейронной сети, несмотря на недоказанную сходимость к глобальному оптимуму, имеет право на существование, поскольку полученные результаты являются удовлетворительными для проверки выдвинутой гипотезы.

Главным итогом проведенной работы является решение задачи использования лингвистических признаков в задачах верификации диктора, что является, имеющей существенное значение для соответствующей отрасли знаний.

Используемые признаки в вокодерной передаче непосредственно передаются по каналу связи, в связи с чем возможна верификация диктора по каналу связи без восстановления исходной формы речевого сообщения. Кроме того, надежность распознавания в данном случае зависит от качества канала связи опосредованно.

Показать весь текст

Список литературы

Advances in Speech Signal Processing / ed. by Sadaoki Furui, M. Mohan Sondhi. New York: Marcel Dekker, Inc, 1991. — 871 p.
Bernard Widrow, Michael A. Lehr, 30 Years of Adaptive NeuralNetworks: Perceptron, Madaline, and Backpropagation //Artificial Neural Networks: Concepts and Theory, IEEE Computer Society Press, 1992, pp.327−354.
C.Cortes, V. Vapnik, Support Vector Networks // Machine Learning 20(3): 273 297, 1995.
C.-W. Hsu and C.-J. Lin. A comparison of methods for multi-class support vector machines // IEEE Transactions on Neural Networks, 13(2):415−425, March 2002.
Christopher J.C. Burges, A Tutorial on Support Vector Machines for Pattern Recognition // Data Mining and Knowledge Discovery, 2(2): 121−167, 1998.
Christopher M. Bishop, Neural Networks for Pattern Recognition, Oxford University Press, 1995.
D.K.Burten Text Independent Speaker Verification Using Vector Quantization Source Coding // IEEE Trans. ASSP-35.
Doddington G.R., Flanagan G.L., Lummis R.C. Automatic speaker verification by non-linear time alignment of acoustic parameters. Патент США № 3 700 815. 1972
Doddington G.R., Przybocki M.A., Martin A.F., Reynolds D.A. The NIST speaker recognition evaluation: Overview, methodology, systems, results, perspective // Speech Communication. 2001. V. 31. P. 225−254.
Furui S. Cepstral analysis technique for automatic speaker verification // IEEE Trans. Acoust., Speech, Signal Process. Apr. 1987. V. ASSP-29. P. 254−272.
Furui Sadaoki Digital speech processing, synthesis and recognition / Sadaoki Furui. 2nd ed., rev. and expanded. — New York: Marcel Dekker, Inc, 2001. -452 p.
He J., Liu L., Palm G. A new codebook training algorithm for VQ-based speaker recognition // IEEE Proc. of International Conference on Acoustics, Speech and Signal Processing. Munich, 1997. V. 2. P. 1091−1094.
L.R. Rabiner, B.H. Juang Fundamentals of speech recognition. Englewood Cliffs, New Jersey: Prentice-Hall, Inc, 1993. — 507 p.
Lawrence R. Rabiner, A Tutorial on Hidden Markov Models and Selected Applications in Speech Recognition, Proceedings of IEEE, vol.77, no.2, p.257−285, 1989.
Ming-Shin Chen, Pie-Hwa Lin, Hsiao-Chuan Wang. Speaker Identification Based on a Matrix Quantization Method // IEEE Trans. On Signal Proc. Jan. 1993. V. 41. № 1.
N. Cristianini, J. Shawe-Taylor, An Introduction To Support Vector Machines (and other kernel-based learning methods), Cambridge University Press, 2000
Nuttakorn Thubthong, Boonserm Kijsirikul Support vector machines for Thai phoneme recognition // International Journal of Uncertainty, Fuzziness and Knowledge-Based Systems. October, 2001.
Roman Jakobson, C. Gunnar, M. Fant, Morris Halle, Preliminaries to speech analysis. The distinctive features and their correltes, «Technical Report», № 13, June 1955, chap. II, p. 16—55.
Rosenberg A E., Soong F.K. «Evalution of a Vector Quntization Talker Recognition System in Text Independent and Text Dependet Modes». Computer Speech and Language, v.2, pp. 143−157, 1987.
V.Vapnik, An Overview of Statistical Learning Theory, IEEE Transactions on Neural Networks, 10(5):988−999, September 1999.
V.Vapnik, Statistical Learning Theory, Wiley, 1998
Xuedong H., Acero A., Hon H. Spoken language processing: a guide to theory, algorithm, and system development. New Jersey: Printice Hall PTR, 2001, 472 p.
Аграновский A.B., Леднов Д. А. Теоретические аспекты алгоритмов обработки и классификации речевых сигналов. Москва: Изд-во «Радио и связь», 2004. 164 с.
Аграновский А.В., Леднов Д. А., Репалов С. А. Метод текстонезависимой идентификации диктора на основе индивидуальности произношения гласных звуков // Акустика и прикладная лингвистика: Ежегодник РАО. Вып. 3. М., 2002. С. 103−115.
Барабаш Ю.Л., Варский Б. В., Зиновьев В. Т., Кириченко B.C., Сапегин В. Ф. Вопросы статистической теории распознавания / Под ред. Б. В. Барского. М.: Советское радио, 1967. -399 с.
Бондарко Л. В. Звуковой отрой современного русского языка. М., 1976.
Бочаров И.В., Акатьев Д. Ю. «Распознавание речевых сигналов на основе корреляционного метода». Электронный журнал «Исследовано в России».
Быков С.Ф., Журавлев В. И., Шалимов И. А. Цифровая телефония: Учеб. пособие для вузов. М.: Радио и связь, 2003. — 144 с.
Вапник В. Н., Червоненкис, А .Я. Теория распознавания образов. Статистические проблемы обучения (статистические проблемы обучения). -М.: Наука, Гл. ред. физ.-мат. лит., 1974. -416 с.
Вапник В.Н., Червоненкис А. Я., Теория распознавания образов, М., Наука, 1974.
Винцюк Т.К. Сравнение ИКДП- и НММ методов распознавания речи // Методы и средства информ. речи. Киев, 1991.
Галушкин А.И. Теория нейронных сетей. Кн. 1.: Учеб. пособие для вузов -М.: ИПРЖР, 2000.-416 с.
Галяшина Е. Речь под микроскопом // «Компьютерра» № 15 от 12 апреля 1999 года.
Горелик А. Л., Скрипкин В. А. Методы распознавания: Учеб. пособие. -2-е изд., перераб. и доп. —М.: Высш. шк., 1984. -208с.
Гудонавичюс Р. В., Кемешис П. П., Читавичюс А. Б. Распознавание речевых сигналов по их структурным свойствам. // Б-ка по автоматике. Вып. 578. Л.: Энергия, 1977. 64 с.
Д.А. Лузин алгоритм начальной оценки основного тона речи для выделителя основного тона речи по методу gs. // Сборник трудов XVIII сессии Российского акустического общества. Т. 3. М.: ГЕОС, 2006.
Дьяконов В.П., Круглов B.B. Matlab 6.5 SP1/7/7 SP1/7 SP2 + Simulink 5/6: Инструменты искусственного интеллекта и биоинформатики. -М.: Солон-пресс, 2006. -456 с.
Журавлев Ю.И., Рязанов В. В., Сенько О. В. Распознавание. Математические методы. Программная система. Практические применения. -М.: Фазис, 2005. 159с.
Идентификация- лиц по фонограммам русской речи на автоматизированной системе «Диалект»: Пособие для экспертов / Н. Ф. Попов, А. Н. Линьков, Н. Б. Кураченкова, Н.В. Байчаров- Под ред. A.B. Фесенко. -М.: Войсковая часть 34 435, 1996: — 102 с.
Кей А. «Искусственные нейронные сети», Открытые системы, 9, 2006.
Кудрявцев В. Б., Андреев А. Е., Гасанов Э. Э. Теория тестового распознавания. М.: ФИЗМАТЛИТ, 2007. — 320с. — ISBN 978−5-92 210 872−0.
Кучеров В. Я., Лобанов Б. М. Синтезированная.речь в, системах массового обслуживания. М.: Радио и связь, 1983. — 132 с.
Лобанов Б.М. Анализ и синтез речи. Сборник научных трудов /АН БССР Институт технической кибернетики. Науч. Ред. Лобанов Б: М'. Минск, 1991,-86 с.
Максимов Е.М., Ромашкин Ю. Н., Лопатина С. А. Актуальные задачи речевой акустики // Речевые технологии. № 2. М!, 2008. С. 66−70.
Макул Д. Векторное квантование при кодировании речи. // ТИИЭР. -1985. Т. 73, № 11.-С. 19−61.46: Математические методы распознавания образов. // 13-я Всероссийская конференция: Сборник докладов. М.: МАКС Пресс, 2007. — 668 с.
Медведев B.C., Потемкин В. Г. Нейронные сети. MATLAB 6 / Под общ. ред. к.т.н. В. Г. Потемкина. -М.: ДИАЛОГ-МИФИ, 2002. 496с.
Милошенко A.A. Особенности анализа лингвистических параметров речевых сигналов // Тезисы докладов научно-технической конференции в/ч 33 965, 3−5 февраля 2010, г. Москва.
Милошенко A.A., Чапак A.C., Шалимов И. А. Просодический облик говорящего из оценки частоты основного тона // Тезисы докладов научно-технической конференции в/ч 33 965, 3−5 февраля 2010, г. Москва.
Милошенко A.A., Шалимов И. А. Нейросетевой критерий распознавания диктора на основе широких фонетических категорий // Труды НИИР № 2, М: МТУСИ, 2010. С. 5−12.
Михайлов В.Г., Златоустова JI.B. Измерение параметров речи / Под ред. М. А. Сапожкова. -М.: Радио и связь, 1987. 168 с.
Нейронные сети. Statistica neural networks. Методология и технология современного анализа данных. -2-е изд., перераб! и доп. / Под ред. В. П. Боровикова -М.: Горячая линия Телеком, 2008. — 392 с.
Обжелян Н.К., Трунин-Донской В.Н. Машины, которые говорят и слушают. / Под. ред. Ю. И. Журавлева. -Кишинев: Штиинца, 1987. -175 с.
Оппенгейм А. В., Шафер Р. В. Цифровая обработка сигналов: Пер. с англ ./Под ред. С. Я. Шаца.-М.: Связь, 1979.-416с., ил.
Осовский С. Нейронные сети для обработки информации / Пер. с польского И. Д. Рудинского. М.: Финансы и статистика, 2002. — 344 с.
Панов М.В. Современный русский язык. Фонетика. М., 1979.
Пилипенко В.В. Распознавание ключевых слов в потоке речи при помощи фонетического стенографа// Речевые технологии. № 1 2009. с. 75−79
Попов Э.В. Общение с ЭВМ на естественном языке. М., 1989.
Прикладные нечеткие системы: Пер. с япон. / К. Асаи, Д. Ватада, С. Иваи и др.- под редакцией Т. Тэрано, К. Асаи, М. Сугэно. М.: Мир, 1993. — 368 е., ил.
Р.К. Потапова, В. В. Потапов О дальнейшем развитии систем идентификации говорящего по голосу и речи // Сборник трудов XVIII сессии Российского акустического общества. Т. 3. М.: ГЕОС, 2006.
P.J1. Григорян, С. А. Репалов Исследование влияния динамических характеристик на точность идентификации дикторов для методов, основанных на векторном кантовании // Сборник трудов XVIII сессии Российского акустического общества. Т. 3. М.: ГЕОС, 2006.
Рабинер JI. Р. Скрытые марковские модели и их применение в избранных приложениях при распознавании речи: Обзор // ТИИЭР, Т. 77, № 2, февраль 1989.-С. 86−120
Рабинер JT. Р., Шафер Р. В. Цифровая обработка речевых сигналов: Пер. с англ./Под ред. М. В. Назарова и Ю. Н. Прохорова. -М.: Радио и связь, 1981.-496 е., ил.
Рабинер Л., Гоулд Л. Теория и применение цифровой обработки сигналов. Пер. с англ. А. Л. Зайцева, Э. Г, Назаренко, H.H. Тетёкина /Под ред. Ю. Н. Александрова -М.: Мир, 1978. -848 е., ил.
Рамишвили Г. С. «Речевой сигнал и индивидуальность голоса». Изд-во «МЕЦНИЕРЕБА», Тбилиси, 1976, стр. 1−183
Рамишвили Г. С., Чикоидзе Г. Б. Криминалистическое исследование фонограмм речи и идентификация личности говорящего. Тбилиси: «Мецниереба», 1991. 265 с
Рамишвили, Г. С. Автоматическое опознавание говорящего по голосу / Г. С. Рамишвили М.: Радио и связь, 1981 224 с.ил.
Садыхов Р.Х., Ракуш В. В. Модели гауссовых смесей для верификации диктора по произвольной речи // Доклады БГУИР. № 4. октябрь-декабрь 2003 / Белорусский государственный университет информатики и радиоэлектроники. Минск, 2003. С. 95−103
Сапожков М. А., Михайлов В. Г. Вокодерная связь. —М.: Радио и связь, 1983.-248 с.
Сапожков М.А. Речевой сигнал в кибернетике и связи. -М.: Связьиздат, 1963.-453 с.
Секунов Н. Ю. Обработка звука на PC. СПб.:БХВ-Петербург, 2001. -1248 е.: ил.
Соболев В.Н. Информационные технологии в синтетической телефонии. -М.: Ириас, 2007.-360 с.
Сорокин В.Н. Синтез речи. -М.: Наука Гл. ред. физ.-мат. лит., 1992. 392 с.
Сорокин В.Н. Теория речеобразования. -М.: Радио и связь., 1985. -312 с.
Справочная система пакета прикладных программ MatLab. Версия 7.6.0.324
Фант Г. Акустическая теория речеобразования. Пер. с англ. Л. А. Варшавского, В. И. Медведева / Под ред. B.C. Григорьева. -М.: Наука Гл. ред. физ.-мат. лит., 1964. 284 с.
Финк Л. М. Сигналы, помехи, ошибки . Заметки о некоторых неожиданностях, парадоксах и заблуждениях в теории связи.-2-e изд., перераб. и доп.-М.: радио и связь, 1984.-256 е., ил.
Фланаган Д. Л. Анализ, синтез и восприятие речи: Пер. с англ./Под ред. А. А. Пирогова. -М.: Связь, 1968.-396 с.
Фомин Я. А., Тарловский Г. Р. Статистическая теория распознавания образов : научное издание. М.: Радио и связь, 1986. — 264 с.
Фукунага К. Введение в статистическую теорию распознавания. М.: Наука, 1979
Хайкин С. Нейронные сети: полный курс, 2-е издание.: Пер. с англ. М.: Издательский дом «Вильяме», 2006. — 1104 с. о
Харкевич A.A. Спектры и анализ. .-4-е изд. -М.: Физ.-мат. лит., 1962. 236 с.
Харламов A.A., Кнеллер Э. Г. Распознавание ключевых слов в потоке' слитной речи на основе нейросетевых технологий. Нейрокомпьютеры разработка применение. Интегральный робот, 2005- 8−9: 88−97.
Харламов A.A., Самаев Е. С., Джураев Э. Ш., Сухоносенко К. В. Фильтрация текстовой информации с помощью нейросетевых алгоритмов. Информационные технологии, 2003, 3:9−13
Худсон Д. Статистика для физиков: Пер. с англ. —2-е изд., перераб. и доп.— М.: Мир, 1970.-297 с.
Цифровая обработка сигналов / А. Б. Сергиенко СПб.:Питер, 2002.-608 е.: ил.
Чедд Г. Звук. Пер. с англ. Г. И. Кузнецова. Ред. и предисл. С. Б. Гуревича. М.: «Мир», 1975. 206 с. с илл. (В мире науки и техники)
Шалимов И. А., Милошенко А. А. Исследование возможности применения лингвистических параметров речи в системах идентификации по голосу // «Вестник ИКСИ», М., 2010.
Шалимов И. А., Милошенко А. А. Обзор моделей идентификации и информативные параметры речевого сигнала // Специальная техника № 5 2009. С. 37−46.
Шелухин О. И., Лукьянцев Н. Ф. Цифровая обработка и передача речи. -М.: Радио и связь, 2000. 456 с.
Шемакин Ю. И. Начала компьютерной лингвистики: Учеб. пособие. М.: Изд-во МГОУ, А/О «Росвузнаука», 1992. — 81 с.
Шемакин Ю.И. Основы информатики и вычислительной лингвистики. — М., 1983.
Шмелева А. «Правда о распознавании речи», Компьютер-пресс, 1, 1998.
Якобсон Р., Фант Г. М. и Хале М. Введение в анализ речи. Различительные признаки и их корреляты // Новое в лингвистике. Выпуск II.-М.: 1962, с. 173 -231.

Заполнить форму текущей работой