Разработка и исследование методов низкоскоростного кодирования речи на основе слуховых вейвлет
Диссертация
Полное сокращение избыточности при обработке стационарного сигнала обеспечивает базис, построенный на основе собственных векторов корреляционной матрицы сигнала. Такое оптимальное преобразование найдено и известно в литературе как преобразование Карунена-Лоэва-Пугачева. Однако, из-за отсутствия «быстрого» алгоритма его реализации, в практике компактного цифрового представления сигналов оно… Читать ещё >
Список литературы
- Артюшенко В.М., Шелухин О. И., Афонин М. Ю. Цифровое сжатие видеоинформации и звука. М.: ИТК «Дашков и К0», 2003. — 426 с.
- Беллами Дж. Цифровая телефония: Пер. с англ. / Под ред. А. Н. Берлина, Ю. Н. Чернышова. -М.: Эко-Трендз, 2004. 640 с.
- Блаттер К. Вейвлет анализ. Основы теории // Перевод с нем. Т. Э. Кренкеля / Под ред. А. Г. Кюркчана. — М.: Техносфера, 2006. — 272 с.
- Вокодерная телефония /Под ред. А. А. Пирогова. -М.: Связь, 1974 536 с
- ГОСТ Р 50 840−95. Передача речи по трактам связи. Методы оценки качества, разборчивости и узнаваемости. 200 с.
- ГОСТ Р 51 061−97. Системы низкоскоростной передачи речи по цифровым каналам. Параметры качества речи и методы измерений. 21 с.
- Градштейн И.С., Рыжик И. М. Таблицы интегралов, сумм, рядов и произведений. М.: Наука, ГР ФМЛ, 1971. — 1108 с.
- Громаков Ю.А. Стандарты и системы подвижной радиосвязи. М.: ЭКО -ТРЭНЗ, 1998.-240 с.
- Дворецкий И.М., Дриацкий И. Н. Цифровая передача сигналов звукового вещания. -М.: Радио и связь, 1987. 192 с.
- Добеши И. Десять лекций по вейвлетам / Пер. с англ. Е. В. Мищенко // Под ред. А. П. Петухова. Москва-Ижевск.: PXD, 2001. — 110 с.
- Дьяконов В.П. Вейвлеты. М.: СОЛОН-Р, 2002. — 580 с.
- Ефимов А.П. Психофизиология вещания. М.: МТУ СИ, 2004. — 196 с.
- Защищенные радиосистемы цифровой передачи информации / П. Н. Сердюков, А. В. Бельчиков, А. Е. Дронов и др. -М.: ACT, 2006.-403 с.
- Зверев Б.В., Зелевич Е. П. Социально ориентированные услуги связи. -М.: Радио и связь, 2005. 128 с.
- Зюко А.Г., Банкет В. Л., Лехан В. Ю. Методы низкоскоростного кодирования при цифровой передаче речи // Зарубежная радиоэлектроника. -1986. -№ 11.-С. 53−69.
- Исаев А.Н., Раков А. С., Дотолев В. Г. Актуальные вопросы развития техники звукового радиовещания в деятельности исследовательской комиссии 10 Международного Союза Электросвязи // Труды НИИР. 1995. -№ 6. -С. 33−38.
- Калинцев Ю.К. Разборчивость речи в цифровых вокодерах. М.: Радио и связь, 1991.-220 с.
- Кириллов С.Н., Лоцманов А. А. Адаптивный дифференциальный им-пульсно-кодовый модулятор с нелинейным фильтром предсказателем // ЭЛЕКТРОСВЯЗЬ. 2004. — № 5. — С. 36−38.
- Ковалгин Ю.А., Вологодин Э. И. Цифровое кодирование звуковых сигналов. СПб.: КОРОНА-принт, 2004. — 240 с.
- Колинько Т. Измерения в цифровых системах связи. Практическое руководство. К.: ВЕК+, НТИ, 2002. — 320 с.
- Коробанов А.В., Санников В. Г. Анализ пороговых зависимостей маскировки тона узкополосным шумом и расчет слуховых вейвлет // Сборник «Техника и технологии связи». Деп. в ЦНТИ «Информсвязь» от 26.05.06 № 2279 св. 2006. -С. 21−27.
- Коротаев Г. А. Эффективный алгоритм кодирования речевого сигнала на скорости 4,8 кбит/с и ниже // Зарубежная радиоэлектроника. 1996. — № З.-С. 16−19.
- Льюнг Л. Идентификация систем. Теория для пользователя: Пер с англ. / Под ред. Я. З. Цыпкина. М.: Наука, ГР ФМЛ, 1991.-432 с.
- Мак-Квери С., Мак-Грю К, Фой С. Передача голосовых данных по сетям Cisco Frame Relay, ATM и IP. Москва-Санкт-Петербург.-Киев: Издательский дом «Вильяме», 2002. — 512 с.
- Малла С. Вэйвлеты в обработке сигналов. М.: Мир, 2005. — 671 с.
- Мардер Н.С. Современные телекоммуникации.-М.: ИРИАС, 2006.-384 с
- Марковская теория оценивания в радиотехнике // Под редакцией М. С. Ярлыкова. -М.: «Радиотехника», 2004. 504 с.
- Маркел Дж., Грей А. Х. Линейное предсказание речи: Пер. с англ. / Под ред. Ю. Н. Прохорова, B.C. Звездина. -М.: Связь, 1980. 308 с.
- МСЭ-R. Рекомендация BS.1196. Кодирование звука в наземном цифровом телевизионном вещании. 1995. — 120 с.
- Назаров М.В., Прохоров Ю. Н. Методы цифровой обработки и передачи речевых сигналов. М.: Радио и связь, 1985. — 176 с.
- Невдяев Л.М. Мобильная связь 3-го поколения. М.: МЦНТИ, ООО «Мобильные коммуникации. — 2000. — 208 с.
- Невдяев Л.М. Телекоммуникационные технологии. М.: МЦНТИ, ООО «Мобильные коммуникации. — 2002. — 592 с.
- Оршценко В.И., Сашшков В. Г., Свириденко В. А. Сжатие данных в системах сбора и передачи информации / Под ред. В. А. Свириденко. М.: Радио и связь, 1985. — 184 с.
- Попов О.Б., Рихтер С. Г. Цифровая обработка сигналов в трактах звукового вещания. М.: Горячая линия — Телеком, 2007. — 341 с.
- Прокис Дж. Цифровая связь. Пер. с англ. / Под ред. Д. Д. Кловского. -М.: Радио и связь, 2000. 800 с.
- Прохоров Ю.Н. Статистические модели и рекуррентное предсказание речевых сигналов // Статистическая теория связи. Вып. 20. -М.: Радио и связь, 1984.-240 с.
- Рабинер JI.P., Шафер Р. В. Цифровая обработка речевых сигналов: Пер с англ. / Под ред. М. В. Назарова, Ю. Н. Прохорова. М.: Радио и связь, 1981. -496 с.
- Ричардсон Я. Видеокодирование. Н.264 и MPEG-4 стандарты нового поколения. -М.: ТЕХНОСФЕРА, 2005.-368 с.
- Санников В.Г. Теоретический анализ заметности искажений речевых сигналов по громкости их слухового восприятия // ЭЛЕКТРОСВЯЗЬ. -2002.-№ 12.-С. 38−42.
- Санников В.Г. Статистический анализ методов формирования речевых сигналов. -М.: МТУСИ, 2005. 140 с.
- Санников В.Г., Коробанов А. В. Получение материнского слухового вейвлета в задаче компактного представления речи // Московская отраслевая научно-техническая конференция «Технологии информационного общества»: Тез. докл. -М.: Инсвязьиздат. -2007. С. 195.
- Савинков В.Г., Медведев О. Н. Эффективный голосовой кодер с полиномиальным синтезом спектра погрешности предсказания речевого сигнала // Мобильные системы. 2007. — № 3. — С. 38−42.
- Санников В.Г. Слуховая томография новое направление в области обработки речевых сигналов // ЭЛЕКТРОСВЯЗЬ. — 2007. — № 5. — С. 52−56.
- Санников В.Г., Коробанов А. В. Кодер речи в классе ЛПАС с представлением сигнала погрешности предсказания в ортогональном базисе слуховых фильтров // Естественные и технические науки. № 3. — 2008. — С. 21−31.
- Сапожков М.А. Речевой сигнал в кибернетике и связи. М.: Связьиздат, 1963.-452 с.
- Сапожков М.А., Михайлов В. Г. Вокодерная связь. М.: Радио и связь, 1983.-248 с.
- Сейдж Э., Меле Дж. Теория оценивания и её применение в связи и управлении: Пер. с англ./ Под ред. Б. Р. Левина -М.: Связь, 1976. -496 с.
- Сиберт У. Преобразование стимула в периферической слуховой системе. В сб. «Распознавание образов». М.: Мир, 1970. — С. 134−169.
- Ситняковский И.В., Порохов О. Н., Нехаев А. Л. Цифровые системы передачи абонентских линий. М.: Радио и связь, 1987. — 216 с. Г
- Скляр Б. Цифровая связь. Теоретические основы и практическое применение.: Пер. с англ. М.: ИД «Вильяме», 2003. — 1104 с.
- Слуховая система / Ред. Я. А. Альтман. JL: Наука, 1990. — 620 с. — (Основы современной физиологии).
- Смоленцев Н.К. Основы теории вейвлетов. Вейвлеты в MATLAB. М.: ДМК Пресс, 2008. — 448 с.
- Соболев В.Н. Информационные технологии в синтетической телефонии. -М.: ИРИАС, 2007. 360 с.
- Сэломон Д. Сжатие данных, изображений и звука: Пер. с англ. М.: Техносфера, 2006. — 365 с.
- Тимченко О.В. Методи р1зницевого кодування форми сигнаив в системах передач! mobhoI шформацй. Льв1в: Вид. УАД, 2006. — 320 с.
- Уэлстед С. Фракталы и Вейвлеты для сжатия изображений в действии. — М.: Триумф, 2003. 320 с.
- Фланаган Дж. JI. Анализ, синтез и восприятие речи: Пер. с англ. / Под ред. А. А. Пирогова М.: Связь, 1968. — 396 с.
- Хайкин С. Нейронные сети: полный курс, 2-е изд.: Пер с англ. М.: Издательский дом «Вильяме», 2008. — 1104 с.
- Цвикер Э., Фельдкеллер Р. Ухо как приемник информации. М.: «Связь», 1971. -255 с.
- Шелухин О.И., Лукьянцев Н. Ф. Цифровая обработка и передача речи. -М.: Радио и связь, 2000. 456 с.
- Шеннон К.Э. Работы по теории информации и кибернетике: Пер. с англ./ Под ред. Р. А. Добрушина, О. В. Лупанова. М: ИЛ, 1963. — 830 с.
- Штарк Г. Г. Применение вейвлетов для ЦОС // Перевод с англ. Н. И. Смирновой / Под ред. А. Г. Кюркчана. -М.: Техносфера, 2007. — 192 с.
- Электродное протезирование слуха. Л.: Наука, 1984. — 215 с. — (Фундаментальные науки — медицине).
- Atal B.S. Predictive Coding of Speech at Low Bit Rates // IEEE Tr., COM. 1982. — V.30. -№ 4. -P. 600−614.
- Benvenuto N., Corvaja R., Erseghe Т., Laurenti N. Communication Systems. Fundamentals and Design Methods. Jon Wiley & Sons, 2007. — 516 p.
- Bertorello L., Copperi M. Design of a 4,8/9,6 kbps Base Band LPC Coder using Split-Band and Vector Quatization // ICASSP. 1983. -V. 3. — P. 1312−1315.
- Besruk V.M. Autoregression methods of signals recognition // Telecommunications and Radio Engineering. 2003. 56(12−14). — P. 12−18.
- Besruk V.M. Autoregression methods of the preset signals recognition in the presence of the unknown signals» class // Radioelectronics & Informatics. -2003.-№ 3.-P. 187−191.
- Campbell J.P. et all. An Expandeble Errorprotected 4800 bps CELP Coder (U.S. Federal Standart 4800 Voice Coder) // ICASSP. 1989. -V. 2. — P. 1111−1200.
- Casajus-Quiros F.J., Hernandes-Gomes L.A., Carcia-Mateo C. Analysis and Quantization Procedures for a Real-Time Implementation of a 4,8 kbps CELP Coder//ICASSP. 1990. -V. 1. -P. 221−225.
- Chiu K.M., Ching P.C. Quan-band excitation for low bit rate speech coding. // J. Acoust. Soc. Amer. 1996. — 99. -№ 4. Pt.l. -P. 2365−2369.
- CCITT. Recommendation G.727. -5-, 4-, 3-, and 2 bits Sample Embedded Adaptive Differential Pulse Code Modulation (ADPCM). P. 1−22.
- CCIR GSM Rec. T/L/03/11. A 13 kbps Regular Pulse Excitation Long Term Prediction-Linear Predictive Coder for the Pan-European Digital Mobile Radio System, 1988.-P. 1−15.
- Cox R. V. Draft Recommendation G.723.1 Dual Rate Speech Coder for Multimedia Telecommunication Transmitting at 5,3 and 6,4 kbps. — ITU, Tele-comm. Standartization Sector, LBC95- 085, — 1995. — P. 1−24.
- Cox R.V., Kroon P. Low bit-rate Speech Coders for Multimedia Communication //IEEE Communications Magazine. December 1996.—P. 34−41.
- Haagen J., Nielsen H., Hansen S.D. A 2,4 kbps High-Ouality Speech Coder// ICASSP, S9.-1991.-V. 5. -P. 589−592.
- Federal Standard 1016. Telecommunications: Analog to Digital Conversion of Radio Voice by 4800 bps Code Excited Linear Prediction (CELP). General Serv. Adm., Office of Inf. Resources Mangm., Febr., 14, 1991. -P.l-12.
- Frazier M.W. An Introduction to Wavelets Through Linear Algebra. New York.: Springer-Verlag, 1999. — 487 p.
- Gersho Allen. Advances in speech and audio compression // Proc. IEEE. -1994. 82. — № 6. -P. 900−918.
- Guyader A., Manaloux D., Zureher. A Robust and Fast CELP Coder at 16 kbps // Speech Communication. 1988. — V. 7. — № 2. -P/217−226.
- International Standard ISO/IEC 15 938−4. Information technology Multimedia content description interface — Part 4: Audio, 2002.
- ISO/IEC FCD 14 496−3. Subpart 1. Information technology Very Lov Bi-trate Audio-Visual Coding. Part 3: Audio, 1998−05−10 (ISO/JTC 1/SC 29. -N 2203).
- Jayant N. Signal compression: technology targets and research directions // IEEE J. on Sel. Areas in Commun., № 10(5), June 1992. P. 796−818.
- Kabal P., Ramachandar R.P. Joint Optimization of Linear Predictors in Speech Coders // IEEE J., ASSP. 1989. — V. 37. -P. 642−650.
- Kleijn W. B. On the periodicity of speech coded with linear-prediction based analysis coders // IEEE Trans. Speech and Audio Process. 1994. -V. 2. -№ 4.-P. 136−138.
- Kroon P., Deprettere F. A Class of Analyses by Synthesis Predictive Coders for High Quality Speech Coding of Rates Between 4,8−16 kbs // IEEE J., SAC. 1988. — V. 6. — № 2. — P. 9−14 .
- Levine S. Audio Representation for Data Compression and Compressed Domain Processing // Departament of Electrical Engineering and the Committee on Graduate Studies of Stanford University. -Dezember. 1998.-215 p.
- Mc Aulay R.J., Quantieri T.F. Multirate Sinusoidal Transform Coding at Rate from 2,4 to 8 kbps // ICASSP. -1987. V. 3. — P. 744−754.
- Musman H.G., Werner O., Fuchs H. Kompressions algoritmen fuer interactive Multimedia Systeme // Informationstechnik und Technische Informatik. -1993.-№ 2. -P. 4−18.
- Painter Т., Spanias A. Perceptual Coding of Digital Audio // Proceedings of the IEEE. 2000. -V. 88. -№ 4. — P. 451−513.
- Picovici D., Mahdi A.E. and Murphy T. An Enhanced Single-Ended Method for Objective Speech Quality Assessment for Telephony Systems // SPECOM 2005. Proceedings 10th International Conference SPEECH’and COMPUTER. -2005. Patras, Greece. -P. 633−636.
- Rose R.C., Barnwell T.P. Design and Performance of an Analysis-by-Synthesis Class of Predictive Speech Coders // Proc. of the IEEE Trans. On ASSP. 1990. -V. 38. -P. 1489−1503.
- Spanias A.S. Speech Coding: A Tutorial Review // Proc. of the IEEE. 1994. — V. 82. — № 10. — P. 1539−1994.
- Tavatia S., Porayath R., Doherty J F. Lattice CELP for low bit rate speech coding // Mil. Commun. Global Inf. Age: Synergies, Innov. and Monmouth Chapter Symp., Fort Monmouth, N. J. 1994. — V. 3. — Piscataway (N. J.). -1994. -P.703−707.
- The Past, Present and Future of Speech Processing // IEEE Signal Processing Magazine. May 1998. -P. 24−48.
- Wickerhauser M.V. Acoustic signal compression with wavelet packets. -New York: Academic Press, 1998. 211 p.
- Woyd I. Speech Codec for the Skyphone Aeronautical Telephone Service. British TELECOMMUNICATION engineering. 1989. — V. 8. — 120 p.