Исследование обратной задачи для голосового источника с помощью процедуры реконструкции математических моделей речевого процесса
Диссертация
Еще одним из недостатков существующих методов анализа речевых сигналов, основанных на технологии обратной фильтрации, является противоречие между теоретическими предположениями и данными, полученными в экспериментальных исследованиях. Существующее деление системы речеобразования на две компоненты — голосовой источник и речевой тракт искусственно, так как на физиологическом уровне система… Читать ещё >
Список литературы
- Рабинер Л.Р., Шафер Р. В. Цифровая обработка речевых сигналов: Пер. с англ./Под ред. М. В. Назарова и Ю. Н. Прохорова. — М.: Радио и связь, 1981.- 496 с.
- Сорокин B.C. Теория речеобразования. М.: Радио и связь. 1985. — 312 с.
- Сорокин В.Н. Синтез речи. М.: Наука. 1992. — 392 с.
- Сорокин В.Н., Макаров И. С. Обратная задача для голосового источника // Информационные процессы. 2006. Том 6, № 4.- С. 375 — 395. .
- Маркел Д., Грей А. Линейное предсказание речи.— М: Связь, 1980.-308 с.
- Vijay Parsa, Donald G. Jamieson, Identification of Pathological Voices Using Glottal Noise Measures // Journal of Speech, Language, and Hearing Research, vol 43, pp. 469 485, 2000.
- Carlson R., Granstrom В., Karlsson I., Experiments with voice modeling in speech synthesis // STL-QPSR, No 2−3, pp. 53 61, 1990.
- Rothenberg M., An interactive model for the voice source // STL-QPSR, No 4, pp. 1−17, 1981.
- Сергиенко В.И., Петросян Э. А., Кулаков А. А., Петросян М. Э. Топографическая анатомия и оперативная хирургия челюстно — лицевой области и шеи. М.: ГЭОТАР — МЕД, Майкоп «Качество», 2006. — 862 с.
- Ananthapadmanabha Т., Acoustic Analysis of Voice Source Dynamics // STL-QPSR, No. 2−3, pp. 1−24, 1984.
- Childers D. G., Paige A., Moore A., Laryngeal vibration patterns // Archives of Otolaryngology, vol. 102, pp. 407 410, 1976.
- Lin Q., Nonlinear Interaction in Voice Production // STL-QPSR, No. 1, pp. 1 12, 1987.
- Titze I., Mapes S., Story В., Acoustics of the Tenor High Voice // J, Acoust. Soc. Amer., vol. 95, pp. 1133 1142, 1994.
- Lisker L., et. al. Transillumination of the larynx in running speech // JASA, vol. 45, pp. 1544 1547, 1969.
- Childers D.G., Naik J., Larar J.N., et. al. Electroglottography, speech, and ultrahigh speed cinematography // Vocal fold Physiology, pp. 202 220, 1983.
- Левин JI.C., Плоткин M.A. Цифровые системы передачи информации. -М.: Радио и связь. 1982. 216 с.
- Bostik М., Sigmund М., Methods for Estimation of Glottal Pulses. Waveform Exciting Voiced Speech // EUROSPEECH 2003 GENEVA, pp. 2389−2392.
- Arroabarren I., Carlosena A., Unified Analysis of Glottal Source Spectrum // EUROSPEECH 2003 GENEVA, pp.1761 — 1763.
- Arroabarren I., Carlosena A., Glottal Spectrum Based Inverse Filtering // EUROSPEECH 2003 GENEVA, pp. 57 — 60.
- Alku P., Airas M., Backstrom Т., Pulakka H., Group Delay Function as a Means to Assess Quality of Glottal Inverse Filtering // INTERSPEECH 2005, pp. 1053−1056.
- Lindqvist-Gauffin J., Inverse filtering. Instrumentation and techniques // STL-QPSR, pp. 1−4, 1964.
- Lindqvist-Gauffin J., Studies of the voice source by means of inverse filtering // STL-QPSR, pp. 8 13, 1965.
- Mathews M. V., Miller J. E., David E.E., Pitch Synchronous Analysis of Voiced Sounds // The journal of the acoustical society of America, vol. 33, pp. 179−186, 1961.
- Lindqvist-Gauffin J., The voice source studied by means of inverse filtering // STL-QPSR, No. 1, pp. 3 9, 1970.
- Price P.J. Male and female voice source characteristics: inverse filtering results // Speech Communication, vol. 8, pp. 261 277, 1989.
- Alku P., Vilkman E., Amplitude domain quotient for characterization of the glottal volume velocity waveform estimated by inverse filtering // Speech Communication, vol. 18, pp. 131- 138, 1996.
- Alku P., Vilkman E., Effects of bandwidth on glottal airflow waveforms estimated by inverse filtering // J. Acoust. Soc.Am.- vol. 98, No 2, pp. 763 -767, 1995.
- Drioli C., A flow waveform-matched low-dimensional glottal model based on physical knowledge // J. Acoust. Soc.Am., vol. 117, No 5, pp. 3184 — 3195,2005.
- Tokihiko Kaburagi, Koji Kawai, Analysis of voice source characteristics using a constrained polynomial model // EUROSPEECH 2003 GENEVA, pp.461 -464.
- Deng H., Beddoes M., Ward R., Hodgson M., Estimating the Vocal-Tract Area Function and the Derivative of the Glottal Wave from a Speech Signal // EUROSPEECH 2003 GENEVA, pp. 2437 — 2440.
- Cranen В., Boves L., Pressure measurements during speech production using semiconductor, miniature pressure transducers: Impact on models for speech production // J. Acoust. Soc.Am., vol. 77, No 4, pp. 1543 1551, 1985.
- Childers D.G., Hicks D.M., Moore G.P., Alsaka Y.A., A model for vocal foldvibratory motion, contact area, and the electroglottogram // J. Acoust. Soc.Am., vol. 80, No 5, pp. 1309 1320, 1986.
- Alku P., Backstrom Т., Vilkman E., Normalized amplitude quotient for Parametrization of the glottal flow // J. Acoust. Soc-.Am., vol. 112, No 2, pp. 701−710, 2002.
- Titze I., Parameterization of the glottal area, glottal flow, and vocal fold contact area // J. Acoust. Soc.Am., vol. 75, No 2, pp. 570 580, 1984.
- Liljencrants J., Analysis by synthesis of glottal airflow in a physical model 11 TMH QPSR, No. 2, pp. 139 — 142, 1996.
- Karlsson I., Dynamic voice source parameters in a female voice // STL -QPSR, No. 1, pp. 75 77, 1989.
- Karlsson I., Glottal waveform parameters for different speaker types // STL -QPSR, No. 2−3, pp. 61 67, 1988.
- Karlsson I., Glottal wave forms for normal female speakers // STL QPSR, No. l, pp.31 -36, 1985.
- Cranen В., Schroeter J., Physiologically motivated modelling of the voice source in articulatory analysis/synthesis // Speech Communication, vol. 19, pp. 1−19, 1996.
- Childers D.G., Glottal source modeling for voice conversion // Speech Communication, vol. 16, pp. 127 138, 1995.
- Drioli C., A flow waveform adaptive mechanical glottal model // TMH -QPSR, vol. 43, pp. 69 79, 2002.
- Cranen В., Boves L., On the measurement of glottal flow // J. Acoust. Soc.Am., vol. 84, No 3, pp. 888 900, 1988.
- Fant G., Lin Q., Glottal source vocal tract acoustic interaction // STL -QPSR, No. 1, pp. 13−27, 1987.
- Childers D., Ahn Ch., Modeling the Glottal Volume Velocity Waveform for Three Voice Types // J. Acoust. Soc. Amer., vol. 97, No. 1, pp. 505 519, 1995.
- Childers D., Lee C., Vocal Quality Factors: Analysis, Synthesis, and Perception // J. Acoust. Soc. Amer., vol. 90, No. 5, pp. 2394 2410, 1991.
- Fu Q., Murphy P., Robust Glottal Source Estimation Based on Joint Source-Filter Model Optimization // IEEE Trans. Audio, Speech, Language Process., vol. 14, No. 2, pp. 492 501, 2006.
- Froelich M., Michaelis D., Strube H. W., SIM Simultaneous Inverse Filtering and Matching of a Glottal Flow Model for Acoustic Speech Signals // J. Acoust. Soc. Amer., vol. 110, No. 1, pp. 479−488, 2001.
- Strik H., Boves L., On the Relation between Voice Source Parameters and Prosodic Features in Connected Speech // Speech Commun., No. 11, pp. 167−174, 1992.
- Fant G., Some Problems in Voice Source Analysis // Speech Commun., No. 13, pp. 7−22, 1993.
- Karlsson I., Liljencrants J., Diverse Voice Qualities: Models and Data // TMH-QPSR, No. 2, pp. 143−146, 1996.
- Fant G., The Voice Source in Connected Speech // Speech Commun., No. 22, pp. 125 139, 1997.
- Strik H., Automatic Parametrization of Differentiated Glottal Flow: Comparing Methods by Means of Syn-thetic Flow Pulses// J. Acoust. Soc. Amer., vol. 103, No. 5, Pt. 1, pp. 2659−2669, 1998.
- Fant G., Liljencrants J., Lin Q., A Four Parameter Model of Glottal Flow // STL-QPSR, vol. 4, pp. 1−13, 1985.
- Fant G., Gustafson K., LF-frequency domain analysis // TMH-QPSR, No. 2, pp. 135−138, 1996.
- Milenkovic P., Glottal Inverse Filtering by Joint Estimation of an AR System with a Linear Input Model // IEEE Trans. Acoust., Speech, Signal Process., vol. ASSP-34, No. 1, pp. 28−42, 1986.
- Milenkovic P., Voice Source Model for Continuous Control of Pitch Period // J. Acoust. Soc. Amer., vol. 93, No. 2, pp. 1087−1096, 1993.
- Childers D., Ни H., Speech Synthesis by Glottal Excited Linear Prediction // J. Acoust. Soc. Amer., vol. 96, No. 4, pp. 2026−2036, 1994.
- Schoentgen J., Glottal Waveform Synthesis with Volterra Shaping Functions // Speech Commun., vol. 11, pp. 499−512, 1992.
- Schoentgen J., Shaping Function Models of the Phonatory Excitation Signal// J. Acoust. Soc. Amer., vol. 114, No. 5, pp. 2906−2912, 2003.
- Narasimhan K., Principe J., Childers D., Nonlinear Dynamic Modeling of the Voiced Excitation for Im-proved Speech Synthesis // Proc. Int. Conf. Acoust., Speech, Signal Process., AZ, pp. 389−392, 1999.
- Rank E., Kubin G., An Oscillator Plus — Noise Model for Speech Synthesis // Speech Commun., vol. 48, pp. 775−801, 2006.
- Pinto N., Childers D., Lalwani A., Formant Speech Synthesis: Improving Production Quality // IEEE Trans. Acoust., Speech, Signal Process., vol. 37, No. 12, pp. 1870−1887, 1989.
- Gupta S., Schroeter J., Pitch-Synchronous Frame-by-Frame and Segment-Based Articulatory Analysis by Synthesis // J. Acoust. Soc. Amer., vol. 94, No. 5, pp. 2517−2530, 1993.
- Titze I., Wong D., Story В., Long R., Considerations in Voice Transformation with Physiologic Scaling Principles", Speech Commun., vol. 22, pp. 113−123, 1997.
- Tom K., Titze I., Vocal Intensity in Falsetto Phonation of a Countertenor: An Analysis by Synthesis Ap-proach // J. Acoust. Soc. Amer., vol. 110, No. 3, pp. 1667−1676, 2001.
- Plumpe M., Quatieri Т., Reynolds D., Modeling the Glottal Flow Derivative with Application to Speaker Identification // IEEE Trans. Speech, Audio Process., vol. 7, No. 5, pp. 569−585, 1999.
- Akande O., Murphy P., Estimation of the Vocal Tract Transfer Function with Application to Glottal Wave Analysis // Speech Commun., vol. 46, No. 1, pp. 15−36, 2005.
- Backstrom Т., Alku P., Vilkman E., Time-Domain Parametrization of the Closing Phase of Glottal Air-flow Waveform from Voices over a Large Intensity Range // IEEE Trans. Speech, Audio Process., vol. 10, No. 3, pp. 186−192,2002.
- Alkhairy A., An Algorithm for Glottal Volume Velocity Estimation // Proc. Int. Conf. Acoust., Speech, Signal Process., 1999. .
- Shapira Y., Gath I., A Geometrical Fuzzy Clustering-Based Solution to Glottal Wave Estimation // J. Acoust. Soc. Amer., vol. 104, No. 5, pp. 30 703 079, 1998.
- Wong D., Markel J., Gray A., Least Squares Glottal Inverse Filtering fromthe Acoustic Speech Wave-form // IEEE Trans. Acoust., Speech, Signal Process., vol. ASSP-27, No 4, pp. 350−355, 1979.
- Larar J., Alsaka Y., Childers D., Variability in Closed Phase Analysis in Speech // Int. Conf. Acoust., Speech, Signal Process., pp. 1089 1092, 1985.
- Леонов A.C., Макаров И. С., Сорокин B.H., Цыплихин А. И., Кодовая книга для речевых обратных задач // Информационные процессы, Т. 5, No. 2, стр. 101−119, 2005.
- Veeneman D., BeMent S., Automatic Glottal Inverse Filtering from Speech and Electroglottographic Study // IEEE Trans. Acoust., Speech, Signal Process., vol. ASSP-33, No. 2, pp. 369−377, 1985.
- Малинецкий Г. Г., Потапов А. Б. Современные проблемы нелинейной динамики. Издание 2-е, исправл. и доп. М.: Едиториал УРСС, 2002. -360 с.
- Тюрин Ю.Н., Макаров А. А. Анализ данных на компьютере / Под ред. В. Э. Фигурнова. 3-е изд., перераб. и доп. — М.: ИНФРА- М, 2003.-544 с.
- Лайонс Р. Цифровая обработка сигналов: Второе издание. Пер. с англ. -М.: ООО «Бином Пресс», 2007. — 656 с.
- Сергиенко А.Б. Цифровая обработка сигналов: Учебник для вузов. 2-е изд. СПб.: Питер, 2007. — 751 с.
- Малинецкий Г. Г., Потапов А. Б. Современные проблемы нелинейной динамики. Издание 2-е, исправл. и доп. М.: Едиториал УРСС, 2002. 360 с.
- Hegger R., Kantz Н., Schmuser F. et al. // Chaos. 1998. V. 8. P. 727 754.
- Swameye I., Muller T.G., Timmer J. et al. // Proc. Natl. Acad. Sci. USA. 2003. V. 100. P. 1028−1033.
- Безручко Б.П., Смирнов Д. А. Математическое моделирование и хаотические временные ряды. Саратов: ГосУНЦ «Колледж», 2005. 320 с.
- Анищенко B.C., Астахов В. В., Вадивасова Т. Е., Нейман А. Б., Стрелкова Г. И., Шиманский-Гайер Л. Нелинейные эффекты вхаотических и стохастических системах. Москва-Ижевск: Институт компьютерных исследований, 2003. 544 с.
- Кузнецов С.П. Динамический Хаос. М.: Физматлит, 2001. 296 с.
- Льюнг Л. Идентификация систем. Теория для пользователя. М.: Наука, 1991.432 с.
- Анищенко B.C., Астахов В. В., Вадивасова Т. Е. Нелинейная динамика хаотических и стохастических систем. Саратов: Изд-во Саратовского университета, 1999. 368 с.
- Casdagli М. Nonlinear prediction of chaotic time series // Physica D. 1989. V. 35. P. 335−356.
- Farmer J.D., Sidorowich J J. Predicting chaotic time series // Phys. Rev. Lett. 1987. V. 59. P. 845−848.
- Калиткин H.H. Численные методы. M.: Наука, 1978.
- Самарский А.А. Введение в численные методы. М.: Наука, 1982.
- Турчак Л.И., Плотников П. В. Основы численных методов:учебное пособие. 2-е изд., перераб. и доп. — М.: ФИЗМАТЛИТ, 2003. 304 с.
- Анищенко B.C. Знакомство с нелинейной динамикой. Лекции соровского профессора: Учеб. пособие. Москва Ижевск: Институт компьютерных исследований, 2002.-144 с.
- Crutchfield J.P., McNamara B.S. Equations of motion from a data series //
- Complex Systems. 1987. Vol. 1. P. 417−452.
- Timmer J., Rust H., Horbelt W., Voss H.U. Parametric, nonparametric and parametric modeling of chaotic circuit time series // In proceedings of International Sumposium NOLTA, 2000. Dresden. Vol. 2. P.713.
- Пределы предсказуемости / Ред. Ю. А. Кравцов. М.: ЦентрКом, 1997. 256 с.
- Modeling and Forecasting Financial Data: Techniques of Nonlinear Dynamics / Eds. A.S. Soofi, L. Cao. Kluwer, 2002.
- Nonlinear Modeling and Forecasting / Eds. M. Casdagli, S. Eubank. SFI Studies in the Sciences of Complexity. V. XII. Addison-Wesley, 1992.
- Time Series Prediction: Forecasting the Future and Understanding the Past /175
- Eds. N.A. Gerschenfeld, A.S. Weigend. SFI Studies in the Science of Complexity, Proc. V. XV. Adisson-Wesley, 1993.
- Breeden J.L., Hubler A. Reconstructing equations of motion from experimental data with unobserved variables // Phys. Rev. A. 1990. Vol. 42. P. 5817.
- Kadtke J., Kremliovsky M. Estimating statistics for detecting determinism using global dynamical models // Phys. Lett. A. 1997. Vol. 229. P. 97.
- Anishchenko V.S., Pavlov A.N. Global reconstruction in application to multichannel communication // Phys. Rev. E. 1998. Vol. 57. P. 2455.
- Cremers J., Hubler A. Construction of differential equations from experimental data // Z. Naturforschung A. 1987. Vol. 42. P. 797−802.
- Takens F., Detecting Strange Attractors in Turbulence, in Dynamical Systems and Turbulence, ed. by D. Rang and L.S. Young. Lecture Notes in Mathematics, Vol. 898 (Springer, Berlin, Heidelberg 1980) p. 366.
- Безручко Б.П., Смирнов Д. А., Сысоев И. В. Оценка параметров динамических систем по хаотическим временным рядам при наличии скрытых переменных // Изв. вузов. Прикладная нелинейная динамика. 2004. Т. 12, № 6. С. 93 -104.
- Безручко Б.П., Диканев Т. В., Смирнов Д. А. Глобальная реконструкция модельных уравнений по временной реализации переходного процесса // Изв. вузов. Прикладная нелинейная динамика. 2001. Т. 9, № 3. С. 3−12.
- Безручко Б.П., Диканев Т. В., Смирнов Д. А. Тестирование на однозначность и непрерывность при глобальной реконструкции модельных уравнений по временным рядам // Изв. вузов. Прикладная нелинейная динамика. 2002. Т. 10, № 4. С. 69−81.
- Безручко Б.П., Левин Ю. И., Смирнов Д. А. Моделирование неавтономных систем по временным рядам (учебно-методическое пособие), Саратов: «Колледж», 2001. 44 с.
- Безручко Б.П., Смирнов Д. А. Построение модельных отображений по хаотическим временным рядам (учебно-методическое пособие).
- Саратов: «Колледж», 2000. 38 с.
- Безручко Б.П., Смирнов Д. А. Реконструкция обыкновенных дифференциальных уравнений по временным рядам (учебно-методическое пособие). Саратов: «Колледж», 2000. 46 с.
- Noack B.R., Ohle F., Eckelmann H. Construction and analysis of differential equations from experimental time series of oscillatory systems // Physica D. 1992. Vol. 56. P. 389.
- Packard N.H., Crutchfield J.P., Farmer J.D., Shaw R.S. Geometry from a time series // Phys. Rev. Lett. 1980. Vol. 45. № 9. P. 712−716.
- Mane R. On the dimension of the compact invariant sets of certain nonlinear maps, in Dynamical Systems and turbulence, ed. by D. Rang and L.S. Young. Lecture Notes in Mathematics, Vol. 898 (Springer, Berlin, Heidelberg 1980) p. 366.
- Grassberger P. Generalized dimensions of strange attractors // Phys. Lett. A 97. 227−231 (1983).
- Grassberger P., Procaccia I. Characterization of strange attractors // Phys. Rev. Lett. 50. 346−349 (1983).
- Grassberger P., Procaccia I. Measuring the strangeness of strange attractors // Physica D. 9. 189−208 (1983).
- Янсон Н.Б., Анищенко B.C. Моделирование динамических систем по экспериментальным данным // Изв. вузов. Прикладная нелинейная динамика. 1995. Т. 3, № 3. С. 112 121.
- Brown R., Rulkov N.F., Tracy E.R. Modeling and synchronizing chaotic systems from time-series data // Phys. Rev. E.1994. Vol.49. № 5. P. 37 843 800.
- Грибков Д.А., Грибкова B.B., Кравцов Ю. А., Кузнецов Ю.И., Ржанов
- А.Г. Восстановление структуры динамической системы по временным рядам // Радиотехника и электроника. 1994. Т39. В. 2. с. 269−277.
- Бохан К.А. Курс математического анализа. T.I. Учеб. пособие для студентов-заочников физ.-мат. фак-тов пед. ин-тов. Под ред. Проф. Б. З. Вулиха. Изд. 2-е. М.: Просвещение, 1972. 511 с.
- Смирнов Д.А., Власкин B.C., Пономаренко В. И. Метод оценки параметров одномерных отображений по хаотическим временным рядам // Письма в ЖТФ. 2005. Т. 31, вып. 3. С. 18−26.
- Дэннис Дж., Шнабель Р. Численные методы безусловной оптимизации и решения нелинейных уравнений. М.: Мир, 1988. 440 с.
- Pisarenko V.F., Sornette D. Statistical methods of parameter estimation for deterministically chaotic time series // Phys. Rev. E.2004. V. 69. 36 122
- Smirnov D.A., Vlaskin V.S., Ponomarenco V.I. Estimation of parameters in one dimensional maps from noisy chaotic time series // Phys. Lett. A, 2005.V. 336. P. 448−458.
- Вентцель E.C. Теория вероятностей: Учебник для студентов вузов. 9-е изд., стер. — М.: Издательский центр «Академия», 2003. — 576 с.
- Кремер Н.Ш. Теория вероятностей и математическая статистика: Учебник для вузов. 2-е изд., перераб. и доп. М.: ЮНИТИ-ДАНА. 2004. -573 с.
- Половко A.M., Бутусов П. Н. Интерполяция. Методы и компьютерные технологии их реализации. СПб.: БХВ-Петербург, 2004. — 320с.
- Сизиков B.C. Устойчивые методы обработки результатов измерений. Учебное пособие. СПб.: СпецЛит, 1999. — 240 с.
- Якушев, Д. В. Фильтрация данных методом скользящей средней на промежуточных этапах моделирования автоколебательных систем /
- Международной открытой научной конференции, Воронеж, ноябрь 2007- январь 2008 гг. С. 326−328.
- Якушев, Д. В. Оценка параметров модели голосового источника /
- Вып. 13: сборник трудов по итогам 13-й Международной открытой научной конференции, Воронеж, ноябрь 2007 — январь 2008 гг. С. 262— 264.
- Якушев, Д. В. Реконструкция речевого сигнала с помощью моделирования голосового источника по акустическим параметрам речевого сигнала
- Д. В. Якушев // Современные методы и средства обработки пространственно-временных сигналов: Сборник статей 6-й Всероссийской научно технической конференции. — Пенза, 2008. — С. 54 —
- Якушев, Д. В. Анализ речевого сигнала с помощью процедуры реконструкции математической модели речевого процесса по порождаемому речевому сигналу / Д. В. Якушев // Инфокоммуникационные технологии. 2008. — Т.6, № 2. — С. 32 — 34.