Разработка и исследование методов и алгоритмов устранения избыточности видеопоследовательностей на основе сегментации видеоданных
Диссертация
Актуальность проблемы. Современный этап развития информационно-вычислительных систем характеризуется широким внедрением технологий мультимедиа, в связи с чем возникает потребность в разработке методов и алгоритмов сжатия цифровых видеоизображений и видеопотоков, основанных на обработке групп изображений, имеющих информационную избыточность. Постоянно растущая вычислительная сложность алгоритмов… Читать ещё >
Список литературы
- Астафьева, Н. М. Вейвлет анализ: основы теории и примеры применения/ Н. М. Астафьева // Успехи физических наук. — 1996. — т. 166. — № 11. — С. 11 451 170.
- Белоголовый, А. В. Кодовое квантование при сжатии видеоизображений: диссертация на соискание ученой степени кандидата технических наук / Белоголовый Андрей Владимирович. СПб., 2004. — 117 с.
- Брейсуэлл, Р. Преобразование Хартли. Теория и приложения / Р. Брейсуэлл. М.: Мир, 1990. — 225 с.
- Ватолин, Д. Методы сжатия данных. Устройство архиваторов, сжатие изображений и видео / Д. Ватолин, А. Ратушняк, М. Смирнов, В. Юкин. М.: ДИАЛОГ-МИФИ, 2003. — 384 с.
- Востров, Г. М. Фрактальное сжатие временных рядов с использованием нелинейной вейвлет аппроксимации / Г. М. Востров, М. В. Полякова, В. В. Любченко // Труды Одесского политехнического института. — 1999. — Вып. З.-С. 87−92.
- Гашников, М. В. Адаптивный алгоритм интерполяции для иерархической компрессии изображений / М. В. Гашников, Н. И. Глумов, В. В. Сергеев // Компьютерная оптика. 2002. — вып. 23. — С. 89 — 93.
- Глущик, Р. В. Процедуры распознавания и локализации объектов на изображении / Р. В. Глущик // Современные технологии. Труды молодых ученых ИТМО. 2001. — С. 106−109.
- Ю.Моисеев, А. А. Курвлет-преобразование в задаче удаления шума из изображений / А. А. Моисеев, В. Ю. Кобелев, В. А. Волохов // Цифровая обработка сигналов. 2008. — № 1. — С. 43−50.
- П.Паршин, А. Методы анализа видекодеков на основе модификации естественных видеопоследовательностей / А. Паршин, Д. Ватолин // вгарЫСоп. -2008.-С. 294−301.
- Ричардсон, Я. Видеокодирование. Н.264 и МРЕв-4 стандарты нового поколения / Я. Ричардсон. — М.: Техносфера, 2005. — 368 с.
- Рубина, И. С. Анализ методов построения траектории движущихся объектов на основе сегментации видеоданных / И. С. Рубина // Сборник тезисов VII Всероссийской межвузовской конференции молодых ученых. 2010. — Вып. 1.-С. 24−25.
- Рубина, И. С. Анализ проблем передачи видео в существующих системах видеоконференцсвязи / И. С. Рубина // Материалы XXXIX научной и учебно-методической конференции СПбГУ ИТМО. 2010. — С. 32.
- Рубина, И. С. Исследование алгоритмов выделения опорных точек в задачах классификации сегментов кадра видеопоследовательности / И. С. Рубина // Материалы ХЬ научной и учебно-методической конференции СПбГУ ИТМО. -2011.-С. 32.
- Рубина, И. С. Исследование методов устранения временной избыточности в перспективных стандартах сжатия видеоданных / И. С. Рубина // Сборник научно исследовательских выпускных квалификационных работ студентов СПбГУ ИТМО. — 2010. — С. 51−53.
- Рубина, И. С. Исследование пространственно временных алгоритмов компенсации движения / И. С. Рубина // Материалы XLI научной и учебно-методической конференции НИУ ИТМО. — 2012. — С. 32.
- Рубина, И. С. Устранение избыточности видеоданных на основе алгоритмов кодирования преобразованием / И. С. Рубина // Сборник тезисов I Всероссийского конгресса молодых ученых. 2012. — вып. 1. — С. 48−49.
- Рубина, И. С. Исследование алгоритмов выбора опорных пикселов в задачах выделения сегментов кадра видеопоследовательности / И. С. Рубина, А. Ю. Тропченко // Научно-технический журнал «Известия вузов. Приборостроение». 2012. — т. 55 № 1. — С. 9−14.
- Рубина, И. С. Исследование алгоритмов кодирования преобразованием в задачах сжатия кадров видеопоследовательности / И. С. Рубина, А. Ю. Тропченко // Научно-Технический журнал «Известия вузов. Приборостроение». 2012. -т. 55 № 10. С. 26−31.
- Семенюк, В. В. Вероятностные методы экономного кодирования видеоинформации / Семенюк Владимир Витальевич: диссертация на соискание ученой степени кандидата технических наук. СПб., 2004. — 99 с.
- Сэломон Д. Сжатие данных, изображений и звука. М.: Техносфера, 2004. — 368 с.
- Adelson, Е. Н. Spatiotemporal energy models for the perception of motion / E. H. Adelson, J. R. Bergen // Journal of Optical Society of America. 1985. — A2. — 2. -P. 284−299.
- Alshibami, H. O. Fast Algorithm for the 3-D DCT-II / H. O. Alshibami, S. Boussakta // IEEE Transactions on signal processing. 2004. — vol. 52. — № 4. — P. 992−1001.
- Barron, J. L. Systems and experiment performance of optical flow techniques / J. L. Barron, D. J. Fleet, S. S. Beaucheminn // International Journal of Computer Vision. -1994.-12.-1.-P. 43−77.
- Bigun, J. Multidimensional orientation estimation with applications to texture analysis and optical flow / J. Bigun, G. Granlund, J. Wiklund // IEEE Transactions on Pattern Analysis and Machine Intelligence. 1991. — 13. — P. 775−790.
- Cummiskey, P. Adaptive quantitation in differential PCM coding of speech / P. Cummiskey, N. S. Jayant, J. L. Flanagan // Bell Syst. Tech. J. 1973. — vol. 52. — P. 1105−1118.
- E1-Sakka, M. R. Adaptive digital image compression based on segmentation and block classification / Mahmoud R. El-Sakka: Ph.D. Dissertation. Canada, 1997. -121.
- Fleet, D. J. Computation of component image velocity from local phase information / D. J. Fleet, A. D. Jepson // International Journal of Computer Vision. -1990.-5.-P. 77−104.
- Harris, C. Combined Corner and Edge Detector / C. Harris, M. Stephens // Proceedings of the 4th Alvey Vision Conference. 2008. — P. 147−151.
- Healy, D. Digital Video Bandwidth Compression Using Block Truncation Coding / D. Healy, O. Mitchell // IEEE Transactions on Communications. 1981. — vol. 29.-№ 12.-P. 1809−1817.
- Heeger D. J. Optical flow using spatiotemporal filters / D. J. Heeger // International Journal of Computer Vision. 1988. — 1. — P. 279−302.
- Hill, L. On the estimation of global motion using phase correlation for broadcast applications / L. Hill, T. Vlachos // IEEE transactions on image processing and its applications. 1999. — vol. 2. — P. 721−725.
- Horita, Y. No-reference image quality assessment for JPEG/JPEG2000 coding / Y. Horita, S. Arata, T. Murai // Proc. of European Signal Processing Conference. -2004.-P. 487−500.
- Huffman, D. A. A Method for the Construction of Minimum-Redundancy Codes / D. A. Huffman // Proceedings of the I.R.E. 1952. — P. 1098−1102.
- Jain, J. R. Displacement measurement and its application in interframe image coding / J. R. Jain, A. K. Jain // IEEE Trans. Commun. 1981. — vol. com-29. — № 12. -P. 1799−1808.
- Jeong, Y. A Practical Projection-Based Postprocessing of Block-Coded Images with Fast Convergence Rate / Y. Jeong, I. Kim, H. Kang // IEEE Transactions on Circuits and Systems for Video technology. 2000. — vol. 10. — № 4. — P. 617−623.
- Kopilovic, I. Artifact Reduction with Diffusion Preprocessing for Image Compression / I. Kopilovic, T. Sziranui // Optical Engineering. 2005. — vol. 44. — № 2.-P. 1−29.
- Konrad, J. Bayesian estimation of motion vector field / Konrad J., Dubois E. // IEEE Transactions on Pattern Analysis and Machine Intelligence. 1992. — 14. — 9. — P. 910−927.
- Liu, J. G. Fast DCT-I, DCT-III, and DCT-IV via Moments / J.G.Liu, Y. Z. Liu, G. Y. Wang // EURASIP Journal on Applied Signal Processing. 2005. -vol. 2005. -№ 12. -P. 1902−1909.
- Lowe, D. G. Object recognition from local scale-invariant features / D. G. Lowe // Proceedings of the International Conference on Computer Vision. 2009. -vol. 2.-P. 1150−1157.
- Martin, G. R. Variable size block matching estimation with minimal error G. R. Martin, R. A. Packwood, I. Rhee // SPIE Conference on Digital Video Compression: Algorithms and Technologies. 1996. — vol. 2668. — P. 324−333
- Nam, Kwon Moon. A Fast Hierarchical Motion Vector Estimation Algorithm Using Mean Pyramid / Kwon Moon Nam, Joon-Seek Kim, Rae-HongPark // IEEE Transactions on Circuits and Systems for Video technology. 1995. — vol. 5. — № 4. — P. 344−351.
- Nosratinia, A. Post-Processing of JPEG-2000 Images to Remove Compression Artifacts / A. Nosratinia // IEEE Signal Processing Letters. 2003. — vol. 10, № 10. — P. 296−299.
- Paek, H. A DCT-Based Spatially Adaptive Post-Processing Technique to Reduce the Blocking Artifacts in Transform Coded Images / H. Paek, R. Kim, S. Lee // IEEE Transactions on Circuits and Systems for Video technology. 2000. vol. 10. — № l.-P. 601−612.
- Pan, J.N. Correlation-feedback technique in optical flow determination / J. N. Pan, Y. Q. Shi, C. Q. Shu // IEEE Transactions on Image Processing. 1988. — P. 1061−1067.
- Po, Lai-Man. A Novel Four Step Search Algorithm For Fast Block Motion Estimation / Lai-Man Po, Wing-Chung Ma // IEEE Transactions on Circuits and Systems for Video Technology. 1996. — vol. 6. -№ 3. — P. 313−317.
- Qiu, G. MLP for Adaptive Postprocessing Block-Coded Images / G Qiu // IEEE Transactions on Circuits and Systems for Video Technology. 2000. — vol. 10. — № 8. -P. 1450−1454.
- Ralston, A. A First Course in Numerical Analysis / A. Ralston, P. Rabinowitz. -New York: McGraw-Hill, 1978. 615 p.
- Ribas-Corbera, J. On the optimal block size for block-based, motion compensated video coders / J. Ribas-Corbera, D. L. Neuhoff // SPIE Proceedings of Visual Communications and Image Processing. 1997. — vol. 3024. — P. 1132−1143.
- Saupe, D. Fractal image compression. An introductory overview / D. Saupe, R. Hamzaoui, H. Hartenstein // Fractal Models for Image Synthesis, Compression, and Analysis. ACM SIGGRAPH Course Notes. 1996.
- Shi, Y. Q. Unified optical flow field approach to motion analysis from a sequence of stereo images / Y. Q. Shi, C. Q. Shu, J. N. Pan // Pattern Recognition. -1994. 27. — 12. — P.1577−1590.
- Singh, A. An estimation-theoretic framework for image-flow computation / A. Singh // CVGIP: Image Understanding. 1992. — 56. — 2. — P. 152−177.
- Song, H. A New Deblocking Algorithm Based on Adjusted Contourlet Transform / H. Song, S. Yu, C. Wang, L. Song, H. Xiong // Proceedings of the 2006 IEEE International Conference on Multimedia and Expo. 2006. — P. 449−452.
- Steele, R. Delta Modulation Systems/ R. Steele. London: Pentech Press, 1975. -379 p.
- SukHwan, Lim. Optical flow estimation using high frame rate sequences / Lim SukHwan, A. El Gamal // IEEE transactions on image processing. 2001. — vol. 2. -P. 925−928.
- Sun, D. Postprocessing of Low Bit-Rate Block DCT Coded Images Based on a Fields of Experts Prior / D. Sun, W. Cham // IEEE transactions on image processing. -2007. vol. 16. — № 11. — p. 2743 — 2751.
- Watson, A. B. Perceptual optimization of DCT color quantization matrices / A. B. Watson // Proceedings of the IEEE International Conference on Image Processing. -1994.-P. 1−5.
- Waxman, A. M. Convected activation profiles and receptive fields for real time measurement of short range visual motion / A. M. Waxman, J. Wu, F. Bergholm // Proceedings of IEEE Computer Vision and Pattern Recognition. 1988. — P. 717−23.
- Xiang, Xui. Research of based on information reorganization thought multimedia data compression and multimedia data security engineering: Zhejiang University doctorate paper / Xiang Xui. Hangzhou, 2009. — 172 p.
- Yip, P. Discrete Cosine Transform: Algorithms, Advantages, Applications / P. Yip, K. R. Rao. -US: Academic Press, 1990. 512 p.
- Yonghong, Z. New algorithms for multidimensional discrete Hartley transform Z. Yonghong, B. Guoan, R. L. Abdul // Signal processing. 2002. — vol. 82. — P. 10 861 095.
- ISO/IEC 14 496−2 Coding of audio-visual objects. Part 2: Visual, 2001. 21 p.
- ISO/IEC 14 496−10 Advanced video coding for generic audiovisual services, 2005. 32 p.
- ITU H.262 MPEG-2 specification, 2000. 25 p.
- ITU-R Recommendation BT.601, 1982. 12 p.
- ITU-T Recommendation P.800. Methods for subjective determination of transmission quality, 1996. 15 p.
- TV transmission standard, part 73, 2009. 19 p.
- FSBM: fixed size block matching- соотнесение блоков фиксированного размера
- FSS: four step search-четырех шаговый поиск
- MP: median pyramid- метод усредненной пирамиды
- OSA: orthogonal search algorithm- алгоритм ортогонального поиска
- OTA: one in time algorithm- алгоритм «один за раз»
- Pol: points of interest based-объединение векторов по признаку принадлежности маске, построенной методом на основе выделения опорных пикселов PSNR: peak signal to noise ratio- пиковое соотношение сигнал/шум, используемое для объективной оценки качества
- RD: rate distortion curve-кривая эффективность сжатия/искажение
- SIFT: Scale-Invariant Feature Transform- неизменное по шкале преобразованиепризнаков
- TDL: two dimensional logarithmic search- двухмерный логарифмический поиск TSS: three step search трех шаговый поиск
- VJ: vectors joint based-объединение векторов по направлению движения VOP video object plane- плоскость видеообъекта
- VSBM variable size block matching- соотнесение блоков переменного размера Вектор движения: вектор, обозначающий смещение блока или области от кадра к кадру при прогнозах компенсации движения
- Квантование: понижение точности представления скалярной или векторной величины
- Кодирование inter: кодирование на основе временного прогнозирование и компенсации движения
- Кодирование intra: кодирование без использования временного прогнозирования Кодирование Хаффмана: метод кодирования кодами переменной длины для сокращения избыточности
- Компенсация движения: прогноз видеокадра с помощью моделирования движения на другом кадре
- Оценка движения: оценка относительного движения областей и блоков на двух или нескольких кадрах
- Статистическая избыточность: избыточность данных, связанная с их вероятностным распределением
- Цветовое пространство: метод представления цифровых изображений в цифровой форме
- Энтропийное кодирование: метод кодирования без потерь информации, уменьшающий избыточность данных