Актуальность проблемы. Последнее десятилетие ознаменовано появлением доступных цифровых телекоммуникационных систем и, в частности, систем сотовой связи, систем 1Р-телефонии и систем конференц-связи.
В связи с этим ежегодно увеличивается нагрузка на телекоммуникационные каналы гражданского и военного применения, немалую часть которой составляет аудиои видеоинформация. Поэтому особо актуально стоит задача эффективного кодирования мультимедиа-потоков.
Компрессия аудиоданных является неотъемлемой частью телекоммуникационных мультимедийных систем, систем мобильной связи, бортовых систем связи, функционирующих на основе обеспечивающих целостность передаваемых данных современных протоколов передачи данных. Такие системы функционируют в реальном времени, поэтому важнейшей характеристикой является быстродействие используемых алгоритмов компрессии. Быстродействие оказывает влияние на число одновременно обслуживаемых пользователей^ время работы мобильного устройства от батареи, стоимость специализированных вычислительных средств обработки аудио, возможность кодирования аудио в-фоновом режиме при использовании ресурсов вычислителя для других задач.
Алгоритмы компрессии аудиосигналов многочисленны и разнообразны по своим характеристикам. Однако известные алгоритмы компрессии аудио, как правило, обладают либо сравнительно малым коэффициентом сжатия при низкой трудоёмкости, либо характеризуются высоким коэффициентом сжатия при высокой трудоёмкости. Поэтому при выборе конкретного алгоритма компрессии производится поиск компромисса между желаемым коэффициентом сжатия и трудоёмкостью алгоритма:
Особенно строгие ограничения на трудоёмкость накладываются в многоканальных системах, а так же в системах, где необходимо параллельно осуществлять интенсивную обработку другой информации.
В связи с отмеченным выше, разработка новых методов и алгоритмов компрессии, характеризующихся низкой вычислительной трудоемкостью и обеспечивающих достаточно высокое для практического использования качество и компрессию аудиосигналов, является актуальной задачей.
Для обработки звуковых сигналов в телефонных сетях в первые годы внедрения цифровой связи активно использовались алгоритмы на основе дельта-преобразования первого порядка [46, 71]. Главной отличительной особенностью этих алгоритмов являлась простота реализации. Вместе с тем, дельта-преобразование первого порядка характеризовалось низкой точностью и существенным ограничением скорости изменения преобразовываемого сигнала.
С повышением требований к качеству аудиокодирования стали развиваться методы компрессии, основанные на дельта-преобразованиях второго порядка, характеризующихся также простотой реализации и более высоким динамическими характеристиками. Вопросы построения алгоритмов дельта-преобразования второго порядка освещены в работах Р. Стала [71], А. В. Шилейко [74], Г. Г. Меньшикова [67, 68], с1е Jeager Б. [9] и многих других. Важной проблемой для практического использования известных алгоритмов дельта-преобразования второго порядка долгое время оставалась неустойчивость преобразований, в связи с чем, эти алгоритмы практически оказывались непригодными [63].
Алгоритмы дельта-преобразований второго порядка, характеризующиеся стабильностью, оптимизацией по быстродействию и точности, впервые были освещены в работах П. П. Кравченко [63, 64, 65].
Известен метод компрессии аудиосигналов на основе оптимизированного дельта-преобразования второго порядка со сглаживанием [66]. Метод отличается от известных низкой вычислительной трудоёмкостью при кодировании и декодировании, однако уступает по степени сжатия исходного сигнала.
В связи с отмеченным выше, представляет интерес решение задачи повышения степени компрессии аудиосигнала, закодированного на основе оптимизированных дельта-преобразований второго порядка, с обеспечением низкой вычислительной трудоёмкости кодирования и декодирования сигнала.
Целью работы является разработка методов и алгоритмических средств повышения степени компрессии аудиосигналов, закодированных на основе оптимизированных дельта-преобразований второго порядка. Для достижения поставленной цели в диссертации решаются следующие задачи:
1) анализ известных методов и алгоритмов компрессии звуковых данных, их достоинств и недостатков;
2) исследование дельта-последовательности с целью выявления возможностей повышения степени компрессии;
3) разработка модифицированных методов и алгоритмов компрессии аудиосигналов на основе оптимизированных дельта-преобразований второго порядка;
4) разработка программной модели и проведение экспериментальных исследований.
Объектом исследования являются методы и алгоритмы компрессии аудиосигналов.
Методы исследования опираются на математический аппарат теории оптимизированных дельта-преобразований второго порядка, теории информации, теории вероятностей.
Научная новизна работы заключается в следующем.
1) Разработано теоретическое обоснование существования для множества цепочек дельта-битов одинаковой длины таких, которые в некотором приближении можно считать идентичными.
2) Предложен метод повышения компрессии на основе дельта-преобразований второго порядка, отличающийся от известного введением дополнительного кодирования цепочек дельта-последовательности определенной длины. Разработаны алгоритмы компрессии и декомпрессии на основе кодирования цепочек дельта-битов длины 4, обеспечивающие гарантированно малое снижение качества. Теоретический выигрыш в компрессии на основе 4-битных цепочек с использованием предложенных методов и алгоритмов составляет ~ 30% по сравнению с базовым алгоритмом дельта-преобразования.
3) Разработано теоретическое обоснование существования для множества особых цепочек дельта-битов, соответствующих полупериодам аудиосигнала и названных минимальными сериями, таких, которые в некотором приближении можно считать идентичными.
4) Предложен метод повышения компрессии на основе дельта-преобразований второго порядка, отличающийся от известного алгоритма введением дополнительного кодирования, на основе семейств минимальных серий, соответствующих полупериодам исходного аудиосигнала. Разработаны алгоритмы компрессии и декомпрессии на основе кодирования семейств минимальных серий, обеспечивающие гарантированно малое снижение качества. Теоретический выигрыш в компрессии на основе данного метода и алгоритмов составляет ~ 45−55% по сравнению с базовым алгоритмом дельта-преобразования.
Основные положения, выносимые на защиту:
1) Метод повышения компрессии на основе дельта-преобразований второго порядка, отличающийся от известного алгоритма введением дополнительного кодирования цепочек дельта-последовательности фиксированной длины.
2) Алгоритмы компрессии и декомпрессии на основе дополнительного кодирования цепочек дельта-последовательности длиной 4 бита, отличающиеся возможностью повышения компрессии на—30% по сравнению с известным алгоритмом и обеспечивающие при этом гарантированно малое снижение качества.
3) Метод повышения компрессии на основе дельта-преобразований второго порядка, отличающийся от известного алгоритма введением дополнительного кодирования на основе кодирования семейств минимальных серий, соответствующих полупериодам исходного аудиосигнала.
4) Алгоритмы компрессии и декомпрессии на основе кодирования семейств минимальных серий, соответствующих полупериодам исходного аудиосигнала, отличающиеся возможностью повышения компрессии на 45−55% по сравнению с известным алгоритмом и обеспечивающие при этом гарантированно малое снижение качества.
Практическая ценность диссертационного исследования состоит в применимости предложенных методов для решения актуальных задач эффективного сжатия звуковых данных. Благодаря низкой трудоёмкости разработанных методов наибольший интерес представляет их применение в многоканальных телекоммуникационных системах, в специализированных системах с одновременной интенсивной параллельной обработкой информации другого назначения, бортовых систем связи, функционирующих на основе обеспечивающих целостность передаваемых данных современных протоколов передачи данных.
Возможность повышения степени компрессии разработанных алгоритмов по сравнению с базовым алгоритмом на ~ 25%-60% сочетается с обеспечением высокого быстродействия по сравнению с другими известными аудиокодеками. В частности, проведенные эксперименты с использованием широко известных оптимизированных программных кодеков и разработанных в рамках диссертации кодеков с неоптимизированным программным кодом показывают, по крайней мере, в —2−4.5 раз меньшую трудоемкость при кодировании и 3−5.5 раз при декодировании при обеспечении сходного уровня компрессии. Увеличение трудоемкости разработанных кодеков по сравнению с базовым кодеком, основанном на оптимизированных дельта-преобразованиях второго порядка со сглаживанием, составляет ~ 1.1−1.3 раз при кодировании и ~ 1.1−1.5 раз при декодировании.
Предложенная методология кодирования представляет интерес для эффективного решения задачи защиты аудиосигналов от несанкционированного доступа в реальном масштабе времени.
Результаты работы использовались в учебном процессе на кафедре Математического обеспечения и применения ЭВМ Технологического института Южного федерального университета в г. Таганроге.
Результаты работы внедрены в программно-аппаратном комплексе 1Р-телефонии ООО НПП «СПЕЦСТРОЙ-СВЯЗЬ» в виде программных средств, реализующих алгоритмы компрессии аудиосигналов.
Акты о внедрении приведены в приложениях Б и В.
Апробация работы.
Результаты работы докладывались и обсуждались на международных, всероссийских научно-технических конференциях, в том числе на:
— VII Всероссийской научной конференции молодых ученых, аспирантов и студентов «Информационные технологии, системный анализ и управление», Таганрог, 2009;
— VI Ежегодной научной конференции студентов и аспирантов базовых кафедр Южного научного центра РАН, Таганрог, 2010;
— Всероссийской научной школе-семинаре молодых ученых, аспирантов и студентов «Интеллектуализация информационного поиска, скантехнологии и электронные библиотеки», Таганрог, 2010;
— XXV Международной научно-технической конференции «Интеллектуальные САПР», Дивноморское, 2010;
— XI Международной научно-практической конференции «Информационная безопасность 2010», Таганрог, 2010;
— V Всероссийской научно-практической конференции «Перспективные системы и задачи управления», Домбай, 2010;
— X Всероссийской научной конференции студентов и аспирантов «Техническая кибернетика, радиоэлектроника и системы управления», Таганрог, 2010.
Публикации.
Результаты, полученные в работе, нашли отражение в 9 печатных работах, среди них 3 статьи в издании, рекомендованном ВАК и 1 свидетельство Федеральной службы по интеллектуальной собственности, патентам и товарным знакам № 2 009 611 765 «Программная система компрессии речевых сигналов» .
Структура работы. Материал основной части диссертационной работы изложен на 130 страницах машинописного текста. Диссертация состоит из введения, 4 глав, заключения, списка литературы из 74 наименований, содержит 72 рисунка, и 3 приложений на 42 листах.
4.6 Выводы.
1) Экспериментальные исследования подтвердили теоретически обоснованное повышение степени компрессии для разработанных алгоритмов 25%-60%) по сравнению с базовым алгоритмом дельта-преобразования второго порядка при малом ухудшении качества сигнала (на 0.7—2.5 дБ отношения сигнал/шум). Увеличение трудоемкости разработанных кодеков по сравнению с базовым кодеком, основанном на оптимизированных дельта-преобразованиях второго порядка со сглаживанием, составляет ~ 1.1—1.3 раз при кодировании и ~ 1.1—1.5 раз при декодировании.
2) Анализ экспериментальных данных показал, что по сравнению с кодеком G.726 при сопоставимой компрессии и несколько более низком уровне качества разработанные алгоритмы обеспечивают выигрыш по скорости работы по крайней мере в 2 раза при кодировании и 3 раза при декорировании.
3) Анализ экспериментальных данных показал, что по сравнению с кодеком AMR при сопоставимой компрессии и несколько более низком уровне качества разработанные алгоритмы обеспечивают выигрыш по скорости работы по крайней мере в 2.5 раза при кодировании и 4 раза при декорировании.
4) Анализ экспериментальных данных показал, что по сравнению с МРЗ при сопоставимой компрессии и несколько более низком уровне качества разработанные алгоритмы обеспечивают значительный выигрыш по скорости работы по крайней мере в 4.5 раза при кодировании и 5.5 раза при декорировании. I i.
ЗАКЛЮЧЕНИЕ
.
В диссертационной работе проведен обзор существующих алгоритмов и методов компрессии звуковых данных, который позволяет утверждать об отсутствии алгоритмов компрессии, обладающих низкой трудоемкостью и достаточно высоким коэффициентом сжатия при достаточном уровне качества сигнала, не зависящих от природы исходного аудиосигнала. Рассмотрен известный метод компрессии аудиосигналов на основе двоичного оптимизированного дельта-преобразования второго порядка со сглаживанием, отличающийся от известных низкой вычислительной трудоёмкостью при кодировании и декодировании, однако уступающий по степени сжатия исходного сигнала.
Для решения задачи повышения степени компрессии аудиосигналов, закодированных на основе оптимизированного дельта-преобразования второго порядка со сглаживанием, выполнено теоретическое исследование дельта-последовательности.
В частности, были исследованы свойства* цепочек последовательных дельта-битов. Показано, что для указанной длины цепочки существуют цепочки, которые в некоторомприближении можно считать идентичными. Предложен метод повышения компрессии на основе дельта-преобразований второго порядка, отличающийся от известного алгоритма введением дополнительного кодирования цепочек дельта-последовательности длиной 4 бита. Разработаны алгоритмы компрессии и декомпрессии* на основе дельта-преобразований второго порядка, отличающиеся возможностью повышения компрессии на ~ 30% по сравнению с известным алгоритмом и обеспечивающие при этом гарантированно малое снижение качества.
Также был подробно исследован особый класс цепочек дельта-битов, названный минимальными сериями. Показано, что для каждой длины минимальной серии существуют такие множества минимальных серий (семейства), в которых входящие в них минимальные серии в некотором приближении можно считать идентичными. Показана практически нереализуемая вычислительная трудоемкость решения задачи оптимального разбиения множества минимальных серий проведением полного перебора и разработан экономичный алгоритм построения субоптимального разбиения множества минимальный серий на семейства. Предложен метод повышения компрессии на основе дельта-преобразований второго порядка, отличающийся от известного алгоритма введением дополнительного кодирования на основе семейств минимальных серий, соответствующих полупериодам исходного аудиосигнала. Разработаны алгоритмы компрессии и декомпрессии на основе дельта-преобразований второго порядка, отличающиеся возможностью повышения компрессии на 45−55% по сравнению с известным алгоритмом и обеспечивающие при этом гарантированно малое снижение качества.
Предложенные алгоритмы реализованы в программной модели кодека, с которой проведены экспериментальные исследования. В ходе экспериментальных исследований проводилось сравнение разработанных алгоритмов с базовым алгоритмом двоичного оптимизированного дельта-преобразования.второго порядка, а так же с кодеками G.726, АМЯ’и МРЗ. Экспериментальные данные подтвердили теоретические оценки компрессии и снижения качества для разработанных алгоритмов. Разработанные алгоритмы в ходе тестирования показали сходный с кодеком G.726 уровень компрессии, и качества при более высокой (в 2—3 раза) их производительности. Тестирование’также выявило несколько более низкий уровень качества по сравнению с AMR при сходном уровне компрессии и более высокой (в12.5—4 раза) производительности. Сравнение с кодеком МРЗ показало более низкое качество разработанных алгоритмов, но более высокую производительность (в 4.5−5.5 раз).
Простота и высокое быстродействие алгоритмов кодирования и декодирования позволяют говорить о перспективности их использования в телекоммуникационных мультимедийных системах, системах мобильной связи, бортовых системах связи, функционирующих на основе обеспечивающих целостность передаваемых данных современных протоколов передачи данных.
Материалы диссертационной работы использованы в учебном процессе на кафедре Математического обеспечения и применения ЭВМ Технологического института Южного федерального университета в г. Таганроге и в программно-аппаратном комплексе 1Р-телефонии ООО НПП «СПЕЦСТРОЙ-СВЯЗЬ» в виде программных средств, реализующих алгоритмы компрессии аудио.