Помощь в написании студенческих работ
Антистрессовый сервис

Идентификация музыкальных объектов на основе непрерывного вейвлет-преобразования

ДиссертацияПомощь в написанииУзнать стоимостьмоей работы

Объектные представления музыкальных произведений, как нотная запись и M/DZ-формат, обладают большим количеством достоинств, о чем свидетельствует их высокая популярность (например, практически все современные мобильные телефоны позволяют воспроизводить полифонические мелодии MIDI-формата). Объектные форматы позволяют выполнять редактирование отдельных партий музыкальных инструментов. Например… Читать ещё >

Идентификация музыкальных объектов на основе непрерывного вейвлет-преобразования (реферат, курсовая, диплом, контрольная)

Содержание

  • ГЛАВА 1. МЕТОДЫ ИДЕНТИФИКАЦИИ ОБЪЕКТОВ МУЗЫКАЛЬНЫХ СИГНАЛОВ
    • 1. 1. Форматы и преобразования музыкальных сигналов
      • 1. 1. 1. Амплитудно-временной формат
      • 1. 1. 2. Объектный формат
      • 1. 1. 3. Преобразования музыкальных сигналов
      • 1. 1. 4. Преобразование объектного формата в амплитудно-временной
      • 1. 1. 5. Преобразование амплитудно-временного формата в объектный
      • 1. 1. 6. Задача идентификации музыкальных объектов
      • 1. 1. 7. Выбор структуры системы идентификации музыкальных объектов
      • 1. 1. 8. Оценка качества работы системы идентификации
    • 1. 2. Музыкальный сигнал в задаче идентификации музыкальных объектов
      • 1. 2. 1. Характеристики музыкальных звуков.40,
      • 1. 2. 2. Структура звука музыкального инструмента
      • 1. 2. 3. Классификации музыкальных сигналов
      • 1. 2. 4. Характеристики музыкального произведения
      • 1. 2. 5. Графические формы представления музыкальных сигналов
    • 1. 3. Методы идентификации музыкальных объектов
      • 1. 3. 1. Обзор методов идентификации музыкальных объектов
      • 1. 3. 2. Психоакустические методы анализа музыкального сигнала
    • 1. 4. Выводы по главе 1
  • ГЛАВА 2. НЕПРЕРЫВНОЕ ВЕЙВЛЕТ-ПРЕОБРАЗОВАГШЕ В ЗАДАЧАХ ОБРАБОТКИ СИГНАЛОВ
    • 2. 1. Введение в вейвлет-преобразоваиия
      • 2. 1. 1. Определение вейвлет-преобразовапия
      • 2. 1. 2. Разложение по вейвлетам
      • 2. 1. 3. Дискретное вейвлет-преобразование
      • 2. 1. 4. Непрерывное вейвлет-преобразование
      • 2. 1. 5. Обратное вейвлет-преобразование
      • 2. 1. 6. Свойства базисных вейвлетов
      • 2. 1. 7. Примеры базисных вейвлетов
      • 2. 1. 8. Выбор базисного вейвлета
    • 2. 2. Интерпретация результатов непрерывного вейвлет-преобразов апия
      • 2. 2. 1. Представление результатов НВП на частотно-временной плоскости
    • 2. 3. Графическая интерпретация результатов вейвлет-преобразований
      • 2. 3. 1. Скалограммы
      • 2. 3. 2. Карты проекций изолиний
      • 2. 3. 3. Скелетоны
    • 2. 4. Примеры применения НВП в прикладных задачах
      • 2. 4. 1. Модельные сигналы
      • 2. 4. 2. Экспериментальные сигналы
    • 2. 5. Выводы по главе 2
  • ГЛАВА 3. АДАПТАЦИЯ МАТЕМАТИЧЕСКОГО АППАРАТА К ЗАДАЧАМ ИДЕНТИФИКАЦИИ МУЗЫКАЛЬНЫХ ОБЪЕКТОВ
    • 3. 1. Исследования в области вейвлет-преобразования
      • 3. 1. 1. Влияние формы материнского вейвлета на результат НВП
      • 3. 1. 2. О необходимости формирования собственных материнских вейвлетов.'
      • 3. 1. 3. Алгоритм формирования базисного вейвлета заданной избирательности.:.-.-.:.-. .V. т.т.л.v.-v.:.т.
      • 3. 1. 4. Оценка избирательной способности сформированных вейвлетов
      • 3. 1. 5. Выбор длины базисного вейвлета
      • 3. 1. 6. Формализация параметров НВП
    • 3. 2. Подготовка результатов НВП к автоматизированной обработке
      • 3. 2. 1. Особенности корреляции сигнала и вейвлета
      • 3. 2. 2. Формирование результатов НВП в полуплоскости положительных значений
      • 3. 2. 3. Сглаживание результатов НВП методом секущих
      • 3. 2. 4. Применение НВП к непериодическим сигналам
    • 3. 3. Применение искусственной нейронной сети в задаче идентификации музыкальных сигналов
      • 3. 3. 1. Принцип работы ИНС MaxNet
      • 3. 3. 2. Модификация сети MaxNet для решсиия задачи классификации звуковых сигналов
      • 3. 3. 3. Реализация модифицированной сети поиска максимумов
    • 3. 4. выводы по главе 3
  • ГЛАВА 4. РЕАЛИЗАЦИЯ ПРОГРАММНО-ТЕХНИЧЕСКОГО КОМПЛЕКСА ИДЕНТИФИКАЦИИ МУЗЫКАЛЬНЫХ ОБЪЕКТОВ
    • 4. 1. Преобразования музыкального сигнала
    • 4. 2. Программно-технический комплекс
      • 4. 2. 1. Модуль формирования музыкального сигнала
      • 4. 2. 2. Модуль математических преобразований
      • 4. 2. 3. Модуль идентификации и распознавания
      • 4. 2. 4. Контур обратной связи
    • 4. 3. Практическое применение программно-технического комплекса в задачах идентификации музыкальных объектов
      • 4. 3. 1. Идентификация нот одноголосной мелодии
      • 4. 3. 2. Идентификация нот многоголосной мелодий
      • 4. 3. 3. Идентификация объектов отдельных инструментов
      • 4. 3. 4. Идентификация объектов аудиозаписи одного инструмента
      • 4. 3. 5. Идентификация объектов аудиозаписи двух инструментов
    • 4. 4. выводы по главе 4

Мир человека наполнен звуками различного происхождения. Среди них голоса людей и животных, звуки технологических приборов и агрегатов, звуки природных явлений, бытовой шум и т. д. Большую часть звуков человек производит сам или при помощи специальных устройств, к которым относятся и музыкальные инструменты. Музыка, создаваемая музыкальными инструментами, сопровождает человека с древних времен. В современном мире музыка составляет часть быта человека. Музыку можно услышать не только на концертах оркестров и ансамблей, но и по радио, телевидению, при помощи мультимедийных компьютеров и мобильных устройств.

Большинство людей, как правило, используют музыкальные произведения, сохраненные в виде фонограмм на цифровых или аналоговых носителях. Однако композиторы и музыканты используют различные формы объектного представления музыкальных произведений. Одной из форм представления музыкального произведения в объектном виде является нотная запись. Первые записи нот в виде объектов использовались в Древнем Китай, Египте и Древней Греции. В привычном виде нотная запись существует и используется с XVII в. [1, 2]. В современном мире цифровых технологий существуют несколько объектных форматов, но наибольшую популярность имеет формат MIDI {Musical Instrument Digital Interface — цифровой интерфейс музыкальных синтезаторов) [1]. Формат MIDI, гак же как и нотная запись позволяет описать ноты, как объекты музыкального произведения с определенным набором свойств и отношения между ними.

Объектные представления музыкальных произведений, как нотная запись и M/DZ-формат, обладают большим количеством достоинств, о чем свидетельствует их высокая популярность (например, практически все современные мобильные телефоны позволяют воспроизводить полифонические мелодии MIDI-формата). Объектные форматы позволяют выполнять редактирование отдельных партий музыкальных инструментов. Например, в объектном виде возможно изменение свойств отдельной, ошибочной, нотызамена звучания одного инструмента другим и т. д. Объектные форматы музыкальных сигналов используется большинством систем «караоке», музыкальными синтезаторами, мультимедийными ЭВМ и программными музыкальными редакторами [1 ].

Музыкальные произведения в объектных форматах востребованы в современной индустрии разработки программно-аппаратных средств, требующих графического и аудио-оформления событий пользовательского интерфейса. Малый объем файлов MIDI-формата позволяет включать элементы музыкального оформления без существенного увеличения физического объема разрабатываемых программных продуктов и требований к аппаратной части ЭВМ. Музыкальное оформление отдельных событий позволяет значительно повысить информативность и привлекательность выпускаемых программных продуктов в целом.

Широкое применение объектных форматов музыкальных сигналов оставляет актуальной задачу создания музыкальной партитуры в объектном формате по имеющейся звукозаписи музыкального произведения (на аналоговом или цифровом носителе). Этот процесс связан с рядом особенностей [3]:

• Нотное письмо является достаточно сложным объектным аппаратом и требует высокой квалификации знаний от человека его использующего, что является большой проблемой для начинающих музыкантов.

• Время, затрачиваемое на формирование нотной записи, достаточно велико и требует от музыканта запоминания больших объемов информации, что может быть неприемлемым для композитора, впервые исполняющего произведение, особенно если произведение продолжительное и темп исполнения высокий.

• Даже если музыкальное произведение записано на каком-либо носителе, для его представлении в потном или объектном цифровом виде музыкант-аранжировщик вынужден на слух подбирать партии каждого музыкального инструмента, а затем воспроизводить их при помощи клавишного синтезатора или записывать нотным письмом. Например, каждая композиция системы караоке подбирается музыкантом на слух и имеет в своем составе в среднем 6 — 9 партий разных музыкальных инструментов со средней продолжительностью звучания 3 — 5 минут. • В объектном формате возможна реставрация аудиозаписей плохого качества тех музыкальных произведений, нотные партитуры которых были утрачены. По полученному объектному формату, музыкальное произведение может быть исполнено заново и записано на современные цифровые носители. Но процесс создания объектного формата реставрируемого произведения требует тех же человеческих ресурсов, что и процесс создания караоке-произведения.

Обоснование актуальности работы.

Задача получения нотной записи многоголосной мелодии по звукозаписи музыкального произведения является высоко актуальной. Далее в работе такая задача носит название идентификации музыкальных объектов.

Кроме того, актуальной является и задача реализации системы, позволяющей в автоматизированном режиме идентифицировать однои многоголосные мелодии отдельных музыкальных инструментов, формируя нотную запись, а также идентифицировать партии определенных музыкальных инструментов на фоне звучания остальных.

К настоящему моменту было произведено большое количество попыток автоматизировать процесс идентификации нот мелодий музыкальных произведений и формирования по ним объектных форматов. Среди таких систем стоит отметить системы Мартинса JI. [55], Серафина С. [57], Фуджишима Т. [58] Jle-вью П. [59] Эмия В. [60] и др. Не смотря на высокие показатели работы систем в отдельных режимах, системы обладают существенными ограничениями в применении к реальным сигналам. Стоит отметить, что на современной мировой музыкальной эстраде автоматизированные системы идентификации музыкальных сигналов не получили применения из-за низких качественных и количественных показателей [3,4].

Большинство существующих систем идентификации раскладывают фрагменты музыкальных произведений в частотный ряд различными методами, а затем группируют локальные частотные экстремумы в наборы гармоник, на основании которых осуществляется установление соответствия тембральным образам музыкальных инструментов [55 — 72]. Однако такой подход показывает высокие результаты только при анализе музыкальных произведений, в каждый момент которых звучит только одна пота. При анализе фрагментов мелодий, в которых звучит больше одной ноты (созвучия, аккорды), частотные диапазоны гармоник отдельных нот пересекаются, и качественные характеристики систем значительно снижаются.

Кроме того, существующие системы не позволяют идентифицировать партию отдельного инструмента на фоне звучания других [4]. А музыкант, с соответствующей квалификацией, справляется с этой задачей весьма удовлетворительно.

Анализ работы музыкантов [3, 16] позволяет сделать вывод, что человек, при идентификации музыкального произведения, содержит в памяти образ (образец) звучания нот каждого инструмента. Наличие таких образов (образцов) позволяет с малой долей ошибок классифицировать партии каждого инструмента на фоне общей фонограммы и идентифицировать объекты-ноты каждой партии. А наличие отдельных обертонов (тонов по частоте выше основного тона звучащей ноты) человек, как правило, не слышит.

Такое наблюдение потребовало для реализации автоматизированной системы использования математического аппарата, позволяющего оперировать заранее заданными образами (образцами) нот музыкальных инструментов. Основным требованием к математическому аппарату было наличие способности выявлять схожие (с высокой степенью корреляции) с образцом фрагменты музыкального произведения на этапе формирования амплитудно-частотно-временной характеристики.

В качестве перспективного аппарата, позволяющего сформировать амплитудно-частотно-временное представление сигнала с использованием изменяемого базиса был выбран аппарат непрерывного вейвлет-преобразования.

Вейвлет-преобразования на сегодняшний день являются достаточно мощным инструментом исследования структуры нестационарных данных [79 — 85]. Вейвлеты получили применение при решении широкого круга задач связанных с подавлением шумов, сжатием больших объемов информации, анализом изображений, синтезом сигналом и т. д. С ростом возможностей вычислительной техники вейвлет-преобразования приобрели широкое значение в различных областях науки. К возможностям вейвлет-преобразования можно отнести способность определять мгновенную амплитуду, фазу и частоту периодических компонент нестационарных широкополосных сигналов. Вейвлет-преобразование является инструментом многомасштабного анализа, позволяющим одновременно анализировать структуру сигналов в разных диапазонах масштабов наблюдения. Возможностям вейвлетов и НВП полностью посвящена вторая глава данной диссертационной работы.

НВП сигнала^/) состоит в его разложении по некоторому базису, сконструированному из функции-вейвлета w (t), посредством ее масштабирования и сдвигов вдоль оси времени:

Здесь [Wwf](r, s) — коэффициенты преобразования, s — масштаб вейвлета, т — параметр смещения вдоль оси времени, символом «*» обозначена операция комплексного сопряжения. Базисная функция w (t) и формируемое на ее основе семейство вейвлетов определяется целями исследования. Выбором базисных.

НВП). вейвлет-функций можно добиться выявления требуемых свойств рассматриваемого сигнала.

Базисные вейвлеты обладают свойством автомодельности. Это свойство используется при получении всех вейвлетов одного семейства. Таким же свойством обладает сигнал одной ноты музыкального инструмента: применив механизм сжатия (растяжения) сигнала одной ноты вдоль временной составляющей, можно получить семейство нот всего диапазона этого же инструмента. Такое сходство вейвлетов и сигналов музыкальных инструментов позволяет на основе сигналов музыкальных инструментов создавать базисные вейвлеты. Такие вейвлеты позволяют настраивать само НВП на идентификацию нот музыкальных инструментов с теми же частотными свойствами. Определение наличия таких возможностей потребовало дополнительных исследований в области НВП. Такие исследования приведены в третьей главе настоящей диссертационной работы.

Несмотря на широко развитые средства и методы графической интерпретации результатов НВП, непосредственно само НВП не решает задачи идентификации образов. В качестве выходных значений НВП формирует двумерный массив чисел JV%vf (j, s содержащий информацию о степени корреляции каждого вейвлета семейства с сигналом — некий аналог амплитудно-частотпо-временной характеристики сигнала. На основе анализа этой характеристики можно сделать выводы относительно наличия в сигнале нот музыкального инструмента и их амплитудно-частотно-временпых отношений.

Для идентификации музыкальных объектов — нот в массиве результатов НВП [WJ{t, s) в работе предложено применение аппарата искусственных нейронных сетей (ИНС). Нейронные сети широко применяются при решении задач распознавания образов, прогнозирования, синтеза, принятия решений и управления [6, 7, 8, 9]. В третьей главе работы описана ИНС прямой передачи с возможностью изменения количества слоев сети. ИНС на основе коэффициентов вейвлет-преобразования формирует образы музыкальных объектов, вычисляя такие их свойства, как высота ноты, время начала, продолжительность звучания, громкость.

Цель и задачи исследования

.

Целью работы является идентификация объектов-нот однои многоголосных мелодий отдельных музыкальных инструментов, а также идентификация партий определенных музыкальных инструментов на фоне звучания остальных в звукозаписях музыкальных произведений с использованием модификаций аппарата непрерывного вейвлег-преобразования.

Для реализации цели работы были поставлены и решены следующие задачи исследования:

1. Провести анализ характеристик музыкальных сигналов, способов их описания, форм представления, форматов записи и возможных преобразований.

2. Провести обзор и анализ существующих систем идентификации музыкальной информации.

3. Оценить возможность применения НВП к идентификации музыкальных объектов, выявить технические границы возможностей его применения.

4. На основе проведенного анализа внести изменения и дополнения к аппарату НВП, позволяющие формировать базис НВП с заданными избирательными способностями. Разработать алгоритм повышения информативности результатов НВП, позволяющий выполнять дальнейшую автоматизированную обработку в среде ИНС.

5. Выполнить модификацию ИНС с прямой передачей типа «MaxNet» для решения задачи классификации музыкальных сигналов. Обеспечить возможность изменения степени полифонической идентификации сети за счет изменения числа скрытых слоев.

6. Реализовать разработанные подсистемы в виде программно-технического комплексапровести отладку их взаимодействия. Разработать механизмы сопряжения форматов входных и выходных сигналов с применяющимися в настоящее время в мультимедийных системах.

7. Провести качественную и количественную оценку работы отдельных компонентов и системы в целом.

Методы исследования: методы статистической обработки результатов экспериментовнепараметрические методы идентификацииметод графоаналитического исследования интерпретаций сигналовметод слухового анализа музыкальных сигналовметодологии разработки и тестирования программного обеспечения.

Научная новизна работы.

1. Предложен метод формирования частных вейвлет-фуикций заданной избирательности и семейств вейвлетов на их основе, использующий фрагмент сигнала одной ноты различных музыкальных инструментов.

2. Обоснованы критерии формирования базисного вейвлета для задачи идентификации объектов в музыкальном произведении, заключающиеся в формировании вейвлета на основе 16 периодов основного тона ноты «Ля субконтроктавы» музыкального инструмента.

3. Предложен способ изменения масштабного коэффициента НВП, заключающийся в формировании значений частоты вейвлетов соответствующих частотам 96 тонов европейского равномерно темперированного строя музыки, что позволило создать систему автоматизированной идентификации музыкальных объектов с диапазоном распознаваемых йот, составляющим 8 октав.

4. Разработан алгоритм увеличения информативности результатов НВП, использующий наложение секущих на их частотные срезы с длиной обратно пропорциональной значению частоты вейвлета текущего масштаба.

5. Для ИНС прямой передачи «MaxNet» с прямыми связями предложено использовать число слоев сети в качестве настроечного параметра. Изменение числа слоев ИНС позволило изменять степень полифонической идентификации системы в целом. Практическая значимость работы.

1. Разработан метод идентификации одноголосных и многоголосных мелодий с количеством одновременно звучащих двух и более нот.

2. Разработан пакет прикладных программ, реализующих алгоритм непрерывного вейвлет-преобразовапия для сигналов и вейвлетов, представленных решетчатыми функциями. Пакет позволяет в качестве варьируемых параметров использовать частотно-временное окно исследования сигнала, базисный вейвлет, методы изменения коэффициентов НВП.

3. Программно реализован алгоритм повышения информативности результатов НВП в системах автоматизированной обработки.

4. Разработана программа, имитирующая работу ИНС поиска максимумов с варьируемым числом слоев.

5. На базе персонального компьютера реализован программно-технический комплекс, включающий программные реализации НВП, ИНС, других алгоритмов и методов, описанных в работе, и ряда коммерческих программных продуктов.

6. Разработаны формальные показатели оценки качества систем идентификации музыкальных объектов.

Основные положения диссертации, выносимые на защиту:

1. Метод формирования материнских вейвлетов заданной избирательности.

2. Метод формализации и дискретизации НВГ1 в задаче идентификации объектов музыкальных произведений с целью уменьшения вычислительной избыточности.

3. Способ изменения масштабного коэффициента при формировании семейства вейвлет-функций, позволяющий классифицировать музыкальные объекты в соответствии с 96 полутонами европейского равномерно темперированного строя музыки.

4. Метод повышения информативности результатов НВП путем использования секущей на интервалах, кратных периоду гармонических составляющих сигнала.

5. Метод изменения степени полифонической идентификации ИНС путем варьирования числа скрытых слоев сети.

6. Структура и элементы программно-технического комплекса идентификации музыкальных объектов.

Личный вклад соискателя заключается в проведении теоретических исследований, их практической реализации, получении основных результатов, изложенных в работе, их интерпретации, авторском сопровождении при внедрении.

Разработка общей структуры работы, программная реализация компонентов и подготовка публикаций к печати выполнены совместно с соавторами. Сведения об апробации результатов диссертации.

Основные результаты диссертации докладывались и обсуждались на XII международной научно-практической конференции студентов и молодых ученых «Современные техника и технологии» (Томск, 2006 г.) — международной открытой научной конференции «Современные проблемы информатизации в моделировании и программировании» (Воронеж, 2006 г.) — IV, V и VI Всероссийских научно-практических конференциях студентов, аспирантов и молодых ученых «Молодежь и современные информационные технологии» (Томск, 2006 — 2008 гг.).

Внедрения.

Результаты работы в виде программно-технического комплекса использованы при формировании музыкального оформления пользовательского интерфейса программного обеспечения, предназначенного для встраиваемых систем и сетевых устройств, разрабатываемых группой компаний «Интант» (г. Томск), при анализе и графической интерпретации численных значений защитного потенциала газопровода «Парабель-кузбасс» в ООО «Антикор — ЭХЗ», объемов ГСМ в ОАО «МК 44» и при формировании нотной партитуры по звукозаписи джазовых импровизаций в ООО «Тропикана» (г. Томск).

Результаты используются при выполнении научно-исследовательской работы и выпускных квалификационных работ студентов кафедры автоматики и компьютерных систем Томского политехнического университета.

Сведения о публикациях (по теме диссертации).

По теме диссертации опубликовано 9 работ [24 — 32]. Из них 4 статьи в журналах и 5 статей в сборниках трудов коиферепций/3 статьи опубликованы в ведущих рецензируемых журналах [24 — 26], рекомендованных Высшей аттестационной комиссией Министерства образования и науки Российской Федерации.

Структура диссертации, ее объем.

Диссертация состоит из введения, четырех глав, заключения, приложения и списка цитируемой литературы. В работе содержится 180 страниц печатного текста, 93 рисунка, библиография из 118 наименований на 12 страницах. Общий объем диссертации составляет 191 страницу.

4.4 Выводы по главе 4.

1. Программно-технический комплекс в целом успешно реализует ряд описанных в работе методов преобразования сигналов. Однако, в некоторых случаях, хорошо изученные свойства отдельных алгоритмов и методов при их объединении приводят к ухудшению общего результата. Стоит отметить, что качественные показатели в некоторых случаях значительно превосходят количественные. Учитывая особенности слухового аппарата человека, многие временные и гармонические изменения при аудиальпом анализе музыкальных произведений малозаметны. Так, одна ошибочно определенная нота в аккорде из четырех звуков в количественном выражении дает ошибку в 25%, а в качественном, если не нарушены гармонические каноны произведения, ошибка может быть пе обнаружена. В связи с этим, ряд количественных показателей стоит учитывать с учетом качественных поправок.

2. Частотный диапазон распознаваемых объектов составляет 96 полутонов (8 октав) от ноты «ля» субконтроктавы до ноты «ля» пятой октавы. Это объясняется однородностью НВП во всем частотном диапазоне преобразований, абсолютной идентичностью всех 96 нейронов каждого слоя ИНС, отсутствием частотных фильтров и нелинейных преобразований в системе в целом.

3. При идентификации нот одноголосных мелодий для музыкальных инструментов, звук которых формируется автоколебаниями, относительное количество ног, совпавших в распознаваемом и оригинальном произведениях A/ifce[80, 90]%, среднее относительное отклонение времени начала звучания каждой ноты Ав е [10, 20]%.

4. При идентификации нот одноголосных мелодий для музыкальных инструментов, звук которых формируется свободными колебаниями, АКсе [95,100]%, Ав е [1,2]%.

5. Степень полифонической идентификации системы составляет 3 — 4 голоса. При полифонии в четыре голоса, АКсе [80, 90]%, Д0е[1, 5]% для музыкальных инструментов со свободными колебаниями и АЯ" с е[50, 70]%, Аве [20, 40]% для инструментов с автоколебаниями. Примерная зависимость качества работы системы от количества распознаваемых г олосов приведена на рисунке (рисунок 4−23). Стоит заметить, что система способна распознавать ноты и в аккордах с количеством одновременно звучащих пот больше четырех, но количество ошибочно определяемых параметров объек.

Рисунок 4−23 — Зависимость качества распознавания объектов системы от степени полифонической идентификации.

6. Количество идентифицируемых музыкальных инструментов составляет 16. Это количество соответствует количеству сформированных и опробованных в работе системы базисных вейвлетов. Распознаваемые инструменты: фортепиано, колокольчик, электро-пианино, скрипка, скрипка пиццикато, труба, орган и др. При наличии возможности создания материнского вейвлета" количество инструментов может дополняться новыми. Для создания материнского вейвлета необходимо иметь звукозапись отдельных нот музыкального инструмента.

7. При идентификации звучания отдельного инструмента па фоне других для музыкальных инструментов, звук которых формируется автоколебаниями, АКс=35%.

8. При идентификации звучания отдельного инструмента на фоне дру- -гих для музыкальных инструментов, звук которых формируется свободными колебаниями, АКс=95%.

ЗАКЛЮЧЕНИЕ

.

В работе предложен и обоснован метод формирования частных вейвлет-функций (базисных вейвлетов и семейств па их основе). Показана возможность формирования базиса с заранее заданными частотно-временными свойствами и его применения в задачах анализа нестационарных сигналов. Предложена система изменения масштабного коэффициента семейства вейвлетов в НВП, позволяющая классифицировать музыкальные объекты в соответствии с 96 полутонами европейского равномерно темперированного строя музыки. Разработан алгоритм увеличения информативности результатов НВП, позволяющий применять их для дальнейшей автоматизированной обработки.

На основе искусственной нейронной сети MaxNet предложена модифицированная ИНС поиска максимумов с прямыми связями. Количество слоев сети предложено варьировать в качестве настроечного параметра степени полифонической идентификации системы в целом.

Разработан программно-технический комплекс,интегрировавший исследования в области НВП и ИНС. Комплекс позволяет решать задачи идентификации партии определенного музыкального инструмента с идентификацией в ней объектов-нот: их высотного положения и временных характеристик. Экспериментально доказана возможность идентификации партии полифонического исполнения одним инструментом (когда в каждый момент времени может звучать более одной йоты), а также партии одного инструмента на фоне звучания других.

Сформированы материнские вейвлеты шестнадцати музыкальных инструментов и сигналов несинусоидальной формы. Отработана методика формирования материнских вейвлетов, позволяющая получать определенный вейвлет для требуемого музыкального инструмента и сигнала с заданными характеристиками.

Разработаны пять программных приложений, выполняющих функции основных этапов идентификации музыкальных объектов. В процессе отладки программного обеспечения была расширена функциональность разработанных программных компонентов, получившая применение в задачах спектрального анализа в отраслях промышленности, не связанных с обработкой музыкальных сигналов.

Показать весь текст

Список литературы

  1. Benson, D. Music Text.: A Mathematical Offering /D. Benson. — Cambridge University Press, 2007. — 536 p.
  2. , А. В. Математика и искусство Текст. / А. В. Волошинов. — М.: Просвещение, 1992. — 335 с.
  3. , Д. В. Применение вей влет-анализа в задачах исследования структуры сигналов Текст.: Дис.. канд. физ.-мат. наук / Д. В. Думский. — Саратов, 2005.— 154 с.
  4. , Ф. Нейрокомпыотерпая техника Текст. / Ф. Уоссермеп. — М.: Мир, 1992. — 184 с.
  5. , А. Н. Нейронные сети на персональном компьютере Текст. / А. Н. Горбань, Д. А. Россиев. —Новосибирск: Наука, 1996. 276 с.
  6. Nigrin, A. Neural Networks for Pattern Recognition Text. / A. Nigrin. — MIT Press, 1993. —413 p.
  7. Haykin, S. Neural Networks Text.: A Comprehensive Foundation / S. Haykin. — Prentice Hall, 1999. — 842 p.
  8. , Р. Фейнмановские лекции, но физике Текст. / Р. Фейнман, Р. Лейтон, М. Сэндс. — М.: Мир, 1967. — Т. 4: Кинетика. Теплота. Звук. — 440 с.
  9. , Г. С. Элементарный учебник физики Текст. / Г. С. Ланд-сберг. — М.: Наука, 1985. — Том 3: Колебания и волны. Оптика. Атомная и ядерная физика. — 656 с.
  10. , И. А. Электроакустика и звуковое вещание Текст.: учебное пособие для ВУЗов / И. А. Алдошина, Э. И. Вологдин, А. 11. Ефимов. — М.: Горячая линия—Телеком. 872с.
  11. , А.А. Использование распознавания образов для обработки и восстановления музыкальных сигналов Текст.: Дис.. канд. технич. наук / А. А. Кудипов. — М., 2003. — 179 с.
  12. Слуховая система Текст. / под ред. Альтман Я. А., — Лен.: Наука, 1990.621 с.
  13. Физиология речи. Восприятие речи человеком Текст. / Чистович JI.A., Венцов А. В., Гранстрем М. П., и др. —- Лен.: Наука, 1976. — 385 с.
  14. , И. А. Основы психоакустики. Часть 1 Текст. / И. А. Алдошина // Звукорежиссер. — 1999. — № 6. — С. 27—32.
  15. , Г. В. Психология восприятия музыки Текст.: подходы, проблемы, перспективы / Г. В. Иванченко. — М.: Смысл, 2001. — 264 с.
  16. , М. С. Слух музыканта Текст. / М. С. Старчеус. — М.: Моск. гос. консерватория им. П. И. Чайковского, 2003. — 640 с.
  17. ANSI — American National Standards Institute Electronic resource. — Title from the screen. —Access mode: http://ansi.org/, free.
  18. , Л. И. Таблицы по инструмептоведеиию Текст. / Л. И. Маль-тер. —М. Музыка, 1965. — 100 с.
  19. , В. А. Элементарная теория музыки Текст. / В. А. Вахромеев.
  20. М.: Высш. шк., 2003. — 462 с.
  21. Большая советская энциклопедия Текст. — М. Советская энциклопедия, 1972. — Т. 9.: Евклид — Ибсен. — 624 с.
  22. Большая советская энциклопедия Текст. — М. Советская энциклопедия, 1974. — Т. 18.: Никко — Отолиты. — 632 с.
  23. , А. С. Метод преобразования форматов музыкальной информации Текст. / А. С. Фадеев, Е. А. Кочегурова // Цифровая обработка сигналов.2007. — № 3. — С. 46—51.
  24. , А. С. Формирование вейвлет-фуикций в задаче идентификации музыкальных сигналов Текст. / А. С. Фадеев // Известия Томского политехнического университета. — 2007. — Т. 311. — № 5. — С. 81—86.
  25. , А. С. Подготовка результатов непрерывного вейвлет-преобразования к автоматизированной обработке Текст. / А. С. Фадеев, Е. А. Кочегурова // Известия Томского политехнического университета. — 2006. — Т. 309. — № 7. — С. 32—35.
  26. , А. Теория информации и эстетическое восприятие Текст. / Абра-амМоль.—М.: Мир, 1966. — 312 с.
  27. , В. И. Колебания и волны в природе и технике Текст.: Компьютеризированный курс / В. И. Каганов. — М.: Горячая линия-Телеком, 2008. — 336 с.
  28. , В. О. Новейший самоучитель работы на компьютере для музыкантов Текст. / В. О. Белунцов. — М.: ДЕСС, 2003. — 560 с.
  29. , В. О. Музыкальные возможности компьютера Текст.: справочник / В. О. Белунцов. — СПб.: Питер, 2000. — 432 с.
  30. , Е. В. Программирование подсистемы MIDI Текст. / Е. В. Музыченко // Компьютер Пресс. — 2000. — № 9. — С 32—39.
  31. , А. В. Музыкальная информатика. Компьютер и звук Текст.: учебное пособие по теоретическому курсу для студентов и аспирантов музыкального вуза / А. В. Харутою. — М.: Московская государственная консерватория, 2000. — 387 с.
  32. , Т. Руководство программиста по работе со звуком Текст. / Тим Кинтцель. — М.: ДМК Пресс, 2000. — 432 с.
  33. , А. В. Компьютерный анализ звука в музыковедческом исследовании Текст. / А. В. Харуто // Труды междунар. научн. симпоз. «Информационный подход в эмпирической эстетике». — г. Таганрог, 1998. — С. 189—208.
  34. , А. Введение в цифровую обработку сигналов Текст. / А. Лукин.1. М.: МГУ, 2002. — 48 с.
  35. , А. Б. Цифровая обработка сигналов Текст. / Сергиепко А. Б.
  36. СПб.: Питер, 2003. — 608 с.
  37. , А. В. Цифровая обработка сигналов Текст. / А. В. Оппен-гейм, Р. В. Шафер. — М.: Связь, 1979. — 416 с.
  38. , У. М. Цепи, сигналы, системы Текст. / У. М. Сиберт — пер. с англ. Э. Я. Пастрона, В. А Усика- под. ред. И. С. Рыжака. — В 2-х ч.— М.: Мир, 1988. —Ч. 2. —360 с.
  39. , О. И. Цифровая обработка и передача речи Текст. / О. И. Ше-лухин, Н. Ф. Лукьянцев — под ред. О. И. Шелухипа. — М.: Радио и связь, 2000.456 с.
  40. , Е. И. Основы судебного речеведения Текст. / Е. И. Галяши-на. — М: СТЭНСИ, 2003. — 236 с.
  41. , У. М. Цепи, сигналы, системы Текст. / У. М. Сиберт — пер. с англ. Э. Я. Пастрона — под. ред. Л. А. Шпирта — В 2-х ч. — Пер. с англ. — М.: Мир, 1988.—Ч. 1. —336 с.
  42. , J. A. — On the Transcription of Musical Sound by Computer Text. / J. A. Moorer // Computer Music Journal. — 1977. V. 1. — No. 4. — P. 32—38.
  43. Moorer, J. A. Lexicon of Analyzed Tones (Part III: The Trumpet) Text.: analysis and plotting programs / J. A. Moorer, J. M. Grey, J. Strawn // Computer Music Journal. — 1978. — V.2. — No. 2. — P. 23—31.
  44. Chafe, C. Source separation and note identification in polyphonic music / C. Chafe, D. Jaffe // Acoustics, Speech, and Signal Processing, IEEE International Conference on ICASSP. Apos 86.—V. 11, 1986. —P. 1289— 1292.
  45. Maher, R. C. Development and evaluation of a method for the separation of musical duet signals / R. C. Maher // Proc. IEEE Workshop on Applications of Signal Processing to Audio and Acoustics, NY, Mohonk, October, 1989. — P. 1 — 3.
  46. Kashino, K. Music recognition using note transition context Electronic resource. / K. Kashino, H. Murase // Proc. of the 1998 IEEE ICASSP. Seattle. 1998. — Access mode: http://ieeexplore.ieee.org/iel4/5518/14 898/00679655.pdf, free.
  47. Martin, K. D. Sound-Source Recognition Electronic resource.: A Theory and Computational Model / K. D. Martin // Ph.D. thesis, MIT. Cambridge, MA, 1999. — Access mode: http://sound.media.mit.edu/Papers/kdm-phdthesis.pdf, free.
  48. Schottstaedt, W. Machine Tongues XVII. CLM Text.: Music V Meets Common Lisp / William Schottstaedt // Computer Music Journal. — 1994. — Vol.18. —No.2.—P. 30—38.
  49. Serafin, S. A pattern recognition approach to invert a bowed string physical model Text. / S. Serafin,, H. Thornburg, J. O. Smith III // Proc. of the International Symposium on Musical Acoustics (ISMA-2001), Perugia, Italy, 2001. — P. 241— 245.
  50. Fujishima, T. Realtime Chord Recognition of Musical Sound Text.: a System Using Common Lisp Music / T. Fujishima // Proc. of the International Computer Music Conference, Beijing: International Computer Music Association, China, 1999. — P. 464—467.
  51. Emiya, V. Multipitch Estimation of Quasi-IIarmonic Sounds in Colored Noise Text. / V. Emiya, R. Badeau, B. David //Proc. of the 10th Int. Conference on Digital Audio Effects (DAFx-07), Bordeaux, France, 2007. — P. 93—98.
  52. Herrera, P. Signal Processing Methods for Music Transcription Text. / P. Herrera, A. Klapuri, M. Davy. — New York, 2006. — Chapter 6: Automatic Classification of Pitched Musical Instrument Sounds. — 437 p.
  53. , А. В. Компьютерные методы анализа звука в музыковедческом исследовании Текст. / А. В. Харуто // Музыка и время. — 2005. — № 8, — С. 55—59.
  54. Eggink, J. Instrument recognition in accompanied sonatas and concertos Text. / J. Eggink, G. J. Brown // Proc. of IEEE Int. Conf. on Audio, Speech and Signal Processing (ICASSP). — V-4. — 2004. P.: IV-217 — IV-220.
  55. Martin, K. D. Automatic Transcription of Simple Polyphonic Music Electronic resource. / K. D. Martin // Computer Music Journal. — 2002. — No 1(7). — Access mode: http://alumni.media.mit.edu/~lcdm/researcli/papers/kdm-TR399.pdf, free.
  56. McAdams, S. Audition: cognitive psychology of music in The Mind-Brain Continuum Text. / S. McAdams- eds. R. Llinas, P. Churchland. — MIT Press — 1996. —P. 251—279.
  57. Scheirer, E.D. Music Listening Systems Text. / E. D. Scheirer. — PhD Thesis. — Massachusetts Institute of Technology. — 2000.
  58. Smith, L. S. Sound Segmentation using onsets and offsets Electronic Resource. /Leslie S. Smith // Interface Journal of New Music Research, No 18(6), 2000. — Access mode: http://www.informaworld.com/index/793 740 949.pdf, free.
  59. , А. В. Компьютерная расшифровка фонограмм фольклорного пения / А. В. Харуто- под ред. Л. Дорфмана, К. Мартиндейла, В. Петрова, П. Махотки, Дж. Купчика // Творчество в искусстве — искусство творчества. — 2000.—С. 325−1336.
  60. Livingston, J. Musical Instrument Identification using wavelets and Neural Networks Text. / J. Livingston, N. Shepard. — The University of Texas at Austin. — Austin, Texas, USA, 2005. — 20 p.
  61. , JI. JI. Распознавание звуковых образов Текст. / JI. JI. Мясников, Е. М. Мясникова. — М.: Наука, 1984. — 158 с.
  62. , И. О. Цифровые синтезаторы музыкальных звуков Текст. / И. О. Симаненков // Компьютерра. — 1998. — № 32. — С. 21—24.
  63. Grossmann, A. Decomposition of Hardy functions into square integrable wavelets of constant shape Text. / A. Grossmann, J. Morlet // SIAM J. Math. Anal. — 1984. —T. 15.—P 723—736.
  64. , В. В. Вейвлет-анализ солнечной активности за 300 лет Электронный ресурс. / В. В. Витязев. — НИАИ им. В. В. Соболева, СПбГУ С. Петербург, 2001. — 9 с. — Режим доступа: http://www.astro.spbu.ru/astro/pub-lications/vityazev/sun.pdf, свободный.
  65. Гелиогеофизические связи Электронный ресурс.: Энциклопедия «Круго-свет». — Загл. с экрана. — Режим доступа: http://www.krugosvet.ru/articles/125/-1 012 579/1012579al .htm, свободный.
  66. , Н. М. Вейвлет-анализ Текст.: основы теории и примеры применения / Н. М. Астафьева // Успехи физических паук. — 1996. — Т. 166. — № 11. —С 1145—1170.
  67. , И. М. Вейвлеты и их применение Текст. / И. М. Дремин, О. В. Иванов, В. А. Нечитайло // Успехи физических наук. — 2001. — Т.171, № 5. — С. 465—501.
  68. Wavelet Analysis and Its Applications Text. / ed. by Charles K. Chui. — San Diego: Academ. Press Inc., 1992.
  69. Vol. 1: An Introduction to Wavelets. — 266 p.
  70. Vol. 2: Wavelets: A Tutorial in Theory and Applications. 723 p.
  71. , JI. Г. Преобразования Фурье и вейвлет-преобразования. Их свойства и применения Текст. / Л. Г. Васильева, Я. М. Жилейкин, Ю. И. Оси-пик // Вычислительные методы и программирование. — 2002. — Т. 3. — С 172—175.
  72. Beltran, J. R. Additive Synthesis based on the Continuous Wavelet Transform Electronic resource.: A Sinusoidal Plus Transient Model / J. R. Beltran, F. Beltran.
  73. Dept of Electronic Engineering and Communications, University of Zaragoza, Spain. 2003. — Access mode: http://www.elec.qmul.ac.uk/dafx03/proce-edings/pdfs/dafxl 4. pdf, free.
  74. Чуй, К. Введение в вэйвлеты Текст. / К. Чуй. — М.: Мир, 2001. — 412 с.
  75. Meyer, Y. Wavelets: Algorithms and Applications / Y. Meyer. — Philadelphia, PA: SI AM Press, 1993.
  76. Coifman, R. R. Wavelet analysis and signal processing Text. / Ronald R. Coifman, Yves Meyer, M. Victor Wickerhauser. // Wavelets and their applications.1992. —Jones and Bartlett, Boston, MA. — P. 153—178.
  77. Wavelets Text. / by Eds.: J. M. Combes, A. Grossmann, P. Tchamitchian. — Berlin: Springer-Verlag, 1989. — 331 p.
  78. Grossman, J. Decomposition of Hardy functions into square integrable wavelets of constant shape Text. / J. Grossman, A. Morlet // SIAM J. Math. Anal. — 1984.—№ 15. —P. 723—736.
  79. Grossmann, A. Wavelets and Their Applications / A. Grossmann, J. Morlet — Ed. R Coifman. — Boston: Jones and Barlett Publ., 1992. — 234 p.
  80. , JI. В. Основы вейвлет-анализа сигналов Текст.: учебное Пособие / Л. В. Новиков. — СПб.: ООО «МОДУС+», 1999. — 152 с.
  81. , С. В. Применение непрерывного вейвлет-преобразования для обработки широкополосных частотно-модулированных сигналов Текст. / С. В. Поршнев // Вычислительные методы и программирование. — 2003. — Т. 4. С 104—116.
  82. , П. В. Вейвлет-преобразоваиие и анализ временных рядов Текст. / П. В. Козлов, Б. Б. Чен // вестник КРСУ. — 2002. —Т2, № 2. — С. 64—69.
  83. , Д. М. Оценка тренда глобального потепления с помощью вейвлетного анализа Текст. / Д. М. Сонечкин, Н. М. Даценко, Н. Н. Иващенко // Изв. РАН. Физика атмосферы и океана. — 1997. — Т.ЗЗ. — № 2. — С.184— 94.
  84. Graps, A. An Introduction to Wavelets Text. / Amara Graps // IEEE Computational Science & Engineering, June 1995. — V.2, n.2. — P.50—61.
  85. Strang, G. Wavelet transforms versus Fourier Transforms Text. / G. Strang // Bull. Am. Math. Soc. — 1993. — V. 28. — P. 288—305.
  86. Mallat, S. G. A Wavelet Tour of Of Signal Processing Text. / S. G. Mallat. — San Diego, Academic Press, 1998. — 663 p.
  87. Г., Корн E. Справочник по математике для научных работников и инженеров Текст. / Г. Корн, Е. Кори. — М.: Наука, 1984. — 831 с.
  88. , А. Л. Земное эхо солнечных бурь Текст. / А. Л. Чижевский. — М.: Мысль, 1973. — 368 с.
  89. Малая математическая энциклопедия Текст. / Э. Фрид, И. Пастор, П. Ре-вес, И. Рейман, И. Ружа. — Будапешт, Венгрия: изд. Академии наук Венгрии. 1976. —698 с.
  90. Дьяконов, В. MATLAB. Обработка сигналов и изображений Текст.: специальный справочник / В. Дьяконов, И. Абраменкова. — СПб.: Питер, 2002.608 с.
  91. , Н. К. Основы теории вейвлетов. Вейвлеты в MATLAB Текст. / Н. К. Смоленков. — М.: ДМК Пресс, 2005. — 304 с.
  92. , Е. Г. Инженерные расчеты в Malhcad Текст.: учебный курс / Е. Г. Макаров. — СПб.: Митер, 2005. — 448 с.
  93. , Н. Формирование равномерно-темперированного строя Текст. / Н. Шерман. — М.: Музыка, 1964. — 214 с.
  94. , А. Основы темперации Текст. 7 А. Волконский. — М.: Композитор, 1998. — 91 с.
  95. , Н. Немецко-русский музыкальный словарь Текст. / Н. Михайлова, А. Кипнис, Д. Кипиис. — М.: Советский композитор, 1976. — 28 с.
  96. Symmetrien in der Musik. Fur ein Zusammenspiel von Musik und Mathema-tik Text. // Neue Zeitschrift fur Musik. — 1982. — Heft 12. — S. 12—19.
  97. Gotze, H. Musik und Mathematik Text. / Heinz Gotze, Rudolf Wille // Salz-burger Musikgesprach 1984 unter Vorsitz von Flerbert von Karajan. — Berlin, 1985.1. S.4—31.
  98. Wolfram, S. Theory and applications of cellular automata Text. / S. Wolfram. —World Scientific Pub Co Inc, 1986. — 570 p.
  99. , Ю. H. Методы и алгоритмы решения задач идентификации и прогнозирования в условиях неопределенности в иейросетевом логическом базисе Текст. / Ю. Н. Минаев, О. Ю. Филимонова, Лиес Бенамсур. — М.: Горячая линия-Телеком, 2003. — 205с.
  100. , Б. И. Синтезаторы частот Текст. / Б. И. Шахтарин. — М.: Горячая линия—Телеком, 2007. — 128 с.
  101. , В. И. Нейронные сети и их применение в системах управ-ления и связи Текст. / В. И. Комашинский. — М.: Горячая линия-Телеком, 2003. ¦— 205 с.
  102. Lippman, R. P., An introduction to computing with neural nets Text. / R. P. Lippman // IEEE ASS Magazine. — 1987. — Apr. — P. 4 — 22.
  103. Lindsey, C. Review of hardware neural networks: a user’s perspective / C. Lindsey, T Lindblad // Proc. of the Third Workshop on Neural Networks: From Biology to High Energy Physics, Isola d’Elba, Italy, September 26−30. — 1994.
  104. , А. Я. Delphi 7 Текст.: справочное пособие / А. Я. Архангельский. — М.: Бином, 2004. — 1023 с.
  105. , А. Ю. Основы аналогового и цифрового звука Текст. / А. Ю. Радзишевский. — М.: Вильяме, 2006. — 288 с.
  106. Kabal, P. Audio File Format Specifications Electronic resource. / P. Kabal.
  107. TSP Lab, ECE, Montreal: McGill University Press, 2006. — Access mode: http://bellatrix.ece.mcgill.ca/Documents/AudioFonTiats/INRS-Telecom/INRS-Tele-com.html, free.
  108. ГОСТ 7.1—2003. Библиографическая запись. Библиографическое описание Текст.: общие требования и правила составления. — Взамен ГОСТ 7.1— 84 — введ. 2004—07—01. — М.: Изд-во стандартов, 2004. — 81 с.
  109. , А. А. Справочник по высшей математике Текст. / А. А. Гусак, Г. М. Гусак, Е. А. Бричикова. — 2-е изд., стереотип. — М.: ТстраСистемс, 2000.640 с.
Заполнить форму текущей работой