Математическая модель и методика численных расчетов количества информации в наблюдениях
Здесь — упрощенная форма коэффициента эмерджентности А. Харкевича (10), предложенный автором в 1979 году и названный так в честь известного советского ученого, внесшего большой вклад в теорию информации, на работах которого основана излагаемая методика численных расчетов количества информации в наблюдениях. Ш — нормировочный коэффициент (Е.В. Луценко, 1979), преобразующий количество информации… Читать ещё >
Математическая модель и методика численных расчетов количества информации в наблюдениях (реферат, курсовая, диплом, контрольная)
Как говорилось выше, ключевым моментом предлагаемой модификации ВМНК является способ определения количества информации в наблюдениях. Поэтому далее в наиболее упрощенном виде приводится методика численных расчетов количества информации в наблюдениях, основанная на теории автоматизированного системно-когнитивного анализа (АСК-анализ) и реализованная в его программном инструментарии — интеллектуальной системе «Эйдос» [7, 17].
Для удобства рассмотрения введем следующие обозначения:
i — индекс значения аргумента;
j — индекс значения функции;
M — количество значений аргумента;
W — количество значений функции;
Nij — количество встреч j-го значения функции при i-м значении аргумента;
— суммарное количество наблюдений при i-м значении аргумента по всей выборке;
— суммарное количество наблюдений j-го значении функции по всей выборке;
— суммарное количество наблюдений по всей выборке;
Iij — количество информации в i-м значении аргумента о том, что функция имеет j-е значение, т. е. это количество информации в наблюдении (i, j);
Ш — нормировочный коэффициент (Е.В. Луценко, 1979), преобразующий количество информации в формуле А. Харкевича в биты и обеспечивающий для нее соблюдение принципа соответствия с формулой Р. Хартли в равновероятном детерминистском случае;
— безусловная относительная частота встречи i-го значения аргумента в обучающей выборке;
Pij — условная относительная частота встречи j-го значения функции при i-м значении аргумента. эйдос экранный математический информация Используя исходную выборку эмпирических наблюдений посчитаем матрицу абсолютных частот (таблица 1):
Таблица 1 — матрица абсолютных частот.
Классы. | Сумма. | |||||
j. | W. | |||||
Значения факторов. | ||||||
i. | ||||||
M. | ||||||
Суммарное количество признаков. | ||||||
Алгоритм формирования матриц абсолютных частот и условных и безусловных процентных распределений. Объекты обучающей выборки описываются векторами (массивами) имеющихся у них признаков:
Первоначально в матрице абсолютных частот все значения равны нулю. Затем организуется цикл по объектам обучающей выборки. Если у предъявленного объекта, относящегося к j-му классу, есть i-й признак, то:
(7).
На основе анализа матрицы частот (табл. 1) классы можно сравнивать по наблюдаемым частотам признаков только в том случае, если количество объектов по всем классам одинаково, как и суммарное количество признаков по классам. Если же они отличаются, то корректно сравнивать классы можно только по условным и безусловным относительным частотам (оценкам вероятностей) наблюдений признаков, посчитанных на основе матрицы частот (табл. 1) в соответствии с выражениями (8), в результате чего получается матрица условных и безусловных процентных распределений (табл. 2):
(8).
Таблица 2 — матрица условных и безусловных процентных распределений.
Классы. | Безусловная вероятность признака. | |||||
j. | W. | |||||
Значения факторов. | ||||||
i. | ||||||
M. | ||||||
Безусловная вероятность класса. | ||||||
Далее произведем расчет количества информации в наблюдениях в соответствии с выражением (9):
(9).
С учетом (8) преобразуем (9) к виду (10):
(10).
Здесь — упрощенная форма коэффициента эмерджентности А. Харкевича (10), предложенный автором в 1979 году и названный так в честь известного советского ученого, внесшего большой вклад в теорию информации, на работах которого основана излагаемая методика численных расчетов количества информации в наблюдениях.
(11).
Используя выражения (9) и (11) на основе таблицы 2 рассчитывается матрицу информативностей (таблица 3). Она также может быть получена: непосредственно из таблицы 1 с использованием выражений (10) и (11):
Таблица 3 — матрица информативностей.
Классы. | Значимость фактора. | |||||
j. | W. | |||||
Значения факторов. | ||||||
i. | ||||||
M. | ||||||
Степень редукции класса. | ||||||
Здесь — это среднее количество информации в i-м значении фактора:
Когда количество информации Iij > 0 — i-й фактор способствует переходу объекта управления в j-е состояние, когда Iij < 0 — препятствует этому переходу, когда же Iij = 0 — никак не влияет на это. В векторе i-го фактора (строка матрицы информативностей) отображается, какое количество информации о переходе объекта управления в каждое из будущих состояний содержится в том факте, что данный фактор действует. В векторе j-го состояния класса (столбец матрицы информативностей) отображается, какое количество информации о переходе объекта управления в соответствующее состояние содержится в каждом из факторов.
Таким образом, данная модель позволяет рассчитать, какое количество информации содержится в любом факте о наступлении любого события в любой предметной области, причем для этого не требуется повторности этих фактов и событий. Если данные повторности осуществляются и при этом наблюдается некоторая вариабельность значений факторов, обуславливающих наступление тех или иных событий, то модель обеспечивает многопараметрическую типизацию, т. е. синтез обобщенных образов классов или категорий наступающих событий с количественной оценкой степени и знака влияния на их наступление различных значений факторов. Причем эти значения факторов могут быть как количественными, так и качественными и измеряться в любых единицах измерения, в любом случае в модели оценивается количество информации, которое в них содержится о наступлении событий, переходе объекта управления в определенные состояния или, просто, о его принадлежности к тем или иным классам. Другие способы метризации приведены в работе [3].
Ниже на простом численном примере мы кратко рассмотрим технологию, позволяющую на практике и в любой предметной области посчитать, какое количество информации содержится в наблюдении. В связи с ограничениями на объем статьи автор не имеет возможности полностью раскрыть все позиции на приведенных ниже скриншотах и рисунках, т. е. фактически предполагается некоторое предварительное знакомство читателя с системой «Эйдос». Если же такое знакомство недостаточно полное, то автор отсылает автора к публикациям в списке литературы и к сайту: http://lc.kubagro.ru/.