Усложнение решающего правила при управлении в задачах распознавания образов
В этом случае усложнение решающего правила, определяемое числом k, не приведёт к снижению вероятности ошибки, если будет выполнено соотношение (7) после подстановки (8). Из этого условия можно найти такое значение k, выше которого теряет всякий смысл усложнение решающего правила, действующего в пространстве непрерывных признаков размерности n: Где k — число линейных решающих правил, составляющих… Читать ещё >
Усложнение решающего правила при управлении в задачах распознавания образов (реферат, курсовая, диплом, контрольная)
Усложнение решающего правила при управлении в задачах распознавания образов
Бекмуратов К.А.
Рассматривается один из возможных принципов усложнения решающего правила непрерывного пространства признаков, порождаемого опорными объектами конкретного образа. Предложена процедура нахождения предельного значения размерности признакового пространства, в котором возможно кусочно-линейное разделение образов и гарантированы требуемые качество и надежность распознавания, необходимые в системах управления.
В работе [1] описан метод формирования пространства непрерывных признаков, приводящий к безошибочному разделению образов. Введено понятие непрерывного признака и показано, что если набирать пространство только из определенных в [1] признаков, то можно достичь безошибочного разделения образов.
В данной работе так же, как и в [2], рассмотрим случай, когда в пространстве непрерывных признаков размерности n безошибочное разделение обучающей последовательности невозможно.
Пусть на некотором множестве мощности объектов определены подмножества при , представляющие собой образы на обучающей выборке
Допустим, что — подмножество на , соответствующее конкретному образу , а — подмножество на , соответствующее остальным образом .
Требуется с использованием обучающую выборки найти решающее правило , указывающее принадлежность любого объекта из одному
из заданных образов или с вероятностью ошибки, не превышающей , достигаемой с надежностью (1-), и определить целесообразности усложнения решающих правил при синтезе непрерывных признаковых пространств.
Если обучающая последовательность не может быть безошибочно разделима выбранным решающим правилом, то в общем случае справедлива теорема Вапника — Червоненкиса [3], смысл которой состоит в том, что если в n-мерном пространстве признаков решающее правило совершает ошибок при классификации обучающей последовательности длины , то с вероятностью можно утверждать, что вероятность ошибочной классификации составит величину, меньшую ,.
,.
где Nчисло всевозможных правил заданного класса, которое можно построить в пространстве заданной размерности.
Предположим, что в процессе обучения из последовательно поступивших непрерывных свойств относительно опорных объектов синтезирована подсистема непрерывных признаков. В зависимости от состава случайной и независимой выборки процесс обучения может остановиться при любом значении n, но если разделение конкретной обучающей выборки наступило в n-мерном пространстве, то число N всевозможных решающих правил в классе не должно превышать числа всех подмножеств множества, состоящего из элементов, т. е.
,
где
.
Логарифмируя получим.
(1).
Если учесть , то (1) принимает вид.
, (2).
где можно оценить в виде.
(3).
Подставляя (3) в (2), получаем.
(4).
Используя теорему Вапника-Червоненкиса [3], можно вычислить предельную размерность пространства.
, (5).
которая при заданных гарантирует требуемые e и h.
Пусть вычислено максимально допустимое значение размерности пространства в виде (5) и в этом пространстве фиксирована линейная решающая функция.
(6).
Далее, для того чтобы в процессе обучения синтезировать пространство, в котором линейное решающее правило (6) безошибочно разделило бы обучающую выборку длины , и при этом размерность пространства не превышала бы , необходимо на признаки наложить дополнительные требования. Зная предельную размерность простанства (8), можно оценить минимально допустимую разделяющую силу каждого выбираемого признака в виде.
.
Минимально допустимая разделяющая сила признака позволяет при синтезе непрерывного пространства использовать не все признаки, а выбирать только те, разделяющая сила которых удовлетворяет неравенству.
.
Допустим, что в синтезированном пространстве непрерывных признаков размерности n линейная решающая функция (9) совершает ошибки с частотой . Тогда рассмотрим соотношение.
, (7).
где N* - соответствует решающему правилу, работающему с частотой ошибки , N**- безошибочно разделяющая обучающая последовательность длины ..
С использованием этого соотношения, можно установить целесообразность усложнения решающего правила в случае, если в пространстве размерности n ещё не достигнуто безошибочное разделение обучающей выборки.
Известно [3], что если вместо линейного правила используется кусочно-линейное и оно безошибочно разделяет обучающую выборку длины l, то в соответствии (7) вместо n следует выбирать величину.
n=nk+k, (8).
где k — число линейных решающих правил, составляющих искомое кусочно — линейное правило. Используя соотношения (7) и (8), ответим на вопрос: стоит ли усложнять решение, если линейное правило в пространстве размерности n не обеспечивает безошибочного разделения обучающей выборки. Для этого нужно сделать подстановку:
, (9).
В этом случае усложнение решающего правила, определяемое числом k, не приведёт к снижению вероятности ошибки, если будет выполнено соотношение (7) после подстановки (8). Из этого условия можно найти такое значение k, выше которого теряет всякий смысл усложнение решающего правила, действующего в пространстве непрерывных признаков размерности n:
. (10).
Таким образом, если выбирать n и k согласно (5) и (10), то процедура позволяет, при синтезе пространства, использовать не все признаки, а выбирать только те, разделяющая сила которых позволяет при заданных обеспечить требуемые значения ε и η.
Список литературы
1. Бекмуратов. К. А. Процедура формирования непрерывных признаковых пространств при последовательном обучении. Узб. Журнал // «Проблемы информатики и энергетики». — 1994.-№ 4.-С.17−20.
2. К. А. Бекмуратов. Пошаговая проверка целесообразности усложнения решающего правила при последовательном обучении задаче распознавания. Узб. Журнал // «Проблемы информатики и энергетики». -2000. -№ 1. — С. 16−19.
3. Вапник В. Н., Червоненкис А. Я. Теория распознавания образов.(Статистические проблемы обучения). — М.: Наука, 1974. -С. 415.