Анализ результатов и оценка качества работы метода голосования

РефератПомощь в написанииУзнать стоимостьмоей работы

В данной главе описаны механизмы реализации системы: предобработка изображения, вычисления значений признаков и классификация объектов. Рассмотрены работа функций библиотеки компьютерного зрения OpenCV, производящих предварительную обработку изображений и вычисление некоторых значений признаков, а также работа метода голосования. Из всех имеющихся функций по обработке изображений для программы… Читать ещё >

Анализ результатов и оценка качества работы метода голосования (реферат, курсовая, диплом, контрольная)

Оценка производительности — это экспериментальная оценка, которая измеряет способность метода классификации принимать верные решения, то есть вычисляет вероятность верной классификации.

Основными характеристиками качества классификации являются уровни ошибок первого и второго рода (error rates).

Ошибка первого рода — это «ложный пропуск» (false negative), когда интересующее нас событие ошибочно не обнаруживается.

Ошибка второго рода — «ложное обнаружение» (false positive), когда при отсутствии события ошибочно выносится решение о его присутствии.

Пусть количество объектов в тестовом наборе равно N, из них Np — кол-во «положительных» объектов, а Nn — кол-во объектов «отрицательных», где N=Nр+Nn. Пусть количество ложных пропусков FN, а ложных обнаружений FP, тогда несложно подсчитать количество верных пропусков и верных обнаружений (True Positives, True Negatives):

TP = Np — FN, (8).

TN = Nn — FP. (9).

С помощью этих величин рассчитываются нормированные уровни ошибок первого и второго рода (nFN, nFP), а также долю верно распознаваемых пропусков (nTN)) и обнаружений (nTP):

nFN=FN / Np * 100%, (10).

nFP = FP / Nn * 100%, (11).

nTN=TN / Nn * 100%, (12).

nTP=TP / Np * 100%. (13).

Данные величины наглядно отражают вероятность верного распознавания, так как не зависят в явном виде от количества объектов в тестовой выборке.

Также рассчитаем меру точности (precision) и меру отзыва (recall). Мера точности измеряет долю верных обнаружений среди всех обнаруженных объектов. Мера отзыва измеряет долю верного распознавания среди всех объектов интересующего нас класса и совпадает с nTP.

Precision=TP / (TP+FP) * 100%, (14).

Recall=TP / (TP+FN) * 100%. (15).

Проведем 2 эксперимента для одного набора данных. В первом случае оценим производительность распознавания методом голосования без опорных множеств на 12 начальных признаках (см. табл 2.1). Во втором случае оценим производительность метода с учетом опорного множества, которое определим с помощью корреляционного анализа. Были получены следующие результаты корреляции (См. табл. 3.3).

Исходя из полученных результатов было решено исключить 2 признака эксцентриситет (E) и Rmax/Rmin. Остальные признаки были сформированы в опорные множества по два признака в каждом следующим образом:

1. Область (A) и диаметр (D).
2. Периметр (Р) и компактность ©.
3. Максимальный радиус (Rmax) и средний радиус (Rср).
4. Минимальный радиус (Rmin) и отношение между Rmin и Rd (Rmin/Rd).
5. Дисперсия радиуса (Rd) и отношение между Rmax и Rd (Rmax/Rd).

Результаты тестирования для первого эксперимента распознавания методом голосования без опорных множеств на 12 начальных признаках по приведенным формулам представлены в табл. 3.4.

Результаты тестирования для второго экспериментов распознавания методом голосования на опорном множестве по приведенным формулам представлены в табл. 3.5.

Можно сделать вывод, что формирование признаков в опорные множества для метода голосования показывает более высокие результаты. В среднем доля по количеству ошибок первого рода составляет 12%. Средняя доля правильно распознаваемых изображений составляет 88%.

Таблица 3.3. Корреляционный анализ признаков.


	Class.	A.	P.	D.	Rmax.	Rmin.	Rcp.	Rd.	Rmax/Rmin.	Rmax/Rd.	Rmin/Rd.	C.
Class.	1,00.
A.	0,38.	1,00.
P.	0,22.	0,13.	1,00.
D.	0,34.	0,93.	0,09.	1,00.
Rmax.	0,26.	0,82.	0,35.	0,77.	1,00.
Rmin.	0,16.	0,76.	— 0,20.	0,71.	0,62.	1,00.
Rcp.	0,32.	0,93.	0,16.	0,88.	0,91.	0,82.	1,00.
Rd.	0,10.	— 0,11.	0,55.	— 0,14.	0,14.	— 0,60.	— 0,15.	1,00.
Rmax/Rmin.	0,05.	— 0,31.	0,47.	— 0,32.	— 0,12.	— 0,78.	— 0,39.	0,91.	1,00.
Rmax/Rd.	— 0,13.	— 0,42.	0,31.	— 0,48.	— 0,14.	— 0,65.	— 0,51.	0,62.	0,67.	1,00.
Rmin/Rd.	— 0,09.	0,31.	— 0,51.	0,29.	0,11.	0,82.	0,35.	— 0,86.	— 0,93.	— 0,58.	1,00.
C.	0,18.	0,01.	0,98.	— 0,02.	0,21.	— 0,28.	0,02.	0,54.	0,48.	0,37.	— 0,51.	1,00.
E.	0,00.	— 0,30.	— 0,22.	— 0,40.	— 0,58.	— 0,36.	— 0,57.	— 0,05.	0,15.	0,43.	— 0,07.	— 0,11.

Таблица 3.4. Оценка качества работы распознавания для 1 эксперимента.


	Alder.	Birch.	Hazel.	Mugwort.	Sweet Grass.	Весь набор данных.
Количество зерен.
Ошибка 1 рода (ложный пропуск, FN).
Ошибка 2 рода (ложное обнаружение, FP).
Количество «положительных» (Np).
Количество «отрицательных» (Nn).
Количество верных пропусков (TN).
Количество верных обнаружений (TP).
Нормированный уровень ошибок первого рода (nFN).	13%.	25%.	38%.	13%.	13%.	20%.
Нормированный уровень ошибок второго рода (nFP).	25%.	0%.	25%.	50%.	50%.	30%.
Доля верно распознаваемых пропусков (nTN).	75%.	100%.	75%.	50%.	50%.	70%.
Доля верно распознаваемых обнаружений (nTP).	88%.	75%.	63%.	88%.	88%.	80%.
Precision.	88%.	100%.	83%.	78%.	78%.	84%.
Recall.	88%.	75%.	63%.	88%.	88%.	80%.

Таблица 3.5. Оценка качества работы распознавания для 2 эксперимента.


	Alder.	Birch.	Hazel.	Mugwort.	Sweet Grass.	Весь набор данных.
Количество зерен.
Ошибка 1 рода (ложный пропуск, FN).
Ошибка 2 рода (ложное обнаружение, FP).
Количество «положительных» (Np).
Количество «отрицательных» (Nn).
Количество верных пропусков (TN).
Количество верных обнаружений (TP).
Нормированный уровень ошибок первого рода (nFN).	0%.	25%.	25%.	13%.	0%.	12%.
Нормированный уровень ошибок второго рода (nFP).	25%.	0%.	25%.	50%.	0%.	20%.
Доля верно распознаваемых пропусков (nTN).	75%.	100%.	75%.	50%.	100%.	80%.
Доля верно распознаваемых обнаружений (nTP).	100%.	75%.	75%.	88%.	100%.	88%.
Precision.	89%.	100%.	86%.	78%.	100%.	90%.
Recall.	100%.	75%.	75%.	88%.	100%.	88%.

На этапе предобработки изображений на изображениях верно детектируются контуры 100% пыльцевых зерен.

На обучение на 120 изображениях уходит в среднем от 1,9 до 2 секунд.

На распознавание 10 изображений примерно 1 секунда.

Распознавание методом голосования показывает результаты выше среднего. В среднем, верно распознаются 88% пыльцевых зерен. Доля ошибок второго рода составляет 20%, доля ошибок первого рода — 12%.

Подавляющее большинство случаев неправильной классификации приходится на пыльцевые зерна имеющие схожую форму и размер.

Показать весь текст

Заполнить форму текущей работой

Другие работы

Лазерные принтеры. Информатика

Формирование скрытого изображения происходит при освещении фотопроводящего слоя (например, селенового барабана). Электропроводность засвеченных участков резко увеличивается, в результате чего они теряют электрический заряд и на слое получается скрытое электростатическое изображение. Проявление таких изображений на поверхности селенового барабана выполняется с помощью специального размельченного…

Реферат