Анализ результатов и оценка качества работы метода голосования
В данной главе описаны механизмы реализации системы: предобработка изображения, вычисления значений признаков и классификация объектов. Рассмотрены работа функций библиотеки компьютерного зрения OpenCV, производящих предварительную обработку изображений и вычисление некоторых значений признаков, а также работа метода голосования. Из всех имеющихся функций по обработке изображений для программы… Читать ещё >
Анализ результатов и оценка качества работы метода голосования (реферат, курсовая, диплом, контрольная)
Оценка производительности — это экспериментальная оценка, которая измеряет способность метода классификации принимать верные решения, то есть вычисляет вероятность верной классификации.
Основными характеристиками качества классификации являются уровни ошибок первого и второго рода (error rates).
Ошибка первого рода — это «ложный пропуск» (false negative), когда интересующее нас событие ошибочно не обнаруживается.
Ошибка второго рода — «ложное обнаружение» (false positive), когда при отсутствии события ошибочно выносится решение о его присутствии.
Пусть количество объектов в тестовом наборе равно N, из них Np — кол-во «положительных» объектов, а Nn — кол-во объектов «отрицательных», где N=Nр+Nn. Пусть количество ложных пропусков FN, а ложных обнаружений FP, тогда несложно подсчитать количество верных пропусков и верных обнаружений (True Positives, True Negatives):
TP = Np — FN, (8).
TN = Nn — FP. (9).
С помощью этих величин рассчитываются нормированные уровни ошибок первого и второго рода (nFN, nFP), а также долю верно распознаваемых пропусков (nTN)) и обнаружений (nTP):
nFN=FN / Np * 100%, (10).
nFP = FP / Nn * 100%, (11).
nTN=TN / Nn * 100%, (12).
nTP=TP / Np * 100%. (13).
Данные величины наглядно отражают вероятность верного распознавания, так как не зависят в явном виде от количества объектов в тестовой выборке.
Также рассчитаем меру точности (precision) и меру отзыва (recall). Мера точности измеряет долю верных обнаружений среди всех обнаруженных объектов. Мера отзыва измеряет долю верного распознавания среди всех объектов интересующего нас класса и совпадает с nTP.
Precision=TP / (TP+FP) * 100%, (14).
Recall=TP / (TP+FN) * 100%. (15).
Проведем 2 эксперимента для одного набора данных. В первом случае оценим производительность распознавания методом голосования без опорных множеств на 12 начальных признаках (см. табл 2.1). Во втором случае оценим производительность метода с учетом опорного множества, которое определим с помощью корреляционного анализа. Были получены следующие результаты корреляции (См. табл. 3.3).
Исходя из полученных результатов было решено исключить 2 признака эксцентриситет (E) и Rmax/Rmin. Остальные признаки были сформированы в опорные множества по два признака в каждом следующим образом:
- 1. Область (A) и диаметр (D).
- 2. Периметр (Р) и компактность ©.
- 3. Максимальный радиус (Rmax) и средний радиус (Rср).
- 4. Минимальный радиус (Rmin) и отношение между Rmin и Rd (Rmin/Rd).
- 5. Дисперсия радиуса (Rd) и отношение между Rmax и Rd (Rmax/Rd).
Результаты тестирования для первого эксперимента распознавания методом голосования без опорных множеств на 12 начальных признаках по приведенным формулам представлены в табл. 3.4.
Результаты тестирования для второго экспериментов распознавания методом голосования на опорном множестве по приведенным формулам представлены в табл. 3.5.
Можно сделать вывод, что формирование признаков в опорные множества для метода голосования показывает более высокие результаты. В среднем доля по количеству ошибок первого рода составляет 12%. Средняя доля правильно распознаваемых изображений составляет 88%.
Таблица 3.3. Корреляционный анализ признаков.
Class. | A. | P. | D. | Rmax. | Rmin. | Rcp. | Rd. | Rmax/Rmin. | Rmax/Rd. | Rmin/Rd. | C. | ||
Class. | 1,00. | ||||||||||||
A. | 0,38. | 1,00. | |||||||||||
P. | 0,22. | 0,13. | 1,00. | ||||||||||
D. | 0,34. | 0,93. | 0,09. | 1,00. | |||||||||
Rmax. | 0,26. | 0,82. | 0,35. | 0,77. | 1,00. | ||||||||
Rmin. | 0,16. | 0,76. | — 0,20. | 0,71. | 0,62. | 1,00. | |||||||
Rcp. | 0,32. | 0,93. | 0,16. | 0,88. | 0,91. | 0,82. | 1,00. | ||||||
Rd. | 0,10. | — 0,11. | 0,55. | — 0,14. | 0,14. | — 0,60. | — 0,15. | 1,00. | |||||
Rmax/Rmin. | 0,05. | — 0,31. | 0,47. | — 0,32. | — 0,12. | — 0,78. | — 0,39. | 0,91. | 1,00. | ||||
Rmax/Rd. | — 0,13. | — 0,42. | 0,31. | — 0,48. | — 0,14. | — 0,65. | — 0,51. | 0,62. | 0,67. | 1,00. | |||
Rmin/Rd. | — 0,09. | 0,31. | — 0,51. | 0,29. | 0,11. | 0,82. | 0,35. | — 0,86. | — 0,93. | — 0,58. | 1,00. | ||
C. | 0,18. | 0,01. | 0,98. | — 0,02. | 0,21. | — 0,28. | 0,02. | 0,54. | 0,48. | 0,37. | — 0,51. | 1,00. | |
E. | 0,00. | — 0,30. | — 0,22. | — 0,40. | — 0,58. | — 0,36. | — 0,57. | — 0,05. | 0,15. | 0,43. | — 0,07. | — 0,11. | |
Таблица 3.4. Оценка качества работы распознавания для 1 эксперимента.
Alder. | Birch. | Hazel. | Mugwort. | Sweet Grass. | Весь набор данных. | ||
Количество зерен. | |||||||
Ошибка 1 рода (ложный пропуск, FN). | |||||||
Ошибка 2 рода (ложное обнаружение, FP). | |||||||
Количество «положительных» (Np). | |||||||
Количество «отрицательных» (Nn). | |||||||
Количество верных пропусков (TN). | |||||||
Количество верных обнаружений (TP). | |||||||
Нормированный уровень ошибок первого рода (nFN). | 13%. | 25%. | 38%. | 13%. | 13%. | 20%. | |
Нормированный уровень ошибок второго рода (nFP). | 25%. | 0%. | 25%. | 50%. | 50%. | 30%. | |
Доля верно распознаваемых пропусков (nTN). | 75%. | 100%. | 75%. | 50%. | 50%. | 70%. | |
Доля верно распознаваемых обнаружений (nTP). | 88%. | 75%. | 63%. | 88%. | 88%. | 80%. | |
Precision. | 88%. | 100%. | 83%. | 78%. | 78%. | 84%. | |
Recall. | 88%. | 75%. | 63%. | 88%. | 88%. | 80%. | |
Таблица 3.5. Оценка качества работы распознавания для 2 эксперимента.
Alder. | Birch. | Hazel. | Mugwort. | Sweet Grass. | Весь набор данных. | ||
Количество зерен. | |||||||
Ошибка 1 рода (ложный пропуск, FN). | |||||||
Ошибка 2 рода (ложное обнаружение, FP). | |||||||
Количество «положительных» (Np). | |||||||
Количество «отрицательных» (Nn). | |||||||
Количество верных пропусков (TN). | |||||||
Количество верных обнаружений (TP). | |||||||
Нормированный уровень ошибок первого рода (nFN). | 0%. | 25%. | 25%. | 13%. | 0%. | 12%. | |
Нормированный уровень ошибок второго рода (nFP). | 25%. | 0%. | 25%. | 50%. | 0%. | 20%. | |
Доля верно распознаваемых пропусков (nTN). | 75%. | 100%. | 75%. | 50%. | 100%. | 80%. | |
Доля верно распознаваемых обнаружений (nTP). | 100%. | 75%. | 75%. | 88%. | 100%. | 88%. | |
Precision. | 89%. | 100%. | 86%. | 78%. | 100%. | 90%. | |
Recall. | 100%. | 75%. | 75%. | 88%. | 100%. | 88%. | |
В данной главе описаны механизмы реализации системы: предобработка изображения, вычисления значений признаков и классификация объектов. Рассмотрены работа функций библиотеки компьютерного зрения OpenCV, производящих предварительную обработку изображений и вычисление некоторых значений признаков, а также работа метода голосования. Из всех имеющихся функций по обработке изображений для программы были выбраны в основном самые эффективные.
На этапе предобработки изображений на изображениях верно детектируются контуры 100% пыльцевых зерен.
На обучение на 120 изображениях уходит в среднем от 1,9 до 2 секунд.
На распознавание 10 изображений примерно 1 секунда.
Распознавание методом голосования показывает результаты выше среднего. В среднем, верно распознаются 88% пыльцевых зерен. Доля ошибок второго рода составляет 20%, доля ошибок первого рода — 12%.
Подавляющее большинство случаев неправильной классификации приходится на пыльцевые зерна имеющие схожую форму и размер.