Методы классификации следует выбирать исходя из условия минимизации потерь или вероятности неправильной классификации объектов [32].
Для формализации данной задачи введем понятие «функция потерь». Обозначим С (1/т) потери, связанные с ошибочным отнесением объекта m-го класса к классу / (при / = от, очевидно, С (1/т) = 0).
Предположение 6.1. Потери С (1/т) одинаковы для любой пары / и от, т. е.
(6.8).
Пусть в процессе классификации число ошибок составило v (//ot). Тогда потери, связанные с ошибочным отнесением объектов от-го класса к классу /, составляют v (//ot) C (//ot) по всем /, от = 1,2 р.
Общие потери С" (п — число наблюдений) при такой процедуре классификации составят.
Удельная характеристика потерь С при и -> ¦" равна.
где Д (//от) — вероятность отнесения объект класса от к классу — вероятность извлечения объекта класса от из общей совокупности объектов, или априорная вероятность (удельный вес) класса от.
Здесь предел понимается в смысле сходимости по вероятности относительных частот к соответвующим вероятностям:
Средние потери от неправильной классификации объектов от-го класса равны.
(6.9).
Средние удельные потери от неправильной классификации всех анализируемых объектов составят.
(6.10).
С учетом предположения (6.8) минимизация средних удельных потерь С эквивалентна вероятности правильной классификации объектов, равной.
С учетом соотношения (6.9) выражение (6.10) может быть преобразовано к виду.
При этом учитывалось, что для любого т. В этом случае при построении процедур классификации часто говорят не о потерях, а о вероятности неправильной классификации объектов.