Помощь в написании студенческих работ
Антистрессовый сервис

Задача обнаружения кишечной палочки

РефератПомощь в написанииУзнать стоимостьмоей работы

Для оценки полученных результатов была выполнена проверка критерия Стьюдента посредством проведения Т-теста, который показывает статистическую значимость результатов работы алгоритмов. Результаты теста представлены в Таблице 4. Пропущенные значения атрибутов: Нет На выборке при помощи методов, выбранных ранее, и их ансамблей было протестировано решение задачи классификации. В Таблице 3 приведены… Читать ещё >

Задача обнаружения кишечной палочки (реферат, курсовая, диплом, контрольная)

Имеется набор данных, связанный с местами скопления белков. Необходимо классифицировать на основании значений атрибутов к какой части кишечной палочки относится конкретный образец.

Характеристики базы данных:

Количество экземпляров: 336;

Количество атрибутов: 7 атрибутов, 1 выходной атрибут;

Входные переменные:

Имена последовательностей: инвентарный номер для базы данных SWISS-PROT;

mcg: метод McGeoch для распознавания сигнальной последовательности;

gvh: метод Heijne для распознавания сигнальной последовательности;

lip: оценка консенсусной последовательности Heijne;

chg: наличие заряда на конце предсказанных N-липопротеинов. Бинарный атрибут;

CBC: оценка дискриминантного анализа аминокислот наружной мембраны и периплазматических белков;

ALM1: прогнозируемая область охвата ALOM мембраны;

ALM 2: оценка ALOM программы после исключения предполагаемых расщепляемых областей сигнала из последовательности.

Выходные переменные:

cp (цитоплазма);

im (внутренняя мембрана без сигнальной последовательности);

pp (перисплазма);

imU (внутренняя мембрана, последовательность нерасщепляемого сигнала);

om (внешняя мембрана);

omL (внешняя мембрана липопротеинов);

imL (внутренняя липопротеидная мембрана);

imS (внутренняя мембрана, последовательность расщепляемого сигнала).

Пропущенные значения атрибутов: Нет На выборке при помощи методов, выбранных ранее, и их ансамблей было протестировано решение задачи классификации. В Таблице 3 приведены результаты тестирования.

Таблица 3. Точность классификации для выборки ECOLI.

Метод.

Точность решения задачи, %.

Без оптимизации.

С оптимизацией.

Ансамбли методов.

Все.

Три худших.

Два лучших.

NN.

81,19.

87.13.

87,13.

DT + NBK + CBR.

NN + k-NN.

k-NN.

80,20.

88,12.

85,15.

84,16.

DT.

64,36.

79,21.

NBK.

85,15.

CBR.

83,17.

NN — это искусственные нейронные сети, k-NN — метод k-ближайших соседей, DT — деревья принятия решений, NBK — наивный Байесовский классификатор (Кернел), CBR — классификация посредством регрессии.

Для оценки полученных результатов была выполнена проверка критерия Стьюдента посредством проведения Т-теста, который показывает статистическую значимость результатов работы алгоритмов. Результаты теста представлены в Таблице 4.

Таблица 4. T-Test Стьюдента для выборки ECOLI

Метод.

DT (0.843 +/- 0.098).

k-NN (0.884 +/- 0.101).

NBK (0.916 +/- 0.089).

NN (0.866 +/- 0.095).

CBR (0.851 +/- 0.097).

DT.

0.143.

0.004.

0.362.

0.767.

k-NN.

0.266.

0.488.

0.260.

NBK.

0.046.

0.009.

NN.

0.535.

CBR.

Из результатов тестирования видно, что высокую эффективность по критерию Стьюдента имеют все методы. Значение критерия Стьюдента для результатов «Байесовский классификатор — k-ближайших соседей», «Нейронная сеть — Деревья принятия решений», «Нейронная сеть — Байесовский классификатор», «Классификация посредством регрессии — Деревья принятия решений», «Классификация посредством регрессии — k-ближайших соседей» и «Классификация посредством регрессии — Нейронная сеть» больше, чем 0,05. Это указывает на то, что разница между значениями не существенна.

Из ансамблей наилучшие результаты дал ансамбль из всех методов. Интересно, что ансамбль из трех худших алгоритмов дал более высокий результат, чем ансамбль из двух лучших.

Это можно объяснить лишь тем, что, несмотря на то, что лучшие методы ошибаются реже, область их ошибок совпадает, в отличие от худших методов.

Показать весь текст
Заполнить форму текущей работой