Статистические методы для принятия решений.
Сравнение выборок
В педагогике и психологии минимально допустимым уровнем значимости признается 0,95. Это значит, что расчеты, основанные на математической теории вероятностей, дают основание утверждать, что при проведении таких же исследований по крайней мере в 95% будет получен такой же результат, возможно, лишь с несущественными отклонениями. В некоторых случаях удается получить и более высокие уровни… Читать ещё >
Статистические методы для принятия решений. Сравнение выборок (реферат, курсовая, диплом, контрольная)
Статистические гипотезы и критерии
Любое психолого-педагогическое исследование носит случайный характер, поэтому, когда говорят о гипотезе исследования, предполагают статистическую гипотезу.
Например:
Гипотеза 1. Успеваемость класса вероятностно зависит от уровня обучаемости учащихся.
Гипотеза 2. Усвоение начального курса математики не имеет существенных различий у учащихся, начавших обучение с 6 или 7 лет.
Гипотеза 3. Проблемное обучение в первом классе эффективнее по сравнению с традиционной методикой обучения в отношении общего развития учащихся.
Гипотезу обозначают буквой II (от лат. hypothesis — гипотеза).
Гипотеза, которая подвергается проверке, называется нулевой гипотезой (//о). Это основное проверяемое предположение, которое обычно формулируется как отсутствие различий, отсутствие влияние фактора, отсутствие эффекта, равенство нулю значений выборочных характеристик и т. п. Называется гипотеза нулевой, так как сопоставление значений сравниваемых признаков в данном случае равно нулю[1][2].
Примером нулевой гипотезы в педагогике является утверждение о том, что различие в результатах выполнения двумя группами учащихся одной и той же контрольной работы вызвано лишь случайными причинами.
Другое проверяемое предположение (не всегда строго противоположное или обратное первому) называется конкурирующей, или альтернативной, гипотезой (Н).
Так, для упомянутого выше примера гипотезы Н0 в педагогике одна из возможных альтернатив Н{ может быть определена так: уровни выполнения работы в двух группах учащихся различны, и это различие определяется особыми технологиями обучения.
Всякое правило, на основе которого отклоняется или принимается нулевая гипотеза, называется критерием для проверки данной гипотезы.
Статистический критерий (критерий) — это случайная величина, которая служит для проверки статистических гипотез.
Другими словами, статистический критерий — это решающее правило, обеспечивающее надежное поведение, т. е. принятие истинной и отклонение ложной гипотезы с высокой вероятностью.
Статистическая значимость (р-уровень значимости) — главный результат проверки статистических гипотез, количественная оценка надежности установленной связи.
Какой же уровень значимости можно признать удовлетворительным?
В педагогике и психологии минимально допустимым уровнем значимости признается 0,95. Это значит, что расчеты, основанные на математической теории вероятностей, дают основание утверждать, что при проведении таких же исследований по крайней мере в 95% будет получен такой же результат, возможно, лишь с несущественными отклонениями. В некоторых случаях удается получить и более высокие уровни значимости — 0,99 и даже 0,999.
Эти же уровни значимости можно записать в виде 0,05; 0,01 и 0,001.
Записывая уровень значимости 0,95, имеют в виду, что полученные параметры повторяются в 95% случаев, а записывая 0,05 — что в 5% случаев они не повторяются.
Уровень значимости выше (при равных других условиях), если:
- • величина связи больше;
- • больше изменчивость признака;
- • объем выборки больше.
При определении уровня значимости необходимо знать число степеней свободы, которым обладает данный коэффициент или параметр. Число независимых величин, участвующих в образовании того или иного параметра, называется числом степеней свободы данного параметра (k).
Число степеней свободы и способы его определения даются в окончательных формулах, которыми пользуется исследователь при статистической обработке своих материалов.
Выбор критерия определяется проверяемой статистической гипотезой. Любой критерий включает в себя:
- • формулу расчета эмпирического значения критерия по выборочным статистикам;
- • правило определения числа степеней свободы;
- • теоретическое распределение для данного числа степеней свободы;
- • правило соотнесения эмпирического значения критерия с теоретическим распределением для определения вероятности того, что гипотеза Я0 верна.
Для проверки статистических гипотез применяются различные критерии. При этом одному теоретическому распределению могут соответствовать разные формулы критериев — в зависимости от проверяемой статистической гипотезы. Но принцип проверки является общим для всего этого многообразия: вычисленное по формуле эмпирическое значение критерия сопоставляется с теоретическим распределением для заданного числа степеней свободы, что позволяет определить вероятность того, что гипотеза Я0 верна.
Рассмотрим правило отклонения Н0 и принятия Нх.
Если эмпирическое значение критерия равняется критическому значению, соответствующему р < 0,05, или превышает его, то Я0 отклоняется, но мы еще не можем определенно принять Н{.
Если эмпирическое значение критерия равняется критическому значению, соответствующему р < 0,01, или превышает его, то Я0 отклоняется и принимается Нх.
Для облегчения принятия решения можно рисовать ось значимости (рис. 7.1).
Рис. 7.1. Ось значимости для принятия решения Критические значения обозначены как Qo, 05 и Qo, oi> эмпирическое значение критерия — как Q.)MIIHp
Вправо от критического значения Qo 01 располагается зона значимости, т. е. все эмпирические значения, попадающие в эту часть и превышающие Qo, oi" являются безусловно значимыми, гипотеза Я0 отклоняется.
Влево от критического значения Qo 05 располагается зона незначимости, т. е. все эмпирические значения, попадающие в эту часть и не превышающие Qo 05> являются безусловно незначимыми, гипотеза Я0 принимается.
Между критическими значениями Оо. оз и Qo. 01 располагается зона неопределенности, здесь уже можно отклонить гипотезу Я0, но мы еще не можем принять гипотезу о достоверности Нх.
Тем не менее исследователь уже может указать, что различия достоверны с уровнем значимости р < 0,05. Для некоторых критериев устанавливаются промежуточные значения уровней значимости, например 0,025, как для %2-критерия Пирсона.
При выборе математико-статистического критерия нужно ориентироваться не только на шкалу измерения, но и на тип распределения данных, который получился в исследовании.
Параметрические критерии используются в том случае, когда распределение полученных данных рассматривается как нормальное (например, t-критерий Стьюдента).
Нормальное распределение называют параметрическим, потому что для построения и анализа кривой распределения достаточно иметь всего два параметра: среднее значение, которое соответствует длине перпендикуляра, восстановленного в центре кривой, а также среднее квадратичное отклонение, характеризующее рассеивание значений вокруг среднего значения[3].
Для непараметрических критериев тип распределения данных не имеет значения. Одним из таких критериев является U-критерий Манна — Уитни.
Если необходимо сравнить два числовых ряда (порядковая шкала), полученных на одной и той же выборке, то используют парный Т-критерий Вилкоксона.
Для определения значимости различий в проявлении признака в исследованиях часто используются такие показатели, как у}-критерий, критерий ф* — угловое преобразование Фишера и др.
Осуществляя поиск взаимосвязи показателей у одних и тех же испытуемых, следует использовать коэффициенты корреляции. Связь величин друг с другом и их зависимость часто характеризуется коэффициентом линейной корреляции Пирсона и коэффициентом ранговой корреляции Спирмена.
Важно обратить внимание на ограничения, которые имеет каждый критерий. Если один критерий не подходит для анализа имеющихся данных, всегда можно найти какой-либо другой, возможно, изменив тип представления самих данных.
- [1] Орлов Л. И. Прикладная статистика: учебник для вузов. М.: Экзамен, 2006. URL: http://orlovs.pp.ru.
- [2] Балинова В. С. Статистика в вопросах и ответах: учеб, пособие. М.: ТК Велби; Проспект, 2004. С. 49.
- [3] Психологическая диагностика: учебник для вузов / под ред. М. К. Акимовой, К. М. Гуревича. СПб.: Питер, 2006. С. 569.