Проверка статистических гипотез, применение универсальных методов теории вероятностей и математической статистики
Различия между зависимыми группами. Если вы хотите сравнить две переменные, относящиеся к одной и той же выборке, то обычно используется t-критерий для зависимых выборок. Альтернативными непараметрическими тестами являются: критерий знаков и критерий Вилкоксона парных сравнений. Если рассматриваемые переменные по природе своей категориальны или являются категоризованными, то подходящим будет… Читать ещё >
Проверка статистических гипотез, применение универсальных методов теории вероятностей и математической статистики (реферат, курсовая, диплом, контрольная)
Аннотация В данной работе проведена проверка совпадений карт на равномерность. Исследованы выборки жанров фильмов разных стран производства на предмет наличия влияния жанра на страну производства. Проверка выборки влияние участия в группе на тревогу перед ЕНТ.
Предложены способы применения показанных в данной работе методов на практике.
Annotation
In this paper, audited matches cards uniformity. Investigated sample different genres of films of the production for the presence of the influence of the genre on the country of production. Verification sampling influence participation in the group of anxiety before UNT.
The methods of application shown in this paper, the methods in practice.
- Введение
- 1. Эксперимент с картами
- 1.1 Проверка статистической гипотезы
- 1.2 Проверка статистической гипотезы в программе IBM SPSS Statistics
- 2. «Из всех искусств для нас важнейшим является кино!»
- 2.1 Проверка непараметрической гипотезы с помощью теста 5L2 для нескольких независимых выборок
- 2.2 Проверка непараметрической гипотезы с помощью теста 5L2 для нескольких независимых выборок в программе IBM SPSS Statistics
- 3. Тревога и ЕНТ
- 3.1 Проверка непараметрической гипотезы с помощью теста МакНемара для двух зависимых выборок
- 3.2 Проверка непараметрической гипотезы с помощью теста МакНемара для двух зависимых выборок в программе IBM SPSS Statistics
- Заключение
- Список использованной литературы
Приложение
Статистические представления являются важнейшей составляющей интеллектуального багажа современного человека. Они нужны в повседневной жизни, так как в нашу жизнь властно вошли выборы и референдумы, банковские кредиты и страховые полисы, таблицы занятости и диаграммы социологических опросов, нужны и для продолжения образования в таких областях, как социология, экономика, право, медицина, демография и других.
Таблицы и диаграммы широко используются в справочной литературе, в средствах массовой информации. Государственные и коммерческие структуры регулярно собирают обширные сведения об обществе и окружающей среде. Эти данные публикуют в виде таблиц и диаграмм.
Общество все глубже начинает изучать себя и стремится сделать прогнозы о самом себе и о явлениях природы, которые требуют представлений о вероятности. Каждый человек должен хорошо ориентироваться в потоке информации.
Мы должны научиться жить в вероятной ситуации. А это, значит, извлекать, анализировать и обрабатывать информацию, принимать обоснованные решения в разнообразных ситуациях со случайными исходами.
Актуальность проблемы в курсовой работе заключается в проверке гипотез о поведении совпадений в результате эксперимента с картами, о влиянии страны производителя фильма на просматриваемые жанры, и стоит ли абитуриентам вступать в группы эмоциональной поддержки для успешной сдачи ЕНТ.
Цель работы — продемонстрировать знание, умение и навыки проверки статистических гипотез и применения универсальных методов теории вероятностей и математической статистики.
Для достижения цели необходимо решить следующие задачи:
1) ознакомиться с механизмом проверки гипотезы для случая единственной выборки;
2) ознакомиться с механизмом проверки гипотезы для случая двух зависимых выборок;
3) ознакомиться с механизмом проверки гипотезы для случая нескольких независимых выборок;
4) сделать обоснованные выводы относительно результатов полученных после проверки статистических гипотез.
Объектами в данной работе будут являться карты, фильмы и абитуриенты.
Предметами в данной работе будут являться совпадения в результате эксперимента, страна производителя фильмов, тревожность перед сдачей ЕНТ.
Методы исследования, применяемые в данной курсовой работе:
1) критерий 5L2, позволяющий определить, равномерно ли распределены совпадения;
2) критерий 5L2, позволяющий определить, зависимость двух выборок;
3) тест МакНемара, позволяющий определить, зависимость двух выборок.
Основные положения работы, выносимые автором на защиту: совпадения в результате эксперимента не подчиняются нормальному и равномерному закону распределения; страна производства фильма не влияет на просматриваемые Абаем жанры фильмов; участие в работе группы влияет на уровень тревожности перед сдачей ЕНТ.
Практическая значимость заключается в том, что проверяемые мною гипотезы позволяют ознакомиться с характером совпадений, помощь в выборе фильма для просмотра, и узнать помогают ли группы эмоциональной поддержки абитуриентам перед ЕНТ.
Достоверность результатов работы достигается путем использования математических методов теории вероятности и математической статистики в рамках заданных погрешностей.
Объем работы — 25 с.
1. Эксперимент с картами
Игральные карты — прямоугольные листы из картона или тонкого пластика, используемые для карточных игр. Полный набор игральных карт для игры называется колода карт. В некоторых карточных играх, различные совпадения карт приводят к победам, такой игрой является покер.
Покер — карточная игра, цель которой — выиграть ставки, собрав как можно более высокую покерную комбинацию, используя 4 (старый классический вариант), или 5 карт, или вынудив всех соперников прекратить участвовать в игре. Игра идет с полностью или частично закрытыми картами. Конкретные правила могут варьироваться в зависимости от разновидности покера. Обобщающими элементами всех разновидностей покера являются комбинации и наличие торговли в процессе игры.
В покер играют разными колодами — по 32, 36 или 54 карты, но чаще всего используется стандартная колода из 52 листов с равнозначными мастями. Играет несколько участников. Значения карт располагаются по нисходящей от туза и далее. Туз может рассматриваться и как младшая карта для образования последовательности до 5 включительно, и как старшая. Игра состоит из нескольких фаз, то есть раундов торговли. Каждая из них начинается с раздачи новых карт. После раздачи карт каждый игрок имеет возможность сделать ставку или выйти из игры. Победителем считается тот, чья комбинация из пяти карт окажется лучшей, или тот, кто сможет вытеснить из игры других игроков с помощью ставок или блеф-ставок и останется один до вскрытия карт.
Эксперимент (от лат. experimentum — проба, опыт), также опыт, в научном методе — метод исследования некоторого явления в управляемых условиях. Отличается от наблюдения активным взаимодействием с изучаемым объектом.
Случайный эксперимент — математическая модель соответствующего реального эксперимента, результат которого невозможно точно предсказать. Математическая модель должна удовлетворять требованиям: она должна быть адекватна и адекватно описывать эксперимент; должна быть определена совокупность множества наблюдаемых результатов в рамках рассматриваемой математической модели при строго определенных фиксированных начальных данных, описываемых в рамках математической модели; должна существовать принципиальная возможность осуществления эксперимента со случайным исходом сколь угодное количество раз при неизменных входных данных; должно быть доказано требование или априори принята гипотеза о стохастической устойчивости относительной частоты для любого наблюдаемого результата, определенного в рамках математической модели.
Эксперимент — разложить карты мастей пики и крести по порядку (поочередно названия), карты красной масти перетасовать и выложить рядом. Событие — число совпадений названий.
Эксперименты проводились следующим образом: карты черных мастей положили следующим образом:
6¦, 6¦, 7¦, 7¦, 8¦, 8¦, 9¦, 9¦, 10¦, 10¦, В¦, В¦, Д¦, Д¦, К¦, К¦, Т¦, Т¦.
Красные карты протусовали и выложили рядом, посчитали совпадение названий. Например:
6¦, 6¦, 7¦, 7¦, 8¦, 8¦, 9¦, 9¦, 10¦, 10¦, В¦, В¦, Д¦, Д¦, К¦, К¦, Т¦, Т¦,
7¦, 9¦, 6¦, Д¦, 9¦, К¦, Т¦, К¦, 6¦, 10¦, 7¦, 10¦, 8¦, Т¦, В¦, В¦, 8¦, Д¦.
Результат эксперимента — 1 совпадение. Подобным образом было проведено 40 экспериментов, результаты совпадений представлены в следующей таблице 1.
Таблица 1
Результат экспериментов
№ эксперимента | События (Число совпадений) | № эксперимента | События (Число совпадений) | |
1.1 Проверка статистической гипотезы Внесем все данные в вычислительную среду IBM SPSS Statistics.
IBM SPSS Statistics — это программное обеспечение для статистического анализа, которое обеспечивает необходимые базовые функции для проведения анализа от начала до конца. Его легко использовать, и оно включает в себя ряд процедур и методов, помогающих увеличивать прибыль, обходить конкурентов, проводить исследования и принимать лучшие решения.
IBM SPSS Statistics предлагает серьезные средства статистического анализа на каждом шаге аналитического процесса таких как:
1) полноценный набор статистических процедур для проведения точного анализа;
2) встроенные методы быстрой и легкой подготовки данных для анализа;
3) тщательно разработанная функциональность для отчетов, обеспечивающая высокоэффективное создание диаграмм;
4) мощные возможности визуализации, которые ясно показывают смысл ваших результатов;
5) поддержка всех типов данных, включая очень большие наборы данных.
Рабочая область IBM SPSS Statistics показана на рисунке 1.
Рисунок 1. Рабочая область IBM SPSS Statistics
Приведем данные к удобному виду с помощью IBM SPSS Statistics в соответствии с рисунком 2.
Рисунок 2. Данные эксперимента в вычислительной среде SPSS
На основании данных этого опроса в программе SPSS был проведен частотный анализ. Результаты частотного анализа приведены на рисунке 3.
Рисунок 3. Частотный анализ По частотному анализу в данном случае видно, что совокупность данных мультимодальна, мода и медиана не равны, следовательно данные не подчиняются нормальному закону распределения. Проверим гипотезу на равномерный закон распределения. Но для того, чтобы удобно было производить проверку гипотезы необходимо чтобы закон распределения был равномерным.
Для проверки соответствия полученного закона распределения, равномерному будем использовать одновыборочный тест 5L2. Существуют два типа задач решаемых с помощью этого теста. Во-первых, сравнение эмпирического распределения качественных признаков с теоретическим. Во-вторых, сравнение между собой двух или более эмпирических распределений качественных признаков. В нашем случае будет использован первый тип.
Критерий согласия для проверки гипотезы о законе распределения исследуемой случайной величины. Во многих практических задачах точный закон распределения неизвестен. Поэтому выдвигается гипотеза о соответствии имеющегося эмпирического закона, построенного по наблюдениям, некоторому теоретическому. Данная гипотеза требует статистической проверки, по результатам которой будет либо подтверждена, либо опровергнута.
Пусть X — исследуемая случайная величина. Требуется проверить гипотезу H0 о том, что данная случайная величина подчиняется закону распределения F (x). Для этого необходимо произвести выборку из n независимых наблюдений и по ней построить эмпирический закон распределения F'(x). Для сравнения эмпирического и гипотетического законов используется правило, называемое критерием согласия. Одним из популярных является критерий согласия хи-квадрат К. Пирсона.
В нем вычисляется статистика хи-квадрат:
(1)
где Oj — наблюдаемые, или эмпирические, значения;
Ej — ожидаемые, или теоретические, значения;
k — количество категорий.
Если вычисленное значение статистики превосходит квантиль распределения 5L2 с k-p-1 степенями свободы для заданного уровня значимости, то гипотеза H0 отвергается. В противном случае она принимается на заданном уровне значимости. Здесь k — число наблюдений, p — число оцениваемых параметров закона распределения.
Что касается вида теоретического распределения, то в нашем случае используется равномерное распределение. Смысл его в том, что все результаты считаются равновероятными. В наших экспериментах было шесть исходов это 0, 1, 2, 3, 4 и 5, то есть событие равно 1/6=0,667. Иными словами если бы эмпирическое распределение результатов полностью совпало с теоретическим, то в каждую ячейку таблицы попало бы одинаковое число событий, равное 40/6=6,667. С учетом данного обстоятельства записывается окончательный вариант расчетной таблицы 2 для задачи.
Таблица 2
Расчетная таблица
События | |||||||
Теоретическая частота | 6,667 | 6,667 | 6,667 | 6,667 | 6,667 | 6,667 | |
Эмпирическая частота | |||||||
С учетом введенных обозначений перейдем от таблицы 2 к таблице 3.
Таблица 3
Распределение теоретических и эмпирических частот
Категории | |||||||
Ожидаемые и эмпирические частоты | Е1=6,667 О1=3 | Е2=6,667 О2=14 | Е3=6,667 О3=14 | Е4=6,667 О4=6 | Е5=6,667 О5=2 | Е6=6,667 О6=1 | |
Существует два вида статистических гипотез параметрические и непараметрические.
Предположение, которое касается неизвестного значения параметра распределения, входящего в некоторое параметрическое семейство распределений, называется параметрической гипотезой, другими словами можно сказать, если заранее известно или можно предположить о каком распределении будет идти речь, то такая гипотеза называется параметрической в противном случае непараметрической. Чаще всего гипотезы основанные на большой выборке будут параметрическими и иметь нормальный закон распределения.
Формируем нулевую и альтернативную гипотезы и зададим уровень значимости б =0,05.
Нулевая гипотеза имеет следующую формулировку: события является равномерными.
Тогда альтернативная гипотеза: cобытия неравномерны.
Затем вычисляется сумма отклонений между наблюдаемыми и теоретическими значениями по формуле (1).
Полученное значение—5L2эмпир сравнивается со значением 5L2критич, которое берется из приложения, А критических значений теста 5L2 в зависимости от выбранного уровня значимости б и числа степеней свободы df. df зависит от размера расчетной таблицы и равно =4.
Если—значение5L2эмпир—меньше—5L2критич,—то—нет—оснований—отвергнуть—нулевую—гипотезу.—Это—значит—что—нет—значимых—различий—между—эмпирическим—и—теоретическим—распределений.—Если—значение5L2эмпир—больше—или—равно—5L2критич,—то—нулевая—гипотеза—отвергается—и—принимается—альтернативная.
Высчитываем—5L2:
Из таблицы 1приложения находим, что для df=5 и б=0,05 5L2критич=11,07. Поскольку 5L2эмпир больше, чем 5L2критич, то нулевая гипотеза отклоняется и принимается альтернативная. Альтернативная гипотеза: cобытия неравномерны.
1.2 Проверка статистической гипотезы в программе IBM SPSS Statistics
Переменная — «Событие». Далее вводится данные переменной. Часть введенных данных показана на рисунке 4.
Рисунок 4. Совпадения После в непараметрические критерии выбираем критерий хи-квадрат, далее кнопка «ок». Результат теста 5L2 для единственной выборки представлен на рисунке 5.
Рисунок 5. Результат теста 5L2
2. «Из всех искусств для нас важнейшим является кино!»
Кинематограф — отрасль человеческой деятельности, заключающаяся в создании движущихся изображений. Иногда также упоминается как синематограф и кинематография. Кинематограф был изобретен в конце XIX века и стал крайне популярен в XX веке.
В понятие кинематографа входят киноискусство — вид современного изобразительного искусства, произведения которого создаются при помощи движущихся изображений, и киноиндустрия (кинопромышленность) — отрасль экономики, производящая кинофильмы, спецэффекты для кинофильмов, мультипликацию, и демонстрирующая эти произведения для зрителей. Произведения киноискусства создаются при помощи кинотехники. Изучением кинематографа занимается наука киноведение. Сами кинофильмы могут сниматься в различных жанрах игрового и документального кино.
Кинематограф занимает значительную часть современной культуры многих стран. Во многих странах киноиндустрия является значимой отраслью экономики. Производство кинофильмов сосредоточено на киностудиях. Фильмы демонстрируются в кинотеатрах, по телевидению, распространяются «на видео» в форме видеокассет и видеодисков, а с появлением скоростного интернета стало доступным скачивание кинофильмов в форме видеофайлов на специализированных сайтах или посредством пиринговых сетей, а также просмотр онлайн.
По существу, для каждого параметрического критерия имеется, по крайней мере, один непараметрический аналог. Эти критерии можно отнести к одной из следующих групп:
· критерии различия между группами (независимые выборки);
· критерии различия между группами (зависимые выборки);
· критерии зависимости между переменными.
Различия между независимыми группами. Обычно, когда имеются две выборки (например, мужчины и женщины), которые вы хотите сравнить относительно среднего значения некоторой изучаемой переменной, вы используете t-критерий для независимых выборок. Непараметрическими альтернативами этому критерию являются: критерий серий Вальда-Вольфовица, U-критерий Манна-Уитни и двухвыборочный критерий Колмогорова-Смирнова. Если вы имеете несколько групп, то можете использовать дисперсионный анализ. Его непараметрическими аналогами являются: ранговый дисперсионный анализ Краскела-Уоллиса и медианный тест.
Различия между зависимыми группами. Если вы хотите сравнить две переменные, относящиеся к одной и той же выборке, то обычно используется t-критерий для зависимых выборок. Альтернативными непараметрическими тестами являются: критерий знаков и критерий Вилкоксона парных сравнений. Если рассматриваемые переменные по природе своей категориальны или являются категоризованными, то подходящим будет критерий хи-квадрат Макнемара. Если рассматривается более двух переменных, относящихся к одной и той же выборке, то обычно используется дисперсионный анализ (ANOVA) с повторными измерениями. Альтернативным непараметрическим методом является ранговый дисперсионный анализ Фридмана или Q-критерий Кохрена. Q-критерий Кохрена используется также для оценки изменений частот (долей).
Зависимости между переменными. Для того, чтобы оценить зависимость (связь) между двумя переменными, обычно вычисляют коэффициент корреляции. Непараметрическими аналогами стандартного коэффициента корреляции Пирсона являются статистики Спирмена R, тау-Кендалла и коэффициент Гамма. Если две рассматриваемые переменные по природе своей категориальны, подходящими непараметрическими критериями для тестирования зависимости будут: хи-квадрат, фи-коэффициент, точный критерий Фишера. Дополнительно доступен критерий зависимости между несколькими переменными так называемый коэффициент конкордации Кендалла. Этот тест часто используется для оценки согласованности мнений независимых экспертов (судей), в частности, баллов, выставленных одному и тому же субъекту.
Описательные статистики. Если данные не являются нормально распределенными, а измерения, в лучшем случае, содержат ранжированную информацию, то вычисление обычных описательных статистик (например, среднего, стандартного отклонения) не слишком информативно. Например, в психометрии хорошо известно, что воспринимаемая интенсивность стимулов (например, воспринимаемая яркость света) представляет собой логарифмическую функцию реальной интенсивности (яркости, измеренной в объективных единицах — люксах). В данном примере, обычная оценка среднего (сумма значений, деленная на число стимулов) не дает верного представления о среднем значении действительной интенсивности стимула. Модуль Непараметрическая статистика вычисляет разнообразный набор мер положения (среднее, медиану, моду и т. д.) и рассеяния (дисперсию, гармоническое среднее, квартильный размах и т. д.), позволяющий представить более «полную картину» данных.
2.1 Проверка непараметрической гипотезы с помощью теста 5L2 для нескольких независимых выборок
Абай любитель кинофильмов и ему захотелось узнать — влияет ли страна производства фильма на просматриваемый им жанр фильма. Абай выбрал 100 фильмов просмотренных им за последние годы.
Для начала выберем страны производства. Выберем странами производства Россию, и иностранные страны (Европа и США). В таблице 4 представлены количество просмотренных жанров для каждого страны производства фильмов.
Таблица 4
Страны производства жанров фильмов
Жанр | Страна выпуска | Итого | ||
Российские фильмы | Иностранные фильмы | |||
Боевик | ||||
Фантастика | ||||
Комедия | ||||
Драма | ||||
Фэнтези | ||||
Итого: | ||||
В том случае, когда экспериментальные данные имеют неизвестный или отличный от нормального закон распределения, нельзя использовать методы проверки статистических гипотез, базирующиеся на свойствах и параметрах нормального распределения. Еще одним важным фактором, обеспечивающим надежную проверку статистических гипотез, является размер выборки. В данном случае размер выборки небольшой и закон распределения неизвестен, следовательно, будут использоваться непараметрические методы проверки гипотез.
Непараметрических методов проверки гипотез очень много, но не каждый может подойти к данному случаю. Тест хи-квадрат является универсальным тестам для данных, выраженных в шкале наименований представленных в виде таблицы размеров (kЧr), где k — число столбцов в ней, а r — число сток. Для корректного использования теста хи-квадрат достаточная по объему выборка. Если более 20% ожидаемых частот имеют значение меньше 5 или если хотя бы одна из ожидаемых частот имеет значение меньше 1, применять тест хи-квадрат нельзя. В данном случае это тест рассматривается в самом общем виде, когда число выборок произвольно. Общий вид таблицы показан на рисунке 6.
Рисунок 6. Общий вид таблицы Значение хи-квадрат вычисляется по формуле:
.
где Oij — наблюдаемые, или эмпирические значения;
Eij — ожидаемые, или теоретически, значения;
Eij рассчитывается по формуле:
Процедура проверки:
· выберем уровень значимости б =0,05;
· Н0: независимо от страны выпуска фильма просматриваемые жанры фильмов были одинаковы;
· Н1: от страны выпуска фильма зависит просматриваемые жанры фильмов.
Определим по приведенной выше формуле значения ожидаемых частот Eij, а затем вычислим значение 52.
Ожидаемые частоты Eij, представлены в таблице 5.
Таблица 5
Ожидаемые частоты Eij
Жанр | Страна выпуска | Итого | ||
Российские фильмы | Иностранные фильмы | |||
Боевик | (46· 18)/100=8,28 | (54· 18)/100=9,72 | ||
Фантастика | (46· 26)/100=11,96 | (54· 26)/100=14,04 | ||
Комедия | (46· 24)/100=11,04 | (54· 24)/100=12,96 | ||
Драма | (46· 18)/100=8,28 | (54· 18)/100=9,72 | ||
Фэнтези | (46· 14)/100=6,44 | (54· 14)/100=7,56 | ||
Итого: | ||||
Рассчитываем—5L2:
Находим степень свободы df=(k-1)(r-1)=(5−1)(2−1)=4.
В таблице 1 приложения находим критическое значение 5L2критич—для—уровня—значимости—б=_,_5—и—степеней—свободы—df=4—5L2критич=9,49. Поскольку 5L2эмпир (1,932)<5L2критич (9,49) нет оснований отвергнуть нулевую гипотезу. Независимо от страны выпуска фильма просматриваемые жанры фильмов были одинаковы.
2.2 Проверка непараметрической гипотезы с помощью теста 5L2 для нескольких независимых выборок в программе IBM SPSS Statistics
Создадим переменную «Жанр», и еще одну переменную «Страна производства», и поместим в переменные данные как показано на рисунке 7.
Рисунок 7. Ввод данных После чего в меню анализ выберем таблицы сопряженности. Перенесем переменные жанр и Страна производства в строки и колонки соответственно. В меню «Статистики» ставим галочку на значении Хи-квадрат и получаем решение. Результат вычисления критерия 52 показан на рисунке 8.
Рисунок 8. Результат вычисления критерия 52
3. Тревога и ЕНТ
Тревога — отрицательно окрашенная эмоция, выражающая ощущение неопределенности, ожидание негативных событий, трудноопределимые предчувствия. В отличие от причин страха, причины тревоги обычно не осознаются, но она предотвращает участие человека в потенциально вредном поведении, или побуждает его к действиям по повышению вероятности благополучного исхода событий. Тревога представляет собой расплывчатый, длительный и смутный страх по поводу будущих событий.
Единое Национальное Тестирование (ЕНТ) — система оценки знаний выпускников, применяемая в Республике Казахстан. От количества баллов, получаемых учеником на ЕНТ, зависят оценки итогового аттестата зрелости, а также возможность поступления в ВУЗы республики. Баллы ЕНТ также имеют значение при присуждении Президентской стипендии «Болашак» .
Аналогом ЕНТ для выпускников школ прошлых лет, выпускников колледжей и некоторых других групп абитуриентов выступает Комплексное Тестирование (КТ).
ЕНТ проходит в один этап и оценивается по 125-балльной шкале. Ученики в один день сдают пять предметов: математика, история Казахстана, русский язык, казахский язык, и предмет по выбору (история мира, иностранный язык, биология, география, химия, физика, литература) по 25 заданий на каждый. На проведение ЕНТ отводится 3,5 часа, то есть 210 минут. Минимальный проходной балл для поступающих в ВУЗы в 2014 году был 50 из 125 (ежегодно этот балл меняется), так как русский язык для казахских школ и казахский язык для русских школ не учитывается во время конкурса грантов.
ЕНТ является также серьезным психологическим испытанием.
Рустаму через неделю предстоит сдавать ЕНТ. Он хочет поступить в ВУЗ и очень тревожится, что плохо сдаст ЕНТ. Его пригласили в группу по эмоциональной подготовки к ЕНТ. Рустам склонен на участие, но он не уверен, сможет ли участие в группе снизить его тревогу. Он решил пообщаться с людьми, у которых был опыт участия в подобных группах. Расспросив 35 людей, Рустам получил следующие результаты:
1) из 20 людей, которые до начала участия в группе имели повышенный уровень тревожности, 6 человек сказали, что группа им не помогла. 14 человек сказали, что их тревога значительно снизилась;
2) из 15 человек, которые не имели проблем с тревожностью, 4 человека сказали, что после участие в группе их тревожность повысилась, остальные 11 человек не заметили каких-либо изменений.
Можно ли на основании полученных данных утверждать, что участи в работе группы влияет на тревожность?
3.1 Проверка непараметрической гипотезы с помощью теста МакНемара для двух зависимых выборок
Тест МакНемара применяется исключительно при наличии дихотомических переменных. При этом для двух зависимых переменных выясняется, происходят ли какие-либо изменения в структуре распределения их значений. В большинстве наблюдений сравнение проводится с учетом временного фактора по схеме «до — после» .
Представим результаты «до и после» в виде таблицы 2Ч2 как показано на рисунке 9.
Рисунок 9. Тревожность до и после участия в группе Где «+» — высокий уровень тревожности, «-» — низкий или нормальный уровень тревожности. Индикаторы изменений являются A и D, значения B и C отсутствие изменений.
Выберем уровень значимости б =0,05 и сформируем гипотезы.
Н0: участие в работе группы не влияет на уровень тревожности перед сдачей ЕНТ.
Н1: участие в работе группы влияет на уровень тревожности перед сдачей ЕНТ.
Построим таблицу 6 для полученных Рустамом данных.
Таблица 6
Значения тревожности до и после участия в работе группы
Тревожность «После» | ||||
Низкая | Высокая | |||
Тревожность «До» | Высокая | |||
Низкая | ||||
Имеются две альтернативы для возможных изменений: высокая тревожность после участия в группе понизится, низкая тревожность после участия в группе повысится. Обе альтернативы равновероятны (то есть p=q=0,5), в пользу одной из них получено, А результатов, в пользу другой — D результатов.
Необходимо определить вероятность получения такого результата.
Вероятность вычисляется по формуле Бернулли:
.
A=14, B=6, C=11, D=4, k=min (14,4)=4.
Подставим в формулу Бернулли необходимые значения.
С учетом того, что альтернативная гипотеза была сформулирована для двусторонней критической области, удваиваем полученное значение вероятности p=0,031.
Поскольку полученное значение вероятности меньше выбранного уровня значимости, нулевая гипотеза отвергается и принимается альтернативная. На уровне значимости б =0,05 можно считать, что участие в группе влияет на уровень тревожности перед сдачей ЕНТ.
Рустам так и не выяснил, в какую сторону изменилась тревожность. Тогда он сформулировал другую альтернативную гипотезу.
Н1: участие в работе группы снижает уровень тревожности перед сдачей ЕНТ.
По полученным ранее данным снова отвергаем нулевую гипотезу и принимаем альтернативную. Участие в работе группы снижает уровень тревожности перед сдачей ЕНТ.
В случае когда (A+D)>10, можно воспользоваться мене точной, но более удобной формулой, по которой вычисляется эмпирический показатель:
.
Полученное по этой формуле значение 52эмпир сравнивается с 52критич. Поскольку в тесте МакНемара всегда используются таблицы 2Ч2, число степеней свободы будет равно df=1.
Подставим в расчетную формулу 5L2 необходимые значения:
.
В таблице 1 приложения находим 52критич для df=1 и б=0,05: 52критич=3,84.
Поскольку 52эмпир (5,56)>52критич (3,84) нулевая гипотеза отвергается и принимается альтернативная. Участие в работе группы снижает уровень тревожности перед сдачей ЕНТ.
3.2 Проверка непараметрической гипотезы с помощью теста МакНемара для двух зависимых выборок в программе IBM SPSS Statistics
Создаем 2 переменные: «до» и «после». В переменные перенесем данные о тревожности, где 0 — низкая тревожность, 1 — высокая тревожность согласно рисунку 10.
Рисунок 10. Данные о тревожности Далее в непараметрические критерии выбираем для двух связных выборок. Предварительно поставив галочку на Критерий МакНемана, жмется кнопка «ок» .
Результат теста представлен на рисунке 11.
Рисунок 11. Результат теста МакНемара Поскольку полученное значение вероятности меньше выбранного уровня значимости (p=0,031<�б=0,05), нулевая гипотеза отвергается и принимается альтернативная. На уровне значимости б =0,05 можно считать, что участие в группе влияет на уровень тревожности перед сдачей ЕНТ.
Заключение
выборка совпадение статистический гипотеза По итогам данной курсовой работы было установлено, что, согласно критерию 52, совпадения карт не подчиняются равномерному с необходимым уровнем значимости. Проведенные эксперименты показывают, что совпадения не равномерны, и в полнее можно предположить, что совпадения карт могут носить случайный характер. Большое число совпадений в результате эксперимента не появлялось. Эксперимент показывает в играх, где число совпадений влияет на победу, то чаще всего будет выпадать малое число совпадений. Так как совпадения не равномерны, у каждого из игроков одинаковые шансы на победу.
Касательно сравнения фильмов разных стран производства, при помощи критерия 52 для двух независимых выборок было установлено, что страна производства не влияет на просматриваемые Абаем жанры фильмов, при уровне значимости. Можно предположить что, Абаю нравится просматривать фильмы определенного жанра чаще, чем других жанров.
Последняя нулевая гипотеза предполагала что, участие в группе не влияло на уровень тревожности. Тест МакНемара показал что, закономерности все такие есть, значит, участие в группе все-таки влияет на уровень тревожности.
1. Покер, http://lurkmore.to/ (Актуальная дата: 26.11.2014 г.).
2. Наследов А. SPSS Inc. Фирменное руководство пользователя по работе с модулем «Statistics Base». — М.: Питер, 2004. — 363 c.
3. Резник А. Д. Книга для тех, кто не любит статистику, но вынужден ею пользоваться. — СПб.: Речь, 2008. — 265 с.
4. Критерий 52, http://psystat.at.ua/publ/1−1-0−29 (Актуальная дата: 26.11.2014 г.).
5. Квантили распределения 52, http://dic.academic.ru/dic.nsf/ruwiki/292 943 (Актуальная дата: 26.11.2014 г.).
6. Непараметрическая статистика и подгонка распределения, http://www.novsu.ru/file/109 286 (Актуальная дата: 26.11.2014 г.).
7. Холлендер М., Вульф Д. А. Непараметрические методы статистики. — М.: Финансы и статистика, 1983. — 518 с.
8. Кинематограф, http://dic.academic.ru/dic.nsf/enc_tech/Кинематограф (Актуальная дата: 26.11.2014 г.).
9. Тюрин Ю. Н. Непараметрические методы статистики. — М.: Знание, 1978. — 64 с.
10. Параметрические критерии, http://uchebnikionline.com/statistika/ matematichna_statistika_-_rudenko_vm/statistichni_kriteriyi (Актуальная дата: 26.11.2014 г.).
11. Непараметрические критерии, http://www.statistica.ru/theory/ neparametricheskie-kriterii (Актуальная дата: 26.11.2014 г.).
12. Син Т. Занимательная статистика. — М.: Додэка XXI, 2010. — 224 с.
13. Щербатых Ю. В. Психология страха. — М.: Эксмо, 2007. — 273 с.
14. ЕНТ, http:// www.uchi.kz/ent (Актуальная дата: 26.11.2014 г.).
15. Тест МакНемара, http://dic.academic.ru/dic.nsf/socio/4201/тест (Актуальная дата: 26.11.2014 г.).
Приложение
Таблица 1
Критические значения для теста
k /б | 0,01 | 0,025 | 0,05 | 0,95 | 0,975 | 0,99 | |
6,6349 | 5,0239 | 3,8415 | 0,0039 | 0,001 | 0,0002 | ||
9,2103 | 7,3778 | 5,9915 | 0,1026 | 0,0506 | 0,0201 | ||
11,345 | 9,3484 | 7,8147 | 0,3519 | 0,2158 | 0,1148 | ||
13,277 | 11,143 | 9,4877 | 0,7107 | 0,4844 | 0,2971 | ||
15,086 | 12,833 | 11,071 | 1,1455 | 0,8312 | 0,5543 | ||
16,812 | 14,449 | 12,592 | 1,6354 | 1,2373 | 0,8721 | ||
18,475 | 16,013 | 14,067 | 2,1674 | 1,6899 | 1,239 | ||
20,09 | 17,535 | 15,507 | 2,7326 | 2,1797 | 1,6465 | ||
21,666 | 19,023 | 16,919 | 3,3251 | 2,7004 | 2,0879 | ||
23,209 | 20,483 | 18,307 | 3,9403 | 3,247 | 2,5582 | ||
24,725 | 21,92 | 19,675 | 4,5748 | 3,8158 | 3,0535 | ||
26,217 | 23,337 | 21,026 | 5,226 | 4,4038 | 3,5706 | ||
27,688 | 24,736 | 22,362 | 5,8919 | 5,0088 | 4,1069 | ||
29,141 | 26,119 | 23,685 | 6,5706 | 5,6287 | 4,6604 | ||
30,578 | 27,488 | 24,996 | 7,2609 | 6,2621 | 5,2294 | ||
28,845 | 26,296 | 7,9617 | 6,9077 | 5,8122 | |||
33,409 | 30,191 | 27,587 | 8,6718 | 7,5642 | 6,4078 | ||
34,805 | 31,526 | 28,869 | 9,3905 | 8,2308 | 7,0149 | ||
36,191 | 32,852 | 30,144 | 10,117 | 8,9065 | 7,6327 | ||
37,566 | 34,17 | 31,41 | 10,851 | 9,5908 | 8,2604 | ||
38,932 | 35,479 | 32,671 | 11,591 | 10,283 | 8,8972 | ||
40,289 | 36,781 | 33,924 | 12,338 | 10,982 | 9,5425 | ||
41,638 | 38,076 | 35,172 | 13,091 | 11,689 | 10,196 | ||
42,98 | 39,364 | 36,415 | 13,848 | 12,401 | 10,856 | ||
44,314 | 40,646 | 37,652 | 14,611 | 13,12 | 11,524 | ||
45,642 | 41,923 | 38,885 | 15,379 | 13,844 | 12,198 | ||
46,963 | 43,195 | 40,113 | 16,151 | 14,573 | 12,879 | ||
48,278 | 44,461 | 41,337 | 16,928 | 15,308 | 13,565 | ||
49,588 | 45,722 | 42,557 | 17,708 | 16,047 | 14,256 | ||
50,892 | 46,979 | 43,773 | 18,493 | 16,791 | 14,953 | ||