Группировка количественных данных.
Таблицы, статистические ряды, графики распределения частот
Исследователя интересует также, какая часть значений данных лежит выше, а какая ниже данного значения. Для ответа на этот вопрос строится распределение кумулятивных (накопленных) частот (в табл. 26.3 представлены восходящие кумулятивные частоты, точно так же можно строить и нисходящие). Мы можем подсчитать проценты распределения частот, а также процентили — процент общего количества значений… Читать ещё >
Группировка количественных данных. Таблицы, статистические ряды, графики распределения частот (реферат, курсовая, диплом, контрольная)
Анализ количественных данных начинается с группировки. Наиболее распространенной формой группировки являются таблицы. В психологических исследованиях данные, как правило, представляются в виде итоговых таблиц, в первом столбце которых стоят имена испытуемых, а в следующих — показатели каждого испытуемого по соответствующей методике (табл. 26.1). При занесении таких таблиц в статистические пакеты обработки данных (например в SPSS) имена испытуемых, как правило, опускаются (при вводе в SPSS оставляют лишь нумерацию, поэтому имена необходимо сохранять в Excel), названия столбцов лучше обозначить так, чтобы можно было легко узнать, о показателях по какой методике идет речь (очень подробно о таблицах для SPSS см.: Кричевец, Корнеев, Рассказова, 2012).
Таблица 26.1
Итоговая таблица данных, полученных в результате применения нескольких методик; буквами (СК; ИТ, С и т. д.) условно обозначены методики, показатели, но которым заносятся в таблицу.
Имя испытуемого. | Переменные исследования. | ||||
СК. | ИТ, С. | ИТ, Р. | УЭ. | ||
1. Иванов А. Б. | |||||
2. Петрова В. Г. | |||||
п. Сидоров Д. Е. |
В таблицах может быть представлена и более сложная информация. Например, для представления данных в исследованиях, нацеленных на проверку причинно-следственных гипотез между варьирующимися переменными, часто используются многопольные таблицы, которые позволяют увидеть тенденцию изменения одних переменных под действием других. В табл. 26.2 приведены классические данные Ф. Гальтона, иллюстрирующие наличие положительной зависимости между ростом родителей.
Таблица 26.2
Данные Ф. Гальтона, показывающие зависимость роста детей от роста родителей.
Рост родителей. | Рост детей в дюймах. | Всего. | |||||||
в дюймах. | 60,7. | 62,7. | 64,7. | 66,7. | 68,7. | 7,7. | 72,7. | 74,7. | |
И. | |||||||||
Всего. |
и детей (пример взят из: Ермолаев-Томин, 2012, с. 45). В ячейках таблицы — количество случаев в выборке Гальтона, в которых наблюдается указанное соотношение роста родителей и ребенка. Как можно видеть, у родителей более высокого роста дети более высокие, у низкорослых родителей дети также низкого роста. Таблица имеет не только иллюстративное, но и аналитическое значение — она позволяет обнаруживать связи между варьирующимися признаками.
Особую форму группировки данных представляют статистические ряды. Числовые значения показателей расположены в них в определенном порядке. Очень часто данные упорядочивают в восходящем (от меньших значений к большим) или нисходящем (от больших значений к меньшим) порядке. Данные можно ранжировать: первому значению в упорядоченном ряду присваивается первый ранг, следующему — второй и т. д.; если в ряду несколько значений одинаковы, им приписываются скорректированные (или связанные) ранги ряда (сумма пунктов рангов делится на их число). Например:
Данные. | |||||||||
Ранги ряда. | (1). | (2). | (3). | (4). | (5). | (6). | (7). | (8). | (9). |
Скорректированные ранги. | 7,5. | 7,5. |
Вариационный ряд — это двойной ряд чисел, состоящий из значений самих признаков (вариант) и их частот. Ряд показывает, с какой частотой встречается то или иное значение (распределение частот). Например:
Варианты xi | ||||||||
Частоты вариант fi |
Это ранжированный вариационный ряд, поскольку в нем значения признака упорядочены по возрастанию. Такой ряд иллюстрирует закономерность варьирования признака. Его можно отобразить на графике, где по оси абсцисс откладываются значения данных, а по оси ординат — частота каждого значения. Именно так строится гистограмма — наиболее популярный тип столбчатого графика, иллюстрирующий распределение частот какоголибо признака.
Однако число значений может быть большим (более 20 единиц), и их будет трудно представить на оси абсцисс. Обычно в таких случаях диапазон значений делят на равные разрядные или классные интервалы и затем строят график.
Предположим, мы получили следующий набор из 72 показателей теста.
Показатели можно упорядочить в вариационный ряд и изобразить график распределения частот. Однако диапазон данных достаточно широк (от 8 до 48, всего 40 единиц), его неудобно изображать на оси абсцисс. Поэтому необходимо разделить данные на разрядные интервалы. Количество разрядных интервалов должно быть не меньше 10 и не больше 20, и их предпочитаемый размер может быть 1, 2, 3, 5, 10 (или кратное 10) единиц. Исследователю нужно выбрать размер разрядов так, чтобы общее количество разрядов было от 10 до 20. В нашем случае размер 3 дает 14 интервалов (40/3 + 1 = 14). Это значит, что мы должны разделить диапазон на 14 групп одинакового размера, каждая из которых содержит 3 единицы показателя (7—9, 10—12,…, 46—48). Если мы имеем дело не только с целыми числами, то нужно выстроить более точные интервалы. Обычно низшая граница интервала задается так, что она лежит на 0,5 единицы ниже низшего целого числа, а верхняя граница — на 0,49 единицы выше высшего целого числа в интервале. Таким образом, мы получаем следующие границы интервалов: 6,5—9,49; 9,5—12,49 и т. д. Данные заносятся в таблицу (табл. 26.3) и на ее основании строится график распределения частот.
Таблица 263
Границы разрядов, простые частоты, восходящие кумулятивные частоты, проценты и процентили для 72 показателей теста.
Границы показателей. | Точные границы разрядов. | Частоты. | Кумулятивные частоты. | Проценты. | Процентили. |
46−48. | 45,50−48,49. | 1,39. | |||
43−45. | 42,50−45,49. | 4,17. | 98,61. | ||
40−42. | 39,50−42,49. | 8,33. | 94,44. | ||
37−39. | 36,50−39,49. | 8,33. | 86,11. | ||
34−36. | 33,50−36,49. | 9,72. | 77,78. | ||
31−33. | 30,50−33,49. | 13,89. | 68,06. | ||
28−30. | 27,50−30,49. | И. | 15,28. | 54,17. | |
25−27. | 24,50−27,49. | 12,5. | 38,89. | ||
22−24. | 21,50−24,49. | 8,33. | 26,39. | ||
19−21. | 18,50−21,49. | 6,94. | 18,06. | ||
16−18. | 15,50−18,49. | 4,17. | 11,12. | ||
13−15. | 12,50−15,49. | 4,17. | 6,95. | ||
10−12. | 9,50−12,49. | 1,39. | 2,78. | ||
7−9. | 6,50−9,49. | 1,39. | 1,39. |
Исследователя интересует также, какая часть значений данных лежит выше, а какая ниже данного значения. Для ответа на этот вопрос строится распределение кумулятивных (накопленных) частот (в табл. 26.3 представлены восходящие кумулятивные частоты, точно так же можно строить и нисходящие). Мы можем подсчитать проценты распределения частот, а также процентили — процент общего количества значений, лежащих ниже данного пункта (процентили считаются только для восходящего ряда). Например, по таблице мы можем ответить на вопрос, как много показателей в выборке равны или меньше 24; 19 показателей из 72, или 26,39%, равны или меньше 24.
Три типа процентилей имеют свое обозначение и часто используются для описания количественных данных. Дециль (10-й нроцентиль) — значение показателя, ниже которого лежат 10% всех значений. Для данных в таблице 18 показатель 16 — точка на шкале распределения, ниже которой 8 из 72 значений; в терминах процентилей эта точка расположена несколько выше 10-го процентиля (11,12%). Медиана (50-й процентиль) — точка, ниже которой расположены 50% всех значений (по нашим данным это показатель 28, 39 из 72 значений лежат ниже этой точки, соответственно, она расположена немного выше медианы). Еще две точки — 25-й и 75-й процентили, называемые квартилями. Для наших данных это показатели 22 и 34 соответственно.
Сегодня все расчеты частот вариационного ряда, процентов, кумулятивных частот, процентилей производятся с помощью компьютерных программ. В статистических пакетах также есть функция построения гистограмм и других графиков (о применении статистических пакетов для обработки данных см. подробнее: Ермолаев-Томин, 2012; Кричевец, Корнеев, Рассказова, 2012; Наследов, 20 086).