Помощь в написании студенческих работ
Антистрессовый сервис

Группировка количественных данных. 
Таблицы, статистические ряды, графики распределения частот

РефератПомощь в написанииУзнать стоимостьмоей работы

Исследователя интересует также, какая часть значений данных лежит выше, а какая ниже данного значения. Для ответа на этот вопрос строится распределение кумулятивных (накопленных) частот (в табл. 26.3 представлены восходящие кумулятивные частоты, точно так же можно строить и нисходящие). Мы можем подсчитать проценты распределения частот, а также процентили — процент общего количества значений… Читать ещё >

Группировка количественных данных. Таблицы, статистические ряды, графики распределения частот (реферат, курсовая, диплом, контрольная)

Анализ количественных данных начинается с группировки. Наиболее распространенной формой группировки являются таблицы. В психологических исследованиях данные, как правило, представляются в виде итоговых таблиц, в первом столбце которых стоят имена испытуемых, а в следующих — показатели каждого испытуемого по соответствующей методике (табл. 26.1). При занесении таких таблиц в статистические пакеты обработки данных (например в SPSS) имена испытуемых, как правило, опускаются (при вводе в SPSS оставляют лишь нумерацию, поэтому имена необходимо сохранять в Excel), названия столбцов лучше обозначить так, чтобы можно было легко узнать, о показателях по какой методике идет речь (очень подробно о таблицах для SPSS см.: Кричевец, Корнеев, Рассказова, 2012).

Таблица 26.1

Итоговая таблица данных, полученных в результате применения нескольких методик; буквами (СК; ИТ, С и т. д.) условно обозначены методики, показатели, но которым заносятся в таблицу.

Имя испытуемого.

Переменные исследования.

СК.

ИТ, С.

ИТ, Р.

УЭ.

1. Иванов А. Б.

2. Петрова В. Г.

п. Сидоров Д. Е.

В таблицах может быть представлена и более сложная информация. Например, для представления данных в исследованиях, нацеленных на проверку причинно-следственных гипотез между варьирующимися переменными, часто используются многопольные таблицы, которые позволяют увидеть тенденцию изменения одних переменных под действием других. В табл. 26.2 приведены классические данные Ф. Гальтона, иллюстрирующие наличие положительной зависимости между ростом родителей.

Таблица 26.2

Данные Ф. Гальтона, показывающие зависимость роста детей от роста родителей.

Рост родителей.

Рост детей в дюймах.

Всего.

в дюймах.

60,7.

62,7.

64,7.

66,7.

68,7.

7,7.

72,7.

74,7.

И.

Всего.

и детей (пример взят из: Ермолаев-Томин, 2012, с. 45). В ячейках таблицы — количество случаев в выборке Гальтона, в которых наблюдается указанное соотношение роста родителей и ребенка. Как можно видеть, у родителей более высокого роста дети более высокие, у низкорослых родителей дети также низкого роста. Таблица имеет не только иллюстративное, но и аналитическое значение — она позволяет обнаруживать связи между варьирующимися признаками.

Особую форму группировки данных представляют статистические ряды. Числовые значения показателей расположены в них в определенном порядке. Очень часто данные упорядочивают в восходящем (от меньших значений к большим) или нисходящем (от больших значений к меньшим) порядке. Данные можно ранжировать: первому значению в упорядоченном ряду присваивается первый ранг, следующему — второй и т. д.; если в ряду несколько значений одинаковы, им приписываются скорректированные (или связанные) ранги ряда (сумма пунктов рангов делится на их число). Например:

Данные.

Ранги ряда.

(1).

(2).

(3).

(4).

(5).

(6).

(7).

(8).

(9).

Скорректированные ранги.

7,5.

7,5.

Вариационный ряд — это двойной ряд чисел, состоящий из значений самих признаков (вариант) и их частот. Ряд показывает, с какой частотой встречается то или иное значение (распределение частот). Например:

Варианты xi

Частоты вариант fi

Это ранжированный вариационный ряд, поскольку в нем значения признака упорядочены по возрастанию. Такой ряд иллюстрирует закономерность варьирования признака. Его можно отобразить на графике, где по оси абсцисс откладываются значения данных, а по оси ординат — частота каждого значения. Именно так строится гистограмма — наиболее популярный тип столбчатого графика, иллюстрирующий распределение частот какоголибо признака.

Однако число значений может быть большим (более 20 единиц), и их будет трудно представить на оси абсцисс. Обычно в таких случаях диапазон значений делят на равные разрядные или классные интервалы и затем строят график.

Предположим, мы получили следующий набор из 72 показателей теста.

Показатели можно упорядочить в вариационный ряд и изобразить график распределения частот. Однако диапазон данных достаточно широк (от 8 до 48, всего 40 единиц), его неудобно изображать на оси абсцисс. Поэтому необходимо разделить данные на разрядные интервалы. Количество разрядных интервалов должно быть не меньше 10 и не больше 20, и их предпочитаемый размер может быть 1, 2, 3, 5, 10 (или кратное 10) единиц. Исследователю нужно выбрать размер разрядов так, чтобы общее количество разрядов было от 10 до 20. В нашем случае размер 3 дает 14 интервалов (40/3 + 1 = 14). Это значит, что мы должны разделить диапазон на 14 групп одинакового размера, каждая из которых содержит 3 единицы показателя (7—9, 10—12,…, 46—48). Если мы имеем дело не только с целыми числами, то нужно выстроить более точные интервалы. Обычно низшая граница интервала задается так, что она лежит на 0,5 единицы ниже низшего целого числа, а верхняя граница — на 0,49 единицы выше высшего целого числа в интервале. Таким образом, мы получаем следующие границы интервалов: 6,5—9,49; 9,5—12,49 и т. д. Данные заносятся в таблицу (табл. 26.3) и на ее основании строится график распределения частот.

Таблица 263

Границы разрядов, простые частоты, восходящие кумулятивные частоты, проценты и процентили для 72 показателей теста.

Границы показателей.

Точные границы разрядов.

Частоты.

Кумулятивные частоты.

Проценты.

Процентили.

46−48.

45,50−48,49.

1,39.

43−45.

42,50−45,49.

4,17.

98,61.

40−42.

39,50−42,49.

8,33.

94,44.

37−39.

36,50−39,49.

8,33.

86,11.

34−36.

33,50−36,49.

9,72.

77,78.

31−33.

30,50−33,49.

13,89.

68,06.

28−30.

27,50−30,49.

И.

15,28.

54,17.

25−27.

24,50−27,49.

12,5.

38,89.

22−24.

21,50−24,49.

8,33.

26,39.

19−21.

18,50−21,49.

6,94.

18,06.

16−18.

15,50−18,49.

4,17.

11,12.

13−15.

12,50−15,49.

4,17.

6,95.

10−12.

9,50−12,49.

1,39.

2,78.

7−9.

6,50−9,49.

1,39.

1,39.

Исследователя интересует также, какая часть значений данных лежит выше, а какая ниже данного значения. Для ответа на этот вопрос строится распределение кумулятивных (накопленных) частот (в табл. 26.3 представлены восходящие кумулятивные частоты, точно так же можно строить и нисходящие). Мы можем подсчитать проценты распределения частот, а также процентили — процент общего количества значений, лежащих ниже данного пункта (процентили считаются только для восходящего ряда). Например, по таблице мы можем ответить на вопрос, как много показателей в выборке равны или меньше 24; 19 показателей из 72, или 26,39%, равны или меньше 24.

Три типа процентилей имеют свое обозначение и часто используются для описания количественных данных. Дециль (10-й нроцентиль) — значение показателя, ниже которого лежат 10% всех значений. Для данных в таблице 18 показатель 16 — точка на шкале распределения, ниже которой 8 из 72 значений; в терминах процентилей эта точка расположена несколько выше 10-го процентиля (11,12%). Медиана (50-й процентиль) — точка, ниже которой расположены 50% всех значений (по нашим данным это показатель 28, 39 из 72 значений лежат ниже этой точки, соответственно, она расположена немного выше медианы). Еще две точки — 25-й и 75-й процентили, называемые квартилями. Для наших данных это показатели 22 и 34 соответственно.

Сегодня все расчеты частот вариационного ряда, процентов, кумулятивных частот, процентилей производятся с помощью компьютерных программ. В статистических пакетах также есть функция построения гистограмм и других графиков (о применении статистических пакетов для обработки данных см. подробнее: Ермолаев-Томин, 2012; Кричевец, Корнеев, Рассказова, 2012; Наследов, 20 086).

Показать весь текст
Заполнить форму текущей работой