Помощь в написании студенческих работ
Антистрессовый сервис

Алгоритм и правила построения группировки данных

РефератПомощь в написанииУзнать стоимостьмоей работы

В случае малой численности (когда статистическая совокупность включает менее 30 ед.) целесообразно выделить три группы, характеризующие передовую, отстающую части и «золотую середину». Это объясняется тем, что при небольшом объеме совокупности нельзя образовывать большое число групп, так как группы будут малочисленными, что не отвечает требованию закона больших чисел. Величину интервала… Читать ещё >

Алгоритм и правила построения группировки данных (реферат, курсовая, диплом, контрольная)

При разделении исходных данных на группы необходимо придерживаться определенной последовательности действий или алгоритма (табл. 2.3).

Алгоритм построения группировки данных.

Таблица 23

1. Выделить группировочный признак (признаки), который будет положен в основание группировки, и определить его вид.

Для количестве! того признака

Для качественного признака

2. Проранжировать (упорядочить) исходные данные от наименьшего значения признака к наибольшему.

3. Определить количество групп.

В случае малой численности (когда статистическая совокупность включает менее 30 ед.) целесообразно выделить три группы, характеризующие передовую, отстающую части и «золотую середину». Это объясняется тем, что при небольшом объеме совокупности нельзя образовывать большое число групп, так как группы будут малочисленными, что не отвечает требованию закона больших чисел.

Если изучаемая совокупность велика, то число групп определяется по формуле Стерджесса: т = 1 + 3,322lgH,.

где п — количество единиц в изучаемой (выборочной) статистической совокупности.

Количество групп для качественного признака определяется числом категорий существующих значений данного признака, например, если в основание группировки рабочих предприятия положен группировочный признак — пол, то групп будет всего две — мужчины и женщины.

4. Определить величину интервалов групп Величина интервалов в этом случае принимается равной для всех групп и определяется по формуле. _ •Г|11ах — хтт т

где дгтах и xmin — максимальное и минимальное значения признака в совокупности; т — число групп.

При этом следует помнить, что по непрерывно варьирующим признакам, если величина интервала получилась целой без округления или округление произведено в меньшую сторону, последнюю группу необходимо делать с открытым интервалом, иначе максимальное значение (по принципу «до») не войдет в группу.

В группировках с неравными интервалами их величина определяется по формулам арифметической или геометрической прогрессии.

5. По каждой группе и по совокупности изучаемых единиц рассчитать общие итоги.

При построении группировок также необходимо соблюдать следующие правила:

• в основу группировки следует положить наиболее существенные признаки, отвечающие задачам исследования и учитывающие особенности изучаемых явлений;

  • • необходимо брать не один, а несколько группировочных признаков, что позволит всесторонне, лучше и глубже характеризовать сложные явления;
  • • выбор числа групп определяется группировочным признаком с учетом численности изучаемой совокупности и степени его варьирования в конкретных условиях места и времени: чем она больше, тем больше должно быть число групп;
  • • приступая к расчетам по формуле Стерджесса, можно использовать следующий вариант зависимости (табл. 2.4).

Таблица 2.4

Зависимость между числом изучаемых единиц и количеством групп (по формуле Стерджесса).

N

15−25.

25—45.

45−90.

90−180.

180−360.

360−720.

п

б.

  • • на практике может возникнуть случай, когда значение изучаемого признака попадает на границу между интервалами. Возникает неопределенность: к какой группе его отнести? Для устранения подобного рода неопределенности используют принцип единообразия — левая граница интервала включает в себя обозначенное значение, а правая — не включает. Например, пусть произведена группировка рабочих предприятия, но величине производительности труда (деталей за смену) и выделено пять групп с равными интервалами: 10—15; 15—20; 20—25; 25—30; 30—35. Производительность труда одного из рабочих составляет 20 деталей за смену. Возникает вопрос: к какой группе его отнести, ко второй или третьей? Следуя вышеприведенному правилу, работник, производительность труда которого составляет 20 деталей, должен быть отнесен к третьей группе;
  • • величину интервала в расчетах можно, а порою и нужно, округлять, при этом следует помнить, что по непрерывно варьирующим признакам, если величина интервала получилась целой без округления или округление произведено в меньшую сторону, последнюю группу необходимо делать с открытым интервалом, иначе максимальное значение (по принципу «до») не войдет в группу.

Типовая задача 2.1.

Известны данные о деятельности банков одной из областей РФ (табл. 2.5).

Таблица 25

Данные о деятельности банков одной из областей РФ, млрд руб.

№ банка.

Уставный капитал.

Работающие активы.

12,4.

31,7.

17,5.

41,1.

2,7.

2,6.

7,1.

19,0.

22,1.

98,5.

N° банка.

Уставный капитал.

Работающие активы.

18,7.

79,8.

5,3.

6,6.

2,1.

5,2.

6,8.

14,6.

3,5.

10,1.

И.

13,6.

54,4.

8,9.

21,2.

2,2.

9,1.

9,0.

16,7.

3,6.

3,7.

7,5.

19,8.

4,3.

14,2.

5,1.

19,8.

9,9.

30,0.

2,9.

10,9.

  • 1. Постройте структурную группировку байков по размеру уставного капитала, образовав четыре группы с равными интервалами. Результаты группировки представьте в табличном виде и сделайте выводы.
  • 2. Преобразуйте структурную группировку банков в аналитическую группировку для изучения зависимости между величиной уставного капитала и работающими активами, образовав четыре группы банков с равными интервалами, охарактеризовав каждую группу и совокупность в целом:
    • а) числом банков;
    • б) величиной уставного капитала — всего и в среднем на один банк;
    • в) величиной работающих активов — всего и в среднем на один банк.

Результаты представьте в табличном виде, сделайте выводы.

Решение

1. Построение структурной группировки данных.

Так как, но условию задачи необходимо построить структурную группировку банков по размеру уставного капитала, то группировочным признаком является величина уставного капитала. Данный признак количественный.

Произведем ранжирование исходных данных по величине групнировочного признака. Данные расположим в возрастающем порядке (табл. 2.6).

Число групп в данном случае задано условием и равно четырем: т = 4.

Интервалы групп по условию равны, определим величину интервала по формуле.

Алгоритм и правила построения группировки данных.

Ранжирование исходных данных.

№ п/и.

Уставный капитал, млрд руб.

CN.

CN.

CN.

CN.

m.

CO.

CD.

со" .

CO.

in.

CO.

in.

CD.

in.

t-" .

oo.

о.

of.

of.

12,4.

13,6.

17,5.

18,7.

VIZ

Работающие активы, млрд руб.

CN.

in.

of.

cq.

CN.

10,9.

о.

со" .

14,2.

14,6.

19,0.

CO.

of.

21,2.

16,7.

30,0.

31,7.

54,4.

79,8.

98,5.

Определим нижнюю и верхнюю границы интервала для каждой группы. Прибавляя далее величину интервала к верхней границе первой группы, получаем верхнюю границу второй группы: 7,1 +5 = 12,1 и т. д.

В результате получим следующие группы банков по величине уставного капитала (табл. 2.7).

Таблица 2.7

Группы банков по величине уставного капитала

№.

Группа банков no величине уставного капитала, млрд руб.

2,1−7,1.

7,1−12,1.

12,1−17,1.

17,1−22,1.

Следует помнить, что левая граница интервала включает в себя значение признака, а правая — нет, поэтому в последней группе целесообразно перейти к открытому интервалу «17,1 и более» (в противном случае значение 22,1 не войдет в последнюю группу).

Распределим исходные данные, но полученным группам (табл. 2.8), охарактеризовав каждую группу числом банков, суммой уставного капитала и суммой работающих активов (табл. 2.9).

Таблица 2.8

Распределение ранжированных данных по группам.

№ п/п.

Уставный капитал, млрд руб.

Сч" .

сч сч.

сч" .

о>

сч" .

ю со.

со со" .

со.

ю.

СО ю" .

со" .

Г-" .

Ю Г-" .

О оо" .

О.

of.

?;

(12,4.

13,6.

f 17,5.

оо" .

сч" .

сч.

Работающие активы, млрд руб.

сч ю.

Of.

со сч" .

0>

о" .

со" .

14,2.

19,8.

СО со" .

14,6.

of.

19,8.

21,2.

16,7.

со.

31,7.

54,4.

79,8.

98,5.

Построим итоговую таблицу, характеризующую структуру распределения банков по размеру уставного капитала (табл. 2.10).

Определение общих итогов по каждой группе

№.

Группа банков по величине уставного капитала, млрд руб.

Число банков.

Общий уставный капитал, млрд руб.

Общие работающие активы, млрд руб.

2,1−7,1.

2,7 + 53 + 2,1 + + 6,8 + 3,5 +.

+ 2,2 + 3,6 +.

+ 4,3 + 5,1 + 2,9.

2,6 + 6,6 + 5,2 + + 14,6 + 10,3 +.

+ 9,1 +3,7 +.

+ 14,2 + 19,8 + 10,9.

7,1−12,1.

7,1 + 8,9 +.

+ 9,0 + 7,5 + 9,9.

19,0 + 21,2 + 16,7 + + 19,8 + 30,0.

12,1−17,1.

12,4 + 13,6.

31,7 + 54,4.

17,1−22,1.

17,5 + 22,1 + 18,7.

41,1 +98,5 + 79,8.

Всего.

165,2.

509,2.

Таблица 2.10

Структурная группировка банков по величине уставного капитала

№.

Группа банков по величине уставного капитала, млрд руб.

Число банков.

Общий уставный капитал, млрд руб.

Общие работающие активы, млрд руб.

2,1−7,1.

38,5.

97,0.

7,1−12,1.

42,4.

106,7.

12,1−17,1.

26,0.

86,1.

17,1−22,1.

58,3.

219,4.

Всего.

165,2.

509,2.

Построенная структурная группировка банков по величине уставного капитала показывает, что в данном регионе преобладают малые банки с величиной уставного капитала от 2,1 млрд до 7,1 млрд руб., что составляет 50% общего их числа.

2. Построение аналитической группировки данных.

Принимаем величину уставного капитала банка за факторный признак, а работающие активы — за результативный признак.

Преобразуем таблицу структурной группировки в сводную аналитическую таблицу для выявления взаимосвязи между величиной уставного капитала и размером работающих активов банка, дополнив ее расчетом величин уставного капитала и работающих активов в среднем на один банк (табл. 2.11).

Построенная аналитическая группировка банков, но величине уставного капитала показывает, что с увеличением размера уставного капитала увеличиваются и средние размеры работающих активов, т. е. между рассматриваемыми признаками существует прямая зависимость.

Аналитическая группировка банков по величине уставного капитала.

№.

Группа банков, но величине уставного капитала, млрд. руб.

Число банков, ед.

Уставный капитал, млрд руб.

Работающие активы, млрд руб.

всего.

в среднем на один банк.

всего.

в среднем на один банк.

2,1−7,1.

38,5.

3,9.

97,0.

9,7.

7,1−12,1.

42,4.

8,5.

106,7.

21,3.

12,1−17,1.

26,0.

13,0.

86,1.

43,1.

17,1−22,1.

58,3.

19,4.

219,4.

71,1.

Всего.

165,2.

—.

509,2.

—.

В среднем на один завод.

—.

—.

8,3.

—.

25,5.

Вопросы и задания для самоконтроля

  • 1. Что собой представляет сводка статистических данных?
  • 2. Какие виды сводок вы знаете?
  • 3. Что называется статистической группировкой?
  • 4. Какие категории лежат в основе группировочного метода?
  • 5. Определите понятие «признак». Какие виды признаков вы знаете?
  • 6. На какие виды делятся статистические группировки? Проиллюстрируете их примерами.
  • 7. Что необходимо учитывать при построении группировки данных по количественному признаку?
  • 8. Из каких этапов состоит механизм группировки данных?
Показать весь текст
Заполнить форму текущей работой