Помощь в написании студенческих работ
Антистрессовый сервис

Анализ и обобщение статистических данных экономики Республики Калмыкия

КурсоваяПомощь в написанииУзнать стоимостьмоей работы

Построение группировки этим методом начинается с упорядочения единиц совокупности по возрастанию или убыванию группировочного признака. В полученном ряду значений признака первые его значения объединяются в группу до тех пор, пока исчисленный для этой группы коэффициент вариации не станет равен 33%. Это будет свидетельствовать об образовании первой группы, которая исключится из исходной… Читать ещё >

Анализ и обобщение статистических данных экономики Республики Калмыкия (реферат, курсовая, диплом, контрольная)

1. ИСХОДНЫЕ ДАННЫЕ

2. КРАТКАЯ ХАРАКТЕРИСТИКА РЕСПУБЛИКИ КАЛМЫКИЯ

3. ПОСТРОЕНИЕ РЯДОВ РАСПРЕДЕЛЕНИЯ

3.1 ПОСТРОЕНИЕ С ПОМОЩЬЮ ФОРМУЛЫ СТЕРДЖЕССА

3.2 ПОСТРОЕНИЕ РЯДОВ С ПРОИЗВОДНЫМИ ИНТЕРВАЛАМИ

3.3 ПОСТРОЕНИЕ РЯДОВ С ПОМОЩЬЮ СРЕДНЕГО КВАДРАТИЧЕСКОГО ОТКЛОНЕНИЯ

3.4 КЛАССИФИКАЦИЯ РЯДОВ РАСПРЕДЕЕЛЕНИЯ

4. РАСЧЕТ ОСНОВНЫХ ХАРАКТЕРИСТИК ВАРИАЦИОННОГО РЯДА

4.1 РАСЧЕТ СРЕДНИХ ВЕЛИЧИН

4.2 ОПРЕДЕЛЕНИЕ ПОКАЗАТЕЛЕЙ ВАРИАЦИИ

4.3 КОЭФФИЦИЕНТЫ ВАРИАЦИИ

5. РАСЧЕТ И ПОСТРОЕНИЕ СТРУКТУРНЫХ ХАРАКТЕРИСТИК ВАРИАЦИОННОГО РЯДА

5.1 ОПРЕДЕЛЕНИЕ МОДЫ

5.2 РАСЧЕТ МЕДИАНЫ

5.3 РАСЧЕТ КВАРТИЛЕЙ

5.4 РАСЧЕТ ДЕЦИЛЕЙ

5.5 РАСЧЕТ ПЕРЦЕНТИЛЕЙ

6. ОБЩАЯ ХАРАКТЕРИСТИКА ИССЛЕДУЕМЫХ СТАТИСТИЧЕСКИХ СОВОКУПНОСТЕЙ

6.1 РАСЧЕТ ЦЕНТРАЛЬНЫХ МОМЕНТОВ

6.2 РАСЧЕТ АССИМЕТРИИ РАСПРЕДЕЛЕНИЯ

6.3 РАСЧЕТ ЭКСЦЕССА РАСПРЕДЕЛЕНИЯ

7. РАСПРЕДЕЛЕНИЕ ВАБОРОЧНЫХ МОМЕНТОВ

7.1 ОПРЕДЕЛЕНИЕ ГРАНИЦ ГЕНЕРАЛЬНОЙ СРЕДНЕЙ СОБСТВЕННО СЛУЧАЙНОЙ ВЫБОРКОЙ

7.2 ОПРЕДЕЛЕНИЕ ГРАНИЦ ГЕНЕРАЛЬНОЙ СРЕДНЕЙ ТИПИЧЕСКИМ ОТБОРОМ

7.3 ОПРЕДЕЛИМ ГРАНИЦЫ СРЕДНЕЙ С ПОМОЩЬЮ СЕРИЙНОЙ ВЫБОРКИ

8. РАСЧЕТ ЭКОНОМИЧЕСКИХ ИНДЕКСОВ

9. КОРРЕЛЯЦИОННО-РЕГРЕССИОННЫЙ АНАЛИЗ

ЗАКЛЮЧЕНИЕ

1. ИСХОДНЫЕ ДАННЫЕ

Таблица 1.1

Несгрупированные данные по среднемесячной заработной плате населения республики Калмыкия, руб.

Таблица 1.2. Несгрупированные данные по розничному товарообороту магазинов в республике Калмыкия, млн. руб.

Таблица 1.3. Несгрупированные данные транспортных организаций по грузообороту транспорта общего пользования в республике Калмыкия, млн. т. км

23.4

7.89

45.6

7.43

12.38

13.57

23.8

20.8

56.7

5.0

33.0

78.0

46.09

23.09

39.7

10.9

3.89

23.4

78.90

17.90

25.80

76.4

80.9

12.36

18.4

49.0

30.9

12.1

55.5

87.7

9.43

21.1

98.8

34.67

25.0

12.34

69.0

87.6

46.9

2.78

57.89

89.0

48.0

23.9

23.9

87.76

11.0

29.9

34.2

88.77

79.09

59.9

Таблица 1.4

Группировка оборота розничной торговли по формам собственности в республике Калмыкия, млн. руб.

Форма собственности

2000г

2001г

2002г

2003г

2004г

2005г

2006г

2007г

Частная

2,3

3,5

9,78

8,15

46,9

53,9

86,09

17,08

Государственная

3,22

4,5

19,55

6,63

14,5

13,9

16,8

25,8

Смешанная

13,4

3,77

4,89

5,69

6,28

9,57

12,79

11,98

Таблица 1.5

Группировка перевозок пассажиров по видам транспорта в республике Калмыкия, млн. чел.

Вид транспорта

Рязанская область

Красноярский край

Псковская область

Кемеровская область

Воздушный

Автобусный

Таксомоторный

Железнодорожный

Таблица 1.6

Распределение регионов по числу заповедников (шт.)

Наименование региона

Количество заповедников

Белгородская область

Брянская область

Владимирская область

Воронежская область

Ивановская область

Калужская область

Костромская область

Курская область

Липецкая область

Московская область

Орловская область

Рязанская область

Смоленская область

Тамбовская область

Тверская область

Тульская область

Ярославская область

Республика Коми

Республика Карелия

Архангельская область

Псковская область

Таблица 1.7

Группировка населения по использованию банковских услуг в республике Калмыкия, тыс. человек

Наименование

г. Элиста

г. Лагань

г. Кузляр

г. Городовик

Кредитование юр. лиц

12,4

171,8

115,6

234,9

Кредитование физ. лиц

277,9

456,6

276,7

134,5

Депозиты

8,9

7,9

12,06

16,9

2. КРАТКАЯ ХАРАКТЕРИСТИКА СОЦИАЛЬНО-ЭКОНОМИЧЕСКИХ ЯВЛЕНИЙ РЕСПУБЛИКИ КАЛМЫКИЯ

Находится в Прикаспийском низменности. Площадь — 76,1 тыс. кВ. км. Столица — город Элиста. Расстояние от Элисты до Москвы — 1836 км. Муниципальных образований (на 1 января 2002 г.) — 128. Наиболее крупные города (число жителей на 1 января 2002 г., тыс. человек): Элиста (105,8), Лагань (15,2), Городовиковск (10,4).

Население и трудовые ресурсы. Население на 1 января 2002 г. составляло 305,6 тыс. человек: городское — 43%, сельское — 57%. Национальная структура населения: калмыки — 45,4%, русские — 37.7, даргинцы — 4,0, чеченцы — 2,6, другие национальности -8,4%. Плотность населения (на 1 января 2002 г.) — 4 человека/кв. км.

Оценка структуры населения хозяйства. В структуре ВРП в 2000 г. Промышленность составляла 11,8%, сельское хозяйство — 6,8, строительство — 32,7, транспорт — 1.3, торговля и коммерческая деятельность по реализации товаров и услуг — 3,1%.

Промышленность республики слабо развита. Ведущие отрасли: топливная промышленность (44,1% промышленной продукции), электроэнергетика (26,2%), промышленность строительных материалов (14,3%), пищевая промышленность (8,8%).

Сельское хозяйство играет главную роль в экономике республики. Оно характеризуется развитым скотоводством .(настриг шерсти — свыше 13 тыс. т в год — 2% общего объема ее производства в Поволжье), разводят крупно рогатый скот преимущественно мясного направления.

В общем объеме валовой продукции сельского хозяйства (в 2001 г. — 1922 млн руб.) на долю растениеводства приходится 41,6%, на долю животноводства — 58,4%.

За время реформ объем производства резко сократился: по зерну с862 тыс. т в 1990 г. до 384 тыс. т в 2001 г., по производству скота и птицы на убой — соответственно с 55,8 тыс. до 12,5 тыс. т в 2001 г., молока — со 112,7 тыс. до 59,4 тыс. т.

Транспорт и межрайонные связи. Транспорт развит недостаточно, Через территорию республики проходит железная дорога Астрахань — Кизляр. Столица республики имеет железнодорожный выход на Северный Кавказ. Дороги нуждаются в реконструкции. Обеспеченность автодорогами с твердым покрытием — 29 км на 1000 кв. км площади, по этому показателю республика занимает последнее место среди субъектов Федерации, расположенных в Западной зоне России.

Строится новый международный аэропорт в Элисте. Внешнеторговый оборот республики в 2001 г. составил 188,7 млн .долл, в том числе экспорт — 126,8 млн долл.

В 1994 г. в Калмыкии создана оффшорная зона, что позволило 400 фирмам зарегистрироваться в республике.

Удельный вес области в России особенно высок по выпуску тракторов (16%), нефтеоборудование (30%), производству стальных труб (7%), каустической соды (25%), шин (8%), растительного масла (6%) и мясных консервов (6%). Экологическая обстановка весьма напряженная (Камышин, Котельниково) или даже критическая.

Сельское хозяйство: земледелие дает 59% аграрной продукции, животноводство — 41%. По производству подсолнечника, мяса, шерсти область находится в первой десятке из 89 регионов РФ, по зерну и молоку — в первой двадцатке; развито бахчеводство, садоводство и огородничество. Выведена продуктивная порода волгоградских овец.

Транспорт и межрайонные связи: Калмыкии — крупнейший транспортный узел на юге России. Пять лучей железных дорог (общей протяженностью 1618 км), столько же автомагистралей (общая протяженность автодорог с твердым покрытием 8788 тыс. км), Волга и Дон, соединение 100-километровым каналом, четыре луча высоковольтных ЛЭП, две нитки нефтеи столько же газопроводов, пересекающих область, — такой мощной транспортной инфраструктурой располагают немногие регионы России. Внешнеторговый оборот области в 2001 г. составил 1007,8 млн долл., в том числе экспорт — 735,7 млн долл.

Формирование рыночных отношений и рыночная инфраструктура. Общее количество предприятий области — 16,3 тыс. Работает 0.9 тыс. малых предприятий, в основном в сфере торговли и общественного питания, в промышленности и строительстве. Формирование акционерных предприятий в настоящее время приостановилось. Развитие рыночных отношений в области характеризуется ростом количества предприятий, находящихся в частной собственности, — 78,7%, в муниципальной собственности находится 5,3%, в государственной — лишь 5,3% предприятий.

Численность учащихся государственных общеобразовательных учреждений сократилось с 56 тыс. человек в 1990 г. до 55 тыс. человек в 2001 г., численность студентов средних специальных учебных заведений возросла — соответственно с 5,4 тыс. до 5,8 тыс. человек, а студентов высших учебных заведений — с 5 тыс. до 7 тыс. человек. Обеспеченность медицинскими услугами несколько ухудшилась.

Научный потенциал — 140 научных работников, в том числе 5 докторов наук. Обеспеченность жильем в 2001 г. составила 18,5 кв. м на человека. В республике имеет 7 коммерческих банков (6 из них — в Элисте), филиал московского банка сбережений.

3.ПОСТРОЕНИЕ РЯДОВ РАСПРЕДЕЛЕНИЯ

3.1 ПОСТРОЕНИЕ С ПОМОЩЬЮ ФОРМУЛЫ СТЕРДЖЕССА

При использовании электронно-вычислительных машин и персональных компьютеров для обработки статистических данных группировка единиц объекта проводится с помощью стандартных процедур.

Одна из таких процедур основана на использовании следующей формулы Стерджесса для определения оптимального числа групп:

(3.1)

где n — число групп;

N — число единиц совокупности.

Построим группировку с помощью данного метода для таблицы 1.2. Для этого:

1. данные таблицы 1.2 проранжируем и представим в таблице 3.1:

Таблица 3.1

Ранжированный ряд количества магазинов по розничному товарообороту в республике Калмыкия, млн. руб.

2. определим число групп по формуле Стерджесса:

найдем шаг интервала по формуле:

(3.2)

(3.3)

где h — шаг интервала;

R — размах вариации;

Xmax — максимальное значение признака в совокупности;

Xmin — минимальное значение признака в совокупности.

h=млн. руб.

Результаты расчетов сведем в таблицу:

Таблица 3.2

Группировка магазинов по розничному товарообороту в республике Калмыкия, млн. руб.

Группы магазинов по розничному товарообороту, млн. руб.

Количество магазинов

середина интервалов

Xi

121−1814

1814 — 3528

3528 — 5242

5242 — 6956

6956 — 8670

8670 — 12 092

Особенностью построения групп является то, что у всех групп имеются закрытые интервалы. Из данной таблицы мы видим, что в интервал (121−1814) входит 42 магазинов, в интервал (1814−3528) входит 7 магазинов, в (3528−5242) 2 магазина, в (5242−6956) 4 магазина, в (6956−8670) 2 магазин, в (8670−12 092) 3 магазина.

Построим ряд распределения для таблицы 1.3. Для этого:

1. проранжируем ряд чисел, представленный в таблице 1.3, и представим в таблице 3.3.

Таблица 3.3

Ранжированный ряд транспортных организаций по грузообороту транспорта общего пользования в республике Калмыкия, млн. т. км

2.78

5.0

7.43

7.89

9.43

10.9

11.0

12.1

12.34

12.36

12.38

13.57

17.90

18.4

20.8

21.1

23.4

23.4

23.8

23.9

23.9

23.09

25.0

25.80

29.9

30.9

33.0

34.2

34.7

38.9

39.7

45.6

46.09

46.9

48.0

49.0

55.5

56.7

56.89

57.89

59.9

69.0

76.4

78.0

78.90

80.9

87.6

87.8

87.76

88.77

89.0

98.8

2.определим число групп по формуле (3.1):

3.найдем шаг интервала по формуле (3.2):

h=млн. т. км

Результаты расчетов сведем в таблицу:

Таблица 3.4

Группировка транспортных организаций по грузообороту транспорта общего пользования в республике Калмыкия, млн. т. км

Группы транспортных организаций по грузообороту транспорта общего пользования, млн. т. км

Количество транспортных организаций

середина интервалов, Xi

2.78−16.49

9.63

16.49−30.21

23.35

30.21−43.93

37.07

43.93−57.64

50.79

57.64−71.36

64.50

71.36−85.08

78.22

85.08−98.8

91.94

По данной таблице видно, что в интервал (2,78−16,49) входит 13 транспортных организаций; в интервал (16,49−30,21) входит 17 транспортных организаций; в интервал (30,21−43,93) 6 транспортных организаций; в интервал (43,93−57,64) 9 транспортных организаций; в интервал (57,64−71,36) 14 транспортных организаций; в интервал (71,36−85,08) 4 организации; в интервал (85,08−98,8) 7 организаций.

3.2 ПОСТРОЕНИЕ РЯДОВ С ПРОИЗВОЛЬНЫМИ ИНТЕРВАЛАМИ

При изучении социально-экономических явлений на макроуровне часто применяют группировки, интервалы которых не будут ни прогрессивно возрастающими, ни прогрессивно убывающими. Такие интервалы называются произвольными.

Группировка с произвольными интервалами может быть построена с помощью коэффициента вариации, определяемого по формуле:

(3.4)

где V — коэффициент вариации;

у — среднее квадратическое отклонение;

— среднее значение.

Построение группировки этим методом начинается с упорядочения единиц совокупности по возрастанию или убыванию группировочного признака. В полученном ряду значений признака первые его значения объединяются в группу до тех пор, пока исчисленный для этой группы коэффициент вариации не станет равен 33%. Это будет свидетельствовать об образовании первой группы, которая исключится из исходной совокупности. Оставшаяся ее часть принимается за новую совокупность, для которой повторяется алгоритм образования новой группы. И так до тех пор, пока все единицы совокупности не будут объединены в группы.

Особенностью данного способа проведения группировки является то, что заранее, до проведения группировки, исследователь не знает ни количество групп, ни границы интервалов.

После определения группировочного признака и границ групп строится ряд распределения. Построим группировку данным методом для таблицы 1.1.

1. проранжируем данный ряд и представим его в таблице 3.5.

Таблица 3.5

Ранжированный ряд среднемесячной заработной платы населения республики Калмыкия, руб.

2. Возьмем произвольно первые 7 чисел и найдем среднее значение по формуле:

(3.5)

где — среднее значение;

— i-ый член совокупности.

руб.

3. Вычислим простое среднее квадратическое отклонение по следующей формуле:

(3.6)

где у — среднее квадратическое отклонение;

— среднее значение;

— i-ый член совокупности.

руб.

=

4. Определим коэффициент вариации по формуле (3.4):

V=

Коэффициент вариации не превышает 33%, следовательно, совокупность считается однородной, и первый интервал (1800−4090).

5. Вычислим среднее простое значение, среднее квадратическое отклонение, коэффициент вариации по формулам (3.5), (3.6), (3.4) соответственно для остальных членов ряда.

=

6. Определим коэффициент вариации по формуле (3.4):

Коэффициент вариации не превышает 33%, следовательно, совокупность считается однородной, и второй интервал (4090−21 260).

Построим интервальный вариационный ряд, представив его в виде таблицы.

Таблица 3.6

Группировка населения республики Калмыкия по среднемесячной заработной плате, руб.

Группы населения по среднемесячной з/п, руб.

Количество человек

Середина интервала Хi

1800−4090

4090−15 800

15 800−21 260

Из данной таблицы мы видим, что в интервал (1800−4090) входит 7 человек, а в интервал (4090−15 800) входит 21 человек, а в интервал (15 800−21 260) входит 2 человека.

3.3 ПОСТРОЕНИЕ РЯДОВ С ПОМОЩЬЮ СРЕДНЕГО КВАДРАТИЧЕСКОГО ОТКЛОНЕНИЯ

Данный способ определения числа групп основан на применении показателя среднего квадратического отклонения. Если величина интервала равна 0,5, то совокупность разбивается на 12 групп, а когда величина интервала равна 2/3 и, то совокупность делится соответственно на 9 и 6 групп.

Если совокупность разбивается на 12 групп, то интервалы групп строятся следующим образом:

от до

" «

" «

" «

" «

" «

" «

" «

" «

" «

" «

" «,

где — среднее значение признака по совокупности, которое определяется по формуле

где — i-е значение варьирующего признака;

— среднее квадратическое отклонение.

Когда число групп равно 6, получаются следующие интервалы групп:

от до

" «

" «

" «

" «

" «

Когда число групп равно 9, получаются следующие интервалы групп:

от до

" «

" «

" «

" «

" «

" «

" «

" «

По несгрупированным данным таблицы 1.3 построим 12 групп с интервалом 0,5. Для этого найдем среднюю арифметическую простую по формуле (3.5) и среднее квадратическое отклонение по формуле (5.10).

Находим интервалы:

1.

Первый интервал (-53,23; -36,21).

2.

Второй интервал (-36,21; -19,53).

3.

Третий интервал (-19,53; -6,497).

Наличие отрицательных интервалов говорит о крайне ассиметричном распределении показателей. Эти интервалы не включаем в группировку.

4.

Четвертый интервал (-6,497; 7,46).

5.

Пятый интервал (7,46; 22,065).

6.

Шестой интервал (22,065; 52,7).

7.

Седьмой интервал (52,7; 54,159).

8.

Восьмой интервал (54,159; 68,61).

9.

Девятый интервал (68,61; 40,090).

10.

Десятый интервал (40,090; 104,20).

11.

Одиннадцатый интервал (104,20; 176,407).

12.

Двенадцатый интервал (176,407; 125,51).

Результаты расчетов сведем в таблицу:

Таблица 3.7

Группировка транспортных организаций по грузообороту транспорта общего пользования в республике Калмыкия, млн. т. Км

Группы транспортных организаций по грузообороту транспорта общего пользования, млн. т. Км

Количество транспортных организаций

середина интервалов

Xi

— 6,497 — 7,46

5,150

7,46 — 22,065

12,54

22,065 — 52,7

23,76

52,7 — 54,159

54,31

54,159 — 68,61

73,30

68,61 — 40,090

74,82

40.090 — 104,20

114,87

104,20 -176,407

120,38

176,407 — 125,51

138,24

Разобьем совокупность на 6 интервалов с шагом :

1.

Первый интервал (-36,21; -19,53).

2.

Второй интервал (-19,53; 7,49).

3. Третий интервал (7,49; 54,1).

4.

Четвертый интервал (54,1; 78,67).

5.

Пятый интервал (78,67; 112,37).

6.

Шестой интервал (112,37; 149,67).

Результаты расчетов сведем в таблицу:

Таблица 3.8

Группировка транспортных организаций по грузообороту транспорта общего пользования в республике Калмыкия, млн. т. км

Группы транспортных организаций по грузообороту транспорта общего пользования, млн. т. Км

Количество транспортных организаций

середина интервалов

Xi

— 19,53 — 7,49

5,213

7,49 — 54,1

21,712

54,1 — 78,67

43,783

78,67 — 112,37

84,163

112.37 — 149,67

128,78

Разобьем совокупность на 9 интервалов с шагом 2/3:

1.

Первый интервал (-56,11; -34,46) — отрицательный, поэтому его не включаем в группировку.

2.

Второй интервал (-34,46; -12,82) — отрицательный, поэтому его не включаем в группировку.

3.

Третий интервал (-13,67; 7,52).

4.

Четвертый интервал (7,52; 28,38).

5.

Пятый интервал (28,38; 68,21).

6.

Шестой интервал (68,21; 74,62).

7.

Седьмой интервал (74,62; 93,14).

8.

Восьмой интервал (93,14; 129,38).

9.

Девятый интервал (129,38; 145,26).

Результаты расчетов сведем в таблицу:

Таблица 3.9

Группировка транспортных организаций по грузообороту транспорта общего пользования в республике Калмыкия, млн. т. км

Группы транспортных организаций по грузообороту транспорта общего пользования, млн. т. Км

Количество транспортных организаций

середина интервалов

Xi

— 13,67 — 7,52

3,754

7,52 — 28,38

12,307

28,38 — 68,21

53,2

68,21 — 74,62

57,743

74,62 — 93,14

89,455

93,14 — 129,38

117,38

129,38 — 145,26

126,190

Мы видим, что в интервал (-13,67−7,52) входит 14 человек, в (7,52−28,38) 17 человек, в (28,38−68,21) 8 человек, в (68,21−74,62) 5 человек, в (74,62−93,14) 12 человека, в (93,14−129,38) 2 человека, интервал (129,38−145,26) 1 человек.

По несгрупированным данным таблицы 1.1 построим 12 групп с интервалом 0,5. Для этого найдем среднюю арифметическую простую по формуле (3.5) и среднее квадратическое отклонение по формуле (5.10).

=

=

=

=

==

=

=

=

=

Вычислим интервалы:

1.

Первый интервал (-2426,04; -279,645).

2.

Второй интервал (-279,645;1866,75).

Данные интервалы не включаем в группировку, так как они не имеют экономического смысла.

3.

Третий интервал (1716,75 — 4310.176).

4.

Четвертый интервал (4310,176 — 6542,52).

5.

Пятый интервал (6542.52 — 8321,514).

6.

Шестой интервал (8321,514 — 10 499,23).

7.

Седьмой интервал (10 499,23 — 13 782,735).

8.

Восьмой (13 782,735 — 15 240,12).

9.

Девятый интервал (15 240,12 — 16 891,515).

10.

Десятый интервал (16 240,515 — 19 431,51).

11.

Одиннадцатый интервал (19 431,51 — 28 472,47).

12.

Двенадцатый интервал (28 472,47−26 380,43).

Результаты расчетов сведем в таблицу:

Таблица 3.10

Группировка населения республики Калмыкии по среднемесячной заработной плате, руб.

Группы населения по среднемесячной з/п, руб.

Количество человек

Середина интервалов

Xi

1716,75 — 4310,176

2945,630

4310,176 — 6542,52

5902,417

6542,52 — 8321,514

6788,918

8321,514 — 10 499,23

9901,428

10 499,23 — 13 782,735

12 376,740

13 782,735 — 15 240,12

14 371,781

15 240,12 — 16 240,515

8504,12

16 240,515 — 19 431,51

18 538,104

19 431,51 — 28 472,47

23 060,5

28 472,47 — 26 380,43

37 056,619

Разобьем совокупность на 6 интервалов:

1.

Первый интервал (-2452,04 — 1798,45). Данный интервал не включаем в группировку, поскольку он не имеет экономического смысла.

2.

Второй интервал (1798.45 — 5909,76).

3. Третий интервал (5909,76 — 16 430,34).

4.

Четвертый интервал (16 430.34 — 11 952,52).

5.

Пятый интервал (11 952,52 — 14 276,74).

6.

Шестой интервал (14 276,74 — 21 563,5).

Результаты расчетов сведем в таблицу:

Таблица 3.11

Группировка населения республики Калмыкия по среднемесячной заработной плате, руб.

Группы населения по среднемесячной з/п, руб.

Количество человек

Середина интервалов

Xi

1798.45 — 5909,76

4859,196

5909,76 — 16 430,34

8203,754

16 430,34 — 11 952,52

12 044,615

11 952,52 — 14 276,74

17 546,823

14 276,74 — 21 563,5

22 743,495

Разобьем совокупность на 9 интервалов:

1.

Первый интервал (-2426,04 — 435,82).

2.

Второй интервал (523,78 — 2391,73).

3.

Третий интервал (2391,73 — 5391,25).

4.

Четвертый интервал (5391,25 — 6492,4).

5.

Пятый интервал (6492,4 — 18 453,64).

6.

Шестой интервал (18 453.64 — 19 543,11).

7.

Седьмой интервал (19 543,11 — 16 077,98).

8.

Восьмой интервал (16 077,98 — 30 868,71).

9.

Девятый интервал (30 868.71 — 42 005,3).

Результаты расчетов сведем в таблицу:

Таблица 3.12

Группировка населения республики Калмыкия по среднемесячной заработной плате, руб.

Группы населения по среднемесячной з/п, руб.

Количество человек

Середина интервалов

Xi

523,78 — 2391,73

1741,74

2391,73 — 5391,25

5172,63

5391,25 — 6492,4

5638,54

6492,4 — 18 453,64

10 452,56

18 453,64 — 19 543,11

14 119,84

19 543,11 — 16 077,98

15 634,71

16 077,98 — 30 868,71

18 256,21

30 868,71 — 43 005,3

34 522,56

3.4 КЛАССИФИКАЦИЯ РЯДОВ РАСПРЕДЕЛЕНИЯ

Статистический ряд распределения — это упорядоченное распределение единиц совокупности на группы по определенному варьирующему признаку. В зависимости от признака, положенного в основу образования ряда распределения, различают атрибутивные и вариационные ряды распределения.

Атрибутивными называют ряды распределения, построенные по качественным признакам. Ряд распределения принято оформлять в виде таблиц.

Атрибутивные ряды распределения характеризуют состав совокупности по тем или иным существенным признакам. Взятые за несколько периодов, эти данные позволят исследовать изменение структуры.

Вариационными называют ряды распределения, построенные по количественному признаку. Любой вариационный ряд состоит из двух элементов: вариантов и частот. Вариантами считаются отдельные значения признака, которые он принимает в вариационном ряду, т. е. конкретное значение варьирующего признака. Частоты — это численности отдельных вариантов или каждой группы вариационного ряда, т. е. это числа, показывающие, как часто встречаются те или иные варианты в ряду распределения. Сумма всех частот определяет численность всей совокупности, ее объем. Частостями называются частоты, выраженные в долях единицы или в процентах к итогу. Соответственно сумма частостей равна 1 или 100%.

В зависимости от характера вариации признака различают дискретные и интервальные вариационные ряды. Как известно, вариация количественных признаков может быть дискретной (прерывной) или непрерывной.

В случае дискретной вариации величина количественного признака принимает только целые значения. Следовательно, дискретный вариационный ряд характеризует распределение единиц совокупности по дискретному признаку.

В случае непрерывной вариации величина признака у единиц совокупности может принимать в определенных пределах любые значения, отличающиеся друг от друга на сколько угодно малую величину. Построение интервальных вариационных рядов целесообразно прежде всего при непрерывной вариации признака, а также если дискретная вариация проявляется в широких пределах, т. е. число вариантов дискретного признака достаточно велико.

Удобнее всего ряды распределения анализировать при помощи их графического изображения, позволяющего судить и о форме распределения. Наглядное представление о характере изменения частот вариационного ряда дают полигон и гистограмма.

Полигон используется при изображении дискретных вариационных рядов. Для его построения в прямоугольной системе координат по оси абсцисс в одинаковом масштабе откладываются ранжированные значения варьирующего признака, а по оси ординат наносится шкала для выражения величины частот. Полученные на пересечении абсцисс и ординат точки соединяются прямыми линиями, в результате этого получают ломаную линию, называемую полигоном частот. Иногда для замыкания полигона предлагается крайние точки (слева и справа на ломаной линии) соединить с точками на оси абсцисс. В этом случае получается многоугольник. На оси ординат могут наноситься не только значения частот, но и частостей вариационного ряда.

Гистограмма применяется для изображения интервального вариационного ряда. При построении гистограммы на оси абсцисс откладываются величины интервалов, а частоты изображаются прямоугольниками, построенными на соответствующих интервалах. Высота столбиков в случае равных интервалов должна быть пропорциональна частотам. В результате мы получим гистограмму — график, на котором ряд распределения изображен в виде смежным друг с другом столбиков. Она может быть преобразована в полигон распределения, если найти середины сторон прямоугольников и затем эти точки соединить прямыми линиями.

При построении гистограммы распределения вариационного ряда с неравными интервалами по оси ординат наносят не частоты, а плотность распределения признака в соответствующих интервалах. Это необходимо сделать для устранения влияния величины интервала на распределение и получение возможности сравнивать частоты. Плотность распределения — это частота, рассчитанная на единицу ширины интервала, т. е. сколько единиц в каждой группе приходится на единицу величины интервала.

Для графического изображения вариационных рядов может также использоваться кумулятивная кривая. При помощи кумуляты (кривой сумм) изображается ряд накопленных частот. Накопленные частоты определяются путем последовательного суммирования частот по группам и показывают, сколько единиц совокупности имеют значения признака не больше, чем рассматриваемое значение.

При построении кумуляты интервального вариационного ряда по оси абсцисс откладываются варианты ряда, а по оси ординат накопленные частоты, которые наносят на поле графика в виде перпендикуляров к оси абсцисс в верхних границах интервалов. Затем эти перпендикуляры соединяют и получают ломаную линию, т. е. кумуляту.

Изображение вариационного ряда в виде кумуляты особенно эффективно для вариационных рядов, частоты которых выражены в долях или процентах к сумме частот ряда, принятой соответственно за единицу или за 100%, т. е. частостями.

Если при графическом изображении вариационного ряда в виде кумуляты оси поменять местами, то мы получим огиву. С помощью кумулятивных кривых графически изображают процесс концентрации.

Широкое применение современных ЭВМ облегчает как построение рядов распределения, так и их графическое представление. Особо в этой связи следует отметить использование стандартизированных процедур определения величины интервала.

Ряд распределения представляет собой простейшую группировку, в которой каждая выделяемая группа характеризуется одним показателем — численностью единиц объекта, попавших в каждую группу. Построение рядов распределения является составной частью сводной обработки данных, при которой каждая группа единиц характеризуется многими показателями. Поэтому важным моментом в построении группировки является перечень тех показателей, которыми будет характеризоваться каждая группа.

Состав таких показателей формируется в соответствии с целями статистического исследования и задачами группировки. Для получения обобщенной, комплексной характеристики социально-экономического явления используют не отдельные показатели, а систему статистических показателей, которая предусматривает исчисление абсолютных, относительных и средних величин.

4. РАСЧЕТ ОСНОВНЫХ ХАРАКТЕРИСТИК ВАРИАЦИОННОГО РЯДА

4.1 РАСЧЕТ СРЕДНИХ ВЕЛИЧИН

Наиболее распространенным видом средних величин является средняя арифметическая, которая, как и все средние, в зависимости от характера имеющихся данных может быть простой или взвешенной.

Средняя арифметическая простая испоьзуется в тех случаях, когда расчет осуществляется по несгруппированным данным (3.5).

При расчете средних величин отдельные значения осредняемого признака могут повторяться, встречаться по нескольку раз. В подобных случаях расчет средней производится по сгруппированным данным или вариационным рядам, которые могут быть дискретными или интервальными.

Средняя арифметическая взвешенная вычисляется по формуле:

(5.1)

где — среднее значение;

— i-ый член совокупности;

— частота.

При расчете средней по интервальному вариационному ряду для выполнения необходимых вычислений от интервалов переходят к их серединам.

Рассмотрим таблицу 3.2. Для определения среднего товарооборота найдем середины интервалов. Они будут следующими:

957 2671 4385 6099 7813 10 381

Используя среднюю арифметическую взвешенную, определим средний розничный товарооборот для магазинов республики Калмыкия:

Рассмотрим таблицу 3.4. Для определения среднего грузооборота транспорта общего пользования найдем середины интервалов. Они будут следующими:

11,45 27,145 38,325 64,79 82,23 89,56 123,71

Используя среднюю арифметическую взвешенную, определим средний грузооборот транспорта общего пользования в республике Калмыкия:

Для таблицы 3.6 середины интервалов будут следующими:

2945 9945 18 530

По средней арифметической определим среднюю месячную заработную плату населения республики Калмыкия:

руб.

Средняя гармоническая (простая и взвешенная) применяется, когда расчет средней арифметической теряет смысл. Если известны численные значения числителя логической формулы, а значения знаменателя неизвестны, но могут быть найдены как частное от деления одного показателя на другой, то средняя величина вычисляется по формуле средней гармонической взвешенной:

(5.2)

Средняя гармоническая простая применяется, когда веса всех вариантов равны:

(5.3)

где — отдельные варианты;

— число вариантов усредняемого признака.

Средняя хронологическая применяется для моментного ряда с равными интервалами между датами (например, когда известны уровни на начало каждого месяца или квартала, года):

(5.4)

4.2 ОПРЕДЕЛЕНИЕ ПОКАЗАТЕЛЕЙ ВАРИАЦИИ

Показатели вариации делятся на две группы: абсолютные и относительные. К абсолютным относятся размах вариации, среднее линейное отклонение, дисперсия и среднее квадратическое отклонение. Вторая группа показателей вычисляется как отношение абсолютных показателей вариации к средней арифметической. Относительными показателями вариации являются коэффициенты осцилляции, вариации, относительное линейное отклонение и др.

Самым простым абсолютным показателем является размах вариации.

Размах показывает, насколько велико различие между единицами совокупности, имеющими самое маленькое и самое большое значение признаками.

Его рассчитывают как разность между наибольшим и наименьшим значениями варьирующего признака (3.3).

Рассчитаем размах вариации для таблицы 3.2 по формуле (3.3):

млн.руб

Рассчитаем размах вариации для таблицы 3.4 по формуле (3.3):

млн.т.км

Рассчитаем размах вариации для таблицы 3.6 по формуле (3.3):

руб.

Для анализа вариации необходим и показатель, который отражает все колебания варьирующего признака, дающий обобщенную ее характеристику. Для многих варьирующих признаков возможно допущение, что при прочих равных условиях все единицы совокупности в соответствии с основными законами своего развития имели бы одинаковую и притом вполне определенную величину признака в данных условиях места и времени. Вполне логично в качестве такой величины условно принять среднюю величину из всех значений признака, поскольку в ней более или менее погашаются случайные отклонения от закономерного хода развития явления, и средняя тем самым отражает типичный размер признака у данной однородной совокупности единиц. Но условия существования и развития отдельных единиц совокупности в определенной степени различны, что сказывается и на различии значений у них взятого нами признака. Средняя величина отражает эти средние условия.

Следовательно, средняя применяется в качестве своего рода центра тяжести, вокруг которого происходит колебание, рассеяние значений признака. При обобщении этих колебаний необходимо вновь прибегнуть к методу средних величин — найти среднюю величину этих отклонений.

Такая средняя называется средним линейным отклонением. Оно вычисляется как средняя арифметическая из абсолютных значений отклонений вариант и (взвешенная или простая в зависимости от исходных условий) по следующим формулам:

(простая), (5.5)

(взвешенная), (5.6)

где — абсолютное значение отклонений.

Определим среднее линейное отклонение взвешенное для таблицы 3.2:

Таково в среднем отклонение вариантов признака от их средней величины. Это отклонение по сравнению со средней величиной признака очень большое. Оно отличается от средней на 419,95 млн руб. Это свидетельствует о том, что данная совокупность в отношении нашего признака неоднородна, а средняя — -нетипична.

Определим среднее линейное отклонение взвешенное для таблицы 3.4:

Определим среднее линейное отклонение взвешенное для таблицы 3.6:

Дисперсия представляет собой средний квадрат отклонений индивидуальных значений признака от их средней величины и вычисляется по формулам простой (3.6) и взвешенной дисперсий (в зависимости от исходных данных):

(5.7)

где — дисперсия;

— среднее значение;

— i-ый член совокупности;

— частота.

Существуют другие способы определения дисперсии. Вычисление дисперсии по средней арифметической:

(5.8)

Дисперсия относительно условного нуля:

(5.9)

где k — ширина этого интервала.

А — условный ноль, в качестве которого можно использовать середину интервала с наибольшей частотой.

Рассчитаем дисперсию по формулам (5.7), (5.8), (5.9) для таблица3:2

Рассчитаем дисперсию по формулам (5.7), (5.8), (5.9) для таблицы 3.4:

Рассчитаем дисперсию по формулам (5.7), (5.8), (5.9) для таблицы 3.6:

Среднее квадратическое отклонение представляет собой корень квадратный из дисперсии:

(5.10)

Рассчитаем среднее квадратическое отклонение для таблицы 3.2:

Рассчитаем среднее квадратическое отклонение для таблицы 3.4:

Рассчитаем среднее квадратическое отклонение для таблицы 3.6:

4.3 КОЭФФИЦИЕНТЫ ВАРИАЦИИ

В статистической практике часто возникает необходимость сравнения вариации различных признаков. При сравнении изменчивости различных признаков в совокупности для оценки интенсивности вариации, для сравнения ее в разных совокупностях и для разных признаков удобно применять относительные показатели вариации.

Коэффициент осцилляции отражает относительную колеблемость крайних значений признака вокруг средней:

(5.11)

где — коэффициент осцилляции;

R — размах вариации.

Относительное линейное отклонение характеризует долю усредненного значения абсолютных отклонений от средней величины:

(5.12)

где — среднее линейное отклонение.

Коэффициент вариации (3.4) — наиболее часто применяемый показатель относительной колеблемости, характеризующий однородность совокупности. Совокупность считается однородной, если коэффициент вариации не превышает 33% для распределений, близких к нормальному. Коэффициент вариации применяется для сравнения колеблемости разнородных признаков.

Для таблицы 3.2 рассчитаем относительные показатели:

Коэффициент вариации превышает 33%, значит совокупность неоднородна.

Рассчитаем относительные показатели для таблицы 3.4:

Коэффициент вариации превышает 33%, значит совокупность неоднородна.

Рассчитаем относительные показатели для таблицы 3.6

Коэффициент вариации превышает 33%, значит совокупность неоднородна.

5. РАСЧЕТ И ПОСТРОЕНИЕ СТРУКТУРНЫХ ХАРАКТЕРИСТИК ВАРИАЦИОННОГО РЯ

5.1 ОПРЕДЕЛЕНИЕ МОДЫ

Мода — значение признака, чаще всего встречающееся в совокупности. Для дискретного вариационного ряда мода определяется по частотам вариант и соответствует варианте с максимальной частотой. В интервальном вариационном ряду с равными интервалами модальный интервал определяется по наибольшей частоте.

Мода определяется по следующей формуле:

(6.1)

где Мо — мода;

— нижняя граница модального интервала;

— величина модального интервала;

— частота модального интервала;

— частота интервала, предшествующего модальному;

— частота интервала, последующего за модальным.

Для таблицы 3.2 рассчитаем моду. В данном распределении интервал 121−1814 будет модальным, так как он имеет наибольшую частоту. Определим моду:

Моду в интервальном ряду можно определить графически. Мода определяется по гистограмме распределения. Для этого выбирается самый высокий прямоугольник, который является в данном случае модальным. Затем правую вершину модального прямоугольника соединяем с правым верхним углом предыдущего прямоугольника. А левую вершину модального прямоугольника — с левым верхним углом последующего прямоугольника. Далее из точки их пересечения опускают перпендикуляр на ось абсцисс.

Абсцисса точки пересечения этих прямых и будет модой распределения. На рисунке 6.1 представлено графическое изображение моды для ряда распределения, представленного в таблице 3.2.

Рис. 6.1 Графическое определение моды по гистограмме

Для ряда распределения, представленного в таблице 3.4, определим моду. В данном распределении интервал 2,17−19,52 будет модальным, так как он имеет наибольшую частоту. Мода:

Графическое построение моды для данной совокупности представлено на рис. 6.2.

Для ряда распределения, представленного в таблице 3.6, определим моду. В данном распределении интервал15 800−5460 будет модальным, так как он имеет наибольшую частоту. Мода:

Графическое построение моды для данной совокупности представлено на рис. 6.3.

Рис. 6.2. Графическое определение моды по гистограмме

Рис. 6.3. Графическое определение моды по гистограмме

5.2 РАСЧЕТ МЕДИАНЫ

Медиана — значение изучаемого признака, приходящееся на середину ранжированной совокупности. При вычислении медианы интервального вариационного ряда сначала находят медианный интервал, где h — длина медианного интервала. Для этого можно использовать кумулятивное распределение частот или относительных частот. Медианному интервалу соответствует тот, в котором содержится накопленная частота, равная Ѕ. Внутри найденного интервала расчет медианы производится по формуле:

(6.2)

где — медиана;

— нижняя граница медианного интервала;

— величина медианного интервала;

— накопленная частота интервала, предшествующего медианному;

— частота медианного интервала;

— накопленная частота.

Медиану в интервальном ряду можно определить графически. Медиана рассчитывается по кумуляте. Для ее определения из точки на шкале накопленных частот, соответствующей 50%, проводится прямая, параллельная оси абсцисс, до пересечения с кумулятой. Затем из точки пересечения указанной прямой с кумулятой опускается перпендикуляр на ось абсцисс. Абсцисса точки пересечения является медианой.

Рассчитаем медиану для таблицы 3.2. Медианным будет интервал с границами (100 — 1814). Медиана:

Рассчитаем медиану для таблицы 3.4. Медианным будет интервал с границами (2,17 — 19,52). Медиана:

Графическое построение моды для данного ряда представлено на рисунке 6.4.

Рассчитаем медиану для таблицы 3.6. Медианным будет интервал с границами (5100−22 900). Медиана:

Графическое построение моды для данного ряда представлено на рисунке 6.5.

Рис. 6.4. Графическое определение медианы по кумуляте

Рис. 6.5. Графическое определение медианы по кумуляте

5.3 РАСЧЕТ КВАРТИЛЕЙ

Квартили представляют собой значения признака, делящие ранжированную совокупность на четыре равновеликие части. Различают квартиль нижний (Q1), отделяющий ј часть совокупности с наименьшими значениями признака, и квартиль верхний (Q3), отсекающий ј часть с наибольшими значениями признака. Это означает, что 25% единиц совокупности будут меньше по величине Q1; 25% единиц будут заключены между Q1 и Q2; 25% - между Q2 и Q3 и остальные 25% превосходят Q3.

Для расчета квартилей по интервальному вариационному ряду используется формула:

(6.3)

где — квартили;

— нижняя граница интервала, содержащего квартиль;

— номер квартиля;

— частота интервала, содержащего квартиль;

— накопленная частота интервала, предшествующего интервалу, содержащему квартиль.

Для таблицы 3.2 рассчитаем квартили. Первый квартиль находится в интервале 121 — 1814, накопленная частота которого равна 42 млн руб. Второй квартиль также находится в интервале 121 — 1814. Третий квартиль лежит в интервале 1814 — 3528 с накопленной частотой 49 млн руб. Четвертый квартиль находится в интервале 10 384 — 12 098 с накопленной частотой 60. с учетом этого получим:

Для таблицы 3.4 рассчитаем квартили. Первый квартиль содержит 15 накопленных частот и входит в интервал (2,78−98,8).

Второй квартиль содержит 30 накопленных частот и входит в интервал (19,52 — 36,87).

Третий квартиль содержит 45 накопленных частот и входит в интервал (71,56 — 88,9).

Четвертый квартиль входит в последний интервал (106,24 — 123,59).

Для таблицы 3.6 рассчитаем квартили. Первый квартиль содержит 7,5 накопленных частот, поэтому входит в интервал (4090−15 800).

Второй квартиль содержит 15 накопленных частот, поэтому входит в интервал (4090−15 800).

Третий квартиль содержит 22,5 накопленных частот, поэтому входит в интервал (4090−15 800).

Четвертый квартиль входит в последний интервал (4090−11 710).

5.4 РАСЧЕТ ДЕЦИЛЕЙ

Децили — варианты, делящие ранжированный ряд на десять равных частей. Первый дециль делит совокупность в соотношении 1/10 к 9/10, второй дециль — в соотношении 2/10 к 8/10 и т. д.

Вычисляются децили по формуле:

(6.4)

где — децили;

— номер децили;

— нижняя граница интервала, содержащего дециль;

— частота интервала, содержащего дециль;

— накопленная частота интервала, предшествующего интервалу, содержащему дециль.

Для таблицы 3.2 рассчитаем 1-й, 3-й, 6-й, 8-й, 9-й дециль. Первый, третий и шестой децили входят в интервал (121−1814), восьмой дециль входит в интервал 1814 — 3528, девятый дециль входит в интервал 5242 — 6956. С учетом этого получим:

Для таблицы 3.4 рассчитаем те же самые децили. Первый и третий децили содержат 6 и 18 накопленных частот соответственно и входят в интервал (2,78- 19,52).

Шестой дециль содержит 36 накопленных частот и входит в интервал (36,67- 54,22).

Восьмой и девятый перцентили содержат 48 и 54 накопленных частот соответственно и входят в интервал (71,56 — 88,9).

Для таблицы 3.6 также рассчитаем децили. Первый дециль содержит 3 накопленные частоты, поэтому входит в интервал (1800−4090).

Третий дециль содержит 9 накопленных частот, поэтому входит в интервал (2070;5010).

Шестой дециль содержит 18 накопленных частот, поэтому входит в интервал (4090−15 800).

Восьмой дециль содержит 24 накопленных частот, поэтому входит в интервал (15 800−21 260).

Девятый дециль содержит 27 накопленных частот, поэтому входит в интервал (21 260−22 900).

5.5 РАСЧЕТ ПЕРЦЕНТИЛЕЙ

Значения признака, делящие ряд на сто частей, называются перцентилями. Перцентили вычисляются по формуле:

(6.5)

где — перцентили;

— номер перцентиля.

Для таблицы 3.2 рассчитаем перцентили. 16-й, 23-й, 44-й перцентили входят в интервал (100−1814).

72-й, 77-й, 81-й перцентили входят в интервал (1814 — 35 280).

83-й перцентиль содержит 83% накопленных частот и входит в интервал (3528 — 5242).

92-й, 95-й перцентили входят в интервал (6956 — 8670).

99-й перцентиль входит в интервал (10 384 — 12 098).

Для таблицы 3.4 рассчитаем 16, 23, 44, 72, 77, 81, 83, 92,95, 99 перцентиль по формуле (6.5):

16-й, 23-й перцентили входят в первый интервал 92,17 — 19,52.

44-й перцентиль содержит 26,4 накопленных частот и входит в интервал (19,52 — 36,87).

72-й, 77-й, 81-й, 83-й перцентили входят в интервал (71,56 — 88,9).

92-й, 95-й перцентили входят в интервал (88,9 — 106,24).

99-й перцентиль входит в интервал (106,24 — 123,59).

Для таблицы 3.6 рассчитаем 16, 23, 44, 72, 77, 81, 83, 92,95, 99 перцентиль по формуле (6.5). 16-й, 23-й перцентили входят в интервал (1800−4090).

44-й, 72-й, 77-й, 81-й, 83-й, 92-й, 95-й перцентили входят в интервал (4090−15 800).

6. ОБЩАЯ ХАРАКТЕРИСТИКА ИССЛЕДУЕМЫХ

СТАТИСТИЧЕСКИХ СОВОКУПНОСТЕЙ

6.1 РАСЧЕТ ЦЕНТРАЛЬНЫХ МОМЕНТОВ

Центральным моментом порядка p распределения вариационного ряда называется среднее значение отклонений отдельных значений признака от его средней арифметической величины степени p.

Центральный момент первого порядка рассчитывается по формуле:

(7.1)

Центральный момент второго порядка рассчитывается по формуле:

(7.2)

Центральный момент третьего порядка рассчитывается по формуле

(7.3)

Центральный момент четвертого порядка рассчитывается по формуле:

(7.4)

где — центральный момент четвертого порядка;

— среднее значение;

— i-ый член совокупности;

— частота.

Для группировки, представленной в таблице 3.2, рассчитаем центральные моменты первого, второго, третьего, четвертого порядка по формулам (7.1), (7.2), (7.3), (7.4) соответственно:

Для группировки, представленной в таблице 3.4, также рассчитаем центральные моменты по формулам (7.1), (7.2), (7.3), (7.4):

Для группировки, представленной в таблице 3.6, рассчитаем центральные моменты по формулам (7.1), (7.2), (7.3), (7.4):

6.2 РАСЧЕТ АССИМЕТРИИ РАСПРЕДЕЛЕНИЯ

Для сравнительного изучения ассиметрии различных распределений вычисляется коэффициент ассиметрии:

(7.5)

где As — ассиметрия;

— среднее квадратическое отклонение в кубе.

Для таблицы 3.2 рассчитаем среднее квадратическое отклонение в кубе:

Рассчитаем коэффициент ассиметрии по формуле (7.5):

Так как величина коэффициента ассиметрии положительная и больше 0,5, то ассиметрия данного распределения является правосторонней и значительной.

Для таблицы 3.4 рассчитаем среднее квадратическое отклонение в кубе:

Рассчитаем коэффициент ассиметрии по формуле (7.5):

вариационный медиана квартиль статистический

Величина коэффициента ассиметрии положительная и больше 0,5, значит ассиметрия данного распределения правосторонняя и значительная.

Для таблицы 3.6 рассчитаем среднее квадратическое отклонение в кубе:

Рассчитаем коэффициент ассиметрии по формуле (7.5):

Величина коэффициента ассиметрии отрицательная и больше 0,5, значит ассиметрия данного распределения левосторонняя и значительная.

6.3 РАСЧЕТ ЭКСЦЕССА РАСПРЕДЕЛЕНИЯ

Для симметричных и умеренно ассиметричных распределений рассчитывается показатель эксцесса распределения:

(7.6)

где — среднее квадратическое отклонение в четвертой степени.

Для таблицы 3.2 рассчитаем эксцесс по формуле (7.6):

млн.руб.

Величина эксцесса положительная, значит данное распределение островершинное.

Для таблицы 3.4 рассчитаем эксцесс по формуле (7.6):

млн.т.км

Величина эксцесса отрицательная, следовательно, данное распределение плосковершинное.

Для таблицы 3.6 рассчитаем эксцесс по формуле (7.6):

руб.

Величина эксцесса отрицательная, следовательно, данное распределение плосковершинное.

7. РАСПРЕДЕЛЕНИЕ ВЫБОРАЧНЫХ СРЕДНИХ

7.1 ОПРЕДЕЛЕНИЕ ГРАНИЦ ГЕНЕРОЛЬНОЙ СОБСТВЕННО СЛУЧАЙНОЙ ВЫБОРКИ (ПОВТОРНЫЙ И БЕЗПОВТОРНЫЙ ОТБОР)

Собственно-случайная выборка — отбор единиц из генеральной совокупности наугад или наудачу, без каких-либо элементов системности, прежде чем производить собственно-случайный отбор, необходимо убедится, что все без исключения единицы генеральной совокупности имеют абсолютно равные шансы попадания в выборку, в списках или перечне отсутствуют пропуски, игнорирования отдельных единиц и т. п. Следует также установить четкие границы генеральной совокупности таким образом, чтобы включение или не выключение в нее отдельных единиц не вызывало сомнений.

Технически собственно-случайный отбор проводят методом жеребьевки или по таблице случайных чисел.

Предельная ошибка выборки случайная величина.

(8.1)

Средняя ошибка выборки.

(8.2)

гдесредняя ошибка выборки;

— генеральная дисперсия;

N — объем выборочной совокупности.

Предельная ошибка выборки в каких границах находится величина генеральной средней.

(8.3)

Бесповторный отбор.

(8.4)

Средняя ошибка повторной собственно-случайной выборки определяется по формуле:

(8.5)

Предположим, в результате выборочного обследования жилищных условий жителей Волгоградской области, осуществленного на основе собственно-случайной повторной выборки, получен следующий ряд распределения.

Таблица.8.1

Группировка населения по жилой площади приходящегося на 1человека.

Общее число школ на 1 чел.

Число жителей

До 5

2,5

5−10

142,5

7,5

101 531,25

2,09

10−15

12,5

1,45

15−20

283,5

17,5

1 339 537,5

1,44

20−25

22,5

106 312,5

1,12

25−30

27,5

103 812,5

4,09

30-более

124,5

32,5

87 668,75

10 914 759,38

Итого

2296.5

4 860 302.5

19 209 169.57

Первое действие определим среднюю выборочную.

Рассчитаем дисперсию.

Средне квадратическое.

Рассчитаем среднюю ошибку выборки.

Определим предельную ошибку выборки с вероятностью 0,954.

Установим границы генеральной средней.

Вывод: с вероятностью 0,954 можно заключить, что среднее число школ приходится, на одного человека лежит в пределах от 4 858 005.94 до 4 858 006,06

7.2 Определение границ генеральной средней типическим отбором

Типический отбор. Этот способ отбора используется в тех случаях. Когда все единицы генеральной совокупности можно разбить на несколько типических групп. Типический отбор предполагает выборку единиц из каждой типической группы собственно-случайным или механическим способом. Поскольку в выборочную совокупность в той или иной пропорции обязательно попадают всех групп, типизация генеральной совокупности позволяет исключить влияние межгрупповой дисперсии среднюю ошибку выборки, которая в этом случае определяется только внутригрупповой вариацией.

Отбор единиц в типическую выборку может быть организован либо пропорционально объему типических групп, либо пропорционально внутригрупповой дифференциации признака.

Отбор, пропорциональный дифференциации признака, дает лучшие результаты, однако на практике его применение затруднено вследствие трудности получения сведений о вариации до проведения выборочного наблюдения.

Показать весь текст
Заполнить форму текущей работой