Помощь в написании студенческих работ
Антистрессовый сервис

Инструменты статистики

КурсоваяПомощь в написанииУзнать стоимостьмоей работы

Из приложения, А можно рассчитать среднее значение показателя в совокупности. Необходимо учитывать, что оно должно быть рассчитано по формуле средней арифметической взвешенной, однако вес определить достаточно сложно, потому что неизвестно, сколько человек и сколько времени работали за весь 2007 год. Также нельзя точно определить размер заработной платы отдельного работника, поэтому в курсовой… Читать ещё >

Инструменты статистики (реферат, курсовая, диплом, контрольная)

ОГЛАВЛЕНИЕ ВВЕДЕНИЕ

1. ОПРЕДЕЛЕНИЕ СРЕДНЕГО ЗНАЧЕНИЯ ПОКАЗАТЕЛЯ В СОВОКУПНОСТИ

2. ВАРИАЦИОННЫЙ АНАЛИЗ ПОКАЗАТЕЛЯ

3. ПРОВЕРКА ГИПОТЕЗЫ О НОРМАЛЬНОМ ХАРАКТЕРЕ РАСПРЕДЕЛЕНИЯ ПОКАЗАТЕЛЯ

4. ВЫБОРОЧНОЕ НАБЛЮДЕНИЕ

5. КОРРЕЛЯЦИОННО-РЕГРЕССИОННЫЙ АНАЛИЗ ПОКАЗАТЕЛЯ

6. АНАЛИЗ РЯДОВ ДИНАМИКИ ЗАКЛЮЧЕНИЕ БИБЛИОГРАФИЧЕСКИЙ СПИСОК ПРИЛОЖЕНИЯ

ВВЕДЕНИЕ

На протяжении всего времени своего существования, статистика была незаменимым помощником в ведении хозяйства, управлении государством, направлении социальных процессов.

Предмет статистики — это количественная сторона социально-экономических явлений, которая рассматривается во взаимозависимости с качественной стороной в системе общественного производства. Именно поэтому статистика является столь важной и востребованной в наши дни наукой.

Цель сводки — выявление типичных черт и закономерностей, присущих явлению в целом. На основе группировки рассчитываются сводные показатели по группам, появляется возможность их сравнения, анализа причин различий между группами, изучение взаимосвязей между признаками. Если рассчитать сводные показатели только в целом по совокупности, то мы не можем уловить ее структуры, роли отдельных групп, их специфики. С помощью вариационного анализа можно найти и проанализировать структуру вариаций, силу вариаций, интенсивности вариаций, характер вариации, колеблемость признака, определить распределение признака. Изучение динамики позволяет дать характеристику изменения статистических показателей во времени, изучить развитие данного статистического показателя.

Методы статистики, перечисленные мною выше, будут применены в рамках данного курсового проекта и именно в том случае, если их применение будет являться оправданным и целесообразным. Цель данной курсовой работы — освоить инструменты статистики для дальнейшего применения в решении управленческих задач.

1. ОПРЕДЕЛЕНИЕ СРЕДНЕГО ЗНАЧЕНИЯ ПОКАЗАТЕЛЯ В

СОВОКУПНОСТИ Формулировка задания: на основании имеющихся данных определить среднее значение показателя в совокупности. Определить размах вариации в исследуемой совокупности на основе имеющихся индивидуальных значений показателя.

Решение: Выполним простую сводку регионов РФ по показателю «Среднемесячная номинальная начисленная заработная плата (в месяц), руб.» в 2007 г., т. е. занесем результаты статистического наблюдения в единый документ без какого-либо ранжирования или разделения на группы. Задача сводки — обобщить, систематизировать результаты наблюдения, чтобы стало возможным выявить характерные черты совокупности. Исходные данные были взяты из Российского статистического ежегодника 2008 года. Для дальнейших расчетов из совокупности исключаем, во-первых, те регионы, данных для которых нет в таблице, а во-вторых, субъекты РФ, значения показателя для которых уже входят в данные, приведенные для соответствующих этим субъектам областей. В результате были исключены следующие субъекты: Ненецкий автономный округ, Усть-Ордынский Бурятский автономный округ, Ханты-Мансийский автономный округ — Югра, Ямало-Ненецкий автономный округ, Агинский Бурятский автономный округ, а также Чеченская республика, т.к. по ней данные отсутствуют. В изучаемой совокупность получилось 80 субъектов.

Из приложения, А можно рассчитать среднее значение показателя в совокупности. Необходимо учитывать, что оно должно быть рассчитано по формуле средней арифметической взвешенной, однако вес определить достаточно сложно, потому что неизвестно, сколько человек и сколько времени работали за весь 2007 год. Также нельзя точно определить размер заработной платы отдельного работника, поэтому в курсовой работе среднее рассчитано по формуле простой арифметической. Средняя величина — количественная характеристика общего в явлениях и процессах, характеристика статистической закономерности. Формула для расчёта простой арифметической средней величины:

Наименьшее значение показателя в совокупности равно 5696,4 рублей и оно принадлежит республике Дагестан. Наибольшее принадлежит Чукотскому автономному округу. Размах вариации, как разность между наибольшего и наименьшего значения, составил 25 162,7 рублей:

Размах вариации является показателем силы вариации, поэтому он показывает насколько велик абсолютный разброс значений признака.

Выводы: В среднем по Российской Федерации на 2007 г. среднемесячная номинальная начисленная заработная плата составляла -11 929,2 руб. Величина размаха вариации 25 162,7 рублей характеризует достаточно высокое расхождение между значениями признаков по единицам статистической совокупности, а, следовательно, и неоднородность изучаемой статистической совокупности.

2. ВАРИАЦИОННЫЙ АНАЛИЗ Формулировка задания: провести вариационный анализ статистической совокупности по показателю, для чего:

1) построить вариационный ряд и изобразить его графически;

2) построить кумуляту и огиву (в одной системе координат);

3) рассчитать показатели структуры, силы и интенсивности вариации;

4) сделать выводы относительно исследуемой совокупности.

Решение:

1) Первый этап вариационного анализа — построение вариационного ряда. Это упорядоченное распределение единиц совокупности по возрастающим (убывающим) значения признака. На этом этапе важно правильно определить, ряд какого вида целесообразно построить. Т.к. изучаемый признак — номинальная начисленная заработная плата — относится к непрерывному виду, то строим интервальный вариационный ряд. Для построения вариационного ряда определим количество интервалов в ряду и длину интервала.

Воспользуемся формулой Стержесса:

К = 1+3,32lg80 = 7,32

В качестве длины интервала выбирается целочисленное и удобное для восприятия значение в интервале от l1 до l2 .

;

В нашем случае l1 = 3594,67 и l2 = 3145,34. Таким образом, вариационный интервальный ряд по формуле Стержесса должен состоять из 7 интервалов длиной l=3500.Но в нашем случае за длину интервала для наглядности необходимо принять 4000 руб. (Таблица 2.1).

Таблица 2.1 — Вариационный ряд

Среднемесячная начисленная заработная плата, руб.

Количество регионов

5 000−9 000

9 000−13 000

13 000−17 000

17 000−21 000

21 000−25 000

25 000−29 000

29 000−33 000

Графически интервальный вариационный ряд изображается гистограммой (рисунок 2.1):

Рисунок 2.1 Графическое отображение вариационного ряда Из графического изображения вариационного ряда видно, что по субъектам Российской Федерации на 2007 год большая доля субъектов имеет уровень среднемесячной заработной платы от 9000 рублей до 13 000 рублей (36 субъектов из 80, что составляет 45%).

2) Огива (распределение «больше чем») и кумулята (распределение «меньше чем») строятся по накопленным частотам. Накопленные частоты определяются путем последовательного суммирования частот по группам и показывают значения признака, который меньше или равен рассматриваемому значению. Расчет накопленных частот для огивы и кумуляты представлены в Таблице 2.2 и Таблице 2.3

Таблица 2.2 — Координаты точек пересечения для кумуляты

Граница интервала

кол-во регионов

накопленные частоты (кумулята)

5000−9000

9000−13 000

13 000−17 000

17 000−21 000

21 000−25 000

25 000−29 000

29 000−33 000

Таблица 2.3 — Координаты точек пересечения для огивы

Граница интервала

кол-во регионов

накопленные частоты (огива)

5000−9000

9000−13 000

13 000−17 000

17 000−21 000

21 000−25 000

25 000−29 000

29 000−33 000

Графическое изображение кумуляты и огивы выглядит следующим образом (Рисунок 2.2 и рисунок 2.3).

Рисунок 2.2 — Графическое изображение кумуляты Рисунок 2.3 — Графическое изображение огивы

3) К показателям структуры относятся мода и медиана.

Мода — наиболее часто встречающееся значение признака.

Модальный интервал — это интервал с наибольшей частотой появления признака. В данном случае модальный интервал: от 9000 рублей до 13 000 рублей.

Мо = ;

В данной совокупности большинство регионов имеют уровень безработицы близкий к 10 368,4 рублей.

Медиана — значение признака, делящее совокупность на две равные части.

Медианный интервал — это интервал, в котором накопленная частота появления признака превышает половину объема совокупности.

В данном случае медианный интервал: от 9000 рублей до 13 000 рублей (в данном интервале накопленная частота 59 превышает половину объема совокупности, который равен 40).

Ме = ;

Это означает, что половина регионов РФ имеют уровень среднемесячной зарплаты ниже 11 956,5 рублей, а половина — выше.

Значение медианы и моды должны попадать в медианный интервал.

Мо = 10 368,4 рублей; Ме = 11 456,5 рублей — эти значения попадают в медианный интервал: от 9000 рублей до 13 000 рублей.

Среднее значение по формуле средней взвешенной равно 11 850 рублей (приложение Б).

К показателям силы вариации относятся среднее линейное отклонение (), среднее квадратическое отклонение () и дисперсия ().

;

В среднем по совокупности значения признака у отдельных единиц отклоняется от среднего значения примерно на 3553,75 рублей, что является довольно значительной цифрой.

;

СКО (корень из дисперсии) показывает, на сколько в среднем фактические значения показателя отклоняются от своего среднего значения (является более точным, чем среднее линейное отклонение). Соотношение СКО к среднему линейному отклонению зависит от наличия в совокупности резких отклонений (чем больше соотношение, тем более неоднородна совокупность). Для нормального распределения ?/d? 1,25. В нашем же случае эта величина равна 1,40 — то есть наше распределение нельзя считать близким к нормальному. Квадрат среднего квадратического отклонения дает величину дисперсии, которая является мерой рассеивания значений признака по всем единицам совокупности под влиянием всех факторов. Чем меньше ее значение, тем лучше, тем меньше значения признака совокупности отклоняются от своего среднего значения. Полученное значение дисперсии велико, что говорит о сильном разбросе значений признака от среднего.

К показателям интенсивности относятся относительный размах вариации (), относительное линейное отклонение () и коэффициент вариации ().

;

;

.

Они используются для сравнения наблюдаемой вариации с некоторой обычной ее интенсивностью, принимаемой за норматив. Совокупность можно считать однородной, если коэффициент вариации не превышает 33%. Значение коэффициента вариации, равное 42%, говорит о неоднородности совокупности (относительное среднее линейное отклонение имеет тот же смысл, но является менее точным показателем: в нашем случае этот коэффициент равен 30%). Относительный размах вариации для нашей совокупности составил 212%. Это говорит о сильном разбросе значений показателя от средней величины.

Таблица 2.4 — Показатели вариации

Показатель

Значение, рублей

Размах вариации

25 162,70

Мода

10 368,40

Медиана

11 456,50

Среднее линейное отклонение

3 553,75

Среднее квадратическое отклонение

4 967,65

Дисперсия

24 677 500,00

Относительный размах вариации

2,12

Относительное линейное отклонение

0,30

Коэффициент вариации

0,42

3. ПРОВЕРКА ГИПОТЕЗЫ О НОРМАЛЬНОМ ХАРАКТЕРЕ

РАСПРЕДЕЛЕНИЯ ПОКАЗАТЕЛЯ Задание: Проверить гипотезу о нормальном распределении Показателя, используя критерий Пирсона. Степень значимости принять равной 0,05.

Решение:

Нормальное распределение — распределение, полностью определяющееся двумя параметрами — средним значением и СКО.

Причина частого обращения именно к закону нормального распределения заключается в том, что в этом типе распределения отражается закономерность, возникающая при взаимодействии множества случайных факторов, ни один из которых не является преобладающим.

Проверим гипотезу о нормальном законе распределения. Для этого воспользуемся критерием согласия Пирсона (хи-квадрат). Идея Пирсона заключается в расчете и последующей оценке размера отклонений фактических значений частоты появления признака по интервалам от их теоретических значений, т. е. значений, которые бы имели место в случае нормального распределения. Чем больше размер этих отклонений, тем меньше оснований считать распределение близким к нормальному.

Результаты проверки гипотезы представлены в Приложении Б.

Таким образом, проверка гипотезы показала, что данное распределение не соответствует нормальному. Этот результат не явился неожиданным, т.к. в социально-экономической статистике нормальное распределение практически вообще не встречается; однако сравнение с нормальным распределением важно для выяснения степени и характера отклонений от него фактического распределения.

Проанализируем характер отклонений в параметрах распределения от нормального.

Если, то гипотеза принята;

Если, то гипотеза отклоняется.

Для расчета фактического значения:

рассчитаем нормированное отклонение () для каждого интервала;

найдём плотности вероятности нормирования по таблице;

определим теоретические частоты для каждого интервал (Приложение В);

определим теоретическое значение критерия Пирсона ();

Расчет представлен в Таблице3.1.

Таблица 3.1 — Расчет критерия Пирсона фактического

Интервалы значений признака

Частота,

Частота,

?2расч.

5 000−9 000

3,06

9 000−13 000

4,84

13 000−17 000

4,76

17 000−33 000

0,09

Итого:

Х

Х

12,76

Для сравнения фактического значения критерия Пирсонас табличным значением рассчитаем число степеней свободы df=4−3=1 (4-число интервалов в вариационном ряду), при уровне значимости 0,05 и при df = 1, табличное значение равно 3,841. Расчётное значение = 12,76, что значительно выше табличного. Следовательно, гипотезу о близости эмпирического распределения к нормальному отвергается с вероятностью 95%.Для наглядности анализа данных, представим распределения теоретических и фактических частот графически (Рисунок 3.1).

Рисунок 3.1 — Распределение частот

Из графика наглядно видно, что данное эмпирическое распределение не соответствует нормальному закону распределения.

Рассчитаем показатели эксцесса и ассиметрии (Приложение Г). Для этого используем формулы коэффициента асимметрии и показателя эксцесса.

Показатель ассиметрии больше нуля, следовательно, имеет место правосторонняя ассиметрия, т. е. основная масса значений смещена в область малых значений. Показатель эксцесса равен 2,61, что больше нуля, следовательно распределение признака является островершинным.

Вывод: гипотеза о близости эмпирического распределения к нормальному отвергается с вероятностью 95%, следовательно, довольно сложно прогнозировать какая доля единиц совокупности попадёт в данный интервал значений признака.

4. ВЫБОРОЧНОЕ НАБЛЮДЕНИЕ Задание: провести 20%-ную бесповторную выборку двумя способами: случайная и районированная, используя в качестве районов Федеральные округа.

Решение: выборка Генеральная совокупность 80 субъектов, выборка будет составлять 18 субъектов. Выборка производиться случайным образом с помощью генератора случайных чисел.

Таблица 4.1 — Список 20%-ной выборочной совокупности

Регион

Среднемесячная начисленная зарплата за 2007 г., руб.

Ивановская область

8171,6

Липецкая область

10 907,1

Тамбовская область

7903,0

Тверская область

10 177,0

г. Москва

23 623,3

Республика Карелия

13 342,1

Калининградская область

12 750,3

Новгородская область

11 004,9

г. Санкт-Петербург

17 552,0

Республика Адыгея

8056,4

Республика Марий Эл

8404,3

Республика Татарстан

11 468,6

Нижегородская область

10 302,0

Челябинская область

11 897,5

Иркутская область

13 770,0

Магаданская область

22 101,6

Сахалинская область

23 346,3

Еврейская автономная область

11 968,9

Х среднее по формуле простой арифметической получается равным 13 297 рублей:

Дисперсию в выборочной () совокупности равна:

Рассчитаем предельную ошибку выборки по формуле:

(1)

где tст — коэффициент доверия Стьюдента; n — размер выборочной совокупности; S2 — выборочная дисперсия признака в малой выборке. Значение коэффициента доверия Стьюдента выбирается по таблице «Распределение Стьюдента» по двум параметрам: число степеней свободы (d.f.=n-1) и степень значимости (?=1-F (t)).

Таблица 4.3 — Расчет предельной ошибки для случайной 20% бесповторной выборки

F (t)

a

t

предельная ошибка выборки

интервал для генеральной средней совокупности

0,977

0,023

2,567

3102,200

0,833

0,167

2,898

3502,211

9650,4

0,641

0,359

1,069

1291,878

Из расчетов видно, что чем больше доверительная вероятность, тем большее значение имеет коэффициент доверия Стьюдента, и тем шире доверительный интервал. Интерпретация полученных результатов:

С вероятностью 97,7% можно утверждать, что среднемесячная начисленная заработная плата за 2007 г. в РФ (генеральной совокупности) находятся в пределах от 10 050 руб. до 16 255 руб.

С вероятностью 83,3% можно утверждать, что среднемесячная начисленная заработная плата за 2007 г. в РФ (генеральной совокупности) находятся в пределах от 9650,4 руб. до 16 655 руб.

С вероятностью 64,1% можно утверждать, что среднемесячная начисленная заработная плата за 2007 г. в РФ (генеральной совокупности) находятся в пределах от 11 861 руб. до 14 444 руб.

Районированная выборка.

В каждом округе производиться двадцати процентная выборка. В центральном округе 18 субъектов, 18*20%=3,6, округляем в большую сторону до 4 субъектов. В Северо-Западном округе 10 субъектов, выбираем 2 субъекта, в Южном округе 13 субъектов 13*20%=2,6 субъекта, округляем до 3х. В Приволжском округе 14 субъектов, 20% составляет 2,8, примерно 3, в Уральском округе 4 субъекта, 20% составляет 1 субъекта, в Сибирском 12 субъектов, 20% - 2,4, примерно 3 субъекта, в Дальневосточном округе 9 субъектов, 20% - 1,8, примерно 2 субъекта. Всего получается 19 субъектов. Считаем х среднее для каждой группы по формуле простой арифметической средней, х среднее общее по формуле средней взвешанной, где вес-количество субъектов в группе. Считается дисперсия внутри групповая для каждой группы, и средняя остаточная дисперсия. Выборка и расчёты по ней представлены в приложении Д.

Таблица 4.4 — Расчет предельной ошибки для районированной 20% бесповторной выборки

F (t)

a

t

предельная ошибка выборки

интервал для генеральной средней

0,977

0,023

2,567

2204,039

10 239,428

14 647,506

0,833

0,167

2,898

2488,237

9955,229

14 931,704

0,641

0,359

1,069

917,849

11 525,618

13 361,315

С вероятностью 97,7% можно утверждать, что среднемесячная начисленная заработная плата за 2007 г. в РФ (генеральной совокупности) находятся в пределах от 10 239,4 руб. до 14 647,5 руб.

С вероятностью 83,3% можно утверждать, что среднемесячная начисленная заработная плата за 2007 г. в РФ (генеральной совокупности) находятся в пределах от 9955,2 руб. до 14 931,7 руб.

С вероятностью 64,1% можно утверждать, среднемесячная начисленная заработная плата за 2007 г. в РФ (генеральной совокупности) находятся в пределах от 11 525,6 руб. до 13 361,3 руб.

Вывод: районированная выборка оказалась более точной, так как при той же вероятности, что и в случае случайной выборки, она обеспечивает меньший доверительный интервал, а значит и более высокую точность.

5 КОРРЕЛЯЦИОННО-РЕГРЕССИОННЫЙ АНАЛИЗ

Задание: для пары признаков, один из которых является факторным (среднемесячная начисленная заработная плата по субъектам РФ за 2007.), а другой результативным (средние цены на первичном рынке жилья по субъектам РФ за 2007 г.), провести корреляционно-регрессионный анализ.

Решение:

Для построения поля корреляции понадобиться корреляционная решётка. Группировку по факторному признаку производим используя расчеты из второго задания. Всего получилось 7 интервалов длиной 4000 рублей.

Теперь разделим совокупность на группы по результативному признаку. Размах его вариации равен 97 702 рублей. По формуле Стерджесса k =7,20.

Целесообразно разделить совокупность по результативному признаку на 7 групп. Получаем интервал для каждой группе 13 957,43 рублей, примерно15 000 рублей. Из 80 единиц совокупности исключаем те, для которых неизвестны значения показателя «Средние цены на первичном рынке жилья, руб.» — получаем 71 единицу.

Таблица 5.1 Корреляционная решетка показателей «Среднемесячная начисленная заработная плата, руб.» (X) и «Средние цены на первичном рынке жилья, руб."(Y).

X

Y

15 000−30 000

30 000−45 000

45 000−60 000

60 000−75 000

75 000−90 000

90 000−105 000

105 000−120 000

5 000−9 000

;

;

;

;

;

9 000−13 000

;

;

;

;

13 000−17 000

;

;

;

;

;

17 000−21 000

;

;

;

;

;

21 000−25 000

;

;

;

;

;

25 000−29 000

;

;

;

;

;

;

29 000−33 000

;

;

;

;

;

;

;

Рисунок 5.1 — Поле корреляции Оценку тесноты связи проведем с помощью таких показателей, как коэффициент корреляции, ЭКО, коэффициент детерминации, Спирмена, Пирсона, Кэндэла и Фехнера, коэффициенты ассоциации и контенгенции.

Коэффициент корреляции: (Приложение К) Вывод: коэффициент корреляции характеризует наличие линейной связи между признаками и пороговое значение для него составляет 0,7, то есть можно сказать, что линейная связь между признаками отсутствует.

Эмпирическое корреляционное отношение и коэффициент детерминации:

Считаем среднюю в каждой группе по формуле простой арифметической, и для каждой группы считаем остаточную дисперсию. Потом рассчитывается средняя остаточная дисперсия, как средняя взвешенная из остаточных, где вес — количество единиц в группе. Она составляет 101 015 032,8 рублей2. Считаем межгрупповую дисперсию (81 966 384,03) и общую (182 981 416,8). Расчет и полученные данные представлены в Приложение К. Можно провести проверку, и получим, что общая дисперсия равна сумме средней остаточной и межгрупповой:

101 015 032,8+81 966 384,03=182 981 416,8

Коэффициент детерминации считаем как частное межгрупповая дисперсия от общей, и он составляет примерно 0,45. ЭКО равен корню из коэффициента детерминации и составляет 0,67. Вывод: связь умеренная, так как значения коэффициента детерминации и ЭКО очень близки к пороговым: 0,5 и 0,7 соответственно.

Коэффициент Спирмана (Приложение Л) равен 0,63: согласно данному коэффициенту связь прямая, довольно тесная, так как пороговое значение составляет 0,5.

Коэффициент Кендалла (Приложение М) равен 0,47, это значение немного меньше порогового (0,5) и указывает на то, что связь прямая, слабая.

Значение коэффициент Фехнера (Приложение Н) равно 0,41, что является меньше порогового (0,5), что указывает на отсутствие связи.

Коэффициенты Пирсона и Чупрова рассчитывается на основе корреляционной решетки, представленной в Таблице 5.1. Для расчета данного коэффициента найдем значение (Приложение П). Коэффициент Пирсона будет равен 0,72, а коэффициент Чупрова составил 0,42. Эти коэффициенты указывают на то, что связь достаточно тесная.

Коэффициенты контингенции и ассоциации рассчитывать не имеет смысла, так как они считаются для альтернативных признаков.

Таблица 5.2 — Сводка рассчитанных коэффициентов

Коэффициент

Полученное

значение

Пороговое

значение

Вывод

Коэффициент корреляции

0,60

0,7

Связь умеренная, прямая

ЭКО

0,67

0,7

Связь умеренная

Коэффициент детерминации

0,45

0,5

Связь умеренная

Коэффициент Спирмена

0,63

0,5

Связь тесная, прямая

Коэффициент Кендалла

0,47

0,5

Связь умеренная, прямая

Коэффициент Фехнера

0,41

0,5

Связь умеренная, прямая

Коэффициент Пирсона

0,76

0,3

Связь тесная

Коэффициент Чупрова

0,48

0,3

Связь тесная

Если делать выводы о наличии связи, опираясь на данную таблицу, можно сказать что связь есть, так как коэффициент Пирсона, Чупрова и Спирмена больше пороговых значений, а коэффициенты Фехнера и Кендела очень близки к пороговым значениям. Однако все эти коэффициенты характеризуют связь, исходя из значений рангов или частот проявления признака, а не из значений самого признака. Поэтому в первую очередь необходимо учитывать коэффициенты корреляции, детерминации и ЭКО, которые рассчитываются непосредственно на основании самих значений признака. Их значения не дотягивают до пороговых (однако очень близки к ним), поэтому нельзя с уверенностью сказать о наличии тесной связи.

Построим уравнение парной регрессии.

Чтобы определить вид связи между признаками проведем регрессионный анализ (построим уравнение регрессии).

Чтобы построить уравнение регрессии, воспользуемся методом наименьших квадратов. Суть метода состоит в том, что в качестве линии регрессии выбирается такая линия, которая наиболее точно описывает поле корреляции. Для определения такой линии по каждому предполагаемому варианту линии регрессии (прямая, парабола, гипербола) рассчитывается сумма квадратов отклонений фактических значений признаков от их теоретических значений. В качестве уравнения выбирается то, которому соответствует наименьшее значение суммы квадратов отклонений.

Уравнение прямой можно получить с помощью Excel:

y = 2,1056x + 11 331

Как и уравнение параболы:

y = -0,6×2+ 3,9247x — 904,1

Уравнения гиперболы приведём вручную — расчёты в Приложении Р. Оно получилось

у=33 307,05849+24 434 401,91/х Из трех вариантов наименьшая сумма квадратов отклонений — у параболы, следовательно, наше уравнение регрессии — параболическое и зависимость — параболическая (Приложение Ж).

Таким образом, можно сделать общий вывод, что связь между признаками — параболическая, прямая, но не очень тесная, т. е. с ростом среднемесячной заработной платы, средние цены на первичном рынке жилья увеличиваются, но это не единственный фактор.

6. АНАЛИЗ РЯДОВ ДИНАМИКИ Задание: провести анализ рядов динамики, для чего рассчитать показатели тенденции динамики, построить тренд (используя графический метод, метод наименьших квадратов и EXCEL), сделать интервальный прогноз на срок 1/3 от базы прогноза и сделать выводы.

Решение:

Тенденция — это основное направление движения признака.

К показателям тенденции относятся: средний уровень ряда, средний прирост, среднее ускорение уровня ряда, средний темп роста, средний темп прироста. Причем, показатели бывают цепные и базисные. Цепные показатели оценивают отношения статистического признака и его характеристик за смежные периоды времени, а базисные — с одним и тем же заданным базисом (в нашем случае — это будет начальный 2000 год).

1. Рассчитаем показатели для первого ряда динамики — Реальная начисленная заработная плата по РФ за 2000;2007 гг., % к предыдущему году. Ряд представлен в таблице 6.1.

Таблица 6.1 — Реальная начисленная заработная плата по РФ за 2000;2007 гг., в процентах к предыдущему году по РФ*

Показатель

Период времени

Среднее значение

Реальная начисленная заработная плата по РФ, руб.

121,00

111,00

111,00

113,00

113,00

117,00

114,33

Абсолютный цепной прирост, процентные пункты

;

2,00

;

4,00

— 50

Абсолютный базисный прирост, процентные пункты

;

— 10,00

— 10,00

— 8,00

— 8,00

— 4,00

Ускорение уровня ряда, процентные пункты

2,00

— 2,00

4,00

1,33

Окончание таблицы 6.1

Показатель

Период времени

Среднее значение

Цепной темп роста, %

100,00%

101,80%

100,00%

103,54%

135,23

Базисный темп роста, %

;

91,74%

91,74%

93,39%

93,39%

96,69%

Цепной темп прироста, %

0,00%

1,80%

0,00%

3,54%

35,23

Базисный темп прироста, %

;

— 8,26%

— 8,26%

— 6,61%

— 6,61%

— 3,31%

Цепное абсолютное значение 1% прироста

.. .

1,21

1,11

1,11

1,13

1,13

Базисное абсолютное значение 1% прироста

1,21

1,21

1,21

1,21

1,21

1,21

*Значения за 1995 г. Были убраны так как являлись несопоставимыми со значениями других годов Хотя ряд и неполный, но по полученным данным можно сделать вывод, что за весь период с 2000 по 2007 гг. Реальная начисленная заработная плата по Российской Федерации в процентах к предыдущему году составило 114 процентов. Причем в течение указанного периода изменение происходит неравномерно, и в среднем за 8 периодов абсолютный прирост снизился на 0,5 процентных пункта.

Построим тренд, используя графический метод, метод наименьших квадратов, Excel.

Графический метод Рисунок 6.1 — Динамика реальной начисленной заработной платы в процентах к предыдущему году по РФ за 2000;2007 гг. (графический метод).

Прямая проводиться визуально, примерно на равном расстоянии от точек совокупности. Берутся на ней 2 точки: A и B. С помощью их координат записывается уравнение для графического метода:

y = -0,3t + 115

Метод наименьших квадратов Таблица 6.2 — Линейная зависимость

Год

ti

yфакт

утеор

(утеор-уфакт)

121,00

115,19

33,79

111,00

114,84

14,78

111,00

114,5

12,26

113,00

114,16

1,34

113,00

113,82

0,67

117,00

113,47

12,44

X

X

X

75,28

yлиней = -0,3429t + 115,53

Таблица 6.3 — Параболическая зависимость

Год

ti

yфакт

утеор

(утеор-уфакт)

121,00

119,36

2,70

111,00

114,01

9,09

111,00

111,17

0,03

113,00

110,83

4,72

113,00

112,99

0,00

117,00

117,64

0,41

X

X

X

16.94

= 1,25 t — 9,0929t + 127,2

Таблица 6.4 — Гиперболическая зависимость

Год

ti

yфакт

утеор

(утеор-уфакт)

121,00

118,85

4,62

111,00

115,04

16,28

111,00

113,76

7,64

113,00

113,13

0,02

113,00

112,75

0,06

117,00

112,49

20,33

X

X

X

48.95

Наименьшая сумма квадратов отклонений теоретических величин от фактических наблюдается при параболической зависимости, следовательно, данный вид зависимости подходит для исследуемой совокупности. Построим тренд:

Рисунок 6.2 — Динамика реальной начисленной заработной платы в процентах к предыдущему году по РФ за 2000;2007 гг. (метод наименьших квадратов).

EXCEL

Теперь построим тренд с помощью EXCEL.

Для того, чтобы построить линию тренда в EXCEL, необходимо сначала построить фактический ряд динамики, а потом добавить линию тренда.

Рисунок 6.3- Динамика реальной начисленной заработной платы в процентах к предыдущему году по РФ за 2000;2007 гг. (EXCEL).

Рассчитаем показатели колеблемости (Приложение З).

Таблица 6.5 — Показатели колеблемости

Показатель

Значение

Амплитуда, процентные пункты

СЛО от тренда, процентные пункты

2,3

СКО от тренда, процентные пункты

2,4

Относительное лин. отклонение

2,0%

Коэффициент аппроксимации

2,1%

Средний уровень ряда, процентные пункты

Анализируя полученные результаты, мы можем сказать, что в среднем фактические значения уровней ряда отклоняются от линии тренда на 1,8 процентных пунктов, что составляет 1,5% от среднего значения уровня ряда. Это отклонение достаточно невелико, следовательно выбранное уравнение тренда неплохого качества, и оно позволяет произвести прогноз.

Составим интервальный прогноз на 2 года. Для этого необходимо уравнение зависимости, которое получено при расчете сумм квадратов отклонений. В него подставляется номер прогнозного периода и получаем точечный прогноз:

y= 1,25 *8 — 9,0929*8 + 127,2

y= 134,4568

Для расчёта интервального прогноза нужно найти ошибки I и II рода. Ошибка II рода — это полученное значение СКО, а ошибка I рода:

где — среднее значение из номеров периодов в ряду динамики;

— среднеквадратическое отклонение фактического значения от тренда;

— база прогноза (число периодов в ряду динамики);

— номер прогнозного периода;

— номера периодов в ряду динамики;

Найдем общую ошибку прогноза:

По таблице определим коэффициент Стьюдента. При степени значимости и числе степеней свободы он примет значение 2,776.

Теперь мы можем рассчитать интервальный прогноз:

125,4355?у?143,4781

Таким образом, с вероятностью 95% можно предположить, что реальной начисленной заработной платы в процентах к предыдущему году по РФ в 2009 году будет находиться в пределах от 125 до 143 процентных пунктов.

2. Реальная начисленная заработная плата по Челябинской в процентах к предыдущему году.

Таблица 6.6 — Реальная начисленная заработная плата по Челябинской за 2000;2007 гг., в процентах к предыдущему году*

Показатель

Период времени

Среднее значение

Реальная начисленная заработная плата по Челябинской области, процентные пункты

119,00

113,00

111,00

111,00

113,00

118,00

114,17

Абсолютный цепной прирост, процентные пункты

— 2,00

0,00

2,00

5,00

— 13

Абсолютный базисный прирост, процентные пункты

;

— 6,00

— 8,00

— 8,00

— 6,00

— 1,00

Ускорение уровня ряда, процентные пункты

2,00

2,00

3,00

2,33

Цепной темп роста, %

100,00

101,80

100,00

103,54

133,67

Базисный темп роста, %

;

91,74

91,74

93,39

93,39

96,69

Цепной темп прироста, %

0,00

1,80

0,00

3,54

33,67

Базисный темп прироста, %

;

— 8,26

— 8,26

— 6,61

— 6,61

— 3,31

Цепное абсолютное значение 1% прироста

.. .

1,19

1,13

1,11

1,11

1,13

Базисное абсолютное значение 1% прироста

1,19

1,19

1,19

1,19

1,19

1,19

*Значения за 1995 г. Были убраны так как являлись несопоставимыми со значениями других годов По полученным данным можно сделать вывод, что за весь период с 2000 по 2007 гг. по Челябинской области среднее средняя заработная плата в процентах на человека составило 114,17%. Причем в течение указанного периода каждый год происходит уменьшение заработной платы в 0,13 процентных пункта.

Построим тренд, используя графический метод, метод наименьших квадратов, Excel.

Графический метод Рисунок 6.4 — Динамика реальной начисленной заработной платы в процентах к предыдущему году по РФ за 2000;2007 гг. (графический метод).

Уравнение для графического метода находится аналогично и имеет вид:

y = - 0,1x + 114

Метод наименьших квадратов Таблица 6.7 — Линейная зависимость

Год

ti

yфакт

утеор

(утеор-уфакт)

121,00

114,53

41,90

111,00

114,38

11,45

111,00

114,24

10,51

113,00

114,10

1,21

113,00

113,96

0,91

117,00

113,81

10,16

X

X

X

76,14

yлиней = -0,1429x + 114,67

Таблица 6.8 — Параболическая зависимость

Год

ti

yфакт

утеор

(утеор-уфакт)

121,00

118,75

0,06

111,00

113,54

0,29

111,00

110,86

0,02

113,00

110,71

0,08

113,00

113,11

0,01

117,00

118,04

0,00

X

X

X

0,46

= 1,2679 t — 9,0179t + 126,5

Таблица 6.9 — Гиперболическая зависимость

Год

ti

yфакт

утеор

(утеор-уфакт)

121,00

117,73

1,61

111,00

114,86

3,46

111,00

113,90

8,43

113,00

113,43

5,88

113,00

113,14

0,02

117,00

112,95

25,54

X

X

X

44,94

Наименьшая сумма квадратов отклонений теоретических величин от фактических наблюдается при параболической зависимости, следовательно, данный вид зависимости подходит для исследуемой совокупности. Построим тренд:

Рисунок 6.5 — Динамика реальной начисленной заработной платы в процентах к предыдущему году по Челябинской области за 2000;2007 гг. (метод наименьших квадратов).

EXCEL

Теперь построим тренд с помощью EXCEL. Для того, чтобы построить линию тренда в EXCEL, необходимо сначала построить фактический ряд динамики, а потом добавить линию тренда.

Рисунок 6.6 — Динамика реальной начисленной заработной платы в процентах к предыдущему году по Челябинской области за 2000;2007 гг. (EXCEL).

Таблица 6.10 — Показатели колеблемости

Показатель

Значение

Амплитуда отклонений, процентные пункты

Среднее линейное отклонение, процентные пункты

0,3

Среднеквадратическое отклонение, процентные пункты

0,4

Относительное линейное отклонение

0,3%

Коэффициент аппроксимации

0,3%

Среднее значение, процентные пункты

Анализируя полученные результаты, мы можем сказать, что в среднем фактические значения уровней ряда отклоняются от линии тренда на 0,3 процентных пункта, что составляет 0,3% от среднего значения уровня ряда. Таким образом, можно сделать вывод, что тенденция динамики исследуемого показателя является достаточно устойчивой и построенное уравнение тренда пригодно для прогнозирования. Т.к. прогнозирование возможно только на 1/3 ретроспективы, следовательно, мы можем сделать прогноз.

Отклонение фактического уровня ряда от теоретического достаточно невелико для рассматриваемых нами данных, это позволяет сделать вывод о том, что составленное нами уравнение тренда имеет хорошее качество.

Составим интервальный прогноз на 2 года. Точечный прогноз равен:

y= 135,50

Итервальный прогноз:

134,009?у? 136,9958

Таким образом, с вероятностью 95% можно предположить, что реальной начисленной заработной платы в процентах к предыдущему году по Челябинской области в 2009 году будет находиться в пределах от 134 до 137 процентных пунктов.

совокупность статистический анализ регрессия

ЗАКЛЮЧЕНИЕ

В курсовой работе был проведен подробный статистический анализ показателя «Среднемесячная начисленная заработная плата, тыс. руб.» в 2007 г. по регионам РФ. Произведенные в результате работы расчеты позволили установить, что среднее значение показателя по РФ составило 11 929,2 руб. Величина размаха вариации — 25 162,7 тыс. руб. характеризует достаточно высокое расхождение значений признака по единицам статистической совокупности, а, следовательно, и неоднородность изучаемой статистической совокупности.

Вариационный анализ позволяет определить, что распределение близко к нормальному, т.к. значение медианы расположено между значениями моды и средней, т.к. среднее значение больше моды, имеет место правосторонняя асимметрия графика распределения.

В третьем задании было установлено, что распределение среднедушевых денежных доходов по регионам РФ не соответствует нормальному, так как расчетное больше табличного.

При помощи корреляционного анализа было установлено, что между реальной среднемесячной начисленной заработной платой и ценами на первичном рынке жилья по регионам существует тесная прямая связь.

При выполнении оценки параметров генеральной совокупности на основе данных случайного и районированного выборочного наблюдения получили значение средней генеральной характеристики по рассматриваемому признаку с учетом предельной ошибки средней величины, причём среднее значение по генеральной совокупности попало во все рассчитанные интервалы по этой выборке.

Анализ динамики показателя «Среднемесячная заработная плата в процентах к предыдущему году» по РФ и по Челябинской области за 2000;2007 годы позволил найти уравнение тренда, описывающего динамику показателя, посчитаны показатели колеблемости динамики, и проведён прогноз.

БИБЛИОГРАФИЧЕСКИЙ СПИСОК

1. Ефремова М. Р. Общая теория статистики: учебник. — Москва: Изд-во ИНФРА-М, 2005 — 412с

2. Российский статистический ежегодник: Официальное издание. — М.: Госкомстат РФ, 2005

3. Лазарева Г. В., Богданчикова М. Ю. Статистика: Учебное пособие по выполнению курсового проекта. — Челябинск: Изд. ЮУрГУ, 2003.

4. СТО ЮУрГУ 20−2008 Стандарт организации. Учебные рефераты. Общие требования к построению, содержанию и оформлению / составители: Т. И. Парубочая, Н. В. Сырейщикова, В. А. Смолко, Л. В. Винокурова. — Челябинск: Изд-во ЮУрГУ, 2008.

5. Электронный ресурс: www.georus.by.ru

ПРИЛОЖЕНИЯ ПРИЛОЖЕНИЕ, А Сводная таблица среднемесячная начисленная заработная плата по субъектам РФ за 2007 год.

Таблица А.1 — Исходные данные

Регион

Среднемесячная начисленная заработная плата за 2007 год, руб.

Белгородская область

10 479,5

Брянская область

8189,6

Владимирская область

9688,1

Воронежская область

8730,9

Ивановская область

8171,6

Калужская область

10 926,8

Костромская область

9058,1

Курская область

8856,8

Липецкая область

10 907,1

Московская область

16 234,5

Орловская область

8610,7

Рязанская область

9796,6

Смоленская область

9552,1

Тамбовская область

Тверская область

Тульская область

10 137,1

Ярославская область

11 214,8

г. Москва

23 623,3

Республика Карелия

13 342,1

Республика Коми

17 077,3

Архангельская область

14 400,3

Вологодская область

12 913,9

Калининградская область

12 750,3

Ленинградская область

13 154,8

Мурманская область

Новгородская область

11 004,9

Псковская область

8950,5

г. Санкт-Петербург

Республика Адыгея

8056,4

Республика Дагестан

5696,4

Республика Ингушетия

7285,4

Кабардино-Балкарская Республика

7213,9

Республика Калмыкия

7101,2

Карачаево-Черкесская Республика

7558,4

Республика Северная Осетия — Алания

7625,8

Чеченская Республика

9916,7

Краснодарский край

Ставропольский край

8647,7

Астраханская область

9866,9

Волгоградская область

9770,2

Ростовская область

9779,6

Республика Башкортостан

11 027,1

Республика Марий Эл

8404,3

Республика Мордовия

Республика Татарстан

11 468,6

Удмуртская Республика

9838,6

Чувашская Республика

8703,2

Пермский край

Кировская область

8861,5

Нижегородская область

Оренбургская область

9619,6

Пензенская область

8566,4

Самарская область

11 920,7

Саратовская область

9108,3

Ульяновская область

8412,7

Курганская область

8883,1

Свердловская область

13 986,9

Тюменская область

Челябинская область

11 897,5

Республика Алтай

9228,2

Республика Бурятия

11 528,6

Республика Тыва

10 701,6

Республика Хакасия

11 251,2

Алтайский край

7804,7

Красноярский край

Иркутская область

Кемеровская область

12 554,9

Новосибирская область

12 017,0

Регион

Среднемесячная начисленная заработная плата за 2007 год, руб

Омская область

11 003,6

Томская область

Читинская область

12 161,5

Республика Саха (Якутия)

19 409,2

Камчатский край

21 814,7

Приморский край

13 174,1

Хабаровский край

15 883,5

Амурская область

13 534,4

Магаданская область

22 101,6

Сахалинская область

23 346,3

Еврейская автономная область

11 968,9

Чукотский автономный округ

30 859,1

Средняя величина — количественная характеристика общего в явлениях и процессах, характеристика статистической закономерности. Формула для расчёта простой арифметической средней величины:

Наименьшее значение показателя в совокупности равно 5696,4 рублей и оно принадлежит республике Дагестан. Наибольшее принадлежит Чукотскому автономному округу. Размах вариации, как разность между наибольшего и наименьшего значения, составил 25 162,7 рублей:

ПРИЛОЖЕНИЕ Б Расчет показателей вариации Таблица Б.1 — Расчет значений для показателей вариации

Интервалы

Частота,

Середина интервала,

5 000−9 000

9 000−13 000

13 000−17 000

17 000−21 000

21 000−25 000

25 000−29 000

29 000−33 000

Рассчитаем среднее значение признака по формуле средней взвешенной:

Показатели структуры вариации.

Мода — наиболее часто встречающееся значение признака.

(Б.1)

где — начальное значение,

— длина модального интервала,

— частота модального интервала,

— частота интервала, предшествующего данному,

— частота интервала, следующего за данным.

Мо = ;

Медиана.

Сначала находим номер медианного интервала:

(Б.2)

.

Затем само значение медианы:

(Б.3)

Ме = ;

Расчет показателей силы вариации.

Среднее линейное отклонение найдем следующим образом:

(Б.4)

где СЛО — среднее линейное отклонение;

— i-е значение признака (середина интервала);

— среднее значение признака;

— частота признака.

Подставив исходные значения, получим:

;

Расчет дисперсии ():

(Б.5)

Среднее квадратическое отклонение:

(Б.6)

;

Расчет показателей интенсивности вариации.

Относительный размах вариации ():

(Б.7)

;

Коэффициент вариации ():

(Б.9)

ПРИЛОЖЕНИЕ В Расчеты для проверки гипотезы о нормальном распределении показателя

Таблица В.1 — Расчет частот теоретического ряда распределения

Середеина интервала

частота

t

f (t)

теоретич

округл

— 0,9763

0,2468

15,90

3,063

— 0,1711

0,3932

25,33

4,840

0,6341

0,3271

21,07

4,762

1,4393

0,1415

9,11

2,778

2,2445

0,0325

2,09

1,205

3,0497

0,0038

0,24

3,8549

0,0002

0,01

Так как у нас есть интервалы с частотой меньше 5, нам необходимо объединить некоторые интервалы. После несложных преобразований получаем новые частоты.

Таблица В.2 — Расчет частот теоретического ряда распределения по объединенным интервалам

Интервалы значений признака

Частота,

Частота,

?2расч.

5 000−9 000

3,06

9 000−13 000

4,84

13 000−17 000

4,76

17 000−33 000

0,09

Итого:

Х

Х

12,76

ПРИЛОЖЕНИЕ Г Расчет ассиметрии и экцесса Таблица Г.1 — Расчет ассиметрии и эксцесса

Интервалы значений признака

Середина интервала

Частота

5 000;

9 000

— 2623 934 875 000,00

12 726 084 143 750 000,00

9 000;

13 000

— 22 108 500 000,00

18 792 225 000 000,00

13 000;

17 000

343 814 625 000,00

1 083 016 068 750 000,00

17 000;

21 000

1 462 103 500 000,00

10 454 040 025 000 000,00

21 000;

25 000

5 544 783 500 000,00

61 824 336 025 000 000,00

25 000;

29 000

3 477 265 875 000,00

52 680 578 006 250 000,00

29 000;

33 000

7 22 735 875 000,00

134 485 392 006 250 000,00

ИТОГО:

X

1 520 466 000 000,00

273 272 238 500 000 000,00

ПРИЛОЖЕНИЕ Д Расчеты для 20% бесповторных случайной и районированной выборок Таблица Д.1 — Случайная выборка

Регион

Среднемесячная начисленная зарплата за 2007 г., руб.

Ивановская область

8171,6

24 810 416,3

Липецкая область

10 907,1

5 042 295,2

Тамбовская область

7903,0

27 558 358,5

Тверская область

10 177,0

8 854 228,4

г. Москва

23 623,3

109 635 442,1

Республика Карелия

13 342,1

35 908,1

Калининградская область

12 750,3

161 849,8

Новгородская область

11 004,9

4 612 639,2

г. Санкт-Петербург

17 552,0

19 354 671,5

Республика Адыгея

8056,4

25 971 311,1

Республика Марий Эл

8404,3

22 546 405,6

Республика Татарстан

11 468,6

2 835 874,7

Нижегородская область

10 302,0

8 125 952,0

Челябинская область

11 897,5

1 575 290,0

Иркутская область

13 770,0

381 175,9

Магаданская область

22 101,6

80 084 501,6

Сахалинская область

23 346,3

103 911 406,4

Еврейская автономная область

11 968,9

1 401 158,8

ИТОГО:

236 746,9

446 898 885,3

В соответствии с заданием необходимо рассчитать предельную ошибку выборки, используя значения вероятности 0,977, 0,833, 0,641.

Определим число степеней свободы:

d.f. = n — 1= 18 — 1=17

Рассчитаем значения степеней значимости, используя значения вероятностей 0,977, 0,833, 0,641 соответственно:

Рассчитаем среднее значение сремесячной начисленной заработной платы за 2007 году в выборке:

Далее рассчитаем среднее квадратическое отклонение исследуемого показателя по малой выборке:

Вычислим предельную ошибку средней для исследуемой малой выборки для соответствующих вероятностей:

;

;

.

Определим доверительные интервалы генеральной средней, в который с доверительными вероятностями попадет значение генеральной средней:

10 050

9650,4

11 861

Таблица Д.2 — Районированная выборка

Субъект

Округ

Среднемеячная з/п за 2007 г.

х среднее

х среднее общее

S2 внутригр.

S2 ср.ост.

Белгородская область

Центральный

10 479,5

12 922,63

12 443,47

38 643 699,16

13 269 645,60

Воронежская область

8730,9

Курская область

8856,8

Г. Москва

23 623,3

Псковская область

Северо-Западный

8950,5

13 251,25

18 496 450,56

г. Санкт-Петеpбуpг

Астраханская область

Южный

9866,9

9805,57

1895,62

Волгоградская область

9770,2

Ростовская область

9779,6

Республика Татарстан

Приволжский

11 468,6

10 112,33

1 421 780,86

Нижегородская область

Пензенская область

8566,4

Челябинская область

Уральский

11 897,5

11 897,50

;

Республика Алтай

Сибирский

9228,2

11 636,13

4 582 140,28

Республика Хакасия

11 251,2

Томская область

Хабаровский край

Дальневосточный

15 883,5

19 614,90

13 923 345,96

Сахалинская область

23 346,3

Рассчитаем средние значения показателя по всем Федеральным округам:

Рассчитаем остаточные дисперсии по всем Федеральным округам:

Найдем среднюю из остаточных дисперсий:

Расчет предельной ошибки средней для исследуемой малой выборки для вероятностей 0,903, 0,870, 0,655:

;

;

.

Определим доверительные интервалы генеральной средней, в который с доверительными вероятностями попадет значение генеральной средней:

10 239,428

9955,229

11 525,618

ПРИЛОЖЕНИЕ Е Расчет коэффициента корреляции Таблица Е.1 — Расчет коэффициента корреляции

Регион

xi

yi

(Xi-Xср)(Yi-Yср)

(Xi-Xср)2

(Yi-Yср)2

Республика Северная Осетия — Алания

7625,8

77 327 339,3

15 238 873,69

392 385 784,2

Республика Калмыкия

7101,2

82 861 153,96

19 609 840,89

350 128 839,6

Еврейская автономная область

11 968,9

— 7 863 823,162

193 072,36

320 292 944,7

Республика Дагестан

5696,4

80 384 376,16

34 025 055,61

189 908 519,3

Ставропольский край

8647,7

36 067 830,71

8 304 771,24

156 643 497,4

Республика Мордовия

40 123 389,85

11 740 902,25

137 117 776,7

Республика Адыгея

8056,4

39 429 166,56

12 062 423,61

128 884 478,5

Саратовская область

9108,3

26 809 293,88

5 862 209,44

122 605 349,7

Орловская область

8610,7

28 994 571,12

8 519 393,44

98 678 991,71

Брянская область

8189,6

33 044 068,83

11 154 932,01

97 885 893,31

Республика Хакасия

11 251,2

2 748 972,259

77 450,89

97 569 549,95

Республика Тыва

10 701,6

7 540 289,667

685 418,41

82 950 745,75

Курская область

8856,8

24 133 759,37

7 143 325,29

81 536 023,87

Смоленская область

9552,1

17 299 738,7

3 910 110,76

76 540 276,61

Астраханская область

9866,9

14 125 000,7

2 764 238,76

72 177 428,23

Тамбовская область

27 651 083,35

13 151 502,25

58 136 507,57

Оренбургская область

9619,6

14 537 643,13

3 647 718,01

57 938 433,59

Читинская область

12 161,5

— 4 776 485,36

57 119 282,75

Республика Алтай

9228,2

15 489 428,95

5 295 981,69

45 302 726,33

Новгородская область

11 004,9

3 472 185,758

275 205,16

43 807 586,81

Воронежская область

8730,9

18 204 137,38

7 832 161,96

42 311 512,37

Республика Бурятия

11 528,6

5541,057

0,81

37 905 324,29

Кемеровская область

12 554,9

— 5 893 722,342

1 051 445,16

33 036 400,15

Ивановская область

8171,6

18 078 026,97

11 275 492,41

28 984 548,71

Ленинградская область

13 154,8

— 8 017 166,069

2 641 600,09

24 331 825,25

Республика Саха (Якутия)

19 409,2

— 37 607 680,58

62 089 672,09

22 778 951,65

Ростовская область

9779,6

8 341 300,827

3 062 150,01

22 721 714,89

Продолжение таблицы Е.1

Регион

xi

yi

(Xi-Xср)(Yi-Yср)

(Xi-Xср)2

(Yi-Yср)2

Ульяновская область

8412,7

13 254 908,86

9 714 442,24

18 085 712,45

Республика Марий Эл

8404,3

12 553 084,6

9 766 875,04

16 134 119,89

Республика Карелия

13 342,1

— 7 179 219,198

3 285 518,76

15 687 382,13

Пензенская область

8566,4

10 971 559,26

8 779 961,61

13 710 209,45

Тульская область

10 137,1

4 874 416,452

1 938 777,76

12 255 110,53

Псковская область

8950,5

8 417 159,67

10 651 933,51

Амурская область

13 534,4

— 6 232 692,777

4 019 624,01

9 664 202,213

Омская область

11 003,6

1 523 390,307

276 570,81

8 391 044,693

Республика Татарстан

11 468,6

173 122,257

3708,81

8 081 113,853

Белгородская область

10 479,5

2 909 266,5

7 676 944,733

Чувашская Республика

8703,2

7 265 654,199

7 987 971,69

6 608 652,733

Челябинская область

11 897,5

— 805 084,64

4 786 162,553

Алтайский край

7804,7

2 159 378,304

13 874 135,04

336 086,8729

Самарская область

11 920,7

— 54 662,376

153 037,44

19 524,4729

Волгоградская область

9770,2

64 619,089

3 095 136,49

1349,0929

Владимирская область

9688,1

— 295 121,178

3 390 753,96

25 686,4729

Рязанская область

9796,6

— 601 784,183

3 002 942,41

120 596,4529

Кировская область

8861,5

— 1 131 952,36

180 005,0329

Томская область

3 259 820,865

8 407 100,25

1 263 983,033

Костромская область

9058,1

— 4 414 587,678

6 107 817,96

3 190 760,513

Липецкая область

10 907,1

— 1 742 265,648

387 381,76

7 835 912,533

Удмуртская Республика

9838,6

— 5 610 862,743

2 859 142,81

11 010 915,79

Калининградская область

12 750,3

4 136 400,016

1 490 352,64

11 480 373,59

Вологодская область

12 913,9

4 910 840,588

1 916 563,36

12 583 124,45

Тверская область

— 5 191 260,175

1 829 256,25

14 732 316,59

Архангельская область

14 400,3

12 164 354,72

8 241 492,64

17 954 457,05

Республика Башкортостан

11 027,1

— 2 146 388,448

252 405,76

18 252 290,95

Калужская область

10 926,8

— 2 666 507,529

363 247,29

19 574 165,03

Краснодарский край

— 5 925 099,265

1 611 630,25

21 783 409,25

Камчатский край

21 814,7

48 055 231,4

21 830 106,95

Красноярский край

40 435,0

19 214 948,24

15 844 380,25

23 302 535,65

Приморский край

13 174,1

8 425 729,842

2 704 709,16

26 247 895,49

Хабаровский край

15 883,5

27 714 385,58

40 516 662,17

Республика Коми

17 077,3

40 550 368,11

30 778 084,84

53 425 427,93

Тюменская область

128 844 086,1

290 208 260,3

57 203 053,09

Новосибирская область

3 744 131,625

237 656,25

58 986 547,27

Ярославская область

11 214,8

— 2 551 357,869

99 036,09

65 727 826,85

Иркутская область

31 387 769,44

5 019 840,25

196 259 645,9

Пермский край

4 652 386,655

106 602,25

203 041 695,5

Московская область

16 234,5

75 935 265,35

260 476 036,1

Свердловская область

13 986,9

45 838 545,7

6 038 814,76

347 944 481,7

Нижегородская область

— 25 292 968,93

1 506 756,25

424 577 151,8

г. Санкт-Петербург

268 864 093,6

36 270 506,25

г. Москва

23 623,3

942 025 628,7

146 259 998,4

Итого

818 594,4

Коэффициент корреляции ():

(Е.1)

где xi, yi — индивидуальные значения факторного и результативного признака.

ПРИЛОЖЕНИЕ Ж Расчет эмпирического корреляционного отношения (ЭКО) и коэффициента детерминации Для расчета данных показателей воспользуемся группировкой единиц исследуемой совокупности (субъектов РФ) по факторному признаку, которая была проведена ранее.

Показать весь текст
Заполнить форму текущей работой