Помощь в написании студенческих работ
Антистрессовый сервис

Основы статистики

КурсоваяПомощь в написанииУзнать стоимостьмоей работы

Слово «статистика» латинского происхождения (от «status» — состояние). В середине века оно означало политическое состояние государства. В науку этот термин введен в ХVIII веке немецким ученым Готфридом Ахенвалем. Собственно как наука, статистика возникла в конце семнадцатого века, хотя статистический учет существовал в глубокой древности. Так, известно, что еще за 5 тыс. лет до н.э. проводились… Читать ещё >

Основы статистики (реферат, курсовая, диплом, контрольная)

Введение

Слово «статистика» латинского происхождения (от «status» — состояние). В середине века оно означало политическое состояние государства. В науку этот термин введен в ХVIII веке немецким ученым Готфридом Ахенвалем. Собственно как наука, статистика возникла в конце семнадцатого века, хотя статистический учет существовал в глубокой древности. Так, известно, что еще за 5 тыс. лет до н.э. проводились переписи населения в Китае, осуществлялось сравнение разных стран, велся учет имущества граждан в Древнем Риме, населения, домашнего имущества, земель — в средние века.

Начало формирования статистики как метода научного познания было положено трудами бельгийского статистика Адольфа Кетле (1796−1874), который поставил своей задачей исследовать законы, управляющие обществом. Благодаря Кетле на первый план вместо описательного государствоведения вышла теория статистики, направленная на изучение массовых процессов общественной жизни, измеряемых статистически и получила развитие практическая статистическая деятельность.

В настоящее время термин статистика употребляется в нескольких значениях:

1) отрасль практической деятельности, направленная на получение, обработку и анализ массовых данных о самых различных явлениях общественной жизни (в этом смысле «статистика» выступает как синоним словосочетания «статистический учет»);

2) цифровой материал, служащий для характеристики какой-либо области общественных явлений или территориального распределения какого-либо показателя;

3) отрасль знания, особая научная дисциплина в высших и средних образовательных учреждениях.

Статистика изучает количественную сторону массовых общественных явлений в неразрывной связи с их качественной стороной или их содержанием, а также количественное выражение закономерностей общественного развития в конкретных условиях места и времени. Задачи статистики зависят от определенного промежутка времени и определяются социально-экономическими потребностями общества. Они состоят в установлении общих свойств единиц совокупности, изучении имеющихся взаимосвязей и закономерностей развития.

В современном обществе статистика стала одним из важнейших инструментов управления национальной экономикой. Развитие рыночных отношений в стране поставило перед статистикой задачу реформирования общеметодических и организационных основ статистической теории и практики, так как, благодаря статистическим исчислениям и анализу статистических показателей, органы управления получают всестороннюю характеристику управляемых объектов. Улучшение хозяйственного руководства неразрывно связано с возрастанием роли статистики и повышением научного уровня статистических исследований.

Статистика является обязательной дисциплиной, изучаемой студентами экономических специальностей.

Целью данной курсовой работы является приобретение навыков по расчету и анализу обобщающих статистических показателей.

1. Расчет абсолютных, относительных, средних величин, показателей вариации, построение и анализ рядов распределения, дисперсионный и корреляционно-регрессионный анализ

1.1 Равно-интервальная группировка по двум признакам

В результате статистического наблюдения были получены данные, характеризующие первый (фондоотдача) и второй (стоимость основных фондов) признаки единиц совокупности. Эмпирические данные представлены в таблице 1.

Таблица 1 — Данные статистического наблюдения

Значение 1-го признака

Значение 2-го признака

А

Б

0,79

118,4

0,80

118,3

0,82

118,5

0,85

118,6

0,87

118,6

0,88

118,5

0,86

118,8

0,87

118,9

0,89

119,0

0,90

119,0

0,91

119,2

0,92

119,3

0,92

119,3

0,93

119,4

0,94

119,4

0,95

119,5

0,96

119,5

0,97

119,5

0,97

119,7

1,02

119,8

1,04

119,9

1,05

120,0

1,07

120,0

1,07

120,4

1,08

120,3

1,09

120,4

1,12

120,5

По данным таблицы 1 произведена первичная равно-интервальная группировка по двум признакам (таблицы 2 и 3). Распределение, полученное в результате группировки, должно соответствовать нормальному, в противном случае необходимо произвести вторичную группировку.

Для проведения равно-интервальной группировки необходимо решить два вопроса: о количестве групп и о ширине интервала. Для определения количества групп воспользуемся формулой 1.

(1)

где n — кол-во групп (целое число);

N — кол-во значений эмпирических данных

В рассматриваемом примере для обоих признаков N=27. Подставив N в формулу 1, получим n=6.

Для определения ширины интервала воспользуемся формулой 2.

(2)

где i — ширина интервала (равно-интервальная группировка);

Xmax — наибольшее значение из эмпирических данных;

Xmin — наименьшее значение из эмпирических данных;

n — кол-во групп

В рассматриваемом примере для первого признака (фондоотдача): Xmax=1,12, Xmin=0,79, а n=6 (посчитано по формуле 1). Подставив эти значения в формулу 2, получим значение ширины интервала равное 0,05. Для второго признака (стоимость основных фондов): Xmax=120,5, Xmin=118,4, n=6, а значение ширины интервала будет равно 0,4.

Используя расчетные данные, произведем первичную равно-интервальную группировку. Первичная группировка по первому признаку представлена в таблице 2, по второму признаку — в таблице 3.

Таблица 2 — Первичная равно-интервальная группировка совокупности по признаку фондоотдача

Значение признака

Частоты

А

0,79−0,85

0,85−0,91

0,91−0,97

0,97−1,03

1,03−1,09

1,09−1,15

Первичная группировка по первому признаку не соответствует нормальному распределению, по этому в таблице 4 представлена вторичная группировка по первому признаку.

Таблица 3 — Первичная равно-интервальная группировка совокупности по признаку стоимость основных фондов

Значение признака

Частота

А

118,4−118,8

118,8−119,2

119,2−119,6

119,6−120,0

120,0−120,4

120,4−120,8

Первичная группировка по второму признаку не соответствует нормальному распределению, поэтому в таблице 5 представлена вторичная группировка по второму признаку.

Таблица 4 — Вторичная равно-интервальная группировка совокупности по признаку фондоотдача

Значение признака

Середина интервала

Частоты

Накоплен. частоты

А

0,7−0,8

0,75

0,8−0,9

0,85

0,9−1,0

0,95

1,0−1,1

1,05

Распределение, представленное в таблице 4, соответствует нормальному. Следовательно, равно-интервальная группировка первого признака (фондоотдача) проведена успешно.

Таблица 5 — Вторичная равно-интервальная группировка совокупности по признаку стоимость основных фондов

Значение признака

Середина интервала

Частоты

Накоплен. частоты

А

118,0−118,5

118,25

118,5−119,0

118,75

119,0−119,5

119,25

119,5−120,0

119,75

120,0−120,5

120,25

Распределение, представленное в таблице 5 соответствует нормальному так же, как и распределение в таблице 4. Следовательно, равно-интервальная группировка второго признака (стоимость основных фондов) проведена успешно.

1.2 Расчет относительных величин (ОВС, ОВК)

В таблицах 6 и 7 представлены результаты расчета относительных величин структуры (ОВС) и координации (ОВК) по первому и второму признакам. При расчете ОВК по первому и второму признакам за базу была выбрана группа с наибольшей частотой.

Таблица 6 — Относительные величины структуры и координации по первому признаку (фондоотдача)

Значение признака

Частоты

ОВС (в %-х)

ОВК

А

0,7−0,8

0,22

0,8−0,9

0,89

0,9−1,0

1,00

1,0−1,1

0,89

Относительные величины структуры выражаются в долях единицы или в процентах и исчисляются по сгруппированным данным. Каждую ОВС называют удельным весом. Сумма удельных весов по каждому признаку должна быть равна единице или сотне.

Таблица 7 — Относительные величины структуры и координации по второму признаку (стоимость основных фондов)

Значение признака

Частоты

ОВС (в %-х)

ОВК

А

118,0−118,5

0,50

118,5−119,0

0,75

119,0−119,5

1,00

119,5−120,0

0,63

120,0−120,5

0,50

Относительные величины структуры (ОВС) характеризуют долю отдельных частей в общем объеме совокупности.

Относительные величины координации (ОВК) отражают отношение численности двух частей единого целого, т. е. показывают, сколько единиц одной группы приходится в среднем на одну, десять или сто единиц другой группы изучаемой совокупности.

1.3 Графики распределения (полигон, кумулята, секторная диаграмма)

По данным, полученным в пункте 1.1 на основе группировок эмпирических данных, строятся полигон распределения (рисунки 1 и 2), кумулята (рисунки 3 и 4) и секторная диаграмма (рисунки 5 и 6) для каждого признака.

Рисунок 1 — Полигон распределения первого признака (фондоотдача) Полигон распределения строится по серединам интервалов.

Условные обозначения:

x — значение признака

f — частота

Рисунок 2 — Полигон распределения второго признака Кумулята в отличие от полигона распределения строится по верхним границам интервалов.

Условные обозначения:

x — значение признака

f — частота

Рисунок 3 — Кумулята первого признака (фондоотдача)

Условные обозначения:

x — значение признака

f — накопленная частота

Рисунок 4 — Кумулята второго признака (стоимость основных фондов) Условные обозначения:

x — значение признака

f — накопленная частота

С использованием рассчитанных относительных величин структуры (таблицы 6 и 7), строятся секторные диаграммы.

Рисунок 5 — Структура совокупности по уровню фондоотдачи

Рисунок 6 — Структура совокупности по стоимости основных фондов Графики распределения строятся для графического анализа рядов распределения. Полигон распределения показывает динамику признака. Кумулята отражает ряд накопленных частот (накопленные частоты показывают, сколько единиц совокупности имеют значение признака, не большие, чем рассматриваемое значение). Секторные диаграммы позволяют наглядно представить структуру совокупности.

1.4 Расчет средних величин

Средней величиной называется обобщающий показатель, характеризующий типичный уровень варьирующего количественного признака на единицу совокупности в определенных условиях места и времени.

§ Средняя арифметическая простая рассчитывается по формуле 3.

(3)

где

— средняя арифметическая

x — значение признака

n — кол-во единиц совокупности

Для 1-ого признака: = 0,95

Для 2-ого признака: = 119,36

§ Средняя арифметическая взвешенная рассчитывается по формуле 4.

(4)

где f — частота

Для 1-ого признака: = 0,94

Для 2-ого признака: = 119,23

§ Средняя арифметическая взвешенная методом моментов рассчитывается по формуле 5.

(5)

где m — момент

i — ширина интервала

A — середина интервала, в котором признак проявляется с наибольшей частотой

Момент рассчитывается по формуле 6.

(6)

где xi — середина каждого интервала

i — расчетное значение

Данные для расчета средней арифметической методом моментов представлены в таблице 8 (для признака фондоотдача).

Таблица 8 — Данные для расчета средней арифметической взвешенной (для признака фондоотдача)

x

f

xi

i

i*f

А

0,7−0,8

0,75

— 2

— 4

0,8−0,9

0,85

— 1

— 8

0,9−1,0

0,95(А)

1,0−1,1

1,05

Итого

— 4

Данные для расчета средней арифметической методом моментов признака стоимость основных фондов представлены в таблице 9.

Таблица 9 — Данные для расчета средней арифметической взвешенной (для признака стоимость основных фондов)

x

f

xi

i

i*f

А

118,0−118,5

118,25

— 10

— 40

118,5−119,0

118,75

— 5

— 30

119,0−119,5

119,25

119,5−120,0

119,75

120,0−120,5

120,25

Итого

— 5

Для 1-ого признака: m= - 0,15; = 0,93

Для 2-ого признака: m= - 0,19; = 118,56

Средняя арифметическая, посчитанная методом моментов, получилась наименьшей.

§ Мода для интервального ряда рассчитывается по формуле 7.

Мода находится в модальном интервале. Модальным является интервал с наибольшей частотой.

(7)

где

хМо — нижняя граница модального интервала

iМо — величина модального интервала

fМо — частота, соответствующая модальному интервалу

fМо-1 — частота интервала, предшествующего модальному

fМо+1 — частота интервала, следующего за модельным Для 1-ого признака: Mo=0,95 (рисунок 7)

Для 2-ого признака: Mo=119,2 (рисунок 8)

Мода стоится на гистограмме.

Рисунок 7 — Мода первого признака (фондоотдача) Условные обозначения: x — значение признака, f — частота

Мода первого признака близка средней арифметической простой, мода второго признака — средней арифметической взвешенной.

Рисунок 8 — Мода второго признака (стоимость основных фондов) Условные обозначения:

x — значение признака

f — частота

§ Медиана в интервальном ряду распределения рассчитывается по формуле 8.

Для определения медианного интервала необходимо по накопленным частотам определить, в какой интервал входит частное от деления кол-ва единиц совокупности плюс 1 на два.

(8)

где

хМе — нижняя граница медианного интервала

i Ме — величина медианного интервала

— полусумма частот ряда

— сумма накопленных частот, предшествующих медианному интервалу

fМе — частота медианного интервала

Для 1-ого признака: Mе=0,94 (рисунок 9)

Для 2-ого признака: Mе=119,1 (рисунок 10)

Медиана строится на кумуляте.

Рисунок 9 — Медиана первого признака (фондоотдача)

Условные обозначения:

x — значение признака

f — накопленная частота

Рисунок 10 — Медиана второго признака (стоимость основных фондов)

Условные обозначения:

x — значение признака

f — накопленная частота

Медианы первого и второго признаков близки средним арифметическим простым этих же признаков.

1.5 Расчет показателей вариации по двум признакам

а) размах вариации:

(9)

где

R — размах вариации

Xmax — максимальное значение признака

Xmin — минимальное значение признака

Для 1-ого признака: R=1,12 — 0,79=0,33

Для 2-ого признака: R=120,5 — 118,4=2,1

б) среднее линейное отклонение

для несгруппированного признака

(10)

для сгруппированного признака:

(11)

где n — численность совокупности Для 1-ого признака: d=0,8

Для 2-ого признака: d=0,51

В совокупности по первому признаку в среднем каждый вариант рассматриваемой совокупности отклоняется от среднего значения на 0,8. В совокупности по второму признаку — на 0,51.

в) среднее квадратическое отклонение для несгруппированного признака:

(12)

для сгруппированного признака:

(13)

Для 1-ого признака: =0,0921; (сгруппированное)=0,0932

Для 2-ого признака: =0,6477; (сгруппированное)=0,6307

В совокупности по первому признаку размер вариации составляет 0,09, в совокупности по второму признаку — 0,64. Среднее квадратическое отклонение по сгруппированному и несгруппированному признакам расходятся незначительно, незначительное расхождение связано с погрешностью при вычислении (округление).

г) коэффициенты вариации по сгруппированным и несгруппированным признакам:

*100% (14)

Для 1-ого признака: = 9,7%; (сгруппированный) = 9,8%

Для 2-ого признака: =0,5%; (сгруппированный) = 0,5%

При расчете коэффициента вариации по сгруппированному признаку применяется средняя арифметическая взвешенная.

В рассматриваемом примере распределения близки к нормальным, а коэффициенты вариации и по сгруппированным, и по несгруппированным признакам не превышают 33%, следовательно, можно сделать вывод, что исследуемая совокупность является однородной.

1.6 Расчет дисперсии и дисперсионный анализ а) дисперсии: общая, межгрупповая и средняя из внутригрупповых Общая дисперсия рассчитывается по формуле 15.

(15)

где — общая средняя арифметическая для всей изучаемой совокупности Для 1-ого признака: =0,0087

Для 2-ого признака: =0,3978

Вариация первого признака под влиянием всех факторов, формирующих уровень признака равна 0,0087, второго признака — 0,3978.

Межгрупповая дисперсия рассчитывается по формуле 16.

(16)

где — межгрупповая дисперсия

— средняя арифметическая в i-той группе

— простая средняя арифметическая

— частота i-той группы Межгрупповая дисперсия (дисперсия групповых средних) отражает систематическую вариацию, т. е. различия в величине изучаемого признака, которые возникают под влиянием фактора, положенного в основу группировки.

Для 1-ого признака: =0,0079

Для 2-ого признака: =0,4057

При расчете межгрупповой дисперсии применяется средняя арифметическая простая в каждой группе и в целом по совокупности.

Внутригрупповая дисперсия (дисперсия по отдельной группе) применяется для расчета средней внутригрупповой дисперсии и рассчитывается по формуле 17.

(17)

где — внутригрупповая дисперсия;

— индивидуальное значение единицы совокупности из i-той группы;

— простая средняя арифметическая i-той группы;

— частота i-той группы.

Для 1-ого признака:

=0; =0,0072; =0; =0

Для 2-ого признака:

=0; =0; =0; =0; =0

Средняя внутригрупповая дисперсия рассчитывается по формуле 18.

(18)

где — средняя внутригрупповая дисперсия;

— дисперсия i-той группы (внутригрупповая дисперсия);

— частота i-той группы.

Для 1-ого признака: =0,213

Для 2-ого признака: =0

б) проверка правила сложения дисперсий Правило сложения дисперсий гласит, что величина общей дисперсии равна сумме межгрупповой дисперсии и средней внутригрупповой дисперсии (формула 19).

(19)

где — общая дисперсия;

— межгрупповая дисперсия;

— средняя внутригрупповая дисперсия.

Для 1-ого признака:

=0,0087; =0,0079; =0,213

0,01=0,008+0,002

Для 2-ого признака:

=0,3978; =0,4057; =0

0,3978=0,4057+0

Отклонение составляет менее 1% и, следовательно, в пределах нормы. Полученные отклонения результатов могут быть объяснены погрешностями в расчетах.

1.7 Кривые распределения

Кривая линия, которая отражает закономерность изменения частот, называется кривой распределения.

Кривые распределения бывают эмпирическими и теоретическими.

Эмпирическая кривая распределения строится по результатам группировки (полигон распределения).

Эмпирическая кривая распределения первого признака (фондоотдача) представлена на рисунке 11.

Рисунок 11 — Эмпирическая кривая распределения признака фондоотдача

Условные обозначения: x — значение признака, f — частота

Эмпирическая кривая распределения второго признака (стоимость основных фондов) представлена на рисунке 12.

Рисунок 12 — Эмпирическое распределение признака стоимость основных фондов Условные обозначения:

x — значение признака;

f — частота Эмпирические кривые распределения строятся по серединам интервалов.

Теоретическая кривая строится по теоретическим частотам, которые рассчитываются по формуле 20.

Результаты расчета теоретических частот для первого признака (фондоотдача) представлены в таблице 10.

(20)

где — теоретические частоты для определенной группы;

— величина интервала;

— сумма эмпирических частот ряда;

— среднее квадратическое отклонение для сгруппированных данных;

— математическая функция, определяемая по специальным таблицам в соответствии с рассчитанным значением ;

— середина i-того интервала;

— средняя арифметическая взвешенная;

— нормированное отклонение Таблица 10 — Расчет теоретических частот признака фондоотдача

Значение признака

Середина интервала

Частота эмпирич.

Нормиров. отклонение

Знач.

ф-ции

Теоретич. частоты

А

0,7−0,8

0,75

2,04

0,0498

0,8−0,9

0,85

0,97

0,2492

0,9−1,0

0,95

0,11

0,3965

1,0−1,1

1,05

1,18

0,1989

Итого

;

;

;

Теоретическими называются те частоты, которые были бы, если бы данное распределение в точности следовало закону нормального распределения.

Теоретическая кривая распределения первого признака (фондоотдача) представлена на рисунке 13.

Рисунок 13 — Теоретическое распределение признака фондоотдача Условные обозначения:

x — середина интервала

f m— теоретические частоты Результаты расчета теоретических частот для второго признака (стоимость основных фондов) представлены в таблице 11.

Таблица 12 — Расчет теоретических частот признака стоимость основных фондов

Значение признака

Середина интервала

Частота эмпирич.

Нормиров. отклонение

Знач.

ф-ции

Теоретич. частоты

А

118,0−118,5

118,25

1,55

0,1200

118,5−119,0

118,75

0,76

0,2989

119,0−119,5

119,25

0,03

0,3988

119,5−120,0

119,75

0,82

0,2850

120,0−120,5

120,25

1,62

0,1074

Итого

;

;

;

Теоретическая кривая распределения второго признака (стоимость основных фондов) представлена на рисунке 14.

Рисунок 14 — Теоретическое распределение признака стоимость основных фондов Условные обозначения:

x — середина интервала

f m— теоретические частоты

1.8 Анализ ряда распределения Многим распределениям присуща асимметрия. Наиболее простой мерой асимметрии является разность между средней арифметической и модой или медианой данного ряда. В симметричном ряду их значения совпадают и показатель асимметрии равен нулю.

а) расчет асимметрии Для определения степени асимметрии используют коэффициент асимметрии, который рассчитывается по формуле 21.

(21)

где — коэффициент асимметрии;

— средняя арифметическая взвешенная;

— мода;

— среднее квадратическое отклонение для сгруппированных данных.

Для 1-го признака (фондоотдача): = - 0,1073

Для 2-ого признака (стоимость основных фондов): = 0,0476

Положительная величина коэффициента асимметрии указывает на правостороннюю асимметрию (Мо<Me<), например, для второго признака: 119,2 < 119,22 < 119,23. Отрицательная величина коэффициента асимметрии указывает на левостороннюю асимметрию (Мо>Me>).

б) расчет эксцесса Для симметричных распределений рассчитывается показатель эксцесса (островершинности) по формуле 22.

(22)

где — эксцесс

— центральный момент четвертого порядка (формула 23)

— среднее квадратическое отклонение для сгруппированных данных

(23)

где — центральный момент четвертого порядка;

— центральный вариант i-того интервала;

— средняя арифметическая взвешенная;

— частота i-той группы Для 1-го признака (фондоотдача): =0,16; = - 0,891 179

Для 2-ого признака (стоимость основных фондов): =0,3223; = - 0,9631

Эксцесс может быть положительным и отрицательным. У высоковершинных распределений показатель эксцесса имеет положительный знак, а у низковершинных — отрицательный.

Предельным значением отрицательного эксцесса является значение -2, величина положительного эксцесса является бесконечной. В нормальном распределении эксцесс равен нулю.

в) определение существенности асимметрии и эксцесса Чем больше абсолютная величина коэффициента асимметрии, тем больше степень асимметрии.

Если <0,25, то асимметрия незначительная, если >0,5, то асимметрия значительная.

В нашем случае асимметрия обоих распределений незначительная:

1= - 0,1073; 2= 0,0476

Также оценка существенности показателя асимметрии производится с помощью средней квадратической ошибки (формула 24).

(24)

где — средняя квадратическая ошибка

— число единиц совокупности Для 1-го признака (фондоотдача): = 0,43 095

Для 2-ого признака (стоимость основных фондов): = 0,43 095

Показатель асимметрии (формула 25) не только определяет степень асимметрии, но и указывает на наличие или отсутствие асимметрии в распределении признака в генеральной совокупности.

(25)

где — коэффициент асимметрии

— средняя квадратическая ошибка Если AS (по модулю) >3, асимметрия существенна и распределение признака в генеральной совокупности не является симметричным. Если

AS (по модулю)<3, асимметрия несущественна.

Для 1-го признака (фондоотдача): AS = 0,25

Для 2-ого признака (стоимость основных фондов): AS = 0,11

Отсюда делаем вывод, что асимметрия в обоих случаях несущественна и распределение признака в генеральной совокупности является симметричным.

Оценка существенности эксцесса также производится с помощью средней квадратической ошибки (формула 26) и показателя эксцесса.

(26)

где — средняя квадратическая ошибка

— число единиц совокупности Показатель эксцесса рассчитывается по формуле 27.

(27)

Для 1-го признака (фондоотдача): Aе = - 1,1514

Для 2-ого признака (стоимость основных фондов): Aе = - 1,2443

Показатель эксцесса может быть положительным и отрицательным. У высоковершинных распределений показатель эксцесса имеет положительный знак, а у низковершинных — отрицательный.

г) оценка соответствия эмпирического ряда распределения теоретическому Для проверки близости теоретического и эмпирического распределений используются специальные показатели, называемые критериями согласия, рассчитываемые по частотам (таблицы 12, 13)

Наиболее распространенным является критерий согласия Пирсона, исчисляемый по формуле 28.

(28)

где — критерий согласия Пирсона;

— эмпирические частоты;

— теоретические частоты Для 1-го признака (фондоотдача): = 1,1414

Для 2-ого признака (стоимость основных фондов): = 0,3472

Полученное значение критерия Пирсона сравнивается с табличным, которое определяется в зависимости от принятой вероятности (Р) и числа степеней свободы (к). Для нормального распределения число степеней свободы равно число групп в ряду распределения минус 3.

Если (расч)<= (табл), то гипотеза о близости эмпирического распределения к нормальному не отвергается.

В нашем случае:

для 1-го признака (фондоотдача):

(расч) = 1,1414

для 2-ого признака (стоимость основных фондов):

(расч)= 0,3472

для 1-го признака (фондоотдача):

(теорет) = 3,8

для 2-ого признака (стоимость основных фондов):

(теорет) = 6,0,

т.е. (расч)1<= (табл)1 и (расч)2<= (табл)2,

отсюда следует вывод о том, что в обоих случаях гипотеза о близости эмпирического распределения к нормальному не отвергается.

Используя критерий Романовского (формула 29) можно оценить близость эмпирического распределения кривой нормального распределения.

(29)

где — критерий Романовского;

— критерий Пирсона;

— количество групп Для 1-го признака (фондоотдача): = 0,1

Для 2-ого признака (стоимость основных фондов): = - 0,8264

Если критерий Романовского < 3, то можно принять гипотезу о нормальном характере эмпирического распределения.

В наших случаях критерий меньше 3, следовательно оба эмпирических распределения имеют нормальный характер.

Также распространенным критерием согласия является критерий Колмогорова (формула 30).

(30)

где — критерий Колмогорова;

— максимальная разность между накопленными теоретическими и эмпирическими частотами;

— численность совокупности.

Таблица 12 — Частоты распределения признака фондоотдача

Значение признака

Эмпир. частоты

Эмпир. частоты накоплен

Теорет. частоты

Теорет. частоты накоплен

А

0,7−0,8

0,8−0,9

0,9−1,0

1,0−1,1

Итого

;

;

Для 1-го признака (фондоотдача): =1; = 0,19 245

Для 2-ого признака (стоимость основных фондов): =1; = 0,19 245

Необходимым условием использования критерия Колмогорова является число наблюдений не менее 100.

Таблица 13 — Частоты распределения признака стоимость основных фондов

Значение признака

Эмпир. частоты

Эмпир. частоты накоплен

Теорет. частоты

Теорет. частоты накоплен

А

118,0−118,5

118,5−119,0

119,0−119,5

119,5−120,0

120,0−120,5

Итого

;

;

По таблице значений вероятностейкритерия находят соответствующую вероятность (Р). Если вероятность по величине значительна, то расхождения между эмпирическим и теоретическим распределениями несущественны.

В наших случаях вероятности по величине значительны, следовательно, расхождения между эмпирическим и теоретическим распределениями несущественны.

1.9 Аналитическая группировка Для того чтобы построить аналитическую комбинационную зависимость, необходимо построить таблицу, в столбцах которой расположить факторный признак (в рассматриваемом примере стоимость основных фондов), а в строках — зависимый (фондоотдача) (таблица 14).

Таблица 14 — Аналитическая группировка

x

y

Код строки

118,0−118,5

118,5−119,0

119,0−119,5

119,5−120,0

120,0−120,5

А

Б

0,7−0,8

**

0,8−0,9

**

******

0,9−1,0

********

*

1,0−1,1

****

****

Так как частоты большей частью расположены на диагонали, идущей из левого верхнего угла в правый нижний, это свидетельствует о наличии прямой связи между стоимостью основных фондов и фондоотдачей, т. е. с увеличением стоимости основных фондов растет и фондоотдача.

1.10 Корреляционно-регрессионный анализ а) поле корреляции Рисунок 15 — Поле корреляции Условные обозначения:

xфакторный признак,

y — зависимый признак Поле корреляции строится по эмпирическим данным (рисунок 15). На оси абсцисс откладывает факторный признак, а на оси ординат — зависимый.

б) расчет коэффициентов регрессии, эластичности Анализируя рисунок, можно сделать вывод, что связь между факторным и зависимым признаком близка к линейной (формула 31). Найдем уравнение этой линии, рассчитав коэффициенты уравнения прямой по формуле 32 .

(31)

(32)

где — зависимый признак (фондоотдача);

— коэффициенты уравнения прямой;

— независимый признак (стоимость основных фондов);

— число выборки В рассматриваемом примере:

=27;

=25,54;

=3222,7;

=3050,01;

=384 670,4

Получим систему уравнений:

a0= - 15,6422

a1=0,138 976

Уравнение прямой имеет вид:

Рассчитаем коэффициент эластичности по формуле 33.

(33)

где — коэффициент эластичности;

— коэффициент при в уравнении прямой;

— среднее значение факторного признака;

— среднее значение зависимого признака.

=0,138 976*(119,36 / 0,95) = 17,46

При увеличении стоимости основных средств на 1% фондоотдача увеличивается в среднем на 17,46%.

Коэффициент регрессии (a1) равен 0,1, т. е. при увеличении стоимости основных средств на 1 единицу своего измерения фондоотдача увеличивается на 0,14 единиц своего измерения.

Средняя квадратическая ошибка уравнения регрессии рассчитывается по формуле 34.

(34)

где — квадратическая ошибка;

— теоретическое значение;

— эмпирическое значение;

— численности совокупности;

— число параметров (для прямой m=2)

Данные для расчета квадратической ошибки представлены в таблице 15.

Таблица 15 — Данные для расчета квадратической ошибки

Код строки

;

(-)2

А

Б

0,79

0,83

— 0,04

0,0016

0,80

0,82

— 0,02

0,0004

0,82

0,84

— 0,02

0,0004

0,85

0,85

0,87

0,84

0,03

0,0009

0,88

0,87

0,01

0,0001

0,86

0,88

— 0,02

0,0004

0,87

0,89

— 0,02

0,0004

0,89

0,91

— 0,02

0,0004

0,90

0,92

— 0,02

0,0004

0,91

0,92

— 0,01

0,0001

0,92

0,93

— 0,01

0,0001

0,92

0,93

— 0,01

0,0001

0,93

0,94

— 0,01

0,0001

0,94

0,94

0,95

0,94

0,01

0,0001

0,96

0,96

0,97

0,97

0,97

0,98

— 0,01

0,0001

1,02

0,99

0,03

0,0009

1,04

0,99

0,05

0,0025

1,05

1,03

0,02

0,0004

1,07

1,02

0,05

0,0025

1,07

1,03

0,04

0,0016

1,08

1,04

0,04

0,0016

1,09

0,85

0,24

0,0576

1,12

0,89

0,23

0,0529

Итого

0,1256

Сравним полученное значение со средним квадратическим отклонением по несгруппированному признаку: 0,7 088 < 0,92 076. Из сравнения следует, что значимость ошибки не значительна. Расчет линейного коэффициента корреляции производится по формулам 35, 36.

(35)

(36)

где — линейный коэффициент корреляции;

— среднее произведение факторного признака на зависимый;

— произведение факторного признака на зависимый;

— простая средняя арифметическая факторного признака;

— простая средняя арифметическая зависимого признака;

— среднее квадратическое отклонение по зависимому признаку;

— среднее квадратическое отклонение по факторному признаку.

В рассматриваемом примере:

=112,9633;

= 0,979

Линейный коэффициент корреляции равен 0,979, следовательно, связь прямая и тесная.

Эмпирическое корреляционное отношение рассчитывается по формуле 37.

(37)

где — эмпирическое корреляционное отношение;

— общая дисперсия зависимого признака;

— межгрупповая дисперсия зависимого признака В рассматриваемом примере:

=0,0087;

=0,0079;

Корреляционное отношение близко к 1, следовательно, связь между группировкой и результативными признаками существенная.

Теоретическое корреляционное отношение рассчитывается по формулам 38, 39.

(38)

(39)

где — теоретическое корреляционное отношение; - общая дисперсия зависимого признака по несгруппированным данным;

— остаточная дисперсия; - теоретическое значение; - простая средняя арифметическая эмпирического ряда; - численность совокупности.

В рассматриваемом примере:

=0,4 774;

Теоретическое корреляционное отношение ближе к 1, следовательно, связь между выровненными и эмпирическими значениями фондоотдачи довольно тесная.

Коэффициент корреляции рангов Спирмена рассчитывается по формуле 40.

(40)

где — коэффициент корреляции рангов Спирмена;

— разность между расчетными рангами в двух рядах;

— численность совокупности Данные для расчета коэффициента корреляции рангов Спирмена представлены в таблице 16.

=1−39/19 656=0,998

Связь между фондоотдачей и стоимостью основных фондов сильная.

Коэффициент ранговой корреляции Кенделла рассчитывается по формуле 41.

(41)

где — коэффициент Кенделла;

— сумма значений рангов, расположенных ниже соответствующего порядкового номера ранга и больше его;

— сумма значений рангов, расположенных ниже соответствующего порядкового номера ранга и меньше его;

— численность совокупности.

Данные для расчета коэффициента Кендела представлены в таблице 16.

=682 / 702 = 0,9715

Коэффициент Кендела показывает тесную связь между факторным и зависимым признаком.

Таблица 16 — Данные для расчета коэффициентов Спирмена, Кенделла, Фехнера

x

Rx

Rx расч

y

Ry

Ry расч

d

d2

С

Н

P

Q

А

118,3

0,80

118,4

0,79

118,5

3,5

0,82

0,5

0,25

118,5

3,5

0,88

— 0,5

0,25

118,6

5,5

0,85

0,5

0,25

118,6

5,5

0,87

— 0,5

0,25

118,8

0,86

118,9

0,87

119,0

9,5

0,89

0,5

0,25

119,0

9,5

0,90

— 0,5

0,25

119,2

0,91

119,3

12,5

0,92

12,5

119,3

12,5

0,92

12,5

119,4

14,5

0,93

0,5

0,25

119,4

14,5

0,94

— 0,5

0,25

119,5

0,95

119,5

0,96

119,5

0,97

18,5

— 1,5

2,25

119,7

0,97

18,5

0,5

0,25

119,8

1,02

119,9

1,04

120,0

22,5

1,05

0,5

0,25

120,0

22,5

1,07

— 0,5

0,25

120,3

1,08

120,4

25,5

1,07

0,5

0,25

120,4

25,5

1,09

— 0,5

0,25

120,5

1,12

Итого

;

;

;

;

;

;

6,5

Коэффициент Фехнера рассчитывается по формуле 42.

(42)

где — коэффициент Фехнера;

— число совпадений знаков отклонений индивидуальных величин факторного признака и результативного признака от их средней арифметической величины

— число несовпадений знаков Данные для расчета коэффициента Фехнера представлены в таблице 16.

В рассматриваемом примере:

=(24−3)/(24+3)=0,778

Коэффициент Фехнера равен 0,778, следовательно, связь между фондоотдачей и стоимостью основных фондов прямая и тесная.

Критерий Фишера рассчитывается по формуле 43.

(43)

где — коэффициент Фишера;

— межгрупповая дисперсия;

— количество групп;

— средняя из внутригрупповых дисперсий;

— численность совокупности.

В рассматриваемом примере:

=27;

=4;

=0,0079;

=0,213

=(0,0079/3)/(0,213/23) = 28,4

Табличное значение Фишера =19,45, что меньше рассчитанного, следовательно, высока точность расчета коэффициента корреляции.

2. Ряды динамики В ходе статистического исследования были получены данные о производстве электроэнергии с 1998 по 2006 год (таблица 17).

Таблица 17 — Производство электроэнергии

Год

Производст. электроэн. усл.ед.

11,8

12,3

12,8

13,4

13,4

12,9

11,5

11,8

Необходимым условием правильного формирования и анализа ряда динамики является нахождение недостающих данных ряда (таблица 18).

Поиск недостающих данных ряда динамики осуществляется по формулам (44, 45)

(44)

(45)

где — уровень динамического ряда в i-ом году;

— уровень динамического ряда в (i-1)-ом году;

— средний коэффициент роста;

— число уровней ряда в данном периоде;

— уровень динамического ряда 2000 года;

— уровень динамического ряда 1998 года.

В рассматриваемом примере:

Таблица 18 — Смыкание рядов динамики

Год

Производст. электроэн. усл.ед.

11,8

12,1

12,3

12,8

13,4

13,4

12,9

11,5

11,8

Для изучения интенсивности изменения уровней ряда во времени исчисляются показатели динамики.

В таблице 19 представлены результаты расчета показателей ряда динамики (цепные и базисные) по данным таблицы 18.

Показатели ряда динамики можно исчислять с переменной или постоянной базой. Если производится сравнение каждого уровня с предыдущим уровнем, то получаются показатели динамики с переменной базой (цепные). Если каждый уровень сравнивается с начальным уровнем или каким-то другим, принятым за базу сравнения, то получаются показатели динамики с постоянной базой (базисные).

а) расчет абсолютного прироста Абсолютный прирост показывает, на сколько в абсолютном выражении уровень текущего периода больше (меньше) базисного.

Абсолютные приросты (цепной и базисный) рассчитываются по формулам 46, 47.

(46)

(47)

где — цепной абсолютный прирост;

— базисный абсолютный прирост;

— уровень показателя в i-том периоде;

— уровень показателя в предыдущем, (i-1)-том периоде;

— уровень показателя в базисном периоде.

Результаты расчета абсолютных приростов представлены в таблице 19.

б) расчет коэффициента роста (снижения) и прироста Коэффициент роста показывает, во сколько раз уровень текущего периода больше (меньше) базисного.

Коэффициенты роста (снижения) цепные рассчитываются по формуле 48, базисные — по формуле 49.

(48)

(49)

где — цепной коэффициент роста;

— базисный коэффициент роста Коэффициенты прироста цепные рассчитываются по формуле 50, базисные — по формуле 51.

(50)

(51)

где — цепной коэффициент прироста;

— базисный коэффициент прироста.

Результаты расчета коэффициентов роста и прироста представлены в таблице 19.

в) расчет темпов роста и прироста Темп роста — это коэффициент роста, выраженный в процентах; он показывает, сколько процентов уровень текущего периода составляет по отношению к уровню базисного периода.

Темпы роста (цепной и базисный) рассчитываются по формулам 52 и 53.

(52)

(53)

где — цепной темп роста;

— базисный темп роста.

Темп прироста показывает, на сколько процентов уровень текущего периода больше (меньше) уровня базисного периода.

Темпы прироста (цепной и базисный) рассчитываются по формулам 54, 55.

(54)

(55)

где — цепной темп прироста;

— базисный темп прироста Результаты расчета темпов роста и прироста представлены в таблице 19.

г) расчет абсолютного значения одного процента прироста Абсолютное значение 1% прироста показывает, какая абсолютная величина скрывается за относительным показателем — одним процентом прироста.

Абсолютное значение одного процента прироста рассчитывается по формуле 56.

(56)

где — абсолютное значение одного процента прироста.

Результаты расчета абсолютного значения одного процента прироста представлены в таблице 19.

Для характеристики интенсивности развития за длительный период рассчитываются средние показатели динамики.

д) расчет среднего уровня ряда Средний уровень ряда (средняя хронологическая) рассчитывается по формуле 57.

(57)

где — средний уровень ряда;

— уровни ряда;

— число уровней Данная формула подходит для расчета среднего уровня моментного ряда с равными интервалами.

=(0,5*11,8+12,1+…+11,5+11,8*0,5)/ 8 = 12,525

В рассматриваемом примере средним будет производство приблизительно 12,5 усл.ед. электроэнергии.

е) расчет среднего абсолютного прироста Средний абсолютный прирост рассчитывается по формуле 58.

(58)

где — средний абсолютный прирост; - абсолютный прирост цепной; - число уровней

=(0,3+0,2+…+(- 1,4)+0,3)/ 8 = 0

В рассматриваемом примере средний абсолютный прирост отсутствует.

ж) расчет средних темпов роста и прироста Для расчета средних темпов роста и прироста необходимо рассчитать коэффициенты роста и прироста по формулам 59 и 60.

(59)

(60)

где — средний коэффициент роста;

— цепные коэффициенты роста;

— базисный коэффициент роста в последнем периоде;

— средний коэффициент прироста

В рассматриваемом примере:

= - 0,93

Средние темпы роста и прироста рассчитываются по формулам 61 и 62.

(61)

(62)

где — средний темп роста;

— средний темп прироста В рассматриваемом примере:

=99,9907

= - 0,0093

Средний темп роста практически равен единице, следовательно за рассмотренный период производство электроэнергии в среднем не изменилось.

2.1 Графики уровней ряда, темпов роста и темпов прироста График уровней ряда (рисунок 16) строится по данным таблицы 18.

Рисунок 16 — Динамика производства электроэнергии Условные обозначения:

t — год

y — уровень производства электроэнергии График темпов роста (рисунок 17) строится на основе рассчитанных показателей темпов роста.

Рисунок 17 — Темпы роста производства электроэнергии Условные обозначения:

t — год; T — темп роста График темпов прироста (рисунок 18) строится на основе рассчитанных показателей темпов прироста.

Рисунок 18 — Темпы прироста производства электроэнергии Условные обозначения:

t — год; T — темп прироста

2.2 Аналитическое выравнивание показателей ряда динамики Анализируя график динамики производства электроэнергии (рисунок 16) следует сделать вывод, что аналитическое выравнивание показателей ряда динамики необходимо производить по параболе (формула 63).

(63)

Для выравнивания ряда динамики используется система уравнений (формула 64), построенная по методу наименьших квадратов:

(64)

где — уровни эмпирического ряда;

— коэффициенты;

— количество уровней ряда;

— порядковый номер периода или момента времени.

Для упрощения решения системы отсчет времени ведется от середины ряда, тогда, (формула 65).

(65)

Расчет данных, необходимых для решения системы — в таблице 20.

Таблица 20 — Данные для расчета аналитического выравнивания

Год

Код

y

t

t2

t4

y*t

y*t2

А

Б

В

11,8

— 4

— 47,2

188,8

12,1

— 3

— 36,3

108,9

12,3

— 2

— 24,6

49,2

12,8

— 1

— 12,8

12,8

13,4

13,4

13,4

13,4

12,9

25,8

51,6

11,5

34,5

103,5

11,8

47,2

188,8

Итого

;

Пользуясь данными таблицы 20, произведем расчеты:

Подставим результаты в уравнение (формула 63).

(66)

Построим график параболы (формула 66)

Рисунок 19 — Аналитическое выравнивание Условные обозначения: t — год, y — уровень производства электроэнергии Используя результаты выравнивания можно сделать прогноз.

2.3 Прогноз. Расчет доверительных интервалов Спрогнозируем уровень производства электричества в 2007. Для этого подставим в формулу 63 значение t=5. Для t=5 получим значение, т. е. в 2007 году уровень производства электроэнергии составит 11,655 усл.ед.

Но эмпирические точки могут отклонятся от прямой аналитического выравнивания, поэтому необходимо рассчитать отклонения от прогнозных значений по формулам (67, 68)

(67)

(68)

где — отклонение от прогнозных значений;

— коэффициент доверия (t=2);

— среднее квадратическое отклонение;

— уровни эмпирического ряда;

— средняя эмпирического ряда;

— число периодов;

— число параметров уравнения (для параболы: m=3).

Данные для расчета отклонения от прогнозных значений оформим в виде таблицы (таблица 21).

Таблица 21 — Данные для расчета среднего отклонения от прогнозных значений

Год

Код строки

y

А

Б

11,8

— 0,57

0,3249

12,1

— 0,27

0,0729

12,3

— 0,07

0,0049

12,8

0,43

0,1849

13,4

1,03

1,0609

13,4

1,03

1,0609

12,9

0,53

0,2809

11,5

— 0,87

0,7569

11,8

— 0,57

0,3249

11,7

— 0,67

0,4489

Итого

123,7

;

4,521

В рассматриваемом примере:

=123,7/10=12,37;

==0,80 365

Отклонение от прогнозных значений:

=0,80 365*2=1,6073

Отклонение признака для 2007 года:

=11,71,6

=13,3; =10,1

2.4 Оценка качества модели Оценим качество полученной модели по критерию нулевого среднего (формулы 69, 70).

(69)

(70)

где — среднее значение остатка;

— остаток;

— эмпирическое значение показателя;

— теоретическое значение показателя;

— число периодов.

Расчет критерия нулевого среднего представлен в таблице 22.

Таблица 22 — Расчет критерия нулевого среднего

Год

Код строки

t

Эмпирич. знач.

Теорет. знач.

А

Б

— 4

11,8

12,042

— 0,242

— 3

12,1

12,343

— 0,243

— 2

12,3

12,558

— 0,258

— 1

12,8

12,687

0,113

13,4

12,73

0,67

13,4

12,687

0,713

12,9

12,558

0,342

11,5

12,343

— 0,843

11,8

12,042

— 0,242

Итого

;

111,99

0,0

Теоретические частоты рассчитываются по формуле:

()

В рассматриваемом примере:

=0/9 = 0

Значение среднего остатка равно нулю, следовательно построенная модель (рисунок 19) адекватна.

2.5 Оценка прогноза по количеству серий, длине серий и критерию Дарбина-Уотсона Критерий Дарбина-Уотсона рассчитывается по формуле 71.

(71)

где — коэффициент Дарбина-Уотсона;

— остаток i-ого периода;

— остаток (i-1)-ого периода.

Необходимые данные для расчета критерия Дарбина-Уотсона представлены в таблице 23.

Таблица 23 — Данные для расчета критерия Дарбина-Уотсона

Год

Код строки

Эмпирич. знач.,

Квадрат остатка,

;

(-)2

А

Б

11,8

0,58 564

;

;

12,1

0,59 049

— 0,001

0,1

12,3

0,66 564

— 0,015

0,225

12,8

0,12 769

0,371

0,137 641

13,4

0,4489

0,557

0,310 249

13,4

0,508 369

0,043

0,1 849

12,9

0,116 964

— 0,371

0,137 641

11,5

0,710 649

— 1,185

1,404 225

11,8

0,58 564

0,601

0,361 201

Итого

;

2,40 392

;

2,353 032

В рассматриваемом примере:

=2,353 032 / 2,40 392 = 1,15

Если коэффициент Дарбина-Уотсона находится в пределах от 0 до 4, то модель адекватна. Коэффициент Дарбина-Уотсона равен приблизительно 1,15, следовательно, построенная модель адекватна.

Критическое число серий рассчитывается по формуле 72, критическая длина серий — по формуле 73.

(72)

(73)

где — критическое число серий; - число уровней ряда; - критическая длина серий.

В рассматриваемом случае:

Средняя ошибка рассчитывается по формуле 74.

(74)

где — среднее значение остатка; - остаток i-ого периода; - число периодов В рассматриваемом примере:

Следовательно, среднее отклонение эмпирических значений от теоретических составляет приблизительно 0,407.

Остаточная дисперсия рассчитывается по формуле 75, среднеквадратическое отклонение — по формуле 76.

(75)

(76)

где — остаточная дисперсия; - среднеквадратическое остаточное отклонение; - квадрат остатка; - остатки; - число уровней.

В рассматриваемом примере:

Дисперсия остатков под влиянием случайных факторов равна 0,227. Среднеквадратическое отклонение эмпирических уровней от теоретических составляет 0,476.

2.6 График прогноза График прогноза строится на графике аналитического выравнивании (рисунок 20).

Рисунок 20 — Прогноз Условные обозначения: t — период, y — уровень производства электроэнергии Выравнивание временного ряда показывает тенденцию к снижению выпуска электроэнергии.

3. Индексы Индекс — относительная величина, характеризующая изменение уровней сложных социально-экономических показателей во времени, в пространстве или по сравнению с планом.

Виды индексов:

— Количественные (индексы физического объема производства, потребления, характеризуются абсолютными величинами)

— Качественные (индексы цен, себестоимости, средней зарплаты, характеризуют уровень изучаемого показателя в расчете на количественную единицу)

— Индивидуальные (характеризуют изменение одного элемента совокупности)

— Сводные (характеризуют изменение сложного явления в целом)

3.1 Расчет индивидуальных индексов потребительских цен Данные для расчета индивидуальных индексов цен представлены в таблице 24.

Таблица 24 — Динамика курса казахстанской валюты по отношению к рублю

Валюта

По отношению

Дата

Курс

Казахстанская

Руб.

21.01.03

0,205 028

Казахстанская

Руб.

22.01.03

0,204 907

Казахстанская

Руб.

23.01.03

0,204 942

Казахстанская

Руб.

24.01.03

0,20 501

Казахстанская

Показать весь текст
Заполнить форму текущей работой