Помощь в написании студенческих работ
Антистрессовый сервис

Математические методы статистики

КурсоваяПомощь в написанииУзнать стоимостьмоей работы

Хотелось бы только отметить, что в данном случае многие из взвешенных характеристик значительно отличаются по значению от невзвешенных. При данном объеме выборки (30 элементов) и даже при всем объеме выборки можно было бы все характеристики рассчитывать только в одном варианте — взвешенное значение, поскольку данное значение является более точным, а при сегодняшнем уровне автоматизации расчетов… Читать ещё >

Математические методы статистики (реферат, курсовая, диплом, контрольная)

Задание к курсовой работе Введение

1 построение выборочной совокупности

1.1 построение интервального вариационного ряда по величине чистого капитала

1.2 построение графика

1.3 расчет показателей вариации

1.4 определение количественных характеристик распределения (показателей ассиметрии и эксцесса)

1.5 нахождение эмпирической функции, построение ее графика

1.6 определение теоретических частот по закону нормального распределения. Построение графиков

1.7 проверка гипотезы о подчинении изучаемых признаков нормальному закону распределения

1.8 оценка параметров генеральной совокупности на основе выборочных данных

1.9 построение интервального вариационного ряда по величине прибыли

1.10 построение графика

1.11 определение количественных характеристик распределения (показателей асимметрии и эксцесса)

1.12 нахождение эмпирической функции, построение ее графика

1.13 определение теоретических частот по закону нормального распределения. Построение графиков

1.14 проверка гипотезы о подчинении изучаемых признаков нормальному закону распределения.

1.15 оценка параметров генеральной совокупности на основе выборочных данных

2. Построение однофакторной модели взаимосвязи

2.1 отбор факторного и результативного признака модели

2.2 расчет парного коэффициента корреляции. Анализ зависимости между переменными

2.3 построение уравнения однофакторной регрессии с использованием метода наименьших квадратов

2.4 проверка значимости коэффициентов регрессии и коэффициента корреляции Заключение

ЗАДАНИЕ К КУРСОВОЙ РАБОТЕ

1. По данным приложения 1 отберите 2−3 экономически связанных между собой показателя деятельности 200 крупнейших в России банков. Определите выборочную совокупность в количестве 30 банков, укажите и опишите способ отбора.

Проведите качественный анализ выборочной совокупности банков по отобранным показателям и исследуйте структуру данных показателей в следующей последовательности:

а) постройте интервальные вариационные ряды по каждому показателю, определив целесообразное количество групп;

б) по данным полученных рядов для каждого показателя постройте графики;

в) вычислите и проанализируйте среднюю арифметическую, моду и медиану, относительные и абсолютные показатели вариации;

г) определите количественные характеристики распределений (показатели асимметрии и эксцесса);

д) найдите эмпирическую функцию распределения и постройте ее график;

е) определите, теоретические частоты по закону нормального распределения и нанесите их на график;

ж) с помощью одного из математических критериев проверьте гипотезу о том, что изучаемые признаки подчиняются нормальному закону распределения;

з) определите границы, в которых с вероятностью 0,95 будет находиться среднее значение выбранных показателей в генеральной совокупности;

и) по каждому пункту сделайте выводы.

2. По данным экономических показателей деятельности коммерческих банков РФ, представленным в приложении 1, постройте однофакторную модель взаимосвязи, определите форму корреляционного уравнения и обоснуйте его выбор. С этой целью:

а) отберите факторный и результативный признаки для включения в регрессионную модель, предварительно оценив важность на основе логики экономического анализа;

б) рассчитайте парный коэффициент корреляции. Проанализируйте характер зависимости между переменными;

в) постройте уравнение однофакторной регрессии; Параметры уравнения определите методом наименьших квадратов;

г) проверьте значимость коэффициентов регрессии (а0, а1,), а также коэффициента корреляции, на основе (-критерия Стьюдента).

д) по полученной модели рассчитайте теоретические значения.

е) сформулируйте выводы.

Задача может быть решена с использованием стандартных пакетов прикладных программ, реализованных на ЭВМ.

интервальный вариационный ряд мода Статистический анализ выборочных данных является очень актуальной темой в наше время. Очень часто невозможно провести анализ по всей совокупности данных (любых данных) по причине их многочисленности. Либо анализ всей совокупности может занимать много времени. Для получения данных проводится анализ выборочных данных по этой совокупности.

В данном случае мы проводим выборочных анализ 30 банков из совокупности общей численностью 200 банков.

Целью данной работы является практическое закрепление теоретических данных статистического анализа вариационных рядов.

1. ПОСТРОЕНИЕ ВЫБОРОЧНОЙ СОВОКУПНОСТИ

По данным приложения 1 мы произвели выборку из 30 банков и выбрали 2 экономически связанных между собой показателя деятельности этих банков — чистые активы и прибыль. Выборка представлена в таблице 1.

Таблица 1

№пп

Название банка

Город

Чистые активы

Прибыль

Национальный резервный банк

Москва

Автобанк

Москва

Мосбизнесбанк

Москва

Газпромбанк

Москва

Ситибанк Т/О

Москва

Ростэсбанк

Тольятти

Нижегородпромстройбанк

Н.Новгород

АКБАРС

Казань

Российский капитал

Москва

Дальрыббанк

Владивосток

Желдорбанк

Москва

Восток-Запад

Москва

Зенит

Москва

Прио-Внешторг-банк

Рязань

Кузбассоцбанк

Кемерово

Элбим-банк

Москва

Уралвнешторгбанк

Екатеринбург

Нефтяной

Москва

Интехбанк

Казань

Экономбанк

Саратов

АБН АМРО банк

Москва

Федеральный депозитный банк

Москва

МБРР

Москва

Воронеж

Воронеж

Руссобанк

Москва

Орбита

Москва

Евросиббанк

Москва

Тольяттихимбанк

Тольятти

Сиф

Якутск

Банк Китая (ЭЛОС)

Москва

— 8

Итого

Среднее значение

1528,0

132,3

При произведении расчетов использовались стандартные пакеты прикладных программ, в частности Excel.

Способ отбора данных был следующий — из 200 банков выбрали каждый 6-ой банк начиная с 3-го по списку. Получился список из 33 банков. Из этого списка исключили каждый 11-ый банк. Получилась выборочная совокупность из 30 банков.

1.1 Построение интервального вариационного ряда по величине чистого капитала

Построим интервальный вариационный ряд распределения по величине чистого капитала Для определения числа групп можно воспользоваться формулой Стерджесса:

где n — число групп;

N — число единиц в совокупности.

n = 1+3.322 lg30 = 5,90 699? 6

Величина интервала определяется по формуле:

где Хmax — максимальное значение признака в ряду;

Xmin — минимальное значение признака в ряду.

Величина интервала для вариационного ряда распределения банков по величине чистых активов

H = (9911 — 141) / 6 = 1628,3 млн руб.

В таблице 2 приведена группировка банков по величине чистых активов Таблица 2

№ группы

Величина чистых активов, млн.руб.

Число банков, шт

Средняя величина интервала, млн.руб.

Общая величина чистых активов в группе, млн.руб.

Средняя величина чистых активов в группе, млн.руб.

141 — 1769,3

955,15

574,8

1769 — 3397,6

2583,15

2583,15

2583,2

3397,6 — 5025,9

4211,75

3649,0

5025,9 — 6654,2

;

6654,2 -8282,5

7468,35

6728,0

8282,5 — 9911

9096,65

9182,0

Итого

45 694,15

1523,1

1.2 Построение графика

Для наглядного изображения интервального ряда распределения построим гистограмму. Она представлена на рисунке 1.

Гистограмма распределения банков по величине чистого капитала

Рис.1

В таблице 2 рассчитана средняя величина чистых активов по группировке.

Хср = 1 527,97 млн руб.

Так же среднюю величину для интервального ряда можно рассчитать по формуле средней арифметической взвешенной

где где xi -середина интервала усредняемого показателя;

n — число единиц (объем) совокупности;

fi — частота, которая показывает как часто встречается значение признака в статистической совокупности.

хср = 1877,84 млн руб.

Однако средняя величина, рассчитанная в первом случае, является более точной и в последующих расчетах мы будем пользоваться ею.

1.3 Расчет показателей вариации

Для характеристики структуры вариации рассчитываем структурные средние: моду и медиану.

Мода — значение признака, которое наиболее часто встречается в ряду распределения. Для интервального ряда мода определяется по наибольшей частоте. Мода находится по формуле:

где x0 — нижняя (начальная) граница модального интервала;

k — величина интервала;

fMo — частота модального интервала;

fMo-1 — частота интервала, предшествующего модальному;

fMo+1 — частота интервала, следующего за модальным.

М0 = 141 + 1628,3*(25 — 0) / ((25 — 0) + (25 — 1)) = 971,77 млн руб.

Медиана — значение признака, которое делит совокупность на две равные части, т. е. 50% единиц совокупности имеют значение меньше медианы, а остальные — больше медианы.

Для определения медианы рассчитывается ее порядковый номер по формуле:

= 31 / 2 = 15,5

где n — число единиц совокупности.

Затем рассчитывается накопленные частоты. После смотрят, какая из накопленных частот впервые превышает номер медианы.

Медиану рассчитывают по формуле:

где x0 — нижняя граница медианного интервала;

k — величина интервала;

?f = n — число единиц совокупности;

SMe-1 — накопленная частота (кумулятивная частота) интервала, предшествующего медианному;

fMe — медианная частота.

Ме = 141 + 1628,3 * (15 — 0) / 25 = 1117,98 млн руб. — данная величина чистых активов находится в середине совокупности.

Степень близости данных отдельных единиц совокупности к средней величине измеряется рядом абсолютных и относительных показателей вариации.

К абсолютным показателям вариации относятся:

— размах вариации;

— среднее линейное отклонение;

— дисперсия;

— среднее квадратическое отклонение.

Размах вариации представляет собой разность между максимальным и минимальным значениями признака совокупности, и находится по формуле:

R = 9911 — 141 = 9770 млн руб.

Среднее линейное отклонение представляет собой среднюю величину из отклонений значений признака от их средней величины, которое рассчитывается по формуле:

= 1688,6 млн руб.

Так же среднее линейное отклонение можно рассчитать по формуле В таблице 3 представлены дополнительные расчеты для исчисления показателей вариации Таблица 3

№ группы

Величина чистых активов, млн.руб.

Число банков, шт, fi

Средняя величина интервала, млн.руб.

|х-хср|

|х-хср|*fi

(х-хср)2*fi

141 — 1769,3

955,15

568,0

14 199,71

8 065 268,67

1769 — 3397,6

2583,15

1060,0

1060,012

1 123 624,73

3397,6 — 5025,9

4211,75

2688,6

2688,612

7 228 632,69

5025,9 — 6654,2

1523,1

0,00

6654,2 -8282,5

7468,35

5945,2

5945,212

35 345 541,76

8282,5 — 9911

9096,65

7573,5

15 147,02

114 716 157,93

Итого

19 358,5

39 040,6

166 479 225,79

Среднее

645,3

1301,4

5 549 307,53

d = 1301,4 млн руб.

Таким образом, средняя величина отклонений значений величины чистых вложений от их средней составляет 1301,4 млн руб.

Дисперсия — это средний квадрат отклонений индивидуальных значений признака от их средней величины. Дисперсия находится по формуле:

— простая (невзвешенная) дисперсия

— дисперсия взвешенная у2 = 5 895 974,6 — невзвешенная дисперсия у2 = 5 549 307,53 млн руб.2 — взвешенная дисперсия Таким образом, средний квадрат отклонений индивидуальных значений величины чистого капитала от их средней величины составляет 5 549 307,53 млн руб.2

Среднее квадратическое отклонение представляет собой корень квадратный из дисперсии, т. е. корень квадратный из среднего квадрата отклонений индивидуальных значений признака от их средней величины. Среднее квадратическое отклонение находится по формуле:

Найдем среднее квадратическое отклонение по объему кредитных вложений:

= 2628,16 млн руб. — невзвешенное значение

= 2355,7 (млн. руб.) — взвешенное значение Относительные показатели вариации в общем виде показывают отношение абсолютных показателей вариации к их средней величине.

К относительным показателям вариации относятся:

— коэффициент осцилляции;

— относительное линейное отклонение;

— коэффициент вариации.

Коэффициент осцилляции находится по формуле:

Коэффициент осцилляции для выборки по величине чистых активов равен:

VR = 9770 / 1528 * 100% = 639,4%

Относительное линейное отклонение рассчитывается по формуле:

Относительное линейное отклонение для выборки величине чистых активов равно:

VD = 1688,6 / 1528 * 100% = 110,5%

VD = 1301,4/ 1528 * 100% = 85,2%

Коэффициент вариации характеризует однородность совокупности. Совокупность считается однородной, если коэффициент вариации меньше либо равен 33%, иначе признается неоднородной. Коэффициент вариации определяется по формуле:

Тогда, коэффициент вариации для выборки по величине чистых активов равен:

Vу = 2628,16 / 1528 * 100% = 172%

Vу = 2355,7 / 1528 * 100% = 154,17%

Коэффициент вариации для выборки по величине чистых активов больше, чем 33%, следовательно, совокупность неоднородна, а это означает, что среднее значение признака не является центром распределения.

1.4 Определение количественных характеристик распределения (показателей асимметрии и эксцесса)

При анализе данных важно представить не только размер вариации, но и то, как распределены единицы совокупности по всему диапазону значений признака.

Показатели асимметрии и эксцесса используются для количественной оценки симметричности.

Для расчета показателя асимметрии используют формулу:

где M3 — центральный момент третьего порядка;

у — среднее квадратическое отклонение.

В свою очередь центральный момент третьего порядка рассчитывается по формуле:

М3 = 34 798 998 424,8 — невзвешенный момент третьего порядка

М3 = 36 419 174 665,3 — взвешенный момент третьего порядка

АS = 34 798 998 424,4 / 2628,163 = 2,43

АS = 328 797 195 203 / 2355,73 = 2,79

Для того, чтобы определить, является ли асимметрия существенной или не существенной, рассчитывается отклонение показателя асимметрии к среднеквадратическому отклонению. Для этого используют соотношение:

где As — показатель асимметрии;

— средняя квадратическая ошибка отклонения асимметрии, которая рассчитывается по формуле:

где n — число единиц в совокупности.

0,412

= 2,43 / 0,412 = 5,898

= 2,79 / 0,412 = 6,772

Если данное соотношение меньше 3, то асимметрия признается несущественной, иначе — существенной.

Как видим, данное соотношение значительно больше 3, поэтому в данном случае асимметрия признается существенной.

В симметричных распределениях или распределениях с несущественной асимметрией рассчитывается показатель эксцесса. Поскольку в данном случае имеет место существенная асимметрия, но данный показатель может не рассчитываться.

1.5 Нахождение эмпирической функции, построение ее графика

Построим график эмпирического распределения банков в зависимости величины чистого капитала. Для этого по оси абсцисс необходимо откладывать середину интервала значения признака, а по оси ординат, соответствующие ей частоты.

Рис.2

1.6 Определение теоретических частот по закону нормального распределения. Построение графиков

Для удобства вычислений вероятностей случайные величины нормируются, а затем по специальным таблицам находится плотность распределения нормируемой случайной величины. Для этого используются следующие формулы:

где t — нормируемое отклонение.

Теоретические частоты находятся по формуле:

где f — эмпирические частоты;

k — величина интервала.

у — невзвешенное значение среднеквадратичного отклонения

Определим теоретические частоты для выборки банков по объему кредитных вложений.

Таблица 4. Расчет теоретических частот

№ п/п

Величина чистых активов, млн.руб.

Число банков, fi

Середина интервала, xi'

t

ц (t)

Теоретические частоты, f'

141 — 1769,3

955,15

— 0,2359

0,3867

1769 — 3397,6

2583,15

0,4346

0,36 050

3397,6 — 5025,9

4211,75

1,1053

0,21 790

5025,9 — 6654,2

5840,05

1,7759

0,7 900

6654,2 -8282,5

7468,35

2,4465

0,1 980

8282,5 — 9911

9096,65

3,1170

0,330

Итого

;

;

;

;

По найденным теоретическим частотам построим график теоретического распределения банков по величине чистого капитала.

Рис.3

При совмещении графиков теоретического и эмпирического распределения получится следующее:

Рис.4

1.7 Проверка гипотезы о подчинении изучаемых признаков нормальному закону распределения

Так как все предположения о характере распределения лишь гипотезы, а не категорические утверждения, то они должны быть подвергнуты статистической проверке с помощью одного из критериев согласия. Критерии согласия, опираясь на установленный закон распределения, дают возможность установить, когда расхождение между частотами эмпирического и теоретического распределений следует признать несущественными, то есть случайными, а когда существенными (в тех случаях, когда неверно выдвинута гипотеза о законе распределения).

Для проверки гипотезы о подчинении изучаемых признаков нормальному закону распределения воспользуемся критерием Романовского, который рассчитывается по формуле:

где h — число групп;

l — число независимых параметров, которые необходимо знать, чтобы построить кривую теоретического распределения.

В свою очередь рассчитывается по формуле:

где fi — эмпирические частоты распределения;

fi' — теоретические частоты распределения.

Таблица 5. Расчет значения критерия Пирсона для распределения по величине чистого капитала

№ п/п

Величина чистых активов, млн.руб.

Эмирические частоты, fi

Теоретические частоты, f'

(fi-f')2

(fi-f')2/f'

141 — 1769,3

38,119

1769 — 3397,6

5,390

3397,6 — 5025,9

2,612

5025,9 — 6654,2

1,589

6654,2 -8282,5

0,909

8282,5 — 9911

0,000

Итого

;

48,619

Рассчитаем значение критерия Романовского для распределения по объему кредитных вложений:

= 18,624

Так как критерий Романовского больше 3 (равен 18,624), то гипотеза о распределении банков в зависимости от величины чистых активов по закону нормального распределения отвергается.

1.8 Оценка параметров генеральной совокупности на основе выборочных данных

Расхождение между генеральной и выборочной совокупностями измеряется средней ошибкой выборки, которая рассчитывается следующим образом:

где n — число единиц в выборочной совокупности;

N — число единиц в генеральной совокупности.

Среднюю ошибку необходимо знать для того, чтобы определить возможные пределы для средней генеральной совокупности

Суждение о том, что средняя в генеральной совокупности будет лежать в пределах можно гарантировать не с абсолютной точностью, а с некоторой вероятностью.

Для этого рассчитывают предельную ошибку выборки по формуле:

где t — коэффициент доверия, определяемый в зависимости от вероятности по таблицам.

Таким образом, показатели генеральной совокупности для генеральной средней при заданной вероятности определяются по показателям выборочной совокупности следующим образом:

Рассчитаем среднюю ошибку для выборки по величине чистых активов:

= 396,52 (млн.руб.)

Найдем предельную ошибку для выборки по кредитным вложениям, принимая вероятность равной 0,95. По таблице находим коэффициент доверия t, равный 1,96.

Д = 396,52 * 1,96 = 777,18 млн руб.

Таким образом, границы, в которых с вероятностью 0,95 будет находиться среднее значение показателя величины чистых активов, принимают вид:

1528 — 777,18 < хср < 1528 + 777,18

750,82 < хср < 2305,18 млн руб.

1.9 Построение интервального вариационного ряда по величине прибыли

Построим вариационный ряд распределения по величине прибыли. Число групп определено в предыдущих расчетах и равно 6.

Величина интервала составляет

H = (913 — (-8)) / 6 = 153,5 млн руб.

В таблице 6 приведена группировка банков по величине чистых активов

Таблица 6

№ группы

Величина прибыли, млн.руб.

Число банков, шт, f

Средняя величина интервала, млн.руб.

Общая величина прибыли в группе, млн.руб.

Средняя величина прибыли в группе, млн.руб.

— 8 — 145,5

68,75

29,4

145,5 — 299

222,25

219,0

299 — 452,5

375,75

481,0

452,5 — 606

529,25

;

606 — 759,5

682,75

645,0

759,5 — 913

836,25

913,0

Итого

132,3

1.10 Построение Графика

Для наглядного изображения интервального ряда распределения построим гистограмму. Она представлена на рисунке 5

Гистограмма распределения банков по величине прибыли

Рис.5

В таблице 6 рассчитана средняя величина прибыли по группировке

Хср = 132,33 млн руб.

Так же среднюю величину для интервального ряда можно рассчитать по формуле средней арифметической взвешенной. В этом случае ее величина составит

Хср = 155,73 млн руб.

Как видим две величины, рассчитанные разными способами значительно отличаются друг от друга. В дальнейших расчетах мы будем пользоваться средней величиной прибыли, рассчитанной в таблице 6, поскольку данная величина является более точной.

1.2.в) Расчет показателей вариации

Для характеристики структуры вариации рассчитываем структурные средние: моду и медиану.

Мо = -8 + 153,5*(21−0) / ((21−0) + (21−6)) = 81,54 млн руб.

Рассчитаем медиану

Ме = -8 + 153,5* (15 — 0) / 21 = 28,55 млн руб.- данная величина прибыли находится в середине совокупности.

Рассчитаем абсолютные показатели вариации

Размах вариации R = 913 — (- 8) = 921 млн руб.

В таблице 7 представлены дополнительные расчеты для исчисления показателей вариации

Таблица 7

Величина прибыли, млн.руб.

Число банков, шт, f

Средняя величина интервала, млн.руб.

|х-хср|

|х-хср|*fi

(х-хср)2*fi

— 8 — 145,5

68,75

63,6

1335,25

84 899,65

145,5 — 299

222,25

89,9

539,5

48 510,04

299 — 452,5

375,75

243,4

243,42

59 251,67

452,5 — 606

529,25

396,9

0,00

606 — 759,5

682,75

550,4

550,42

302 958,51

759,5 — 913

836,25

703,9

703,92

495 498,67

Итого

2048,2

3372,5

991 118,54

Среднее

68,3

112,4

33 037,28

Среднее линейное отклонение

D = 144,1 млн руб. — невзвешенная величина среднего линейного отклонения

D = 112,4 млн руб. — взвешенная величина среднего линейного отклонения

Дисперсия

у2 = 43 189,42 млн.руб.2 — невзвешенная дисперсия

у2 = 33 037,282 млн.руб.2 — взвешенная дисперсия

Среднее квадратическое отклонение

у = 207,82 млн руб.- невзвешенное среднее квадратическое отклонение

у = 181,76 млн руб.- взвешенное среднее квадратическое отклонение

Рассчитаем относительные показатели вариации

Коэффициент осцилляции

VR = 921 / 132,3 * 100 = 696,1%

Относительное линейное отклонение

VD = 144,1 / 132,3 * 100% = 108,9%

VD = 112,4/ 132,3 * 100% = 84,96%

Коэффициент вариации

Vу = 207,82 / 132,3 * 100% = 157,1%

Vу = 181,76 / 132,3 * 100% = 137,38%

Коэффициент вариации для выборки по величине прибыли значительно больше, чем 33%, следовательно, совокупность неоднородна, а это означает, что среднее значение признака не является центром распределения.

1.11 Определение количественных характеристик распределения (показателей асимметрии и эксцесса)

М3 = 20 997 502,5 — невзвешенный момент третьего порядка

М3 = 17 630 989,7 — взвешенный момент третьего порядка

АS = 20 997 502,5 / 207,823 = 2,34

АS = 20 997 502,5 / 181,763 = 2,94

Найдем соотношение

= 2,34 / 0,412 = 5,67

= 2,94 / 0,412 = 7,14

Данное соотношение в обоих случаях (как при расчете невзвешенной величины, так и при расчете взвешенной величины) значительно больше 3, поэтому асимметрия признается существенной

В симметричных распределениях или распределениях с несущественной асимметрией рассчитывается показатель эксцесса. Поскольку в данном случае имеет место существенная асимметрия, но данный показатель может не рассчитываться.

1.12 Нахождение эмпирической функции, построение ее графика

Построим график эмпирического распределения банков в зависимости от величины прибыли. Для этого по оси абсцисс необходимо откладывать середину интервала значения признака, а по оси ординат, соответствующие ей частоты.

Рис.6

1.13 Определение теоретических частот по закону нормального распределения. Построение графиков

Таблица 8. Расчет теоретических частот

№ п/п

Величина прибыли, млн.руб.

Число банков, fi

Середина интервала, xi'

t

ц (t)

Теоретические частоты, f'

— 8 — 145,5

68,75

— 0,3498

0,3752

145,5 — 299

222,25

0,4947

0,3521

299 — 452,5

375,75

1,3392

0,1604

452,5 — 606

529,25

2,1837

0,0355

606 — 759,5

682,75

3,0282

0,0041

759,5 — 913

836,25

3,8727

0,0003

Итого

По найденным теоретическим частотам построим график теоретического распределения банков по величине прибыли.

Рис.7

При совмещении графиков теоретического и эмпирического распределения получится следующее:

Рис.8

1.14 Проверка гипотезы о подчинении изучаемых признаков нормальному закону распределения

Для проверки гипотезы о подчинении изучаемых признаков нормальному закону распределения воспользуемся критерием Романовского.

Таблица 9. Расчет значения критерия Пирсона для распределения по величине прибыли

№ п/п

Величина прибыли, млн.руб.

Эмирические частоты, fi

Теоретические частоты, f'

(fi-f')2

(fi-f')2/f'

— 8 — 145,5

19,358

145,5 — 299

0,416

299 — 452,5

1,836

452,5 — 606

0,787

606 — 759,5

9,098

759,5 — 913

0,000

Итого

Итого

31,494

Рассчитаем значение критерия Романовского

Р = = 11,63

Поскольку величина критерия Романовского больше 3 (равна 11,63), то гипотеза о распределении банков в зависимости от величины прибыли по закону нормального распределения отвергается.

1.15 Оценка параметров генеральной совокупности на основе выборочных данных

Рассчитаем среднюю ошибку выборки по величине прибыли

= 34,98 млн руб.

Найдем предельную ошибку, принимая вероятность равной 0,95. Коэффициент доверия t = 1,96

Д = 34,98 * 1,96 = 65,56 млн руб.

Таким образом, границы, в которых с вероятностью 0,95 будет находится среднее значение показателя величины чистых активов, принимают вид

132,3 — 65,56 < хср < 132,3 + 65,56

66,74 < хср < 197,86

2. Построение однофакторной модели взаимосвязи

2.1 Отбор факторного и результативного признака модели

Примем в качестве факторного признака величину чистых активов, а в качестве результативного — прибыль.

2.2 Расчет парного коэффициента корреляции. Анализ зависимости между переменными

Парный коэффициент корреляции можно вычислить по следующей формуле:

Таблица 10 — Данные для расчета парного коэффициента корреляции для выборочной совокупности.

№пп

Чистые активы, млн.руб., хi

Прибыль, млн.руб., уi

хi2

уi2

хiуi

98 227 921

416 025

6 392 595

45 265 984

833 569

6 142 664

71 453 209

231 361

4 065 893

13 315 201

70 225

966 985

7 441 984

66 564

703 824

1 575 025

59 049

304 965

583 696

32 041

136 756

110 889

25 921

53 613

900 601

7 592

400 689

11 881

68 997

758 641

15 625

108 875

531 441

13 122

1 857 769

43 264

283 504

136 900

4 070

495 616

13 376

192 721

3 512

302 500

6 889

45 650

281 961

3 717

53 824

5 336

196 249

12 847

1 742 400

31 680

102 400

338 724

5 238

135 424

10 672

212 521

3 025

25 355

34 225

75 625

6 325

28 224

1 089

5 544

147 456

3 072

— 8

19 881

— 1 128

Итого

246 919 701

1 821 046

19 425 796

Среднее

8 230 657

60 702

647 527

R = 0,882

Коэффициент корреляции является величиной положительной, следовательно, связь между факторами прямая. Величина коэффициента корреляции больше 0,5, значит, связь между факторами можно назвать тесной.

2.3 Построение уравнения однофакторной регрессии с использованием метода наименьших квадратов

Определим вид зависимости между объемом кредитных вложений и размером прибыли, используя графический метод.

Рис.9

По графику можно предположить, что зависимость прибыли от объема кредитных вложений приближается к уравнению прямой. Следовательно, сумма квадратов отклонений эмпирических точек от теоретических принимает вид:

В этом случае коэффициенты уравнения регрессии рассчитываются по формулам:

Рассчитаем данные коэффициенты:

А = 16,93

b = 0,0755

Таким образом, уравнение регрессии принимает вид:

У = 16,93 +0,0755х

2.4 Проверка значимости коэффициентов регрессии и коэффициента корреляции

Поскольку анализ взаимосвязей между явлениями проводят в выборочной совокупности, а данные необходимо обобщить на всю генеральную совокупность, то необходимо проверить коэффициенты уравнения регрессии на статистическую значимость.

При объеме выборки меньше или равном 30 единицам значимость коэффициентов уравнения регрессии определяют с помощью t-критерия Стьюдента, который находится по формуле (для коэффициента a):

где a — коэффициент уравнения регрессии;

n — число единиц совокупности;

— остаточное среднее квадратическое отклонение, которое отображает вариацию результативного признака (y) от всех прочих, кроме факторного признака (x), которое находится по формуле:

где yi — эмпирические значения результативного признака;

урасчх — теоретические значения результативного признака, найденные по уравнению регрессии;

n — число единиц в совокупности.

Проверка значимости для коэффициента b осуществляется по формуле:

где b — коэффициент уравнения регрессии;

n — число единиц совокупности;

— остаточное среднее квадратическое отклонение, которое отображает вариацию результативного признака (y) от всех прочих, кроме факторного признака (x);

— среднее квадратическое отклонение факторного признака, которое находится по формуле:

где xi — эмпирические значения факторного признака;

хср — среднее значение факторного признака.

Проведем проверку коэффициентов уравнения регрессии (a = 16,93 и b = 0,0755) на статистическую значимость.

Таблица 11. Проверка значимости коэффициентов регрессии

№пп

Чистые активы, млн.руб., х

Прибыль, млн.руб., у

(х — хср)2

урасч

у — урасч

(у — урасч)2

70 275 247,87

765,51

— 120,51

14 522,08

27 040 346,67

525,09

387,91

150 470,92

47 956 086,67

655,38

— 174,38

30 409,85

4 498 782,401

292,54

— 27,54

758,23

1 440 080,001

222,97

35,03

1226,93

74 510,80111

111,72

131,28

17 235,48

583 645,0678

74,63

104,37

10 892,97

1 427 945,334

42,08

118,92

14 142,69

335 202,4011

88,60

— 80,60

6496,96

800 965,3344

64,74

44,26

1959,29

431 605,2011

82,71

42,29

1788,25

638 347,7344

71,99

— 53,99

2914,60

27 214,00111

119,87

88,13

7766,31

1 340 886,801

44,87

— 33,87

1147,28

678 921,0678

70,10

— 51,10

2611,08

1 185 848,401

50,08

— 42,08

1770,99

956 418,8011

58,47

24,53

601,86

993 942,5344

57,03

— 50,03

2503,20

1 679 529,601

34,45

— 11,45

131,07

1 177 152,668

50,39

— 21,39

457,33

43 250,13444

116,63

— 92,63

8579,49

1 459 183,468

41,10

— 38,10

1451,23

894 852,9344

60,88

— 51,88

2691,95

1 345 522,668

44,72

— 15,72

247,14

1 138 417,868

51,74

3,26

10,60

1 803 559,468

30,90

— 29,90

893,92

1 569 925,468

37,70

— 14,70

215,98

1 849 509,334

29,61

3,39

11,46

1 308 659,734

45,93

— 37,93

1438,61

— 8

1 923 676,534

27,58

— 35,58

1265,59

Итого

45 839

3 970

176 879 237

3 970

286 613

Рассчитаем остаточное среднее квадратическое отклонение результативного признака:

уе = = 97,74

Вычислим t-критерий Стьюдента для коэффициента a уравнения регрессии:

= 0,917

Полученное расчетное значение сравним с табличным:

(х=28, б=0,05) = 2,0484 > = 0,0917, следовательно, параметр a статистически не значим, и его нельзя распространять на всю совокупность.

Рассчитаем остаточное среднее квадратическое отклонение факторного признака:

2628,16

Вычислим t-критерий Стьюдента для коэффициента b уравнения регрессии:

= 10,74

Полученное расчетное значение сравним с табличным:

(х=28, б=0,05) = 2,0484 < = 10,74, следовательно, параметр b статистически значим, и его можно распространять на всю совокупность.

При объеме выборочной совокупности менее или равном 30 единицам проверка коэффициента корреляции на статистическую значимость осуществляется при помощи t-критерия Стьюдента, который рассчитывается по формуле:

Рассчитаем t-критерий Стьюдента для выборочной совокупности:

= 9,93

Полученное расчетное значение сравним с табличным:

(х=28, б=0,05) = 2,0484 < = 15.76, следовательно, коэффициент корреляции признается статистически значимым и его можно распространять на всю совокупность.

Построение графика зависимости признаков по теоретическим частотам

Рис.10ЗАКЛЮЧЕНИЕ

В данной работе мы произвели выборку 30 банков из общей совокупности в 200 банков и произвели анализ данной выборки. Мы рассчитали показатели вариационного ряда по двум показателям — среднюю арифметическую, моду, медиану, относительные и абсолютные показатели вариации, количественные характеристики распределения, а так же нашли эмпирическую и теоретическую функцию распределения ряда и построили их графики.

Почти все характеристики ряда считались в двух вариантах — взвешенное значение и невзвешенное.

Можно сказать, что цель данной работы (практическое закрепление полученных теоретических данных) достигнута.

Хотелось бы только отметить, что в данном случае многие из взвешенных характеристик значительно отличаются по значению от невзвешенных. При данном объеме выборки (30 элементов) и даже при всем объеме выборки можно было бы все характеристики рассчитывать только в одном варианте — взвешенное значение, поскольку данное значение является более точным, а при сегодняшнем уровне автоматизации расчетов и применении электронных таблиц Exsel проведение таких расчетов не является трудоемким.

Показать весь текст
Заполнить форму текущей работой