Помощь в написании студенческих работ
Антистрессовый сервис

Пакет программ Майкрософт, как эффективное средство эконометрического анализа

КурсоваяПомощь в написанииУзнать стоимостьмоей работы

Прямая связь между рентабельностью и фондоотдачей достаточно тесная и значимая, при этом частный коэффициент по модулю немного меньше парного. Следовательно, остальные переменные, включённые в корреляционную модель (Х5 — удельный вес рабочих в составе ППП, Х7 — коэффициент сменности оборудования и X15 — оборачиваемость нормируемых оборотных средств) ослабляют взаимосвязь между указанными… Читать ещё >

Пакет программ Майкрософт, как эффективное средство эконометрического анализа (реферат, курсовая, диплом, контрольная)

1. Данные для корреляционного и регрессионного анализа.

2. Корреляционный анализ экономических показателей.

2.1 Построение матрицы парных коэффициентов корреляции.

2.2 Расчёт частных коэффициентов корреляции. Сравнение частных и парных коэффициентов корреляции.

2.3 Расчёт множественных коэффициентов корреляции.

3. Регрессионный анализ экономических показателей.

3.1 Проверка исходных данных на мультиколлинеарность.

3.2 Построение регрессионной модели и её интерпретация.

3.3 Сравнение исходных данных с рассчитанными по уравнению регрессии Заключение Список используемой литературы.

В банковской, финансовой сфере, при проведении маркетинговых и социологических исследований, при обработке различных экономических данных требуется оценка взаимосвязи показателей и моделирование их зависимости для дальнейшего прогнозирования. Эти задачи призваны решать методы корреляционного и регрессионного анализов.

Изменение любого экономического показателя зависит от большого числа факторов, но из них лишь некоторые оказывают существенное воздействие на исследуемый показатель. Доля влияния остальных факторов столь незначительна, что их игнорирование не может привести к существенным отклонениям исследуемого объекта.

В большинстве случаев между экономическими явлениями не существует строгой функциональной взаимосвязи, поэтому в экономике говорят не о функциональных, а о корреляционных или статистических зависимостях.

Нахождение, оценка и анализ таких зависимостей и оценка их параметров будет произведена в данной курсовой работе.

Задачами курсовой работы является следующее: провести корреляционный анализ (то есть построить матрицу парных коэффициентов корреляции, частных коэффициентов корреляции, сравнить этих коэффициентов, рассчитать множественные коэффициенты корреляции); выявить, можно ли производить регрессионный анализ; провести регрессионный анализ (проверить данные на наличие мультиколлинеарности, исходя из этого, провести поэтапный регрессионный анализ, интерпретировать полученное уравнение регрессии).

Объектом исследования курсовой работы является массив данных из пяти показателей (одному результативному и четырём факторным) по 50 объектам.

Предметом изучения курсовой работы является определение наличия взаимосвязи между показателями, а также характера этих взаимосвязей.

В курсовой работе делается акцент на использование ППП Microsoft Excel, так как Microsoft Office, куда он входит, имеет в настоящее время наибольшее распространение и доступен всем пользователям современных компьютеров, в отличие от многих специальных статистических пакетов. Также используются такие методы, как графический и табличный.

1. Данные для корреляционного и регрессионного анализа

С целью анализа взаимосвязи показателей эффективности производства продукции были рассмотрены показатели производственно-хозяйственной деятельности 50 предприятий машиностроения.

Необходимо провести анализ взаимосвязи следующих экономических показателей:

Результативный признак:

Y — рентабельность.

Факторные признаки Xi:

X5 — удельный вес рабочих в составе ППП.

X7 — коэффициент сменности оборудования.

X10 — фондоотдача.

X15— оборачиваемость нормируемых оборотных средств.

Исходные данные представлены в табл. 1.

Предположим, что рассматриваемые признаки Y, X5, X7, X10, X15 в генеральной совокупности подчиняются нормальному закону распределения и указанные данные представляют выборку из этой генеральной совокупности.

Таблица 1

Исходные данные

№.

Y3

X5

X7

X10

X15

13,26.

0,78.

1,37.

1,45.

166,32.

10,16.

0,75.

1,49.

1,3.

92,88.

13,72.

0,68.

1,44.

1,37.

158,04.

12,85.

0,7.

1,42.

1,65.

93,96.

10,63.

0,62.

1,35.

1,91.

173,88.

9,12.

0,76.

1,39.

1,68.

162,3.

25,83.

0,73.

1,16.

1,94.

88,56.

23,39.

0,71.

1,27.

1,89.

101,16.

14,68.

0,69.

1,16.

1,94.

166,32.

10,05.

0,73.

1,25.

2,06.

140,76.

13,99.

0,68.

1,13.

1,96.

128,52.

9,68.

0,74.

1,1.

1,02.

177,84.

10,03.

0,66.

1,15.

1,85.

114,48.

9,13.

0,72.

1,23.

0,88.

93,24.

5,37.

0,68.

1,39.

0,62.

126,72.

9,86.

0,77.

1,38.

1,09.

91,8.

12,62.

0,78.

1,35.

1,6.

69,12.

5,02.

0,78.

1,42.

1,53.

66,24.

21,18.

0,81.

1,37.

1,4.

67,68.

25,17.

0,79.

1,41.

2,22.

50,4.

19,4.

0,77.

1,35.

1,32.

70,56.

0,78.

1,48.

1,48.

6,57.

0,72.

1,24.

0,68.

97,2.

14,19.

0,79.

1,4.

2,3.

80,28.

15,81.

0,77.

1,45.

1,37.

51,48.

5,23.

0,8.

1,4.

1,51.

105,12.

7,99.

0,71.

1,28.

1,43.

128,52.

17,5.

0,79.

1,33.

1,82.

94,68.

17,16.

0,76.

1,22.

2,62.

85,32.

14,54.

0,78.

1,28.

1,75.

76,32.

6,24.

0,62.

1,47.

1,54.

12,08.

0,75.

1,27.

2,25.

107,64.

9,49.

0,71.

1,51.

1,07.

90,72.

9,28.

0,74.

1,46.

1,44.

82,44.

11,42.

0,65.

1,27.

1,4.

79,92.

10,31.

0,66.

1,43.

1,31.

120,96.

8,65.

0,84.

1,5.

1,12.

84,6.

10,94.

0,74.

1,35.

1,16.

85,32.

9,87.

0,75.

1,41.

0,88.

101,52.

6,14.

0,75.

1,47.

1,07.

107,64.

12,93.

0,79.

1,35.

1,24.

85,32.

9,78.

0,72.

1,4.

1,49.

131,76.

13,22.

0,7.

1,2.

2,03.

116,64.

17,29.

0,66.

1,15.

1,84.

138,24.

7,11.

0,69.

1,09.

1,22.

156,96.

22,49.

0,71.

1,26.

1,72.

137,52.

12,14.

0,73.

1,36.

1,75.

135,72.

15,25.

0,65.

1,15.

1,46.

155,52.

31,34.

0,82.

1,87.

1,6.

48,6.

11,56.

0,8.

1,17.

1,47.

42,84.

2. Корреляционный анализ экономических показателей

2.1 Построение матрицы парных коэффициентов корреляции

Парные коэффициенты корреляции характеризуют взаимосвязь между двумя выбранными переменными на фоне действия остальных показателей и являются самыми распространёнными показателями тесноты связи при статистическом анализе данных.

Расчёт матрицы выборочных парных коэффициентов корреляции осуществляется в Excel с помощью пакета анализа данных.

Таблица 2

Y3

X5

X7

X10

X15

Y3.

X5.

0,241 163.

X7.

0,118 018.

0,379 629.

X10.

0,450 862.

— 0,732.

— 0,20 751.

X15.

— 0,32 518.

— 0,61 934.

— 0,37 435.

0,8 075.

Кроме того, для дальнейших расчётов необходимо привести корреляционную матрицу к обычному виду, заполнив верхний треугольник таблицы. При этом надо учесть, что матрица парных коэффициентов корреляции является симметричной и коэффициенты rij=rji.

Итак, получили матрицу парных коэффициентов корреляции размерности kЧk (в нашем случае 5Ч5).

Таблица 3

Матрица парных коэффициентов корреляции исследуемых экономических показателей

Y3

X5

X7

X10

X15

Y3.

0,241 163.

0,118 018.

0,450 862.

— 0,32 518.

X5.

0,241 163.

0,379 629.

— 0,732.

— 0,61 934.

X7.

0,118 018.

0,379 629.

— 0,20 751.

— 0,37 435.

X10.

0,450 862.

— 0,732.

— 0,20 751.

0,8 075.

X15.

— 0,32 518.

— 0,61 934.

— 0,37 435.

0,8 075.

Теперь необходимо проверить значимость полученных коэффициентов корреляции, т. е. гипотезу H0: с=0. Для этого рассчитаем наблюдаемые значения t-статистик для всех коэффициентов по формуле:

и построим матрицу наблюдаемыx значений t-статистик для всех коэффициентов rij (таб.4).

Наблюдаемые значения t-статистик необходимо сравнить с критическим значением tкр, найденным для уровня значимости б=0,05 и числа степеней свободы н=n-2.

Для этого используем встроенную функцию Excel.

ВСТАВКА (Office 2003) или ФОРМУЛЫ (Office 2007).

f (x) Функция

Статистические

СТЬЮДРАСПОБР,

введя в предложенное меню вероятность б=0,05 и число степеней свободы н=n-2=50−2=48.

Получаем tкр= 2,10 634 722.

Таблица 4

Матрица наблюдаемыx значений t-статистик парных коэффициентов корреляции исследуемых экономических показателей

tнабл.

Y3

X5

X7

X10

X15

Y3.

1,7216.

0,82 341.

3,4995.

— 2,38 235.

X5.

1,7216.

2,84 297.

— 0,051.

— 5,4653.

X7.

0,8234.

2,843

— 1,47.

— 2,79 693.

X10.

3,4995

— 0,051.

— 1,4697.

0,5 595.

X15.

-2,382

-5,465

-2,7969

0,0559.

По результатам, представленным в табл. 4, наблюдаемое значение t-статистики больше критического tкр= 2,10 634 722 по модулю для парных коэффициентов корреляции Следовательно, гипотеза о равенстве нулю этих коэффициентов отвергается с вероятностью ошибки, равной 0,05, т. е. соответствующие коэффициенты значимы.

Для остальных коэффициентов наблюдаемое значение t-статистики меньше критического значения по модулю, следовательно, гипотеза H0 не отвергается, т. е. коэффициенты — незначимы.

Для проверки значимости парных коэффициентов корреляции можно также воспользоваться таблицами Фишера-Иейтса для нахождения критического значения rкр для уровня значимости б=0,05 и числа степеней свободы н=n-2=50−2=48.

По таб. rкр (б=0,05; н=48)=0,267.

Если соответствующий коэффициент | rij | > rкр, то он считается значимым.

Отметим в матрице парных коэффициентов корреляции значимые.

Таблица 5

Матрица парных коэффициентов корреляции исследуемых показателей с выделением значимых коэффициентов (при б=0,05)

Y3

X5

X7

X10

X15

Y3.

0,241 163.

0,118 018.

0,450 862

-0,32 518

X5.

0,241 163.

0,379 629

— 0,732.

-0,61 934

X7.

0,118 018.

0,379 629

— 0,20 751.

-0,37 435

X10.

0,450 862

— 0,732.

— 0,20 751.

0,8 075.

X15.

-0,32 518

-0,61 934

-0,37 435

0,8 075.

Для значимых парных коэффициентов корреляции можно построить с заданной надёжностью г интервальную оценку сmin? с? сmax с помощью Z-преобразования Фишера:

Алгоритм построения интервальной оценки для генерального коэффициента корреляции следующий.

1). Zr По найденному выборочному коэффициенту корреляции r с помощью Z-преобразования Фишера находят соответствующее значение Zr, являющееся гиперболическим арктангенсом r :

Для этого в Excel есть встроенные функции:

ВСТАВКА (Office 2003) или ФОРМУЛЫ (Office 2007).

f (x) Функция f(x) Функция

Статистические или Математические

ФИШЕР, ATANH ,

в качестве аргумента вводится значение соответствующего выборочного коэффициента корреляции r.

Следует учитывать, что Z-функция — нечетная, т. е. Z(-r)= - Z(r).

2). ДZ Найдём значение tг, соответствующее заданной надёжности г=0,95. — значение функции Лапласа.

Значение tг можно найти по таблице, а можно использовать встроенную функцию Excel:

ВСТАВКА (Office 2003) или ФОРМУЛЫ (Office 2007).

f(x) Функция

Статистические

НОРМСТОБР

Необходимо заметить, что Excel с помощью функции НОРМСТОБР выдаёт не значения функции Лапласа, а значение функции распределения стандартного нормального закона F (t):

.

Поэтому при расчёте всех интервальных оценок нужно пересчитывать г=0,95 в, а по этому значению уже вычислять t.

В нашем случае для надёжности г=0,95: F (t)=0,975; tг =1,959 964 (по таблице tг =1,96).

Находим.

3). Zmin и Zmax Теперь можно найти Zmin и Zmax:

Zmin = Zr — ДZ; Zmax= Zr + ДZ

4). сmin и сmax

Наконец, использовав обратное преобразование Фишера, находят нижнюю и верхнюю границы для генерального коэффициента корреляции сmin и сmax, соответствующие Zmin и Zmax.

Соответствующие значения сmin и сmax являются гиперболическими тангенсами Zmin и Zmax :

.

Для их нахождения в Excel используем встроенные функции:

ВСТАВКА (Office 2003) или ФОРМУЛЫ (Office 2007).

f (x) Функция f(x) Функция

Статистические или Математические

ФИШЕРОБР, TANH ,

введя в качестве аргумента значения соответствующих Zmin и Zmax.

Можно найти значения сmin и сmax и по таблице Z-преобразования Фишера.

Построим с надёжностью г=0,95 и с учётом найденного доверительные интервалы для всех значимых парных коэффициентов корреляции, полученных нами. Расчёты представим в виде таблицы.

Таблица 6

Расчёт доверительных интервалов для парных генеральных коэффициентов корреляции исследуемых экономических показателей с надёжностью г=0,95

r.

Zr

Zmin

Zmax

сmin

сmax

y3x10

0,450 862.

0,485 782.

0,1 998 914.

0,771 672.

0,19 727 096.

0,6479.

y3x15

— 0,325 176.

— 0,33 742.

— 0,623 314.

— 0,5 153.

— 0,5 534 312.

— 0,5 149.

x5x7

0,379 629.

0,399 626.

0,1 137 357.

0,685 516.

0,11 324 784.

0,595 094.

x5x15

— 0,619 341.

— 0,72 394.

— 1,9 826.

— 0,43 805.

— 0,7 656 901.

— 0,41 202.

x7x15

— 0,374 348.

— 0,39 347.

— 0,679 361.

— 0,10 758.

— 0,5 911 036.

— 0,10 717.

Таким образом, доверительные интервалы с надёжностью г=0,95 для всех значимых парных генеральных коэффициентов корреляции выглядят следующим образом:

P (0,19 727? сY3X10? 0,6479)=0,95.

P (-0,55 343? сY3X15? -0,5 149)=0,95.

P (0,11 325? сX5X7? 0,59 509)=0,95.

P (-0,76 569? сX5X15? -0,41 202)=0,95.

P (-0,59 110? сX7X15? -0,10 717)=0,95.

По полученным данным можно сделать следующие выводы:

1. Значимые прямые взаимосвязи обнаружены между изучаемым признаком Y3-рентабельность и факторным признаком Х10 — фондоотдача, а также между факторными признаками Х5 — удельный вес рабочих в составе ППП и Х7 — коэффициент сменности оборудования.

2. Обратные значимые взаимосвязи наблюдаются между факторным признаком Х15 — оборачиваемость нормируемых оборотных средств и изучаемым признаком Y3-рентабельность; между факторным признаком Х15 и Х5 — удельным весом рабочих в составе ППП; а также между факторным признаком Х15 и Х7 — коэффициентом сменности оборудования.

3. О тесноте связи можно судить по приближенности коэффициента корреляции по абсолютному значению к единице. Наиболее тесная связь наблюдается между удельным весом рабочих в составе ППП и оборачиваемостью нормируемых оборотных средств. Об этой связи можно сказать, что она умеренная (0,5?|r|?0,7), в то же время, остальные значимые связи являются слабыми (0,3?|r|?0,5).

2.2 Расчёт частных коэффициентов корреляции. Сравнение частных и парных коэффициентов корреляции

Частные коэффициенты корреляции характеризуют взаимосвязь между двумя выбранными переменными при исключении влияния остальных показателей (т.е. характеризуют «чистую» связь только между этими признаками) и важны для понимания взаимодействия всего комплекса показателей, т.к. позволяют определить механизмы усиления-ослабления влияния переменных друг на друга.

Частный коэффициент (k-2)-го порядка между переменными, например, между Y и X1, равен:

.

где Rij — алгебраическое дополнение элемента rij корреляционной матрицы R, равное Rij =(-1)i+j? Mij

Mij — минор элемента rij корреляционной матрицы R, т. е. определитель матрицы на 1 меньшего порядка, полученной из R путём вычёркивания i-й строки и j-го столбца.

Сформировав в в Excel соответствующие матрицы размерности (k-1)Ч (k-1) (в нашем случае 4Ч4), найдем с помощью встроенной функции определители этих матриц :

ВСТАВКА (Office 2003) или ФОРМУЛЫ (Office 2007).

f(x) Функция

Математические

МОПРЕД ,.

указав в качестве массива соответствующую матрицу переменных.

Воспользовавшись этой функцией, получаем:

Таблица 7

Алгебраические дополнения корреляционной матрицы

R11

0,48 252.

R12

-(0,2 028).

R24

— 0,952.

R22

0,55 534.

R13

— 0,4 886.

R25

-(-0,30 082).

R33

0,42 276.

R14

-(0,22 887).

R34

-(-0,10 839).

R44

0,45 305.

R15

0,12 790.

R35

0,8 093.

R55

0,58 563.

R23

-(0,9 779).

R45

-(0,4 340).

Рассчитаем частные коэффициенты корреляции с помощью формул и занесем это в таблицу.

; ;

; ; и т. д.

Таблица 8

Матрица выборочных частных коэффициентов корреляции исследуемых экономических показателей

Y3

X5

X7

X10

X15

Y3

0,3 917.

0,1 081 842.

0,489 510.

— 0,2 406 076.

X5

0,3 917.

0,2 018 278.

0,18 971.

— 0,5 274 903.

X7

0,108 184.

0,201 828.

— 0,24 767.

— 0,1 626 469.

X10

0,489 510.

0,18 971.

— 0,247 666.

0,8 425 646.

Теперь необходимо проверить значимость полученных частных коэффициентов корреляции, т. е. гипотезу H0: сij/{.} = 0.

Для этого рассчитаем наблюдаемые значения t-статистик для всех коэффициентов по формуле:

где l — порядок частного коэффициента корреляции, совпадающий с количеством фиксируемых переменных случайных величин (в нашем случае l=3, например), а n — количество наблюдений.

Построим матрицу наблюдаемыx значений t-статистик для всех коэффициентов rij/{.}

Таблица 9

Матрица наблюдаемыx значений t-статистик частных коэффициентов корреляции исследуемых экономических показателей

tнабл.

Y3.

X5.

X7.

X10.

X15.

Y3.

0,26 296.

0,730 006.

3,7 657 588.

— 1,66 290.

X5.

0,26 296.

1,382 349.

0,12 729.

— 4,16 511.

X7.

0,73 001.

1,38 235.

— 1,7148.

— 1,10 579.

X10.

3,7 657 588.

0,12 729.

— 1,71 482.

0,56 723.

X15.

— 1,6629.

— 4,1651.

— 1,10 579.

0,56 723.

Наблюдаемые значения t-статистик необходимо сравнить с критическим значением tкр, найденным для уровня значимости б=0,05 и числа степеней свободы н=n — l — 2.

Для этого используем встроенную статистическую функцию Excel СТЬЮДРАСПОБР, введя в предложенное меню вероятность б=0,05 и число степеней свободы н=n-l-2=50−3-2=45. (Можно найти значения tкр по таблицам математической статистики).

Получаем tкр= 2,14 103 359.

По результатам, представленным в таблице 9, наблюдаемое значение t-статистики больше критического tкр= 2,14 103 359 по модулю для частных коэффициентов корреляции и.

Следовательно, гипотеза о равенстве нулю этих коэффициентов отвергается с вероятностью ошибки, равной 0,05, т. е. соответствующие коэффициенты значимы.

Для остальных коэффициентов наблюдаемое значение t-статистики меньше критического значения по модулю, следовательно, гипотеза H0 не отвергается, т. е. незначимы.

Для проверки значимости частных коэффициентов корреляции можно также воспользоваться таблицами Фишера-Иейтса для нахождения критического значения rкр с учётом уровня значимости б=0,05 и числа степеней свободы н=n-l-2=50−3-2=45. По таб. rкр (б=0,05; н=45)=0,288. Если соответствующий коэффициент |r|> rкр, то он считается значимым.

Отметим в матрице частных коэффициентов корреляции значимые.

Таблица 10

Матрица частных коэффициентов корреляции исследуемых показателей с выделением значимых коэффициентов (при б=0,05)

Y3

X5

X7

X10

X15

Y3

0,3 917.

0,1 081 842.

0,489 510

— 0,2 406 076.

X5

0,3 917.

0,2 018 278.

0,18 971.

-0,5 274 903

X7

0,108 184.

0,201 828.

— 0,24 767.

— 0,1 626 469.

X10

0,489 510

0,18 971.

— 0,247 666.

0,8 425 646.

X15

— 0,240 608.

-0,5275

— 0,162 647.

0,84 256.

Для значимых частных коэффициентов корреляции можно построить с заданной надёжностью г интервальную оценку сmin? с? сmax с помощью Z-преобразования Фишера:

Алгоритм построения интервальной оценки для частного генерального коэффициента корреляции такой же, как и для парного; единственное отличие заключается в расчёте ДZ :

.

где l — порядок частного коэффициента корреляции, совпадающий с количеством фиксируемых переменных случайных величин (в нашем случае l=3), а n — количество наблюдений.

Построим с надёжностью г=0,95 и с учётом найденного доверительные интервалы для всех значимых частных коэффициентов корреляции, полученных нами. Расчёты представим в виде таблицы 11.

Таблица 11

Расчёт доверительных интервалов для частных генеральных коэффициентов корреляции исследуемых экономических показателей с надёжностью г=0,95

r.

Zr

Zmin

Zmax

сmin

сmax

YX10

0,48 950 965.

0,535 415.

0,2 399 396.

0,830 891.

0,23 543 867.

0,680 954.

X5X15

— 0,5 274 903.

— 0,58 666.

— 0,882 137.

— 0,29 119.

— 0,7 074 884.

— 0,283 226.

Таким образом, доверительные интервалы с надёжностью г=0,95 для всех значимых частных генеральных коэффициентов корреляции выглядят следующим образом:

P (0,23 543 867?? 0,680 954)=0,95.

P (-0,707 488?? -0,283 226)=0,95.

Теперь построим таблицу сравнения выборочных парных и частных коэффициентов корреляции для всех переменных.

Сравнение парных и частных коэффициентов играет важную роль в выявлении механизмов воздействия переменных друг на друга.

Таким образом, если оказывается, что парный коэффициент корреляции между двумя переменными по модулю больше соответствующего частного, то остальные переменные усиливают связь между этими двумя признаками. Соответственно, если парный коэффициент корреляции между двумя переменными по абсолютной величине меньше частного, то остальные признаки ослабляют связь между рассматриваемыми двумя.

Таблица 12

Таблица сравнения выборочных оценок парных и частных коэффициентов корреляции пар исследуемых показателей с выделением значимых коэффициентов (при б=0,05)

Между переменными

Коэффициент корреляции

парный

частный

Y X5

0,241 163.

0,3 917.

Y X7

0,118 018.

0,108 184.

Y X10

0,450 862

0,489 510

Y X15

-0,32 518

— 0,24 061.

X5 X7

0,379 629

0,201 828.

X5 X10

— 0,732.

0,18 971.

X5 X15

-0,61 934

-0,52 749

X7 X10

— 0,20 751.

— 0,24 767.

X7 X15

-0,37 435

— 0,16 265.

X10 X15

0,8 075.

0,84 256.

По полученным данным можно сделать следующие выводы.

Значимые корреляционные зависимости, полученные на этапе расчёта парных коэффициентов корреляции, подтвердились и при вычислении частных коэффициентов корреляции только для связей между рентабельностью и фондоотдачей, и удельным весом рабочих в составе ППП и оборачиваемостью нормируемых оборотных средств. При этом выявлены следующие механизмы воздействия переменных друг на друга:

1. Прямая связь между рентабельностью и фондоотдачей достаточно тесная и значимая, при этом частный коэффициент по модулю немного меньше парного. Следовательно, остальные переменные, включённые в корреляционную модель 5 - удельный вес рабочих в составе ППП, Х7 - коэффициент сменности оборудования и X15 — оборачиваемость нормируемых оборотных средств) ослабляют взаимосвязь между указанными факторными признаками.

2. Между факторными признаками X5 — удельным весом рабочих в составе ППП и Х15 — оборачиваемость нормируемых оборотных средств также существует значимая обратная корреляционная связь. Её усиливают переменные, включенные в корреляционную модель, так как парный коэффициент по абсолютному значению больше частного.

3. Для связи рентабельности (Y) с удельным весом рабочих в составе ППП (Х5), а также рентабельности и коэффициента сменности оборудования (Х7) характерна следующая ситуация: обе связи незначимы, являются прямыми, воздействие других переменных значительно усиливает эти взаимосвязи.

4. Парный коэффициент корреляции для связи X5X7 значим, но его частный коэффициент незначим, то есть значимость этой прямой корреляционной связи не подтвердилась. В тоже время, ее усиливают переменные, включенные в корреляционную модель.

5. Аналогичная ситуация происходит со связями рентабельности (Y) с оборачиваемостью нормируемых оборотных средств (X15) и коэффициента сменности оборудования (X7) также с оборачиваемостью нормируемых оборотных средств: парный коэффициент значим, взаимосвязи обратные, и их усиливает переменные, включенные в модель.

6. Единственная обратная взаимосвязь, которая ослабляется остальными переменными — это связь между коэффициентом сменности оборудования (X7) и фондоотдачей (Х10), так как значение частного коэффициента превышает значение парного по модулю. Но эта взаимосвязь незначима.

2.3 Расчёт множественных коэффициентов корреляции

Множественные коэффициенты корреляции служат мерой связи одной переменной с совместным действием всех остальных показателей.

Вычислим точечные оценки множественных коэффициентов корреляции. Множественный коэффициент корреляции, например, для 1-го показателя Y вычисляется по формуле:

где |R| - определитель корреляционной матрицы R;

Rii — алгебраическое дополнение элемента rii корреляционной матрицы R.

Все алгебраические дополнения Rii были найдены в п. 2.2 на этапе расчёта частных коэффициентов корреляции, поэтому осталось вычислить только определитель самой корреляционной матрицы.

Чтобы найти определитель корреляционной матрицы, воспользуемся встроенной математической функцией Excel МОПРЕД.

Получим |R| = 0,327 084 571.

;

Множественный коэффициент детерминации R2i/{.}) (и его выборочная оценка r2i/{.}) показывает долю дисперсии рассматриваемой случайной величины, обусловленную влиянием остальных переменных, включённых в корреляционную модель.

Соответственно (1- R2i/{.}) показывает долю остаточной дисперсии данной случайной величины, обусловленную влиянием других, не включённых в исследуемую модель факторов.

Множественные коэффициенты детерминации получаются возведением соответствующих множественных коэффициентов корреляции в квадрат (таб. 13).

Проверим значимость полученных множественных коэффициентов корреляции и детерминации.

Проверка значимости, т. е. гипотезы о равенстве нулю соответствующего множественного коэффициента корреляции, осуществляется с помощью статистики:

.

где l — порядок множественного коэффициента корреляции, совпадающий с количеством фиксируемых переменных случайных величин (в нашем случае l=4, например,), а n — количество наблюдений.

Произведя расчёты, получим (таб.13).

Для определения значимости множественных коэффициентов корреляции и детерминации нужно найти критическое значение F-распределения для заданного уровня значимости б и числа степеней свободы числителя н1=l и знаменателя н2=n-l-1.

Для определения Fкр можно воспользоваться встроенной функцией Excel:

ВСТАВКА (Office 2003) или ФОРМУЛЫ (Office 2007).

f (x) Функция

Статистические

FРАСПОБР,

введя в предложенное меню вероятность б=0,05 и число степеней свободы н1=l=4 и н2=n-l-1=50−4-1=45.

Можно найти значения Fкр по таблицам математической статистики.

Получаем Fкр(0,05; 4; 45)= 2,578 739 184.

Таблица 13

Множественные коэффициенты корреляции и детерминации исследуемых показателей с выделением значимых коэффициентов (на уровне значимости б=0,05)

Множественный коэффициент корреляции

Множественный коэффициент детерминации r2

Значение статистики

F набл

rY /{.}

0,5 675 688.

0,3 221 344.

5,3 462 093.

rX5/{.}

0,641 108.

0,4 110 195.

7,8 508 016.

rX7/{.}

0,4 757 306.

0,2 263 196.

3,2 908 884.

rX10/{.}

0,527 289.

0,2 780 337.

4,3 324 456.

rX15/{.}

0,6 644 429.

0,4 414 844.

8,8 926 764.

Если наблюдаемое значение F-статистики превосходит ее критическое значение Fкр=2,578 739 184, то гипотеза о равенстве нулю соответствующего множественного коэффициента корреляции отвергается с вероятностью ошибки, равной 0,05. Следовательно, у нас все коэффициенты значимо отличаются от нуля.

Полученные данные позволяют сделать следующие выводы.

Множественный коэффициент корреляции = 0,5 675 688 значим и имеет достаточно высокое значение, что говорит о том, показатель Y — рентабельность имеет умеренную связь с многомерным массивом факторных признаков X5 — удельный вес рабочих в составе ППП, X7 — коэффициент сменности оборудования, X10 — фондоотдача и X15 — оборачиваемость нормируемых оборотных средств. Это даёт основание для проведения дальнейшего регрессионного анализа.

Множественный коэффициент детерминации r2Y/{.}=0,3 221 344 показывает, что 32,21% доли дисперсии Y — объёма промышленной продукции, обусловлены изменениями факторных признаков.

Факторные признаки также являются значимыми, несмотря на то, что у Х7 и Х10 всего 22,63% и 27,80% доля дисперсии соответственно обусловлены изменениями факторных признаков. Более тесная связь с другими переменными наблюдается у Х5 и Х15, у которых 41,10% и 44,15% доли дисперсии обусловлены изменениями остальными рассматриваемыми признаками, а остальное факторами, которые не включены в изучаемую модель.

Итак, полученные результаты корреляционного анализа, показавшие, что показатель Y3 — рентабельность имеет умеренную связь с многомерным массивом факторных признаков, позволяют перейти ко второму этапу статистического исследования — построению регрессионной модели.

3. Регрессионный анализ экономических показателей

После того как с помощью корреляционного анализа выявлено наличие статистически значимых связей между переменными и оценена степень их тесноты, обычно переходят к математическому описанию конкретного вида зависимостей с использованием регрессионного анализа. С этой целью подбирают класс функций, связывающий результативный показатель Y и аргументы X1, X2, X3 ,… Xk, отбирают наиболее информативные аргументы, вычисляют оценки неизвестных значений параметров уравнения связи и анализируют точность полученного уравнения.

Наиболее часто используется множественная линейная модель регрессионного анализа, уравнение которой имеет вид:

для всех i=1,2,…n, или в матричной форме: ,.

Где Исследуем на основе линейной регрессионной модели зависимость рентабельности (Y) от удельного веса рабочих в составе ППП (Х5), коэффициента сменности оборудования (Х7), фондоотдачи (X10) и оборачиваемости нормируемых оборотных средств (X15).

3.1 Проверка исходных данных на мультиколлинеарность

Одним из основных препятствий эффективного применения множественного регрессионного анализа является мультиколлинеарность. Она возникает в случаях существования достаточно тесных линейных статистических связей между объясняющими переменными X1, X2, X3 ,… Xk. В результате мультиколлинеарности матрица парных коэффициентов корреляции становится слабообусловленной, близкой к вырожденной.

Точных количественных критериев для определения наличия или отсутствия мультиколлинеарности не существует. Однако существуют некоторые рекомендации по выявлению этого негативного явления, на которые следует обратить внимание. На практике о наличии мультиколлинеарности обычно судят по матрице парных коэффициентов корреляции. Если один из элементов матрицы R больше 0,8, т. е. | rij | > 0,8, то считают, что имеет место мультиколлинеарность и в уравнение регрессии следует включать только один из показателей Xi или Xj (как правило, тот, который имеет наибольшую связь с Y).

Прежде, чем переходить к построению регрессионной модели, необходимо проверить объясняющие переменные на наличие мультиколлинеарности. Для этого рассмотрим матрицу парных коэффициентов корреляции между факторными признаками Xi.

Таблица 14

Матрица парных коэффициентов корреляции факторных признаков

X5

X7

X10

X15

X5.

0,379 629.

— 0,732.

— 0,61 934.

X7.

0,379 629.

— 0,20 751.

— 0,37 435.

X10.

— 0,732.

— 0,20 751.

0,8 075.

X15.

— 0,61 934.

— 0,37 435.

0,8 075.

Поскольку значения коэффициентов корреляции для всех пар объясняющих переменных не превышают по модулю 0,8, то нет необходимости сокращать набор объясняющих переменных.

3.2 Построение регрессионной модели и её интерпретация

Будем использовать алгоритм пошагового регрессионного анализа с последовательным исключением незначимых регрессоров, пока все входящие в регрессионную модель факторы не будут иметь значимые коэффициенты.

Построение и оценка регрессионной модели осуществляется в Excel с помощью модуля регрессии пакета анализа данных.

в меню Office 2007.

ДАННЫЕ

Анализ данных (Data Analysis)

Регрессия (Regression)

Задаем нужные параметры.

I ЭТАП РЕГРЕССИОННОГО АНАЛИЗА.

В модель включены все факторные признаки (X5, X7, X10 , X15).

ВЫВОД ИТОГОВ

Регрессионная статистика

Множественный R.

0,56 756 882.

R-квадрат.

0,32 213 436.

Нормированный R-квадрат.

0,26 187 964.

Стандартная ошибка.

4,96 625 793.

Наблюдения.

Дисперсионный анализ

df

(число степеней свободы н)

SS

(сумма квадратов отклонений Q)

MS

(средний квадрат MS=SS/н)

F

(Fнабл= MSR/MSост)

Значимость F

Регрессия.

527,4296.

131,8574.

5,3462.

0,1 309.

Остаток.

1109,8673.

24,6637.

Итого.

1637,2969.

Коэффи-циенты

(bi)

Стандартная ошибка

(Sbi)

t-ста-тистика

(tнабл)

P-Значение

Нижние 95% imin)

Верхние 95% (вimax)

Нижние 98% imin)

Верхние 98% (вimax)

Y-пересечение.

— 1,3837.

15,8683.

— 0,0872.

0,9309.

— 33,3442.

30,5768.

— 39,6600.

36,8926.

Переменная X5

4,5936.

17,4685.

0,2630.

0,7938.

— 30,5899.

39,7770.

— 37,5426.

46,7297.

Переменная X7

4,1894.

5,7389.

0,7300.

0,4692.

— 7,3693.

15,7481.

— 9,6534.

18,0323.

Переменная X10

6,5490.

1,7391.

3,7658.

0,0005.

3,0463.

10,0518.

2,3541.

10,7439.

Переменная X15

— 0,0428.

0,0257.

— 1,6629.

0,1033.

— 0,0945.

0,0090.

— 0,1048.

0,0193.

В регрессионной статистике указываются множественный коэффициент корреляции (Множественный R) и детерминации (R-квадрат) между Y и массивом факторных признаков (что совпадает с полученными ранее значениями в корреляционном анализе) Средняя часть таблицы (Дисперсионный анализ) необходима для проверки значимости уравнения регрессии.

Нижняя часть таблицы — точечные оценки bi генеральных коэффициентов регрессии вi, проверка их значимости и интервальная оценка.

Оценка вектора коэффициентов b (столбец Коэффициенты):

Тогда оценка уравнения регрессии имеет вид:

Необходимо проверить значимость уравнения регрессии и полученных коэффициентов регрессии.

Проверим на уровне б=0,05 значимость уравнения регрессии, т. е. гипотезу H0: в1=в2=в3=…=вk=0. Для этого рассчитывается наблюдаемое значение F-статистики:

Excel выдаёт это в результатах дисперсионного анализа:

QR=527,4296; Qост=1109,8673 =>

В столбце F указывается значение Fнабл.

По таблицам F-распределения или с помощью встроенной статистической функции FРАСПОБР для уровня значимости б=0,05 и числа степеней свободы числителя н1=k=4 и знаменателя н2=n-k-1=45 находим критическое значение F-статистики, равное.

Fкр = 2,578 739 184.

Так как наблюдаемое значение F-статистики превосходит ее критическое значение 8,1957 > 2,7587, то гипотеза о равенстве вектора коэффициентов отвергается с вероятностью ошибки, равной 0,05. Следовательно, хотя бы один элемент вектора в=(в1,в2,в3,в4)T значимо отличается от нуля.

Проверим значимость отдельных коэффициентов уравнения регрессии, т. е. гипотезу .

Проверку значимости регрессионных коэффициентов проводят на основе t-статистики для уровня значимости .

Наблюдаемые значения t-статистик указаны в таблице результатов в столбце t-статистика.

Коэффициенты (bi)

t-статистика (tнабл)

Y-пересечение.

b0=-1,3837.

— 0,0872.

Переменная X5

b1= 4,5936.

0,2630.

Переменная X7

b2 = 4,1894.

0,7300.

Переменная X10

b3= 6,5490.

3,7658.

Переменная X15

b4 =-0,0428.

— 1,6629.

Их необходимо сравнить с критическим значением tкр, найденным для уровня значимости б=0,05 и числа степеней свободы н=n — k — 1.

Для этого используем встроенную статистическую функцию Excel СТЬЮДРАСПОБР, введя в предложенное меню вероятность б=0,05 и число степеней свободы н= n-k-1=50−4-1=45. (Можно найти значения tкр по таблицам математической статистики.

Получаем tкр= 2,14 103 359.

Для наблюдаемое значение t-статистики меньше критического по модулю 2,0141>|-0,0872|, 2,0141>|0,2630|, 2,0141>|0,7300|, 2,0141>|-1,6629|.

Следовательно, гипотеза о равенстве нулю этих коэффициентов не отвергается с вероятностью ошибки, равной 0,05, т. е. соответствующие коэффициенты незначимы.

Для наблюдаемое значение t-статистики больше критического значения по модулю |3,7658|>2,0141, следовательно, гипотеза H0 отвергается, т. е. — значим.

Значимость регрессионных коэффициентов проверяют и следующие столбцы результирующей таблицы:

Столбец p-значение показывает значимость параметров модели граничным 5%-ым уровнем, т. е. если p?0,05, то соответствующий коэффициент считается значимым, если p>0,05, то незначимым.

И последние столбцы — нижние 95% и верхние 95% и нижние 98% и верхние 98% - это интервальные оценки регрессионных коэффициентов с заданными уровнями надёжности для г=0,95 (выдаётся всегда) и г=0,98 (выдаётся при установке соответствующей дополнительной надёжности).

Если нижние и верхние границы имеют одинаковый знак (ноль не входит в доверительный интервал), то соответствующий коэффициент регрессии считается значимым, в противном случае — незначимым.

Как видно из таблицы, для коэффициента в3 p-значение p=0,0005<0,05 и доверительные интервалы не включают ноль, т. е. по всем проверочным критериям этот коэффициент является значимым.

Согласно алгоритму пошагового регрессионного анализа с исключением незначимых регрессоров, на следующем этапе необходимо исключить из рассмотрения переменную, имеющую незначимый коэффициент регрессии.

В случае, когда при оценке регрессии выявлено несколько незначимых коэффициентов, первым из уравнения регрессии исключается регрессор, для которого t-статистика () минимальна по модулю. По этому принципу на следующем этапе необходимо исключить переменную Х5, имеющую незначимый коэффициент регрессии в2

II ЭТАП РЕГРЕССИОННОГО АНАЛИЗА.

В модель включены факторные признаки X7, X10, X15, исключён X5.

ВЫВОД ИТОГОВ

Регрессионная статистика

Множественный R.

0,56 665.

R-квадрат.

0,321 093.

Нормированный R-квадрат.

0,276 816.

Стандартная ошибка.

4,915 753.

Наблюдения.

Дисперсионный анализ

df

(число степеней свободы н)

SS

(сумма квадратов отклонений Q)

MS

(средний квадрат MS=SS/н)

F

(Fнабл= MSR/MSост)

Значимость F

Регрессия.

525,7241.

175,2414.

7,251 979.

0,44.

Остаток.

1111,573.

24,16 463.

Итого.

1637,297.

Коэффи-циенты

(bi)

Стандартная ошибка

(Sbi)

t-ста-тистика

(tнабл)

P-Значение

Нижние

95% imin)

Верхние 95% (вimax)

Нижние 98% imin)

Верхние

98% (вimax)

Y-пересечение.

1,94 084.

9,492 634.

0,204 457.

0,838 898.

— 17,1668.

21,4 852.

— 20,9382.

24,81 987.

Переменная X7

4,502 469.

5,556 948.

0,810 241.

0,421 973.

— 6,68 309.

15,68 803.

— 8,89 082.

17,89 576.

Переменная X10

6,569 053.

1,719 766.

3,819 738.

0,399.

3,107 345.

10,3 076.

2,424 095.

10,71 401.

Переменная X15

— 0,0465.

0,21 196.

— 2,19 389.

0,33 333.

— 0,8 917.

— 0,384.

— 0,9 759.

0,4 584.

Оценка коэффициентов в случае трех объясняющих переменных имеет вид:

а уравнение регрессии имеет вид:

Проверим на уровне б=0,05 значимость уравнения регрессии, т. е. гипотезу H0: в2=в3=в4=0. Для этого в результатах дисперсионного анализа находим наблюдаемое значение F-статистики Fнабл=7,251 979.

С помощью встроенной статистической функции FРАСПОБР или по таблицам F-распределения для уровня значимости б=0,05 и числа степеней свободы числителя н1=k=3 и знаменателя н1=n-k-1=46 находим критическое значение F-статистики, равное.

Fкр = 2,80 684 494.

Так как наблюдаемое значение F-статистики превосходит ее критическое значение 7,251 979 > 2,80 684 494, то гипотеза о равенстве вектора коэффициентов отвергается с вероятностью ошибки, равной 0,05. Следовательно, хотя бы один элемент вектора в=(в2,в3,в4)T значимо отличается от нуля.

Проверим значимость отдельных коэффициентов уравнения регрессии, т. е. гипотезу. H0:вi=0, i=2,3,4.

Наблюдаемые значения t-статистик указаны в таблице результатов в столбце t-статистика.

Показать весь текст
Заполнить форму текущей работой