Задание 2. Множественная регрессия и корреляция
Определяет тесноту связи с учетом степеней свободы общей и остаточной дисперсий. Он дает такую оценку тесноты связи, которая не зависит от числа факторов и поэтому может сравниваться по разным моделям с разным числом факторов. Оба коэффициента указывают на весьма высокую (более 94%) детерминированность результата y в модели факторами x1 и x2. Получили, что (при n = 20), т. е. вероятность случайно… Читать ещё >
Задание 2. Множественная регрессия и корреляция (реферат, курсовая, диплом, контрольная)
По 20 предприятиям региона изучается зависимость выработки продукции на одного работника у (тыс. руб.) от ввода в действие новых основных фондов (% от стоимости фондов на конец года) и от удельного веса рабочих высокой квалификации в общей численности рабочих (%) (смотри таблицу своего варианта).
Требуется:
- 1. Построить линейную модель множественной регрессии. Записать стандартизованное уравнение множественной регрессии. На основе стандартизованных коэффициентов регрессии и средних коэффициентов эластичности ранжировать факторы по степени их влияния на результат.
- 2. Найти коэффициенты парной, частной и множественной корреляции. Проанализировать их. корреляция аппроксимация фишер регрессия
- 3. Найти скорректированный коэффициент множественной детерминации. Сравнить его с нескорректированным (общим) коэффициентом детерминации.
- 4. С помощью Fкритерия Фишера оценить статистическую надежность уравнения регрессии и коэффициента детерминации
- 5. С помощью частных Fкритериев Фишера оценить целесообразность включения в уравнение множественной регрессии фактора после и фактора после .
- 6. Составить уравнение линейной парной регрессии, оставив лишь один значащий фактор.
Номер предприятия. | |||
3.6. | |||
3.6. | |||
3.7. | |||
4.1. | |||
4.3. | |||
4.5. | |||
5.4. | |||
5.5. | |||
5.8. | |||
6.1. | |||
6.3. | |||
6.9. | |||
7.2. | |||
7.8. | |||
8.1. | |||
8.2. | |||
8.4. | |||
8.8. | |||
9.5. | |||
9.7. |
Решение
Для удобства проведения расчетов поместим результаты промежуточных расчетов в таблицу:
№. | |||||||||
3.6. | |||||||||
3.6. | 25,2. | 39,6. | 12,96. | ||||||
3.7. | 25,9. | 44,4. | 13,69. | ||||||
4.1. | 32,8. | 65,6. | 16,81. | ||||||
4.3. | 34,4. | 81,7. | 18,49. | ||||||
4.5. | 85,5. | 20,25. | |||||||
5.4. | 48,6. | 29,16. | |||||||
5.5. | 49,5. | 30,25. | |||||||
5.8. | 121,8. | 33,64. | |||||||
6.1. | 128,1. | 37,21. | |||||||
6.3. | 132,3. | 39,69. | |||||||
6.9. | 75,9. | 158,7. | 47,61. | ||||||
7.2. | 79,2. | 172,8. | 51,84. | ||||||
7.8. | 93,6. | 60,84. | |||||||
8.1. | 105,3. | 218,7. | 65,61. | ||||||
8.2. | 106,6. | 237,8. | 67,24. | ||||||
8.4. | 109,2. | 260,4. | 70,56. | ||||||
8.8. | 123,2. | 290,4. | 77,44. | ||||||
9.5. | 332,5. | 90,25. | |||||||
9.7. | 135,8. | 329,8. | 94,09. | ||||||
129,9. | 1422,2. | 3147,1. | 894,63. | ||||||
Среднее значение. | 10,4. | 6,345. | 22,5. | 70,86. | 251,1. | 157,01. | 44,332. | 558,9. | 114,1. |
Найдем средние квадратические отклонения признаков:
1. Вычисление параметров линейного уравнения множественной регрессии.
Для нахождения параметров линейного уравнения множественной регрессии:
необходимо решить следующую систему линейных уравнений относительно неизвестных параметров :
либо воспользоваться готовыми формулами:
Рассчитаем сначала парные коэффициенты корреляции:
Находим:
Таким образом, получили следующее уравнение множественной регрессии:
Коэффициенты и стандартизованного уравнения регрессии:
находятся по формулам:
Т.е. уравнение будет выглядеть следующим образом:
Так как стандартизованные коэффициенты регрессии можно сравнивать между собой, то можно сказать, что ввод в действие новых основных фондов оказывает большее влияние на выработку продукции, чем удельный вес рабочих высокой квалификации.
Сравнивать влияние факторов на результат можно также при помощи средних коэффициентов эластичности:
Вычисляем:
Т.е. увеличение только основных фондов (от своего среднего значения) или только удельного веса рабочих высокой квалификации на 1% увеличивает в среднем выработку продукции на 0,693% или 0,037%.
соответственно. Таким образом, подтверждается большее влияние на результат y фактора x1, чем фактора x2.
2. Коэффициенты парной корреляции мы уже нашли:
Они указывают на весьма сильную связь каждого фактора с результатом, а также высокую межфакторную зависимость (факторы и явно коллинеарны, т.к.). При такой сильной межфакторной зависимости рекомендуется один из факторов исключить из рассмотрения.
Частные коэффициенты корреляции характеризуют тесноту связи между результатом и соответствующим фактором при элиминировании (устранении влияния) других факторов, включенных в уравнение регрессии.
При двух факторах частные коэффициенты корреляции рассчитываются следующим образом:
Если сравнить коэффициенты парной и частной корреляции, то можно увидеть, что из-за высокой межфакторной зависимости коэффициенты парной корреляции дают завышенные оценки тесноты связи. Именно по этой причине рекомендуется при наличии сильной коллинеарности (взаимосвязи) факторов исключать из исследования тот фактор, у которого теснота парной зависимости меньше, чем теснота межфакторной связи.
Коэффициент множественной корреляции определить через матрицу парных коэффициентов корреляции:
где.
— определитель матрицы парных коэффициентов корреляции;
— определитель матрицы межфакторной корреляции.
Коэффициент множественной корреляции.
Аналогичный результат получим при использовании других формул:
Коэффициент множественной корреляции показывает на весьма сильную связь всего набора факторов с результатом.
3. Нескорректированный коэффициент множественной детерминации оценивает долю вариации результата за счет представленных в уравнении факторов в общей вариации результата. Здесь эта доля составляет 98.1% и указывает на весьма высокую степень обусловленности вариации результата вариацией факторов, иными словами — на весьма тесную связь факторов с результатом.
Скорректированный коэффициент множественной детерминации.
определяет тесноту связи с учетом степеней свободы общей и остаточной дисперсий. Он дает такую оценку тесноты связи, которая не зависит от числа факторов и поэтому может сравниваться по разным моделям с разным числом факторов. Оба коэффициента указывают на весьма высокую (более 94%) детерминированность результата y в модели факторами x1 и x2.
4. Оценку надежности уравнения регрессии в целом и показателя тесноты связи дает Fкритерий Фишера:
В нашем случае фактическое значение F -критерия Фишера:
Получили, что (при n = 20), т. е. вероятность случайно получить такое значение F -критерия не превышает допустимый уровень значимости 5%. Следовательно, полученное значение не случайно, оно сформировалось под влиянием существенных факторов, т. е. подтверждается статистическая значимость всего уравнения и показателя тесноты связи .
5. С помощью частных F -критериев Фишера оценим целесообразность включения в уравнение множественной регрессии фактора x1 после x2 и фактора x2 после x1 при помощи формул:
Найдем.
Имеем.
Получили, что. Следовательно, включение в модель фактора x2 после того, как в модель включен фактор x1
статистически нецелесообразно: прирост факторной дисперсии за счет дополнительного признака x1 оказывается незначительным, несущественным; фактор x2 включать в уравнение после фактора x1 не следует.
Если поменять первоначальный порядок включения факторов в модель и рассмотреть вариант включения x1 после x2, то результат расчета частного.
F -критерия для x1 будет иным. т. е. вероятность его случайного формирования меньше принятого стандарта Следовательно, значение частного F -критерия для дополнительно включенного фактора x1 не случайно, является статистически значимым, надежным, достоверным: прирост факторной дисперсии за счет дополнительного фактора x1 является существенным. Фактор x1 должен присутствовать в уравнении, в том числе в варианте, когда он дополнительно включается после фактора x2
6. Общий вывод состоит в том, что множественная модель с факторами x1 и x2 с содержит неинформативный фактор x2. Если исключить фактор 2 x, то можно ограничиться уравнением парной регрессии: