Помощь в написании студенческих работ
Антистрессовый сервис

Линейные и криволинейные модели

Практическая работаПомощь в написанииУзнать стоимостьмоей работы

Данная матрица показывают, что оба предиктора существенно влияют на наш Y, но корреляция между предикторами высокая и есть проблема мультиколлениарности. Поэтому мы будем рассматривать модель Y=b1+b2*x+b3*e^x, по отдельности: Эта сложная модель имеет высокий показатель R-квадрат (88,8%), но предыдущие, в особенности первая модель, превосходят эту модель, по эффективности. Предлагаю… Читать ещё >

Линейные и криволинейные модели (реферат, курсовая, диплом, контрольная)

Министерство Иностранных Дел Республики Узбекистан Университет Мировой Экономики и Дипломатии Кафедра «Математическое моделирование и информатика»

Предмет «Эконометрия»

САМОСТОЯТЕЛЬНАЯ РАБОТА по Problems,

выполненная при помощи программы MINITAB

Выполнила: Хайруллаев А.Б.

Группа 0−4а-09

Проверила: Раимова Г. М.

Ташкент — 2011

Постановка задачи. Данные

Бухгалтера городской Службы Доставки Почты, Джин Фостер, попросили вычислить уровень нового расписания для местных доставок. У нее уже есть информация о средних издержках грузовых перевозок, но ей нужно вычислить среднее время расходования на доставку почты. Она собрала данные по 13 заказам.

Заказ

Минуты, Y

Миль, X

Точечная диаграмма. Предварительные выводы

Данная диаграмма показывает о положительной зависимости между минутами и милями затраченными на доставку почты.

Построить линейную модель (y=b1+b2*xt+et). Уравнение, график, значение R-квадрат, выводы

Уравнение регрессии при заданном предикторе равна:

Y = 3,91 + 2,27 X

S = 3,16 143 R-Sq = 91,4% R-Sq (adj) = 90,7%

После данного анализа подтверждается наличие положительной зависимости и эта зависимость очень высокая (91,4%) и близка к 100%

Предиктор Coef SE Coef T P

Константа 3,909 1,880 2,08 0,062

Мили, X 2,2736 0,2099 10,83 0,000

Источник DF SS MS F P

Регрессия 1 1173,0 1173,0 117,36 0,000

Residual Error 11 109,9 10,0

Total 12 1282,9

r= 0,956 Sr=0,884 534 t (tab) =10,8080

Т-тест

Распределение Стьюдента со степенью свободы 11

P (X <= x) x

0,95 1,79 588 t (cr) =1.79 588

F-тест

F распределение со степенью свободы 2 numerator и со степенью свободы 11 in denominator

P (X <= x) x

0,95 3,98 230 F=117,36

Построить следующие криволинейные модели

Параболическая модель (Уравнение, график, значение R-квадрат, выводы)

Уравнение регрессии

Y=4,887+1,955X+0,01929X2

S = 3,29 937 R-Sq = 91,5% R-Sq (adj) = 89,8%

Источник DF SS MS F P

Регрессия 2 1174,06 587,032 53,93 0,000

Error 10 108,86 10,886

Total 12 1282,92

Источник DF SS F P

Линейный 1 1172,98 117,36 0,000

Параболический 1 1,08 0,10 0,759

Эта первая сложная модель, с регрессионным уравнением и со значением R-квадрат (91,5%), которая превышает предыдущую на 0,1%. Но так как разница незначительная мы с легкостью можем использовать первую, простую, линейную модель.

Кубическая модель (Уравнение, график, значение R-квадрат, выводы)

Уравнение регрессии

Y=11,73−1,597X+0,4989X2−0,01860X3

S = 3,31 121 R-Sq = 92,3% R-Sq (adj) = 89,7%

Источник DF SS MS F P

Регрессия 3 1184,25 394,749 36,00 0,000

Error 9 98,68 10,964

Total 12 1282,92

Источник DF SS F P

Линейный 1 1172,98 117,36 0,000

Параболический 1 1,08 0,10 0,759

Кубический 1 10,18 0,93 0,360

Хотя коэффициент детерминации показывает наилучшую модель, p-value параболической и кубической модели не позволяют использовать их как подходящую модель.

линейная криволинейная модель кубическая

Экспоненциальная модель: Y=b1+b2*xt+b3*exp (kxt) +et (Уравнение, Корреляционная матрица, график, значение R-квадрат, выводы)

K=0,1

Корреляционная матрица.

1,0 0,95 619 0,94 400

0,95 619 1,0 0,98 367

0,94 400 0,98 367 1,0

Данная матрица показывают, что оба предиктора существенно влияют на наш Y, но корреляция между предикторами высокая и есть проблема мультиколлениарности. Поэтому мы будем рассматривать модель Y=b1+b2*x+b3*e^x, по отдельности:

Y=b1+b2*x,

Y=e^x, Y=b1+b2*x,

Регрессионное уравнение:

Y=3,91+2,27X

Предиктор Coef SE Coef T P

Константа 3,909 1,880 2,08 0,062

X 2,2736 0,2099 10,83 0,000

S = 3,16 143 R-Sq = 91,4% R-Sq (adj) = 90,7%

Источник DF SS MS F P

Регрессия 1 1173,0 1173,0 117,36 0,000

Residual Error 11 109,9 10,0

Total 12 1282,9

Y=a0+a1*e^x

Регрессионное уравнение:

Y =-0,22+9,18e^x

Предиктор Coef SE Coef T P

Константа -0,220 2,534 -0,09 0,932

e^x 9,1849 0,9680 9,49 0,000

S = 3,56 333 R-Sq = 89,1% R-Sq (adj) = 88,1%

Источник DF SS MS F P

Регрессия 1 1143,3 1143,3 90,04 0,000

Residual Error 11 139,7 12,7

Total 12 1282,9

У нас коэффициент детерминации экспоненциальной модели высокий, но предложенная линейная модель имеет более высокие показатели. Поэтому, мы все еще придерживаемся линейной модели.

Противоположная модель: y=b1+b2*1/x+et (Уравнение, график, значение R-квадрат, выводы)

Уравнение регрессии:

Y=33,75−63,84/x

S = 6,17 692 R-Sq = 67,3% R-Sq (adj) = 64,3%

Источник DF SS MS F P

Регрессия 1 863,23 863,225 22,62 0,001

Error 11 419,70 38,154

Total 12 1282,92

Вывод. Данная модель имеет довольно низкие показатели по отношению к другим. Поэтому это модель не является эффективной в нашей работе.

Fitted Line: Y versus 1/x

Scatterplot of FITS3 vs X

Лог-лог модель. ln (yt) =b1+b2*ln (xt) +et (Уравнение, график, значение R-квадрат, выводы)

Уравнение регрессии:

ln (Y) =0,6760+0,7466ln (X),

S = 0,790 408 R-Sq = 88,8% R-Sq (adj) = 87,7%

Источник DF SS MS F P

Регрессия 1 0,542 756 0,542 756 86,88 0,000

Error 11 0,68 722 0,6 247

Total 12 0,611 478

Fitted Line: Y versus X

Эта сложная модель имеет высокий показатель R-квадрат (88,8%), но предыдущие, в особенности первая модель, превосходят эту модель, по эффективности. Предлагаю не рассматривать данную модель.

Лог-линейный ln (yt) =b1+b2* (xt) +et (Уравнение, график, значение R-квадрат, выводы)

Уравнение регрессии:

ln (Y) =0,9043+0,04875X

S = 0,809 879 R-Sq = 88,2% R-Sq (adj) = 87,1%

Источник DF SS MS F P

Регрессия 1 0,539 328 0,539 328 82,23 0,000

Error 11 0,72 149 0,6 559

Total 12 0,611 478

Fitted Line: Y versus X

Эта сложная модель имеет высокий показатель R-квадрат (88,2%), но предыдущие, в особенности первая модель, превосходят эту модель, по эффективности. Предлагаю не рассматривать данную модель.

Линейный-лог yt=b1+b2* (xt) +et (Уравнение, график, значение R-квадрат, выводы)

Уравнение регрессии:

Y = - 5,442 + 33,24 logten (X)

S = 4,33 584 R-Sq = 83,9% R-Sq (adj) = 82,4%

R-квадрат ниже чем предыдущие модели.

Источник DF SS MS F P

Регрессия 1 1076,13 1076,13 57,24 0,000

Error 11 206,79 18,80

Total 12 1282,92

Fitted Line: Y versus X

Лог-обратная ln (yt) =b1+b2/xt+et (Уравнение, график, значение R-квадрат, выводы)

Уравнение регрессии:

ln (Y) = 1,570 — 1,508 1/x

S = 0,108 659 R-Sq = 78,8% R-Sq (adj) = 76,8%

Источник DF SS MS F P

Регрессия 1 0,481 603 0,481 603 40,79 0,000

Error 11 0,129 875 0,11 807

Total 12 0,611 478

Вывод. Коэффициент детерминации объясняет изменения в Y всего лишь на 78,8% изменений в X. По отношению к другим моделям, показатель не высокий. Не рассматриваем.

Fitted Line: Y versus 1/x

Общее заключение

При рассмотрении линейных и криволинейных моделей, мы получили несколько моделей с высокими показателями R-квадрат. Это модели линейная, параболическая, кубическая, экспоненциальная (если рассматривать по отдельности линейную и экспоненту) и несколько лог-моделей. Все показатели R-квадрат находились в пределах 88 и 92, поэтому модели были более или менее равнозначны. А выбор модели мы сделали по сложности моделей. Из всех перечисленных, самая легкая модель это линейная модель, кроме этого она имеет коэффициент детерминации (91,4%), объясняющий изменения в Y изменениями в X, являющийся одним из высоких.

Я предлагаю линейную модель, как рабочую.

Показать весь текст
Заполнить форму текущей работой