Помощь в написании студенческих работ
Антистрессовый сервис

Статистический анализ младенческой смертности в мире

РефератПомощь в написанииУзнать стоимостьмоей работы

Следующим шагом является проверка краткосрочной связи переменных с помощью панельного МНК. Для этого классическим способом (по критериям качества моделей — значимость коэффициентов, стандартные ошибки, информационные критерии и др.) выбирается лучшая коинтегрирующая модель, полученная ранее, сохраняются ее остатки. Затем остатки добавляются в модель панельного МНК в качестве регрессора вместе… Читать ещё >

Статистический анализ младенческой смертности в мире (реферат, курсовая, диплом, контрольная)

Методика исследования младенческой смертности и ее основных факторов

Применение статистического и эконометрического инструментария оказывается наиболее эффективным, если имеется общее представление об исходных данных и исследуемом явлении. Это достигается построением графиков и первичным анализом данных: для пространственных данных — на наличие аномальных наблюдений, нормальность распределения; для временных рядов — на наличие детерминированного тренда, стационарность, тестирование автокорреляционной функции.

В основной части работы используются панельные данные. Преимущество их применения состоит в следующем: многие явления подвержены изменению в зависимости от ранее принятых решений и изменениям в сопутствующих им процессах. Очевидно, это усложняет исследование и интерпретацию наблюдаемых фактов и полученных от исследования результатов. Кроме того, различные объекты, характеризующиеся качественными и количественными признаками изучаемого процесса, могут в свою очередь иметь собственные особенности развития, отличные от других объектов. Данный феномен называют неоднородностью и считают, что он вызывает сложности при изучении. Таким образом, следует учитывать как динамические характеристики, так и индивидуальные качества объектов, с чем прекрасно справляются методы исследования панельных данных. Панельный набор данных обеспечивает возможность совместного изучения этих параметров.

Для достижения цели исследования были взяты данные по странам мира за 2014 год. Следует отметить, что данные о КМС, взятые для исследования на официальном сайте базы данных World Bank, были получены стандартным методом расчета уровня младенческой смертности: число новорожденных, умерших в первый год жизни в данном календарном году в расчете на 1000 живорожденных в том же году.

В первую очередь необходимо разделить страны на три группы в соответствии с их уровнем развития, так как размах КМС даже по состоянию на 2015 год довольно велик (94,5‰), и значительная часть стран имеет высокий уровень смертности среди новорожденных. Для решения этой задачи был выбрал метод кластерного анализа, а именно метод к-средних, позволяющий разделить объекты по степени их схожести, минимизируя среднее квадатическое отклонение на объектах каждого кластера. С помощью итераций заново находятся центры кластеров до тех пор, пока не произойдет стабилизация.

Перед применением кластерного анализа необходимо проверить предпосылки его применения. Во-первых, данные для исследования должны подчиняться нормальному закону распределения или быть близкими к нему. Для этого проводится ряд статистических тестов, проверяющих гипотезу о нормальном распределении. Во-вторых, при выборе количества классифицирующих переменных, рекомендуется обратить внимание на соотношение количества объектов и переменных так, чтобы число наблюдений было значимо большим, чем количество переменных, например, в 5 раз.

Особенностью метода к-средних является заранее определенное количество кластеров. Классически, страны делят на три группы: развивающиеся (с низкими, например, экономическими показателями), развитые (отличающиеся высоким уровнем жизни и показателями) и страны среднего уровня развития (страны, находящиеся на переходном этапе от низких к высоким показателям). В данном исследовании принята та же классификация. Данный инструмент реализован в статистическом пакете SPSS.

Определить названия кластеров поможет графическое представление центров кластеров для разных показателей из итоговых таблиц.

Метод кластерного анализа основывается на расчете расстояний от объекта до центров кластеров или между друг другом. Так или иначе, метод расчета расстояний может значительно повлиять на результат, как в иерархических процедурах, так и для к-средних. Применительно к к-средних, начальные центры кластеров выбираются случайно, а затем близлежащие к ним объекты классифицируются. Случайный выбор начальных центров кластеров может повлечь погрешность.

Следующим шагом в исследовании является проверка исследуемых процессов на стационарность. Временной ряд называется стационарным, если среднее, дисперсия и автоковариация (корреляция) не меняются со временем. Ряд имеет постоянное среднее. Общим теоретическим примером слабого стационарного процесса является процесс белого шума, который имеет нулевое математическое ожидание E (еt) = 0, постоянную дисперсию Var (еt) = 2 и нулевую ковариацию Cov (еt, Еs) = 0 для всех t.

При тестировании на стационарность внутри панели возможно наличие как стационарных, так и нестационарных рядов. В этом случае неочевидно, отвергается ли гипотеза о нестационарности. Также панели не всегда бывают сбалансированы и как правило, отличаются в разных исследованиях количеством рассматриваемых объектов и временных периодов. Для решения этих задач было создано несколько тестов на наличие единичного корня. Каждый из них по-своему эффективен в зависимости от числа наблюдений, объектов и сбалансированности.

Панельные тесты на стационарность делятся на две группы: гомогенные (проверяют стационарность одновременно всех объектов пространственной выборки) и гетерогенные (допускают наличие нестационарных рядов в панели). Гетерогенные тесты имеют менее строгую формулировку нулевой гипотезы.

Тестирование на наличие единичного корня может производиться с помощью нескольких тестовых статистик:

1) Levin, Lin & Chu t-statistic (LLC) — наличие общего единичного корня Н0: в данных содержится единичный корень.

Статистический анализ младенческой смертности в мире.

Данный тест предполагает одинаковый авторегрессионный параметр для всех объектов. Тест предлагает регрессионную t-статистику, среднее значение и стандартное отклонение которой зависят от спецификации детерминированной части уравнения.

Так как порядок лага неизвестен, применяется трехшаговая процедура:

1. Проводится тест Дикки-Фуллера для каждого временного ряда;

Для заданного T выбирается максимальный лаг и, используя t-статистику, определяется наилучший лаг; Строятся вспомогательные регрессии для получения ортогональных остатков; Стандартизируются остатки;

  • 2. Оценивается уровень долгосрочных и краткосрочных стандартных отклонений;
  • 3. Рассчитывается t-статистика следующим образом:
Статистический анализ младенческой смертности в мире.

Без константы: ,.

Статистический анализ младенческой смертности в мире.

С константой: ,.

Статистический анализ младенческой смертности в мире.

Где ,.

T — количество временных уровней, N — количество объектов,.

= 0 при тестировании без константы, 1 — с константой,.

Статистический анализ младенческой смертности в мире.

.

Статистический анализ младенческой смертности в мире.

.

Тест наиболее эффективен при применении к небольшим панелям, где число объектов/наблюдений варьируется от 10 до 250, а количество временных уровней — от 25 до 250. Недостатком теста является то, что он предполагает зависимость процессов одного объекта от другого. Кроме того, нулевая гипотеза состоит в том, что все объекты содержат единичный корень, что является ограничивающим для исследования.

2) Breitung t-statistic — наличие общего единичного корня Н0: в данных содержится единичный корень Тест Брайтунга требует сбалансированности панели и предполагает видоизменение данных для того, чтобы использовать стандартные t-статистики. Тест проводит расчет робастной t-статистики, по отношению к пространственной корреляции объектов [9].

Тестовая статистика рассчитывается без корректировки смещения следующим образом:

1. Аналогично тесту LLC.

Статистический анализ младенческой смертности в мире.

2. Преобразование остатков с помощью:

Статистический анализ младенческой смертности в мире.

3. Построение объединенной регрессии ,

Статистический анализ младенческой смертности в мире.

где.

Статистический анализ младенческой смертности в мире.

Асимптотически статистика является нормальной при стремящемуся к бесконечности количеству объектов и временных уровней. Наибольшую точность тест показывает для панелей относительно небольшого размера (20 объектов, 30 лагов).

3) Im, Pesaran and Shi W-stat (далее — IPS) — наличие индивидуальных единичных корней во временных рядах Н0: в данных содержится единичный корень По сравнению с предыдущими тестами, в качестве альтернативной гипотезы IPS рассматривает наличие стационарных временных рядов в панели, то есть относится к разряду гетерогенных тестов [10].

В зависимости от детерминированной части модели, статистика может вычисляться по двум формулам. Если число объектов и временных периодов ограничено, тест выдает статистику:

Статистический анализ младенческой смертности в мире.

.

Статистический анализ младенческой смертности в мире.

где — индивидуальные статистики, тестирующие стационарность данных для отдельного объекта. Если предполагается, что число объектов стремится к бесконечности, тест проводится по статистике:

Статистический анализ младенческой смертности в мире.

Для асимптотически нормального распределения статистики необходимо, чтобы в сбалансированной панели было строго больше 5 периодов.

4) Fisher tests — наличие индивидуальных единичных корней во временных рядах Н0: в данных содержится единичный корень В тестах Фишера отдельно проверяется каждый объект, а затем вычисляется общее P-значение, комбинированное из индивидуальных:

Статистический анализ младенческой смертности в мире.

Далее применяется либо методика ADF — Fisher Chi-square, либо PP — Fisher Chi-square.

5) Hadri — наличие индивидуальных единичных корней во временных рядах Н0: в данных не содержится единичный корень (стационарность) Тест схож с KPSS тестом на стационарность для временных рядов. Тест Хадри основан на статистике множителя Лагранжа. Статистика рассчитывается следующим образом:

Статистический анализ младенческой смертности в мире.

.

где.

Статистический анализ младенческой смертности в мире.

Тест требует строгой сбалансированности панели.

На основе большинства результатов будет сделан вывод о наличии или отсутствии единичного корня в данных. Тесты представлены в статистическом пакете Eviews с возможностью автоматического выбора количества лагов, учета тренда и/или константы.

Тесты на стационарность будут проведены для стран, принадлежащих разным кластерам. Затем при наличии нестационарности показателей с помощью тестов на панельную коинтеграцию будет подтверждено или опровергнуто ее наличие.

Нестационарность временных рядов означает их интегрированность, при этом порядок интеграции можно проверить, взяв первую разность и повторно проведя тест на стационарность.

Два или несколько временных рядов (или панелей), имеющие одинаковый порядок интеграции, могут иметь некоторую стационарную линейную комбинацию, что является их коинтегрированностью. Коинтеграция — это метод проверки взаимосвязи явлений. С помощью коинтеграции проверяется наличие взаимосвязи тенденций для аналогичных объектов. Таким образом, целесообразно провести разделение стран на 3 кластера по нужным характеристикам и исследовать долгосрочные в рамках аналогичных стран.

Гипотеза о коинтегрирующей регрессии имеет вид:

Статистический анализ младенческой смертности в мире.

Тестов на панельную коинтеграцию существует несколько:

1) Тесты Педрони — имеют 7 статистик, 3 из них — групповые, показывают наличие коинтеграции как группового процесса, общего для всех стран. Остальные статистики учитывают индивидуальные эффекты. С формулами расчета статистик можно ознакомиться в учебном издании Ратниковой Т. А., Фурманова К. К. [8].

Тесты применимы при наличии временного тренда.

Н0: отсутствие коинтеграции.

2) Тест Фишера (Maddala & Wu).

Н0: отсутствие коинтеграции Данный тест основывается на усреднении уровней значимости для каждого из наборов временных рядов. Для тестовой статистики Маддала и Ву предлагают следующее выражение:

Статистический анализ младенческой смертности в мире.

Преимуществом теста является то, что длина временных рядов для всех объектов может быть разной.

3) Тест Као Н0: отсутствие коинтеграции В случае экзогенности регрессоров используют две статистики:

Статистический анализ младенческой смертности в мире.
Статистический анализ младенческой смертности в мире.

.

Распределения всех тестовых статистик на проверку коинтеграции асимптотически сходятся к нормальному.

К методам оценивания коинтегрирующего вектора относят Dynamic Ordinary Least Squares (DOLS) и Fully Modified Ordinary Least Squares (FMOLS). Наличие коинтеграционной долгосрочной связи между показателями будет обосновано при получении статистически значимого коэффициента зависимой переменной в коинтегрирующей модели, а также при высоких показателях качества модели.

Йохансен предложил альтернативную процедуру — оценку по методу максимального правдоподобия (MLE). Однако при малых выборках полученные этим методом оценки смещены. Проблему смещенности оценок можно избежать, применяя динамический метод наименьших квадратов (DOLS), улучшающий оценки, полученные методом наименьших квадратов (далее — МНК) и имеющий те же асимптотические свойства оптимальности, что и процедура Johansen. Процедура DOLS была разработана в работах Phillips и Loretan (1991), Saikkonen (1991), Stock и Watson (1993). При этом статистическое моделирование показывает, что в случае малых выборок, что имеет место в данном исследовании, DOLS позволяет получить более точные оценки, чем другая модификация OLS (с теми же асимптотическими свойствами) — FMOLS (Fully Modified OLS). Сильная сторона метода DOLS заключается еще и в том, что он позволяет оценивать коинтеграционные соотношения между переменными разного порядка интегрированности, а также, возможно, включающими детерминированные составляющие. Для проверки гипотез о коэффициентах можно использовать стандартные процедуры, основанные на tи F-статистиках, поскольку DOLS-оценки являются асимптотически нормальными.

Схема применения DOLS следующая:

  • 1) МНК оценивается регрессия
  • 2) Строятся кросс-коррелограммы рядов приращений объясняющих переменных и остатков регрессии.
  • 3) Анализируются N кросс-коррелограмм, построенных на шаге 2: определяется количество значимых запаздывающих (Ki— ) и опережающих (Ki+) всплесков для каждого случая. На этой основе делается вывод о Ki— и Ki+, i=1,…, N.
  • 4) По результатам шага 3 выбирается максимальное количество значимых запаздывающих и опережающих всплесков по всем переменным, т. е.
Статистический анализ младенческой смертности в мире.

5) МНК оценивается регрессия вида:

Статистический анализ младенческой смертности в мире.

.

то есть регрессия из шага 1 с добавлением запаздывающих и опережающих приращений переменных.

  • 6) Остатки модели проверяются на наличие автокорреляции с помощью стандартных методов, таких как статистика Дарбина — Уотсона, коррелограмма остатков, тест Бройша — Годфри. Далее возможны два варианта: 1) если признаков автокорреляции нет, то можно переходить к шагу 9; 2) если автокорреляция есть, то корректировку оценок, полученных на шаге 5, возможно провести способами, описанными в следующих шагах.
  • 7) Можно применить для оценивания расширенного уравнения процедуру Кохрана — Оркатта. По количеству значимых запаздываний в тесте Бреуша — Годфри выбирается количество лагов, включаемых в модель авторегрессии AR (p). Далее оценивается коррелограмма остатков (на предмет необходимости включения лагов в модель скользящего среднего MA (q)).
  • 8) Методом наименьших квадратов оценивается уравнение шага 5 с добавлением члена вида ARMA (p, q). На шагах 5−8 образуется некоторый цикл, во время которого выбирается наилучшая спецификация модели.
  • 9) Проверка оцененного уравнения, анализ его «адекватности» (речь идет о независимости и нормальности остатков, непротиворечивости модели экономической теории).

Еще одна дополнительная оценка причинно-следственных зависимостей проводится с помощью полностью модифицированного метода наименьших квадратов (FMOLS) c дальнейшим построением коинтеграционных соотношений.

В этом методе осуществляются корректировки, необходимые для получения оценок, имеющих стандартное распределение. Метод Fully Modified Ordinary Least Squares (FMOLS) использует ядерные оценки параметров, которые влияют на асимптотическое распределение МНК оценок. Для достижения асимптотической эффективности этот метод модифицирует наименьшие квадраты для учета последовательных корреляционных эффектов и проверки эндогенности регрессоров, которые являются результатом существования коинтегрирующих соотношений.

Стационарность остатков показывает, что существует такой коинтегрирующий вектор, при котором два процесса первого порядка интеграции образуют стационарный процесс.

Следующим шагом является проверка краткосрочной связи переменных с помощью панельного МНК. Для этого классическим способом (по критериям качества моделей — значимость коэффициентов, стандартные ошибки, информационные критерии и др.) выбирается лучшая коинтегрирующая модель, полученная ранее, сохраняются ее остатки. Затем остатки добавляются в модель панельного МНК в качестве регрессора вместе с первой разностью независимой переменной. Итоговое уравнение в общем виде выглядит следующим образом:

Статистический анализ младенческой смертности в мире.

.

Статистический анализ младенческой смертности в мире.
Статистический анализ младенческой смертности в мире.
Статистический анализ младенческой смертности в мире.

где Y — зависимая переменная, Х — независимая переменная, , — коэффициенты регрессии при константе и регрессоре соответственно, — параметр, определяющий скорость возвращения Y к равновесной траектории, — механизм корректировки равновесия, представляющий собой остатки коинтеграционного уравнения.

Статистический анализ младенческой смертности в мире.

Обратное коэффициенту значение показывает количество лет до возвращения на равновесную траекторию зависимой переменной.

Для проверки результатов теста используют тест Гранжера на причинность. Он проверяет две гипотезы: когда одна переменная является причиной для другой и наоборот. Статистики для двух случаев рассчитываются следующим образом:

Статистический анализ младенческой смертности в мире.
Статистический анализ младенческой смертности в мире.
Статистический анализ младенческой смертности в мире.

где — коэффициенты регрессии.

В том случае, если одна гипотеза была отвергнута, а вторая — нет, можно говорить о причинности по Гранжеру. Тогда при изменении одного показателя в долгосрочной перспективе можно ожидать соответствующие колебания в другом. Если обе гипотезы не отвергаются, значит между показателями нет причинной связи по Гранжеру. Если отвергаются обе гипотезы — следует сделать вывод о существовании общего причинного по Гранжеру фактора, предшествующего изменению обоих показателей.

Показать весь текст
Заполнить форму текущей работой