Помощь в написании студенческих работ
Антистрессовый сервис

Построение регрессий. 
Расчет оптимального количества резервов под ипотечные ссуды

РефератПомощь в написанииУзнать стоимостьмоей работы

Источник: расчеты автора) Можно заметить, что данное преобразование позволило мне существенно повысить предсказательную способность модели — значение R2 возросло до 74, 7%, а из незначимых коэффициентов на 10% уровне доверия осталась только фиктивная переменная «период рецессии». На мой взгляд, такое улучшение произошло из-за того, что в каждой когорте по отдельности слишком малое количество… Читать ещё >

Построение регрессий. Расчет оптимального количества резервов под ипотечные ссуды (реферат, курсовая, диплом, контрольная)

Теперь, когда я перечислил все переменные, которые, на мой взгляд, могут влиять на уровень просроченной задолженности 90+ дней, можно перейти к регрессионным уравнениям, которые я оценивал.

В своей модели я пытаюсь учесть все имеющиеся у меня параметры риска (насколько долго платежи по кредиту находятся в просроченном состоянии и показатели LTV и PTI). Первый параметр я учитываю тем, что использую данные только по просроченным платежам 90+ дней, однако такую же регрессию можно прогнать и для оставшихся портфелей. С тем, как включить показатели LTV и PTI я испытал некоторые трудности, ведь данные, которые я имею в наличии, относятся к портфелям, а не к индивидуальным кредитам. Но я нашел два способа, как их учесть.

Первый заключается в том, что я объединяю свои данные и делаю из них пространственные данные (cross-sectional data) с фиктивными переменными, отвечающими за каждую из четырех когорт, а дальше оцениваю коэффициенты методом наименьших квадратов (МНК). В данном способе, чтобы получить прогнозное поведение винтажа, обязательным условием является включение в регрессию переменной «время». Ведь иначе, я не смогу отличить уровень просроченных платежей с одинаковыми макроэкономическими показателями, но разными периодами с момента выдачи. Так как я включаю только фиктивные переменные на свободный член, то я предполагаю, что уровень просроченных платежей не зависит от того, в какой момент были выданы ипотечные кредиты. После тестирования нескольких вариантов модели (включая лаги переменных «уровень безработицы», «реальная заработная плата», модель, использующую первую разницу переменных, используя темпы роста переменных), я пришел к выводу, что лучшей моделью является следующая:

NPL = б0 + б1Unemp + б2Salary + б3InterestA + б4Normal + б5Recession + б6d1 + б7d2 + б8d3 + б9logt + м ,.

где.

NPL — уровень просроченных платежей 90+ (Non Performing Loan);

Unemp — уровень безработицы;

Salary — уровень реальной заработной платы;

InterestA — процентная ставка, по которой был выдан кредит;

Normal — фиктивная переменная, принимающая значение «1» в спокойный период и «0» в других;

Recession — фиктивная переменная, принимающая значение «1» в кризисный период и «0» в других;

d1 — фиктивная переменная, принимающая значение «1» для первой когорты (LTV? 70 и PTI? 50) и «0» для других;

d2 — фиктивная переменная, принимающая значение «1» для второй когорты (LTV? 70 и PTI > 50) и «0» для других;

d3 — фиктивная переменная, принимающая значение «1» для третей когорты (LTV > 70 и PTI? 50) и «0» для других;

logt — логарифм времени.

Все лаги переменных, которые я вводил, оказались незначимыми даже на 10% уровне доверия. Переменная «сбережения», тоже была не значимой. Также, я включил постоянный член в уравнение, а значит, из каждой группы фиктивных переменных я включал на одну меньше в модель, чтобы избежать абсолютной мультиколлиниарности. Результаты регрессии представлены в Таблице 6.

Таблица 6. Регрессия, показывающая зависимость просроченных кредитов.

Построение регрессий. Расчет оптимального количества резервов под ипотечные ссуды.

(Источник: расчеты автора) Если посмотреть на значение R2, то можно заметить, что оно принимает значение 0, 224 — скромный результат для такого количества объясняющих переменных. Рассмотрим коэффициенты при каждой переменной более подробно:

  • 1) Переменная «уровень безработицы» является значимой на 1 и выше проценте уровня доверия. Знак коэффициента — положительный, что подразумевает, что при увеличении уровня безработицы в стране, уровень просроченных платежей растет. Ожидаемый результат;
  • 2) Переменная «уровень реальной заработной платы» является значимой на любом уровне доверия. Знак коэффициента — отрицательный, что подразумевает, что при увеличении уровня реальной заработной платы уровень просроченных платежей падает. Ожидаемый результат;
  • 3) Переменная «процентная ставка, по которой был выдан кредит» является значимой на любом уровне доверия. Знак коэффициента — отрицательный, что подразумевает, что при увеличении процентной ставки по кредиту уровень просроченных платежей падает. Результат не является ожидаемым. Однако этот исход можно объяснить тем, что при более высоких ставках по кредиту его берут только те люди, которые знают, что смогут его обслуживать.
  • 4) Фиктивные переменные «спокойный период» и «период рецессии» являются значимыми на любом уровне доверия. Интерпретировать коэффициенты нужно в сравнении с фиктивной переменной, которую я не включил — «период восстановления». Коэффициенты положительные, что означает, что по сравнению с периодом восстановления уровень просроченный задолженности выше в других. Это является ожидаемым результатом для переменной «период рецессии», но не для спокойного периода.
  • 5) Фиктивные переменные для каждой когорты. Так как я не включал в уравнение переменную для четвертой, самой худшей, когорты, то отрицательные коэффициенты для первых двух являются ожидаемыми. К сожалению, коэффициент для третей когорты является положительным и незначимым. Скорее всего, это связанно с тем, что уровень просрочки слишком мало различается между когортами.

В целом, большинство знаков являются правильными, что является признаком того, что спецификация является верной.

Еще одним способом включения риск параметров LTV и PTI в модель прогнозирования уровня просроченных платежей является создания четырех разных регрессий для каждой когорты. На самом деле, оба варианта должны давать одинаковые результаты, если включить в первоначальную модель полный набор фиктивных переменных, а не только на пересечение. Однако, в моем случае, существенным различием и плюсом моделирования поведения четырех когорт по отдельности является то, что я могу представить данные в виде панелей, где параметром i выступает винтаж, например, 1 квартал 2007 года, а параметром t — номер квартала с момента выдачи винтажа. Из-за того, что стандартно мои данные включают в себя поведение каждого портфеля на протяжении четырех лет (16 кварталов), а винтажи, выданные, например, в 2012 еще не прожили столько, мои панельные данные являются несбалансированными. Получить оценки коэффициентов панельной регрессии можно тремя способами: объединенный МНК (pooled OLS), с фиксированным эффектом (fixed effect) и случайным эффектом (random effect). Для того, чтобы понять, какой способ дает лучшие результаты, нужно прогнать регрессию всеми способами, а потом с помощью тестов выбрать лучшую.

Объединенный МНК проводится как обычный, не принимая во внимание что данные — панельные. В таком случае предполагается, что необозримый гетерогенный член (unobserved heterogeneity term) равен нулю. Это значит, что если на самом деле, уровень просроченной задолженности зависит от винтажа, в котором он был выдан, то это значит, что мы не включили значимую переменную в уравнение, а это приводит к проблеме эндогености (по крайней мере, одна объясняющая переменная скоррелирована с ошибочным членом (disturbance term)). В результате все оценки коэффициентов будут несостоятельные, смещенные и неэффективные (inconsistent, biasedandinefficient).

Второй метод получения коэффициентов для панельной регрессии — это с фиксированным эффектом. Предполагается что необозримый гетерогенный член нестохастичен в модели. Получить коэффициенты можно используя три разных способа: Least Squares Dummy Variables, между групп (within groups) и методом первой разницы (first difference). В своей работе я использовал метод между групп. Главными минусами получения оценок методом с фиксированным эффектом являются:

  • · Потеря переменных, которые не меняются со временем;
  • · Падение степеней свободы.

Третий метод получения оценок коэффициентов предполагает, что необозримый гетерогенный член берется случайно из фиксированного распределения. Этот метод дает правильные оценки, только если необозримый гетерогенный член не скоррелирован с объясняющими переменными. Однако, даже это предположение делает невозможным применение МНК. Вместо этого нужно использовать Generalized Least Squares.

Получив оценки регрессий всеми тремя способами, я провел тест Дурбина-Ву-Хаусманна (Durbin-Wu-Hausmann), чтобы выбрать между случайным эффектом и фиксированным. По результатам теста я не смог отвергнуть нулевую гипотезу, а значит использование случайного эффекта предпочтительнее в данной модели. Далее, мне нужно было выбрать между случайным эффектом и объединенным МНК. Для этого существует тест Бреуша-Пагана (Breush-Pagan Lagrange multiplier test). После того, как я его провел, я смог отвергнуть нулевую гипотезу, а значит из этих двух методов случайный эффект предпочтительнее.

При составлении регрессионного уравнения для уровня просроченной задолженности 90+ дней для каждой когорты, я столкнулся с тем, что многие переменные были незначимые, включая фиктивные переменные на кризисный и спокойный периоды. Также, лучший вариант уравнения оставался неизменным между когортами и был следующим:

NPLi, t= б0 + б1Unempi, t + б2Salaryi, t + б3logti, t+ мi, t.

Результаты регрессий представлены вТаблице 7 и Приложении 4.

Таблица 7. Классификация результатов регрессийпо показателям LTV и PTI.

R2.

Незначимые переменные (на 10% уровне доверия).

1) LTV? 70 и PTI? 50.

0, 4628.

Постоянный член.

2) LTV? 70 и PTI > 50.

0, 1262.

;

3) LTV > 70 и PTI? 50.

0, 134.

Постоянный член и уровень безработицы.

4) LTV > 70 и PTI > 50.

0, 3229.

Постоянный член.

(Источник: расчеты автора) Из данной таблицы видно, что, построенная мною регрессия, плохо объясняет поведение просроченных платежей во второй и третей когортах. Однако, разбив одно уравнение на четыре разных, я добился лучшей прогнозирующей силы для лучшего и худшего портфелей. В целом, учитывая тот факт, что я использовал панельные данные для отдельных портфелей, то есть использовал большее количество информации, я бы выбрал второй метод прогнозирования уровня просроченных платежей.

Однако, принимая во внимание то, что, полученная регрессия плохо предсказывает уровень просроченных платежей по второй и третей когорте, и, что по нормативам Центрального Банка РФ при определении уровня резервирования по портфелю однородных ссуд не принимается во внимание риск параметры LTV и PTI, я решил объединить данные по четырем когортам в один портфель. Теперь, в каждом винтаже у меня только один портфель с просроченными платежами 90+ дней, поведение которого надо предсказать. Мои данные — панельные, где параметром i выступает винтаж, а параметром t — номер квартала с момента выдачи винтажа. Для получения оценок коэффициентов я воспользовался алгоритмом, описанным выше и получил, что случайный эффект предпочтительнее. Спецификация модели была следующей:

NPLi, t= б0 + б1Unempi, t + б2Salaryi, t + б3logti, t+ б4InterestAi, t+ б5Normali, t + б6Recessioni, t+ мi, t.

С результатами можно ознакомиться в таблице 8.

Таблица 8. Результаты проведенной регрессии по новой спецификации модели.

Построение регрессий. Расчет оптимального количества резервов под ипотечные ссуды.

(Источник: расчеты автора) Можно заметить, что данное преобразование позволило мне существенно повысить предсказательную способность модели — значение R2 возросло до 74, 7%, а из незначимых коэффициентов на 10% уровне доверия осталась только фиктивная переменная «период рецессии». На мой взгляд, такое улучшение произошло из-за того, что в каждой когорте по отдельности слишком малое количество ипотечных кредитов — эта отрасль не так развита в России, как за рубежом, поэтому индивидуальный эффект каждого кредита имеет большое влияние на уровень просроченной задолженности всего портфеля. Таким образом, лучшая, полученная мной модель это та, в которой я не делаю различие по риск параметрам LTV и PTI, а использую агрегированные данные, как по текущим нормативам Центрального Банка РФ.

Показать весь текст
Заполнить форму текущей работой