Автор: Пользователь скрыл имя, 14 Декабря 2012 в 19:14, курсовая работа
Динамичное развитие финансового рынка, появление новых инструментов и институтов способствуют возникновению явных и скрытых угроз стабильности. Предупреждение кризисов непосредственно связано с выявлением рисков и управлением ими. Примером по внедрению в международную практику методов оценки рисков является Базельское соглашение о норме собственного капитала, в котором достаточность капитала определяется при помощи коэффициентов, учитывающих кредитный, рыночный и операционный риски.
Введение………………………………………………………………….3
1. Обзор моделей оценки кредитного риска…………………………...6
1.1 Подходы к оценке кредитного риска…………………………...6
1.2 Понятие качества и прозрачности методик…………………….7
1.3 Характеристики физического лица. Структура данных………10
2. Статистические и экономические методы оценки риска…………..11
2.1 Скоринговые методики………………………………………….11
2.2 Кластерный анализ………………………………………………12
2.3 Дискриминантный анализ……………………………………….15
2.4 Дерево классификаций…………………………………………..18
2.5 Нейронные сети…………………………………………………..19
2.6 Технология Data mining………………………………………….20
2.7 Линейная вероятностная регрессионная модель……………….20
2.8 Логистическая регрессия………………………………………...24
3. Признаки устойчивости банка……………………………………….27
Заключение………………………………………………………………33
Список литературы……………………………………………………...36
Главное преимущество методик на основе data mining заключается в том, что они могут работать на малых выборках. При больших выборках их точность, робастность и прозрачность недостаточны. В них также не дается ответ, насколько кредит хорош или плох Метод не позволяет получить количественную оценку риска, установить допустимый риск, назначить цену за риск и выявить вклады факторов и их градаций в риск.
2.7 Линейная
вероятностная регрессионная
Задача регрессионного анализа состоит в построении модели, позволяющей по значениям независимых показателей получать оценки значений зависимой переменной. Линейная модель связывает значения зависимой переменной Y со значениями независимых показателей Xk (факторов) формулой:
Y=B0+B1X1+…+BpXp+e
где e - случайная ошибка. Здесь Xk означает не "икс в степени k", а переменная X с индексом k. Традиционные названия "зависимая" для Y и "независимые" для Xk отражают не столько статистический смысл зависимости, сколько их содержательную интерпретацию. Величина e называется ошибкой регрессии. Первые математические результаты, связанные с регрессионным анализом, сделаны в предположении, что регрессионная ошибка распределена нормально с параметрами N(0,σ2), ошибка для различных объектов считаются независимыми. Кроме того, в данной модели мы рассматриваем переменные X как неслучайные значения, Такое, на практике, получается, когда идет активный эксперимент, в котором задают значения X (например, назначили зарплату работнику), а затем измеряют Y (оценили, какой стала производительность труда). За это иногда зависимую переменную называют откликом. Для получения оценок коэффициентов регрессии минимизируется сумма квадратов ошибок регрессии:
Решение задачи сводится к решению системы линейных уравнений относительно . На основании оценок регрессионных коэффициентов рассчитываются значения Y:
О качестве полученного
уравнения регрессии можно
Величина S называется стандартной ошибкой регрессии. Чем меньше величина S, тем лучше уравнение регрессии описывает независимую переменную Y.
Так как мы ищем оценки , используя случайные данные, то они, в свою очередь, будут представлять случайные величины. В связи с этим возникают вопросы:
1. Существует ли регрессионная зависимость? Может быть, все коэффициенты регрессии в генеральной совокупности равны нулю, оцененные их значения ненулевые только благодаря случайным отклонениям данных?
В пакете SPSS вычисляются статистики, позволяющие решить эти задачи.
Для проверки одновременного отличия всех коэффициентов регрессии от нуля проведем анализ квадратичного разброса значений зависимой переменной относительно среднего. Его можно разложить на две суммы следующим образом:
В этом разложении обычно обозначают
- общую сумму квадратов
- сумму квадратов регрессионных отклонений;
- разброс по линии регрессии.
Статистика в условиях гипотезы равенства нулю регрессионных коэффициентов имеет распределение Фишера и, естественно, по этой статистике проверяют, являются ли коэффициенты B1,…,Bp одновременно нулевыми. Если наблюдаемая значимость статистики Фишера мала (например, sig F=0.003), то это означает, что данные распределены вдоль линии регрессии; если велика (например, Sign F=0.5), то, следовательно, данные не связаны такой линейной связью.
При сравнении качества регрессии, оцененной по различным зависимым переменным, полезно исследовать доли объясненной и необъясненной дисперсии. Отношение SSreg/SSt представляет собой оценку доли необъясненной дисперсии. Доля дисперсии зависимой переменной , объясненной уравнением регрессии, называется коэффициентом детерминации. В двумерном случае коэффициент детерминации совпадает с квадратом коэффициента корреляции.
Корень из коэффициента детерминации называется КОЭФФИЦИЕНТОМ МНОЖЕСТВЕННОЙ КОРРЕЛЯЦИИ (он является коэффициентом корреляции между y и ). Оценкой коэффициента детерминации ( ) является . Соответственно, величина R является оценкой коэффициента множественной корреляции. Следует иметь в виду, что является смещенной оценкой. Корректированная оценка коэффициента детерминации получается по формуле:
В этой формуле используются несмещенные оценки дисперсий регрессионного остатка и зависимой переменной.
Если переменные X независимы между собой, то величина коэффициента bi интерпретируется как прирост y, если Xi увеличить на единицу.
Можно ли по абсолютной величине коэффициента судить о роли соответствующего ему фактора в формировании зависимой переменной? То есть, если b1>b2, будет ли X1 важнее X2?
Абсолютные значения коэффициентов не позволяют сделать такой вывод. Однако при небольшой взаимосвязи между переменными X, если стандартизовать переменные и рассчитать уравнение регрессии для стандартизованных переменных, то оценки коэффициентов регрессии позволят по их абсолютной величине судить о том, какой аргумент в большей степени влияет на функцию.
Дисперсия коэффициента позволяет получить статистику для проверки его значимости . Эта статистика имеет распределение Стьюдента. В выдаче пакета печатается наблюдаемая ее двусторонняя значимость - вероятность случайно при нулевом регрессионном коэффициенте Bk получить значение статистики, большее по абсолютной величине, чем выборочное.
Построим регрессию Y на факторы Z1-Z20 по методу линейной регрессии (табл.14.)
Таблица 14. Оценка линейной вероятностной модели
В нашем случае прогнозные значения Yf указывают на вероятность возврата (невозврата) кредита. Построим график прогнозных значений (рис.3.)
Рис.3. график прогнозных значений
Можно видеть, что прогнозные значения могут находиться вне интервала [0,1] – это главный недостаток LP модели. Поэтому приступим к построению моделей, лишенных этих недостатков.
2.8 Логистическая регрессия
Будем считать, что событие в данных фиксируется дихотомической переменной (0 не произошло событие, 1 - произошло). Для построения модели предсказания можно было бы построить, к примеру, линейное регрессионное уравнение с зависимой дихотомической переменной Y, но оно будет не адекватно поставленной задаче, так как в классическом уравнении регрессии предполагается, что Y - непрерывная переменная. С этой целью рассматривается логистическая регрессия. Ее целью является построение модели прогноза вероятности события {Y=1} в зависимости от независимых переменных X1,…,Xp. Иначе эта связь может быть выражена в виде зависимости P{Y=1|X}=f(X)
Логистическая регрессия выражает эту связь в виде формулы
Название "логистическая регрессия" происходит от названия логистического распределения, имеющего функцию распределения . Таким образом, модель, представленная этим видом регрессии, по сути, является функцией распределения этого закона, в которой в качестве аргумента используется линейная комбинация независимых переменных.
Отношение вероятности того, что событие произойдет к вероятности того, что оно не произойдет P/(1-P) называется отношением шансов. С этим отношением связано еще одно представление логистической регрессии, получаемое за счет непосредственного задания зависимой переменной в виде Z=Ln(P/(1-P)), где P=P{Y=1|X1,…,Xp}. Переменная Z называется логитом. По сути дела, логистическая регрессия определяется уравнением регрессии Z=B0+B1X1+…+BpXp. В связи с этим отношение шансов может быть записано в следующем виде
P/(1-P)=
Отсюда получается, что, если модель верна, при независимых X1,…,Xp изменение Xk на единицу вызывает изменение отношения шансов в раз.
Механизм решения такого уравнения можно представить следующим образом
Еще одна особенность состоит в том, что в реальных данных очень часто группы по X оказываются однородными по Y, поэтому оценки оказываются равными нулю или единице. Таким образом, оценка логита для них не определена (для этих значений ).
Построим модель пробит для наших данных. Оценивание в SPSS дает результаты (табл.15.), где приведены коэффициенты оценивания.
Таблица 15. Оценка логит-модели
|
B | |
Step 1(a) |
schet |
,585 |
|
srok |
-,139 |
|
histor |
,388 |
|
naznah |
,033 |
|
zaim |
-,181 |
|
chares |
,239 |
|
timrab |
,161 |
|
vznos |
-,299 |
|
famil |
,264 |
|
poruchit |
,360 |
|
timelive |
-,005 |
|
garonti |
-,191 |
|
vozras |
,068 |
|
inizaimi |
,315 |
|
kvartir |
,318 |
|
kolzaim |
-,240 |
|
proff |
,021 |
|
rodstve |
-,153 |
|
telefon |
,312 |
|
inosmest |
1,225 |
|
Constant |
-4,227 |
На основе модели логистической регрессии можно строить предсказание произойдет или не произойдет событие {Y=1}. Правило предсказания, по умолчанию заложенное в процедуру LOGISTIC REGRESSION устроено по следующему принципу: если >0.5 считаем, что событие произойдет; £0.5, считаем, что событие не произойдет (табл.16).
Таблица 16. Таблица прогнозов
Так в нашем примере результаты прогноза можно оформить в виде таблицы 17.
Таблица 17. Прогнозное качество модели
Логит модель | |||
Y=0 |
Y=1 |
Всего | |
всего по выборке |
300 |
700 |
1000 |
прогноз |
226 |
774 |
1000 |
правильно |
150 |
624 |
774 |
неправильно |
150 |
76 |
226 |
% правильно |
50,0% |
89,1% |
77,4% |
% неправильно |
50,0% |
10,9% |
22,6% |
Результаты подобной
классификации превосходят
3. Признаки устойчивости банка
Немаловажную роль в поддержании устойчивости коммерческого банка играет качество ресурсной базы и активов. Необходимость оценки качества пассивов банка связана с тем, что привлеченные средства занимают преобладающее место в структуре банковских ресурсов и именно они служат основой для удовлетворения разнообразных потребностей предприятий, организаций и населения, в том числе и потребностей в кредитных ресурсах. В России на практике финансовая устойчивость коммерческих банков определяется не только рискованностью проводимых операций и величиной капитала, но и качественной структурой привлеченных ресурсов.
Качество пассивов традиционно характеризуется стабильностью ресурсной базы, стоимостью привлечения, чувствительностью к изменениям процентных ставок и зависимостью от внешних источников финансирования, таких как межбанковский рынок краткосрочных капиталов.