Множественная регрессия

Автор: Пользователь скрыл имя, 14 Декабря 2011 в 15:23, лабораторная работа

Краткое описание

Цель: закрепление теоретического и практического материала по теме множественная регрессия, приобретение навыков построения и анализа многофакторных эконометрических моделей в модуле Множественная регрессия.

Файлы: 1 файл

Лабораторная работа №4.doc

— 309.50 Кб (Скачать)

Лабораторная  работа №4 

Тема: Множественная регрессия

Цель: закрепление теоретического и практического материала по теме множественная регрессия, приобретение навыков построения и анализа многофакторных эконометрических моделей в модуле Множественная регрессия.

1. Необходимо проверить наличие линейной множественной связи между соответствующими показателями (доход банка и объем средства юридических лиц (Х1) и объем средства физических лиц (Х2)) в модуле Multіple Regressіon  ППП Statіstіca. Построить линейную многофакторную эконометрическую модель. Рассчитать ее характеристики (среднее квадратичное отклонение параметров модели, дисперсию и среднее квадратичное отклонение ошибок модели, коэффициенты множественной корреляции и детерминации коэффициенты).

2. Проверить статистическую значимость параметров модели, коэффициенту множественной корреляции. Проверить адекватность модели в целом.

3. Проанализировать модель с точки зрения мультиколинеарности. Рассчитать матрицу парных корреляций для факторов.

4. Проанализировать ошибки модели. Проверить модель на наличие автокорреляции.

5. Исключить из модели факторы, которые не влияют на зависимую сменную (использовать метод пошагового включения и пошагового исключения). Определить все вышеуказанные характеристики построенных моделей, сделать выводы относительно их адекватности. Сделать сравнительный анализ построенных моделей. Определить наиболее адекватную и экономически интерпретированную модель.

6. Спрогнозировать ситуацию на 1 шаг вперед.

Вариант 10                    
Y X1 X2
1 77,25 13,38 8,87
2 64,68 10,5 10,9
3 74,68 11,9 11,6
4 70,29 12,8 8,3
5 72,68 12,4 10,9
6 100,69 12,7 18,2
7 98,59 14,4 12,9
8 91,48 13,9 13,1
9 99,68 14,5 13,9
10 102,68 14,7 12,6
11 96,36 14,8 10,9
12 57,69 9,4 11,9
13 113,03 15,9 13,3
14 114,68 16,2 14
15 115,61 16,8 11,9
 

      

Найти прогнозное значение дохода банка и доверительные  интервалы, если объем средства юридических  лиц (Х1 пр) будет составлять 22 млн. грн., а объем средства физических лиц (Х2 пр) - 15 млн. грн. 

      

Ход работы:

1. Ввод исходных данных.

Для построения и всестороннего анализа множественных  линейных экономических моделей  в Statistica предусмотрен модуль Multiple Regression.

Вносим исходные данные для построения модели. Заходим в меню Множественная регрессия и заносим зависимую и независимые переменные для построения многофакторной регрессионной модели. 

Рис. 1. Окно множественной  регрессии

2. Построение линейной многофакторной модели.

Построим линейную многофакторную модель и определим  все ее характеристики (параметры модели, среднеквадратическое отклонение параметров модели, дисперсию и среднеквадратическое отклонение ошибок модели, коэффициенты множественной корреляции и детерминации). Проверим статистическую значимость модели и адекватность параметров модели по критерию Фишера. 

Рис.2. Результаты регрессионного анализа

Во вкладке  Advanced выбираем Summary: Regression Results. 

Рис.3. Результаты регрессионного анализа

     

Проанализируем  полученные результаты модели:

     

R = коэффициент множественной корреляции. Если значение не стремится к единице, то модель не адекватна.

     

R?= - коэффициент детерминации модели, стремится к 1. Показывает, что вариация зависимой переменной зависит от вариации независимой переменной.

     

Adjusted R?= - скорректированный коэффициент детерминации.

      

F(2,12) = 0,47 - критерий адекватности Фишера. Если полученное значение меньше табличного, значит модель статистически не значима. Так как вычисленное значение F –отношения  - F факт при заданном уровне значимости больше критического (табличного) F табл , т.е. F факт > F табл = F(2,n-2), то признаётся статистическая значимость уравнения регрессии, т.е. связь между рассматриваемыми признаками есть и результаты наблюдений не противоречат предположению о её линейности.

      

dF- число степеней свободы

     

P = – вероятность ошибки для критерию Фишера. Если p>0.05, то модель статистически не значима.

     

Std. Error of estimate = - среднее квадратическое отклонение ошибок модели. Если значение велико, то модель не адекватна.

     

B = (-53,35;7,8;3,03) - параметры модели, значит уравнение регрессии имеет вид: Y =  -53,35+7,8х1+ 3,03x2.

     

 Std. Error of Bеta =  - среднее квадратическое отклонение параметров модели.

     

 t(12) = - значимость параметров по критерию Стьюдента.

=0,05 при к=n-2=13 степенях свободы критерий Стьютента tтабл. = 2,16. tрас. =11,12> tтабл. Так как вычисленное значение t – статистики - |tфакт| при заданном уровне значимости α больше критического (табличного) t табл,, можно говорить о принятии гипотезы H1. Это подтверждает статистическую значимость коэффициента регрессии.

     

Р-level =– вероятность к критерию Стьюдента. Если p>0.05, то модель статистически не значима.

В целом, предложенная модель адекватна исследуемому процессу.

     

3. Проверка модели на наличие мультиколинеарности.

     

Одним из способов проверки модели на мультиколинеарность является расчет матрицы парных корреляций. Для этого в окне Review Descriptive Statistics во вкладке Quick выбираем Correlation. 

Рис.4. Выбор опции Descriptive statistics / Correlation 

Рис.5. Матрица  парных корреляций 

4. Расчет и исследование ошибок модели.

Для дальнейшего  анализа необходимо рассчитать теоретические  значения зависимой переменной и  ошибки модели, привести результаты исследования модели по критерию Дарбина-Уотсона  и нециклического коэффициента автокорреляции.

     

Рассчитаем теоретические  значения зависимой переменной. Для  этого построим гистограмму и  график распределения ошибок на нормальной вероятностной бумаге.

     

В модуле множественной  регрессии во вкладке Residuals выбираем Descriptive Statistics. В открывшимся окне во вкладке Advanced выбираем Matrix plot of correlations. 
 

     

Рис. 6. Диаграммы и гистограммы рассеивания переменных 

     

Чтобы рассчитать и проанализировать остатки, в нижней части окна результатов регрессионного анализа есть опция Perform residual analysis (Всесторонний анализ остатков). Инициировав данную опцию мы получим меню для анализа ошибок модели.

     

Кнопка анализа  ошибок Summary: Residuals & Predicted отображает наблюдаемые значения зависимой переменной (Observed value), теоретические значения зависимой переменной  (Predicted value) и ошибки модели (Residual), как разницу наблюдаемых и теоретических значений. 

Рис.7. Анализ ошибок модели 

     

Для выполнения прогнозов по полученному уравнению  необходимо показать, что регрессионная  модель адекватна результатам наблюдений. С этой целью можно воспользоваться критерием Дарбина-Уотсона, согласно которого, рассчитанный системой Statistica коэффициент dрасч необходимо сравнить с табличным значением dтабл (для совокупности объемом n=15, уровня значимости

a

=0,05 и двух оцениваемых параметров регрессии, значение dтабл=1,54). Если dрасч>dтабл, то полученная модель адекватна и пригодна для прогнозирования. Для определения dрасч в Statistica в окне Residual Analysis на вкладке Advanced необходимо выбрать опцию Durbin-Watson statistic: 
 
 

Рис.7 Автокорреляция ошибок модели 

5. Метод пошагового  включения и исключения 

В модуле Multiple Regression реализован метод пошагового включения  переменных (Forward stepwise) и метод пошагового исключения (Backward stepwise). Выбор методов осуществляется на стартовой панели Multiple Linear Regression в меню Advanced. 
 

Рис.8. Выбор метода пошагового включения переменных модели 

Рис. 9. Регрессионный  анализ методом пошагового включения 
 

Рис.10. Выбор  метода пошагового исключения переменных модели 
 

Рис.11. Регрессионный  анализ методом пошагового исключения 

Параметры модели, полученные методами пошагового включения  и исключения, одинаковы, поэтому  включать и исключать переменные из модели не требуется. 

6. Расчет прогноза значений зависимых переменных и доверительных интервалов изменения.

Чтобы рассчитать прогнозные значения зависимой переменной, в нижней части окна результатов  регрессионного анализа есть опция  Predict dependent variable. Выбираем значения для параметров модели. 

Рис.12. Выбор  значений параметров модели 
 

Рис.13. Результаты прогнозирования 

      

Прогнозное значение у =163, 85. Доверительный интервал прогноза от 158,21 до 169,5. Модель прогноза можно  считать хорошей, так как доверительный  интервал не широкий. 

Вывод: прогнозное значение дохода банка при объемах  средств юридических лиц 22 млн. грн. и при объеме средств физических лиц 22 млн. грн., составило 163,85 млн. грн. Интервал прогноза равен 158,21 и 169,5 млн. грн. 

      

Варианты

      

Знайти прогнозне  значення доходу банку та довірчі інтервали, якщо обсяг коштів юридичних осіб (Х1 пр) складатиме 15 млн. грн., а обсяг коштів фізичних осіб (Х2 пр) – 20 млн. грн.  

Варіант 1                        Варіант 2                          Варіант 3
Y X1 X2   Y X1 X2   Y X1 X2
1 55,26 7,5 11,8   1 70,26 8,5 9,79   1 62,37 8,1 12,8
2 60,34 9,4 10,8   2 57,34 9,4 7,4   2 49,34 9,4 10,5
3 72,34 11,4 11,9   3 72,34 11,4 9,1   3 62,34 11,4 11,9
4 73,48 15,4 12,8   4 73,48 11,4 7,9   4 93,48 15,4 12,8
5 67,34 12,3 12,4   5 75,34 12,3 8,4   5 67,34 12,3 12,4
6 56,37 6,8 13,1   6 66,37 6,8 10,1   6 66,64 7,2 14,2
7 61,37 7,9 15,4   7 64,37 7,9 9,7   7 64,37 7,9 14,4
8 90,14 10,4 13,9   8 84,14 10,4 10,6   8 86,14 10,4 13,9
9 111,34 11,6 14,5   9 96,34 11,6 12,4   9 91,34 11,6 14,5
10 80,34 9,8 14,7   10 77,34 9,8 10,1   10 87,34 9,8 14,7
11 114,54 11,4 15,1   11 127,54 21,4 11,7   11 101,54 11,4 15,1
12 83,89 10,6 1,4   12 80,89 10,6 9,9   12 145,26 11,8 20,4
13 104,69 11,8 15,9   13 134,69 11,8 18,8   13 124,69 11,8 15,9
14 119,34 12,7 16,2   14 96,34 12,7 11,5   14 119,34 12,7 16,2
15 131,27 13,7 16,8   15 102,27 13,7 11,5   15 124,27 13,7 16,8
 
 
Знайти  прогнозне значення та довірчі інтервали, якщо обсяг коштів юридичних осіб (Х1 пр) складатиме 16 млн. грн., а обсяг коштів фізичних осіб (Х2 пр) – 22 млн. грн.

Варіант 4                        Варіант 5                          Варіант 6

Y X1 X2   Y X1 X2   Y X1 X2
1 70,060 11,8 9,7   1 62,37 8,1 12,8   1 97,71 10,40 16,70
2 51,340 10,5 8,4   2 49,34 9,4 10,5   2 65,68 10,10 10,50
3 65,340 11,9 9,1   3 68,34 11,4 11,9   3 85,68 12,10 11,90
4 73,480 12,8 8,4   4 93,48 15,4 12,8   4 108,82 16,10 12,80
5 67,340 12,4 8,4   5 75,34 12,3 12,4   5 90,68 13,00 12,40
6 80,700 12,7 10,7   6 64,37 7,2 14,2   6 59,71 7,90 12,70
7 84,370 14,4 9,7   7 70,37 7,9 14,4   7 77,71 8,60 14,40
8 86,140 13,9 10,6   8 82,14 10,4 13,9   8 91,48 11,10 13,90
9 91,340 14,5 11,4   9 91,34 11,6 14,5   9 96,68 12,30 14,50
10 97,340 14,7 10,1   10 87,34 9,8 14,7   10 90,68 10,50 14,70
11 99,540 14,8 11,7   11 95,54 11,4 15,1   11 96,88 12,10 14,80
12 49,400 9,4 8,7   12 125,35 10,7 19,8   12 70,69 11,40 9,40
13 104,690 15,9 10,8   13 84,69 11,8 13,4   13 103,03 12,50 15,90
14 114,250 16,2 12,5   14 111,34 12,7 16,2   14 111,68 13,40 16,20
15 113,270 16,8 11,5   15 134,27 13,7 18,2   15 121,61 14,40 16,80
 

Информация о работе Множественная регрессия