Парная и множественная линейная регрессия

Автор: Пользователь скрыл имя, 23 Февраля 2013 в 20:33, контрольная работа

Краткое описание

Общее качество уравнения регрессии, оценивается по тому, как хорошо эмпирическое уравнение регрессии согласуется со статистическими данными, другими словами, насколько широко рассеяны точки наблюдений относительно линии регрессии. Для этой цели используется коэффициент детерминации . Очевидно, если все точки лежат на построенной прямой, то регрессия У на Х идеально объясняет поведение зависимой переменной.
Коэффициент детерминации определяет долю разброса зависимой переменной, объяснимую регрессией У на Х.
В общем случае справедливо соотношение . Чем теснее связь между Х и У, тем коэффициент ближе к единице. Чем слабее такая связь, тем ближе к нулю.

Файлы: 1 файл

деятельность.doc

— 357.00 Кб (Скачать)

Российский  Государственный Социальный Университет

Факультет социального  страхования, экономики и финансов

Кафедра бухгалтерского учета, анализа и аудита

 

 

 

 

 

 

 

 

 

 

 

Расчетно-графическая  работа по эконометрике

на тему:

«Парная и  множественная линейная регрессия»

 

Вариант 8.8

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Москва

2008

 

Задание

Необходимо построить  уравнение регрессии и проанализировать результаты моделирования (качество регрессии), осуществить спецификацию (отбор  факторных переменных) регрессионной  модели, провести проверку уравнения регрессии на мультиколлинеарность объясняющих переменных, гетероскедастичность и автокорреляцию остатков, в случае их обнаружения принять меры.

Данные

Y8

X1

X2

X3

X4

X5

X6

X7

X8

X9

X10

X11

X12

0

0,71

0,93

0,66

0,53

0,97

0,73

0,49

0,93

0,73

0,83

0,68

1,48

15

0,76

1,24

0,95

0,7

1,51

2,03

0,69

0,7

0,98

1,15

0,98

1,23

6

0,78

1,07

1,05

0,97

0,8

0,78

0,99

0,78

0,97

1,05

0,98

0,75

15

0,8

1,62

1,16

0,7

0,84

0,88

0,69

1,46

0,83

1,03

1,04

0,8

6

1,04

0,63

1,02

0,93

1,12

0,73

1,11

1,04

1,11

0,59

1,09

1,23

9

0,9

1,38

0,64

0,51

1,1

1,42

0,76

0,41

0,79

1

0,91

1,19

6

0,94

1,28

1,36

0,87

1,16

0,74

1,02

1,12

0,95

0,53

0,89

1,55

9

0,94

1,21

0,54

0,97

1,55

1,36

0,71

0,76

1,06

1,22

0,66

1,18

3

0,79

0,54

1,03

1,06

0,78

0,83

1,13

0,83

0,9

0,77

1,14

1,1

12

1,06

1,47

0,76

0,46

1,95

1,56

0,61

1,1

1,04

1,19

0,6

0,77

21

0,84

0,87

1,67

0,81

0,98

1,31

1,12

0,99

0,92

1,09

0,85

1,05

3

1,08

1,39

0,98

0,98

0,91

1,19

1,29

1,09

0,96

1,19

1,1

1,28

12

0,84

1,25

0,64

0,74

1,1

1,05

0,62

1,15

1,22

0,92

1,06

1,09

12

1,14

1,73

0,74

0,88

1,17

1,25

0,91

1

0,97

1,16

1,01

0,85


 

Переменная

Канал

Точка

X1

Легкие

тай-юань

X2

Толстый кишечник

ян-си

X3

Желудок

чун-ян

X4

Слезенка

тай-бай

X5

Сердце

шэнь-мэнь

X6

Тонкий кишечник

вань-гу

X7

Мочевой пузырь

шу-гу

X8

Почки

тай-си

X9

Перикард

да-лин

X10

Тройной обогреватель

ян-чи

X11

Желчный пузырь

цю-сюй

X12

Печень

тай-чун

Y8

Возбудимость

Агрессивность, упрямство, повышенное самолюбие, обидчивость


 

  1. Построить уравнение регрессии только со значимыми факторами («лучшее» из возможных уравнений) и пояснить смысл (экономический, социальный) его параметров
  • Построим уравнение множественной регрессии в среде Statgraphics Plus путем вывода из главного меню пункта Relate → Multiple Regression

Multiple Regression Analysis

 

-----------------------------------------------------------------------------

Dependent variable: Y

-----------------------------------------------------------------------------

                                       Standard          T

Parameter               Estimate         Error       Statistic        P-Value

-----------------------------------------------------------------------------

CONSTANT       25,8717        76,6657       0,337462         0,7928

X1                       36,7663        29,6022        1,24201         0,4315

X2                      -1,93269        7,63643      -0,253088         0,8422

X3                       14,6031        21,7913       0,670136         0,6241

X4                       13,3194        13,1815        1,01046         0,4967

X5                      -33,3926        26,8485       -1,24374         0,4311

X6                       30,4613        29,8465         1,0206         0,4935

X7                      -31,5172         31,742      -0,992917         0,5023

X8                       3,61345        18,3887       0,196504         0,8765

X9                       19,9578        14,6648        1,36094         0,4034

X10                     -23,3686        42,2614      -0,552953         0,6784

X11                     -28,0495        47,6549      -0,588597         0,6613

X12                     -13,2077        15,3712      -0,859252         0,5481

-----------------------------------------------------------------------------

 

                           Analysis of Variance

-----------------------------------------------------------------------------

Source             Sum of Squares     Df  Mean Square    F-Ratio      P-Value

-----------------------------------------------------------------------------

Model                     409,926     12      34,1605       2,75       0,4361

Residual                  12,4307      1      12,4307

-----------------------------------------------------------------------------

Total (Corr.)             422,357     13

 

R-squared = 97,0568 percent

R-squared (adjusted for d.f.) = 61,7389 percent

Standard Error of Est. = 3,52571

Mean absolute error = 0,743937

Durbin-Watson statistic = 1,43489

 

  • Необходимо определить наиболее значимые факторы.

Вредные (ведущие к  возникновению мультиколлинеарности) или статистически незначимые переменные  могут быть удалены из модели автоматически. Через контекстное меню Analysis Options вызываются дополнительные опции множественного регрессионного анализа Multiple Regression Options..

Далее, переключатель Fit ставится в положение Backward Selection (Отбор последовательным исключением).

Эта процедура  приводит к получению подобранной модели:

Y1 = -23,5694+22,7264*X1+18,7726*X3-13,539*X5+12,7556*X6-26,0736*X7+18,9432*X9

, ,

 

Multiple Regression Analysis

-----------------------------------------------------------------------------

Dependent variable: Y

-----------------------------------------------------------------------------

                                       Standard          T

Parameter               Estimate         Error       Statistic        P-Value

-----------------------------------------------------------------------------

CONSTANT       -23,5694        8,21504       -2,86905         0,0240

X1                       22,7264        9,59446         2,3687         0,0497

X3                       18,7726        3,72199        5,04371         0,0015

X5                       -13,539        5,11333       -2,64779         0,0330

X6                       12,7556        2,93193        4,35057         0,0034

X7                      -26,0736        6,69033        -3,8972         0,0059

X9                       18,9432        7,41946        2,55317         0,0379

-----------------------------------------------------------------------------

 

                           Analysis of Variance

-----------------------------------------------------------------------------

Source    Sum of Squares     Df  Mean Square    F-Ratio      P-Value

-----------------------------------------------------------------------------

Model                   365,402      6      60,9004       7,48       0,0089

Residual                56,9548      7       8,1364

-----------------------------------------------------------------------------

Total (Corr.)             422,357     13

 

R-squared = 86,515 percent

R-squared (adjusted for d.f.) = 74,9565 percent

Standard Error of Est. = 2,85244

Mean absolute error = 1,7215

Durbin-Watson statistic = 2,15227

Таким образом, главными значимыми факторами, влияющими  на возбудимость человека (агрессивность, упрямство, повышенное самолюбие, обидчивость) на основании электрокожного сопротивления (отношения фона к нагрузке) являются такие биологические точки на теле человека как тай-юань, чун-ян, шэнь-мэнь, вань-гу, шу-гу, да-лин.

  1. Дать оценку качества регрессии на основе коэффициента детерминации и общего F-критерия Фишера, а также оценить значимость влияния объясняющих переменных по t-критерию Стьюдента (уровень значимости принять равным 0,05)
  • Проверка статистической значимости коэффициентов уравнения регрессии

Коэффициенты при Х  показывают на какую величину изменится У, если Х возрастут на одну единицу. На графике эти коэффициенты определяют тангенс угла наклона прямой регрессии относительно положительного направления абсцисс (объясняющей переменной). Поэтому он часто называется угловым коэффициентом.

Свободный член уравнения  регрессии определяет прогнозируемое значение У при величин Х, равных нулю. Значение свободного члена определяет точку пересечения прямой регрессии  с осью ординат и характеризует  сдвиг линии регрессии вдоль  оси У

Осуществляя проверку статистической значимости коэффициентов уравнения регрессии, используем Т-статистику

  • Если модуль , то коэффициент статистически значим;
  • Если , то коэффициент относительно значим (в данном случае рекомендуется воспользоваться таблицами распределения Стьюдента);
  • Если  , то коэффициент значим.
  • Если , то коэффициент считается сильно значимым. Вероятность ошибки в данном случае при достаточном числе наблюдений не превосходит 0,001

В нашем случае для свободного члена равен 2,86905-коэффициент значим. Необходимо обратиться к таблице: (число степеней свободы , уровень значимости ) . Следовательно, . Значит свободным коэффициентом нельзя пренебречь, он является значимым.

Для коэффициента при  Х1 - коэффициент значим, для Х3-5,04371 - коэффициент сильно значим, для Х5 - 2,64779 - коэффициент значим, для X6 - 4,35057 - коэффициент сильно значим, для X7 - 3,8972 - коэффициент сильно значим, для X9 - 2,55317 - коэффициент значим.

Таким образом наша модель примет вид:

Y1 = -23,5694+22,7264*X1+18,7726*X3-13,539*X5+12,7556*X6-26,0736*X7+18,9432*X9

, ,

  • Проверка общего качества уравнения регрессии

 

Общее качество уравнения регрессии, оценивается по тому, как хорошо эмпирическое уравнение регрессии согласуется со статистическими данными, другими словами, насколько широко рассеяны точки наблюдений относительно линии регрессии. Для этой цели используется коэффициент детерминации . Очевидно, если все точки лежат на построенной прямой, то регрессия У на Х идеально объясняет поведение зависимой переменной.

Коэффициент детерминации определяет долю разброса зависимой  переменной, объяснимую регрессией У на Х.

В общем случае справедливо  соотношение . Чем теснее связь между Х и У, тем коэффициент ближе к единице. Чем слабее такая связь, тем ближе к нулю.

В нашем случае   

Следовательно, связь  тесная, разброс незначительный.

  • Анализ статистической значимости коэффициента детерминации.

Проверяется гипотеза о  статистической значимости коэффициента детерминации :

Для проверки данной гипотезы используется -статистика: нулевая гипотеза отклоняется если значит, , т.е статистически значим.

В нашем случае  , , следовательно, , значит статистически значим.

  1. Провести проверку уравнения регрессии на мультиколлинеарность объясняющих переменных, гетероскедастичность и автокорреляцию остатков.
  • Мультиколлинеарность (см в п.1)
  • Гетероскедастичность

Гетероскедастичностью называется непостоянство дисперсий  отклонений, т.е. не выполняется условие, что дисперсия случайных отклонений постоянна ( для любых наблюдений и ).

Информация о работе Парная и множественная линейная регрессия