Автор: Пользователь скрыл имя, 23 Февраля 2013 в 20:33, контрольная работа
Общее качество уравнения регрессии, оценивается по тому, как хорошо эмпирическое уравнение регрессии согласуется со статистическими данными, другими словами, насколько широко рассеяны точки наблюдений относительно линии регрессии. Для этой цели используется коэффициент детерминации . Очевидно, если все точки лежат на построенной прямой, то регрессия У на Х идеально объясняет поведение зависимой переменной.
Коэффициент детерминации определяет долю разброса зависимой переменной, объяснимую регрессией У на Х.
В общем случае справедливо соотношение . Чем теснее связь между Х и У, тем коэффициент ближе к единице. Чем слабее такая связь, тем ближе к нулю.
Российский Государственный Социальный Университет
Факультет социального страхования, экономики и финансов
Кафедра бухгалтерского учета, анализа и аудита
Расчетно-графическая работа по эконометрике
на тему:
«Парная и множественная линейная регрессия»
Вариант 8.8
Москва
2008
Задание
Необходимо построить
уравнение регрессии и
Данные
Y8 |
X1 |
X2 |
X3 |
X4 |
X5 |
X6 |
X7 |
X8 |
X9 |
X10 |
X11 |
X12 |
0 |
0,71 |
0,93 |
0,66 |
0,53 |
0,97 |
0,73 |
0,49 |
0,93 |
0,73 |
0,83 |
0,68 |
1,48 |
15 |
0,76 |
1,24 |
0,95 |
0,7 |
1,51 |
2,03 |
0,69 |
0,7 |
0,98 |
1,15 |
0,98 |
1,23 |
6 |
0,78 |
1,07 |
1,05 |
0,97 |
0,8 |
0,78 |
0,99 |
0,78 |
0,97 |
1,05 |
0,98 |
0,75 |
15 |
0,8 |
1,62 |
1,16 |
0,7 |
0,84 |
0,88 |
0,69 |
1,46 |
0,83 |
1,03 |
1,04 |
0,8 |
6 |
1,04 |
0,63 |
1,02 |
0,93 |
1,12 |
0,73 |
1,11 |
1,04 |
1,11 |
0,59 |
1,09 |
1,23 |
9 |
0,9 |
1,38 |
0,64 |
0,51 |
1,1 |
1,42 |
0,76 |
0,41 |
0,79 |
1 |
0,91 |
1,19 |
6 |
0,94 |
1,28 |
1,36 |
0,87 |
1,16 |
0,74 |
1,02 |
1,12 |
0,95 |
0,53 |
0,89 |
1,55 |
9 |
0,94 |
1,21 |
0,54 |
0,97 |
1,55 |
1,36 |
0,71 |
0,76 |
1,06 |
1,22 |
0,66 |
1,18 |
3 |
0,79 |
0,54 |
1,03 |
1,06 |
0,78 |
0,83 |
1,13 |
0,83 |
0,9 |
0,77 |
1,14 |
1,1 |
12 |
1,06 |
1,47 |
0,76 |
0,46 |
1,95 |
1,56 |
0,61 |
1,1 |
1,04 |
1,19 |
0,6 |
0,77 |
21 |
0,84 |
0,87 |
1,67 |
0,81 |
0,98 |
1,31 |
1,12 |
0,99 |
0,92 |
1,09 |
0,85 |
1,05 |
3 |
1,08 |
1,39 |
0,98 |
0,98 |
0,91 |
1,19 |
1,29 |
1,09 |
0,96 |
1,19 |
1,1 |
1,28 |
12 |
0,84 |
1,25 |
0,64 |
0,74 |
1,1 |
1,05 |
0,62 |
1,15 |
1,22 |
0,92 |
1,06 |
1,09 |
12 |
1,14 |
1,73 |
0,74 |
0,88 |
1,17 |
1,25 |
0,91 |
1 |
0,97 |
1,16 |
1,01 |
0,85 |
Переменная |
Канал |
Точка |
X1 |
Легкие |
тай-юань |
X2 |
Толстый кишечник |
ян-си |
X3 |
Желудок |
чун-ян |
X4 |
Слезенка |
тай-бай |
X5 |
Сердце |
шэнь-мэнь |
X6 |
Тонкий кишечник |
вань-гу |
X7 |
Мочевой пузырь |
шу-гу |
X8 |
Почки |
тай-си |
X9 |
Перикард |
да-лин |
X10 |
Тройной обогреватель |
ян-чи |
X11 |
Желчный пузырь |
цю-сюй |
X12 |
Печень |
тай-чун |
Y8 |
Возбудимость |
Агрессивность, упрямство, повышенное самолюбие, обидчивость |
Multiple Regression Analysis
------------------------------
Dependent variable: Y
------------------------------
Parameter Estimate Error Statistic P-Value
------------------------------
CONSTANT 25,8717 76,6657 0,337462 0,7928
X1 36,7663 29,6022 1,24201 0,4315
X2 -1,93269 7,63643 -0,253088 0,8422
X3 14,6031 21,7913 0,670136 0,6241
X4 13,3194 13,1815 1,01046 0,4967
X5 -33,3926 26,8485 -1,24374 0,4311
X6 30,4613 29,8465 1,0206 0,4935
X7 -31,5172 31,742 -0,992917 0,5023
X8 3,61345 18,3887 0,196504 0,8765
X9 19,9578 14,6648 1,36094 0,4034
X10 -23,3686 42,2614 -0,552953 0,6784
X11 -28,0495 47,6549 -0,588597 0,6613
X12 -13,2077 15,3712 -0,859252 0,5481
------------------------------
Analysis of Variance
------------------------------
Source Sum of Squares Df Mean Square F-Ratio P-Value
------------------------------
Model 409,926 12 34,1605 2,75 0,4361
Residual 12,4307 1 12,4307
------------------------------
Total (Corr.) 422,357 13
R-squared = 97,0568 percent
R-squared (adjusted for d.f.) = 61,7389 percent
Standard Error of Est. = 3,52571
Mean absolute error = 0,743937
Durbin-Watson statistic = 1,43489
Вредные (ведущие к
возникновению
Далее, переключатель Fit ставится в положение Backward Selection (Отбор последовательным исключением).
Эта процедура приводит к получению подобранной модели:
Y1 = -23,5694+22,7264*X1+18,7726*
, ,
Multiple Regression Analysis
------------------------------
Dependent variable: Y
------------------------------
Parameter Estimate Error Statistic P-Value
------------------------------
CONSTANT -23,5694 8,21504 -2,86905 0,0240
X1 22,7264 9,59446 2,3687 0,0497
X3 18,7726 3,72199 5,04371 0,0015
X5 -13,539 5,11333 -2,64779 0,0330
X6 12,7556 2,93193 4,35057 0,0034
X7 -26,0736 6,69033 -3,8972 0,0059
X9 18,9432 7,41946 2,55317 0,0379
------------------------------
Analysis of Variance
------------------------------
Source Sum of Squares Df Mean Square F-Ratio P-Value
------------------------------
Model 365,402 6 60,9004 7,48 0,0089
Residual 56,9548 7 8,1364
------------------------------
Total (Corr.) 422,357 13
R-squared = 86,515 percent
R-squared (adjusted for d.f.) = 74,9565 percent
Standard Error of Est. = 2,85244
Mean absolute error = 1,7215
Durbin-Watson statistic = 2,15227
Таким образом, главными значимыми факторами, влияющими на возбудимость человека (агрессивность, упрямство, повышенное самолюбие, обидчивость) на основании электрокожного сопротивления (отношения фона к нагрузке) являются такие биологические точки на теле человека как тай-юань, чун-ян, шэнь-мэнь, вань-гу, шу-гу, да-лин.
Коэффициенты при Х показывают на какую величину изменится У, если Х возрастут на одну единицу. На графике эти коэффициенты определяют тангенс угла наклона прямой регрессии относительно положительного направления абсцисс (объясняющей переменной). Поэтому он часто называется угловым коэффициентом.
Свободный член уравнения регрессии определяет прогнозируемое значение У при величин Х, равных нулю. Значение свободного члена определяет точку пересечения прямой регрессии с осью ординат и характеризует сдвиг линии регрессии вдоль оси У
Осуществляя проверку статистической значимости коэффициентов уравнения регрессии, используем Т-статистику
В нашем случае для свободного члена равен 2,86905-коэффициент значим. Необходимо обратиться к таблице: (число степеней свободы , уровень значимости ) . Следовательно, . Значит свободным коэффициентом нельзя пренебречь, он является значимым.
Для коэффициента при Х1 - коэффициент значим, для Х3-5,04371 - коэффициент сильно значим, для Х5 - 2,64779 - коэффициент значим, для X6 - 4,35057 - коэффициент сильно значим, для X7 - 3,8972 - коэффициент сильно значим, для X9 - 2,55317 - коэффициент значим.
Таким образом наша модель примет вид:
Y1 = -23,5694+22,7264*X1+18,7726*
, ,
Общее качество уравнения регрессии, оценивается по тому, как хорошо эмпирическое уравнение регрессии согласуется со статистическими данными, другими словами, насколько широко рассеяны точки наблюдений относительно линии регрессии. Для этой цели используется коэффициент детерминации . Очевидно, если все точки лежат на построенной прямой, то регрессия У на Х идеально объясняет поведение зависимой переменной.
Коэффициент детерминации определяет долю разброса зависимой переменной, объяснимую регрессией У на Х.
В общем случае справедливо соотношение . Чем теснее связь между Х и У, тем коэффициент ближе к единице. Чем слабее такая связь, тем ближе к нулю.
В нашем случае
Следовательно, связь тесная, разброс незначительный.
Проверяется гипотеза о статистической значимости коэффициента детерминации :
Для проверки данной гипотезы используется -статистика: нулевая гипотеза отклоняется если значит, , т.е статистически значим.
В нашем случае , , следовательно, , значит статистически значим.
Гетероскедастичностью
называется непостоянство дисперсий
отклонений, т.е. не выполняется условие,
что дисперсия случайных
Информация о работе Парная и множественная линейная регрессия