Модель множественной линейной регрессии

Автор: Пользователь скрыл имя, 03 Апреля 2014 в 10:48, контрольная работа

Краткое описание

Необходимо провести анализ исходных данных, предоставленных агентством недвижимости «Дом-Юг» и установить влияет ли площадь квартир на их стоимость. Для проведения исследований воспользуемся пакетом прикладных программ Microsoft Office, а именно пакетом Microsoft Excel и Statistica 10.

Файлы: 1 файл

Множественная регрессия.docx

— 182.88 Кб (Скачать)

В итоге у нас всего лишь один фактор (X1) статистически значим

Шаг 2.

Исключим из нашего выборки фактор X2 так как он имеет наибольшее p-value.

 

Regression Summary for Dependent Variable: Y (Spreadsheet1) 
R= ,80913388 R?= ,65469764 Adjusted R?= ,61014249 
F(4,31)=14,694 p<,00000 Std.Error of estimate: 765,71

N=36

b*

Std.Err. of b*

b

Std.Err. of b

t(29)

p-value

Intercept

   

1317,461

576,5950

2,28490

0,029318

X1

0,784327

0,106941

47,045

6,4144

7,33419

0,000000

X3

-0,176691

0,105682

-36,950

22,1004

-1,67191

0,104607

X4

-0,067011

0,113020

-31,790

53,6164

-0,59291

0,557542

X6

-0,050836

0,112477

-130,397

288,5133

-0,45196

0,654442


В итоге у нас всего лишь один фактор (X1) статистически значим

Шаг 3.

Исключим из нашего выборки фактор X6 так как он имеет наибольшее p-value.

 

Regression Summary for Dependent Variable: Y (Spreadsheet1) 
R= ,80772663 R?= ,65242231 Adjusted R?= ,61983690 
F(3,32)=20,022 p<,00000 Std.Error of estimate: 756,13

N=36

b*

Std.Err. of b*

b

Std.Err. of b

t(29)

p-value

Intercept

   

1182,679

487,3137

2,42694

0,021036

X1

0,789346

0,105032

47,346

6,2999

7,51527

0,000000

X3

-0,177545

0,104343

-37,128

21,8204

-1,70155

0,098539

X4

-0,049600

0,104923

-23,530

49,7751

-0,47273

0,639616


 

В итоге у нас всего лишь один фактор (X1) статистически значим

Шаг 4.

Исключим из нашего выборки фактор X4 так как он имеет наибольшее p-value.

 

Regression Summary for Dependent Variable: Y (Spreadsheet1) 
R= ,80622268 R?= ,64999501 Adjusted R?= ,62878258 
F(2,33)=30,642 p<,00000 Std.Error of estimate: 747,18

N=36

b*

Std.Err. of b*

b

Std.Err. of b

t(29)

p-value

Intercept

   

1067,786

417,3806

2,55830

0,015294

X1

0,795040

0,103104

47,687

6,1843

7,71103

0,000000

X3

-0,177106

0,103104

-37,037

21,5613

-1,71773

0,095217


В итоге у нас всего лишь один фактор (X1) статистически значим

 

Шаг 5.

Исключим из нашего выборки фактор X3 так как он имеет наибольшее p-value.

 

 

Regression Summary for Dependent Variable: Y (Spreadsheet1) 
R= ,78657500 R?= ,61870023 Adjusted R?= ,60748553 
F(1,34)=55,169 p<,00000 Std.Error of estimate: 768,32

N=36

b*

Std.Err. of b*

b

Std.Err. of b

t(29)

p-value

Intercept

   

695,0475

366,6237

1,895806

0,066512

X1

0,786575

0,105899

47,1794

6,3519

7,427563

0,000000


В результате пошагового исключения факторов влияющих на уравнение множественной регрессии мы получили в итоге один статистически значимый фактор X1.

 

8.Прогнозное значение

Прогнозное значение от 85% максимального значения стоимости (Y).

 

 

Predicting Values for (Spreadsheet1) 
variable: Y

Variable

b-Weight

Value

b-Weight * Value

 Y

47,17940

5525,000

260666,2

Intercept

   

695,0

Predicted

   

261361,2

-95,0%CL

   

190738,4

+95,0%CL

   

331984,1


 Прогнозное значение равно 261361,2.

 

9.Доверительные интервалы

 

Нижние 95%

Верхние 95%

X1

10,59379677

96,09084053

X2

-83,3629134

56,75807076

X3

-82,88965402

11,43980255

X4

-158,8670484

84,23698879

X5

-473,4645529

604,2755046

X6

-736,4626923

487,1241389


Так же определим доверительные интервалы прогноза для уровня значимости α=0,05, которые с надежность 95% будут следующим:

1) 10,59379677≤ X1 ≤ 96,09084053

2) -83,3629134≤ X2 ≤ 56,75807076

3) -82,88965402≤ X3 ≤ 11,43980255

4) -158,8670484≤ X4 ≤ 84,23698879

5) -473,4645529≤ X5 ≤ 604,2755046

6) -736,4626923≤ X6 ≤487,1241389

Анализ верхней и нижней границ доверительных интервалов приводит к выводу о том, что с вероятностью p = 1 - α = 0,95 исследуемые параметры, находясь в указанных границах, являются статистически значимыми и существенно отличны от нуля. 

 

10.Вывод

В результате проведенного анализа мы получаем окончательное уравнение множественной регрессии:

Y = 695.05 + 47.18X1

Оценка значимости уравнения множественной регрессии осуществляется путем проверки гипотезы о равенстве нулю коэффициент детерминации рассчитанного по данным генеральной совокупности: R2 или b1 = b2 =... = bm = 0 (гипотеза о незначимости уравнения регрессии, рассчитанного по данным генеральной совокупности).

Проверим гипотезу об общей значимости - гипотезу об одновременном равенстве нулю всех коэффициентов регрессии при объясняющих переменных:

H0: β1 = β2 = ... = βm = 0.

Проверка этой гипотезы осуществляется с помощью F-статистики распределения Фишера.

Если F < Fkp  = Fα ; n-m-1, то нет оснований для отклонения гипотезы H0.

F = R2;1 - R2n - m -1;m  = 0.62;1 - 0.6236-1-1;1 = 55.19

Табличное значение при степенях свободы k1 = 1 и k2 = n-m-1 = 36 - 1 - 1 = 34, Fkp(1;34) = 4.08

Поскольку фактическое значение F > Fkp, то коэффициент детерминации статистически значим и уравнение регрессии статистически надежно.

Следовательно, на основании критерия Фишера можно сказать, что данная модель пригодна для составления дальнейшего прогноза.

Проведем теперь оценку общего качества модели по коэффициенту детерминации. В полученной модели коэффициент детерминации R2=0.62, что говорит о том, что на результативный признак Y (стоимость квартиры) на 62 % объясняется фактором X1(общая площадь квартиры) и 38% отводится на долю посторонних факторов оказывающих влияние на стоимость квартиры.

 

 


Информация о работе Модель множественной линейной регрессии