Автор: Пользователь скрыл имя, 03 Апреля 2014 в 10:48, контрольная работа
Необходимо провести анализ исходных данных, предоставленных агентством недвижимости «Дом-Юг» и установить влияет ли площадь квартир на их стоимость. Для проведения исследований воспользуемся пакетом прикладных программ Microsoft Office, а именно пакетом Microsoft Excel и Statistica 10.
В итоге у нас всего лишь один фактор (X1) статистически значим
Шаг 2.
Исключим из нашего выборки фактор X2 так как он имеет наибольшее p-value.
Regression Summary for Dependent Variable: Y (Spreadsheet1) | ||||||
N=36 |
b* |
Std.Err. of b* |
b |
Std.Err. of b |
t(29) |
p-value |
Intercept |
1317,461 |
576,5950 |
2,28490 |
0,029318 | ||
X1 |
0,784327 |
0,106941 |
47,045 |
6,4144 |
7,33419 |
0,000000 |
X3 |
-0,176691 |
0,105682 |
-36,950 |
22,1004 |
-1,67191 |
0,104607 |
X4 |
-0,067011 |
0,113020 |
-31,790 |
53,6164 |
-0,59291 |
0,557542 |
X6 |
-0,050836 |
0,112477 |
-130,397 |
288,5133 |
-0,45196 |
0,654442 |
В итоге у нас всего лишь один фактор (X1) статистически значим
Шаг 3.
Исключим из нашего выборки фактор X6 так как он имеет наибольшее p-value.
Regression Summary for Dependent Variable: Y (Spreadsheet1) | ||||||
N=36 |
b* |
Std.Err. of b* |
b |
Std.Err. of b |
t(29) |
p-value |
Intercept |
1182,679 |
487,3137 |
2,42694 |
0,021036 | ||
X1 |
0,789346 |
0,105032 |
47,346 |
6,2999 |
7,51527 |
0,000000 |
X3 |
-0,177545 |
0,104343 |
-37,128 |
21,8204 |
-1,70155 |
0,098539 |
X4 |
-0,049600 |
0,104923 |
-23,530 |
49,7751 |
-0,47273 |
0,639616 |
В итоге у нас всего лишь один фактор (X1) статистически значим
Шаг 4.
Исключим из нашего выборки фактор X4 так как он имеет наибольшее p-value.
Regression Summary for Dependent Variable: Y (Spreadsheet1) | ||||||
N=36 |
b* |
Std.Err. of b* |
b |
Std.Err. of b |
t(29) |
p-value |
Intercept |
1067,786 |
417,3806 |
2,55830 |
0,015294 | ||
X1 |
0,795040 |
0,103104 |
47,687 |
6,1843 |
7,71103 |
0,000000 |
X3 |
-0,177106 |
0,103104 |
-37,037 |
21,5613 |
-1,71773 |
0,095217 |
В итоге у нас всего лишь один фактор (X1) статистически значим
Шаг 5.
Исключим из нашего выборки фактор X3 так как он имеет наибольшее p-value.
Regression Summary for Dependent Variable: Y (Spreadsheet1) | ||||||
N=36 |
b* |
Std.Err. of b* |
b |
Std.Err. of b |
t(29) |
p-value |
Intercept |
695,0475 |
366,6237 |
1,895806 |
0,066512 | ||
X1 |
0,786575 |
0,105899 |
47,1794 |
6,3519 |
7,427563 |
0,000000 |
В результате пошагового исключения факторов влияющих на уравнение множественной регрессии мы получили в итоге один статистически значимый фактор X1.
8.Прогнозное значение
Прогнозное значение от 85% максимального значения стоимости (Y).
Predicting Values for (Spreadsheet1) | |||
Variable |
b-Weight |
Value |
b-Weight * Value |
Y |
47,17940 |
5525,000 |
260666,2 |
Intercept |
695,0 | ||
Predicted |
261361,2 | ||
-95,0%CL |
190738,4 | ||
+95,0%CL |
331984,1 |
Прогнозное значение равно 261361,2.
9.Доверительные интервалы
Нижние 95% |
Верхние 95% | |
X1 |
10,59379677 |
96,09084053 |
X2 |
-83,3629134 |
56,75807076 |
X3 |
-82,88965402 |
11,43980255 |
X4 |
-158,8670484 |
84,23698879 |
X5 |
-473,4645529 |
604,2755046 |
X6 |
-736,4626923 |
487,1241389 |
Так же определим доверительные интервалы прогноза для уровня значимости α=0,05, которые с надежность 95% будут следующим:
1) 10,59379677≤ X1 ≤ 96,09084053
2) -83,3629134≤ X2 ≤ 56,75807076
3) -82,88965402≤ X3 ≤ 11,43980255
4) -158,8670484≤ X4 ≤ 84,23698879
5) -473,4645529≤ X5 ≤ 604,2755046
6) -736,4626923≤ X6 ≤487,1241389
Анализ верхней и нижней границ доверительных интервалов приводит к выводу о том, что с вероятностью p = 1 - α = 0,95 исследуемые параметры, находясь в указанных границах, являются статистически значимыми и существенно отличны от нуля.
10.Вывод
В результате проведенного анализа мы получаем окончательное уравнение множественной регрессии:
Y = 695.05 + 47.18X1
Оценка значимости уравнения множественной регрессии осуществляется путем проверки гипотезы о равенстве нулю коэффициент детерминации рассчитанного по данным генеральной совокупности: R2 или b1 = b2 =... = bm = 0 (гипотеза о незначимости уравнения регрессии, рассчитанного по данным генеральной совокупности).
Проверим гипотезу об общей значимости - гипотезу об одновременном равенстве нулю всех коэффициентов регрессии при объясняющих переменных:
H0: β1 = β2 = ... = βm = 0.
Проверка этой гипотезы осуществляется с помощью F-статистики распределения Фишера.
Если F < Fkp = Fα ; n-m-1, то нет оснований для отклонения гипотезы H0.
F = R2;1 - R2n - m -1;m = 0.62;1 - 0.6236-1-1;1 = 55.19
Табличное значение при степенях свободы k1 = 1 и k2 = n-m-1 = 36 - 1 - 1 = 34, Fkp(1;34) = 4.08
Поскольку фактическое значение F > Fkp, то коэффициент детерминации статистически значим и уравнение регрессии статистически надежно.
Следовательно, на основании критерия Фишера можно сказать, что данная модель пригодна для составления дальнейшего прогноза.
Проведем теперь оценку общего качества модели по коэффициенту детерминации. В полученной модели коэффициент детерминации R2=0.62, что говорит о том, что на результативный признак Y (стоимость квартиры) на 62 % объясняется фактором X1(общая площадь квартиры) и 38% отводится на долю посторонних факторов оказывающих влияние на стоимость квартиры.