Автор: Пользователь скрыл имя, 03 Апреля 2014 в 10:48, контрольная работа
Необходимо провести анализ исходных данных, предоставленных агентством недвижимости «Дом-Юг» и установить влияет ли площадь квартир на их стоимость. Для проведения исследований воспользуемся пакетом прикладных программ Microsoft Office, а именно пакетом Microsoft Excel и Statistica 10.
В итоге у нас всего лишь один фактор (X1) статистически значим
Шаг 2.
Исключим из нашего выборки фактор X2 так как он имеет наибольшее p-value.
Regression Summary for Dependent Variable: Y (Spreadsheet1)   | ||||||
N=36  | 
  b*  | 
  Std.Err. of b*  | 
  b  | 
  Std.Err. of b  | 
  t(29)  | 
  p-value  | 
Intercept  | 
  1317,461  | 
  576,5950  | 
  2,28490  | 
  0,029318  | ||
X1  | 
  0,784327  | 
  0,106941  | 
  47,045  | 
  6,4144  | 
  7,33419  | 
  0,000000  | 
X3  | 
  -0,176691  | 
  0,105682  | 
  -36,950  | 
  22,1004  | 
  -1,67191  | 
  0,104607  | 
X4  | 
  -0,067011  | 
  0,113020  | 
  -31,790  | 
  53,6164  | 
  -0,59291  | 
  0,557542  | 
X6  | 
  -0,050836  | 
  0,112477  | 
  -130,397  | 
  288,5133  | 
  -0,45196  | 
  0,654442  | 
В итоге у нас всего лишь один фактор (X1) статистически значим
Шаг 3.
Исключим из нашего выборки фактор X6 так как он имеет наибольшее p-value.
Regression Summary for Dependent Variable: Y (Spreadsheet1)   | ||||||
N=36  | 
  b*  | 
  Std.Err. of b*  | 
  b  | 
  Std.Err. of b  | 
  t(29)  | 
  p-value  | 
Intercept  | 
  1182,679  | 
  487,3137  | 
  2,42694  | 
  0,021036  | ||
X1  | 
  0,789346  | 
  0,105032  | 
  47,346  | 
  6,2999  | 
  7,51527  | 
  0,000000  | 
X3  | 
  -0,177545  | 
  0,104343  | 
  -37,128  | 
  21,8204  | 
  -1,70155  | 
  0,098539  | 
X4  | 
  -0,049600  | 
  0,104923  | 
  -23,530  | 
  49,7751  | 
  -0,47273  | 
  0,639616  | 
В итоге у нас всего лишь один фактор (X1) статистически значим
Шаг 4.
Исключим из нашего выборки фактор X4 так как он имеет наибольшее p-value.
Regression Summary for Dependent Variable: Y (Spreadsheet1)   | ||||||
N=36  | 
  b*  | 
  Std.Err. of b*  | 
  b  | 
  Std.Err. of b  | 
  t(29)  | 
  p-value  | 
Intercept  | 
  1067,786  | 
  417,3806  | 
  2,55830  | 
  0,015294  | ||
X1  | 
  0,795040  | 
  0,103104  | 
  47,687  | 
  6,1843  | 
  7,71103  | 
  0,000000  | 
X3  | 
  -0,177106  | 
  0,103104  | 
  -37,037  | 
  21,5613  | 
  -1,71773  | 
  0,095217  | 
В итоге у нас всего лишь один фактор (X1) статистически значим
Шаг 5.
Исключим из нашего выборки фактор X3 так как он имеет наибольшее p-value.
Regression Summary for Dependent Variable: Y (Spreadsheet1)   | ||||||
N=36  | 
  b*  | 
  Std.Err. of b*  | 
  b  | 
  Std.Err. of b  | 
  t(29)  | 
  p-value  | 
Intercept  | 
  695,0475  | 
  366,6237  | 
  1,895806  | 
  0,066512  | ||
X1  | 
  0,786575  | 
  0,105899  | 
  47,1794  | 
  6,3519  | 
  7,427563  | 
  0,000000  | 
В результате пошагового исключения факторов влияющих на уравнение множественной регрессии мы получили в итоге один статистически значимый фактор X1.
8.Прогнозное значение
Прогнозное значение от 85% максимального значения стоимости (Y).
Predicting Values for (Spreadsheet1)   | |||
Variable  | 
  b-Weight  | 
  Value  | 
  b-Weight * Value  | 
Y  | 
  47,17940  | 
  5525,000  | 
  260666,2  | 
Intercept  | 
  695,0  | ||
Predicted  | 
  261361,2  | ||
-95,0%CL  | 
  190738,4  | ||
+95,0%CL  | 
  331984,1  | ||
Прогнозное значение равно 261361,2.
9.Доверительные интервалы
Нижние 95%  | 
  Верхние 95%  | |
X1  | 
  10,59379677  | 
  96,09084053  | 
X2  | 
  -83,3629134  | 
  56,75807076  | 
X3  | 
  -82,88965402  | 
  11,43980255  | 
X4  | 
  -158,8670484  | 
  84,23698879  | 
X5  | 
  -473,4645529  | 
  604,2755046  | 
X6  | 
  -736,4626923  | 
  487,1241389  | 
Так же определим доверительные интервалы прогноза для уровня значимости α=0,05, которые с надежность 95% будут следующим:
1) 10,59379677≤ X1 ≤ 96,09084053
2) -83,3629134≤ X2 ≤ 56,75807076
3) -82,88965402≤ X3 ≤ 11,43980255
4) -158,8670484≤ X4 ≤ 84,23698879
5) -473,4645529≤ X5 ≤ 604,2755046
6) -736,4626923≤ X6 ≤487,1241389
Анализ верхней и нижней границ доверительных интервалов приводит к выводу о том, что с вероятностью p = 1 - α = 0,95 исследуемые параметры, находясь в указанных границах, являются статистически значимыми и существенно отличны от нуля.
10.Вывод
В результате проведенного анализа мы получаем окончательное уравнение множественной регрессии:
Y = 695.05 + 47.18X1
Оценка значимости уравнения множественной регрессии осуществляется путем проверки гипотезы о равенстве нулю коэффициент детерминации рассчитанного по данным генеральной совокупности: R2 или b1 = b2 =... = bm = 0 (гипотеза о незначимости уравнения регрессии, рассчитанного по данным генеральной совокупности).
Проверим гипотезу об общей значимости - гипотезу об одновременном равенстве нулю всех коэффициентов регрессии при объясняющих переменных:
H0: β1 = β2 = ... = βm = 0.
Проверка этой гипотезы осуществляется с помощью F-статистики распределения Фишера.
Если F < Fkp = Fα ; n-m-1, то нет оснований для отклонения гипотезы H0.
F = R2;1 - R2n - m -1;m = 0.62;1 - 0.6236-1-1;1 = 55.19
Табличное значение при степенях свободы k1 = 1 и k2 = n-m-1 = 36 - 1 - 1 = 34, Fkp(1;34) = 4.08
Поскольку фактическое значение F > Fkp, то коэффициент детерминации статистически значим и уравнение регрессии статистически надежно.
Следовательно, на основании критерия Фишера можно сказать, что данная модель пригодна для составления дальнейшего прогноза.
Проведем теперь оценку общего качества модели по коэффициенту детерминации. В полученной модели коэффициент детерминации R2=0.62, что говорит о том, что на результативный признак Y (стоимость квартиры) на 62 % объясняется фактором X1(общая площадь квартиры) и 38% отводится на долю посторонних факторов оказывающих влияние на стоимость квартиры.