Автор: Пользователь скрыл имя, 17 Февраля 2013 в 18:44, контрольная работа
Изучается линейная зависимость результативного признака Y – ожидаемой продолжительности жизни мужчины (в годах) от пяти факторных признаков – регрессоров x1 - численности населения (в тыс. чел.), x2 - рождаемости (на 1000 чел.), x3 - смертности (на 1000 чел.), x4 - среднего числа детей в семье, x5 - процента городского населения.
Изучается линейная зависимость результативного признака Y – ожидаемой продолжительности жизни мужчины (в годах) от пяти факторных признаков – регрессоров x1 - численности населения (в тыс. чел.), x2 - рождаемости (на 1000 чел.), x3 - смертности (на 1000 чел.), x4 - среднего числа детей в семье, x5 - процента городского населения.
;
где случайные величины (случайные эффекты влияния на результативный признак неконтролируемых факторов) независимы и имеют одинаковое нормальное распределение , или, иначе, наблюдения независимы и имеют нормальное распределение
.
. Данная функция называется линейной множественной регрессии.
В результате работы программы «Корреляция» рассчитана матрица оценок коэффициентов парной корреляции (табл.1). Жирным шрифтом выделены коэффициенты корреляции, оценки которых по модулю превосходят 0,7.
Таблица 1
Y |
x(1) |
x(2) |
x(3) |
x(4) |
x(5) | |
Y |
1 |
|||||
x(1) |
-0,12513 |
1 |
||||
x(2) |
-0,81727 |
0,042289 |
1 |
|||
x(3) |
-0,59694 |
-0,03566 |
0,236172 |
1 |
||
x(4) |
-0,80838 |
-0,00289 |
0,966282 |
0,334691 |
1 |
|
x(5) |
0,687435 |
-0,30208 |
-0,6335 |
-0,29824 |
-0,5719 |
1 |
Выводы: cудя по наблюдениям, наиболее сильна линейная связь результативного признака Y (ожидаемой продолжительности жизни мужчины) с факторным признаком x(2) (рождаемостью на 1000 чел.), x(4) (средним числом детей в семье), так как модули оценок соответствующих коэффициентов парной корреляции достаточно велики: .
Достаточно сильна линейная связь между парой регрессоров x(2)(рождаемостью) и x(4)(средним числом детей в семье): – это свидетельствует о коллинеарности регрессоров x2 и x4.
Оценка линейной функции регрессии:
.
Стандартная ошибка .
Средняя относительная ошибка аппроксимации (в процентах) равна 3,4%.
.
, значения которых, равные соответственно 2958,092, 444,889, 3402,981, приводятся в столбце «SS»; а в столбце «MS» приведены значения величин , равные соответственно 591,618, 9,671 (табл.2).
Таблица 2. Дисперсионный анализ
df |
SS |
MS |
F |
Значимость F | |
Регрессия |
5 |
2958,092 |
591,618 |
61,171 |
0,000 |
Остаток |
46 |
444,889 |
9,671 |
||
Итого |
51 |
3402,981 |
Проверка гипотезы Н0: . Так как значимость F меньше , то гипотеза Н0 не принимается (уравнение значимо).
б) Проверим гипотезы : при альтернативных гипотезах : .
Таблица 3
Стандартная ошибка |
t-статистика |
P-Значение |
Нижние 95% |
Верхние 95% |
Нижние 95,0% |
Верхние 95,0% | |
Y-пересечение |
3,535 |
24,435 |
0,000 |
79,265 |
93,497 |
79,265 |
93,497 |
x(1) |
0,000 |
-1,104 |
0,275 |
0,000 |
0,000 |
0,000 |
0,000 |
x(2) |
0,202 |
-3,758 |
0,000 |
-1,165 |
-0,352 |
-1,165 |
-0,352 |
x(3) |
0,159 |
-6,976 |
0,000 |
-1,432 |
-0,791 |
-1,432 |
-0,791 |
x(4) |
1,259 |
1,333 |
0,189 |
-0,857 |
4,213 |
-0,857 |
4,213 |
x(5) |
0,028 |
1,534 |
0,132 |
-0,013 |
0,098 |
-0,013 |
0,098 |
В табл.3 в столбце «t-статистика» приводятся значения статистики , которая при выполнении гипотезы Н0 имеет распределение Стьюдента с степенью свободы.
Так как критическая точка , то только гипотезы отвергаются (оценки параметров значимы), а гипотезы принимаются (оценки незначимы).
В табл.3 в столбце «P-значение» приводятся рассчитанные уровни значимости гипотез – вероятности . Отсюда видно, что гипотезы отвергаются, а гипотезы принимаются.
.
Стандартная ошибка .
Средняя относительная ошибка аппроксимации (в процентах) равна 3,4%.
Оценка коэффициента множественной линейной корреляции равна 0,93, оценка коэффициента множественной линейной детерминации равна 0,87, оценка нормированного коэффициента множественной линейной детерминации равна 0,85.
Гипотеза H0 о том, что все параметры при регрессорах одновременно равны нулю, отвергается на 5%-ном уровне значимости, поскольку значимость F меньше принятого уровня значимости α = 0,05.
Так как , только гипотеза принимается, а гипотезы не принимаются.
б) Исключим из уравнения регрессор , при котором коэффициент незначим. Оценка линейной функции регрессии:
.
Стандартная ошибка .
Средняя относительная ошибка аппроксимации (в процентах) равна 3,5%. Оценка коэффициента множественной линейной корреляции равна 0,93, оценка коэффициента множественной линейной детерминации равна 0,86, оценка нормированного коэффициента множественной линейной детерминации равна 0,85.
Таблица 4
Уравнение, интервальные оценки коэффициентов, наблюдаемые значения статистики Т, Р-значения |
F |
||||||
1 |
(79.27;93.5)
(0;0)
(-1.104) (0.28) |
0.87 |
0.86 |
3.11 |
3.4% |
61.17 |
2.417 |
2 |
(78.39;91.94) (-1.17;-0.35) (-1.42;-0.78) (-0.79;4.29) (0;0.11) (-3.75) (-6.89) (1.39) (2.03) (0) (0) (0.17) (0.05) |
0.87 |
0.86 |
3.12 |
3.4% |
75.8 |
2.57 |
3 |
(76.89;88.49) (-0.6;-0.37) (-1.27;-0.71) (0.01; 0.11) (-8.68) (-7.04) (2.59) (0)
(0) |
0.86 |
0.85 |
3.15 |
3.5% |
98.53 |
2.798 |
Гипотеза H0 о том, что все параметры при регрессорах одновременно равны нулю, отвергается на 5%-ном уровне значимости, поскольку значимость F меньше принятого уровня значимости α = 0,05.
Так как , то гипотезы не принимаются.
Результаты отображены в табл.4.
а) более 80% дисперсии продолжительности
жизни мужчины связано с
б) точечная оценка генерального среднего значения продолжительности жизни мужчины при значениях регрессоров на первом объекте равна
, а реальная
продолжительность жизни
в) увеличение смертности на единицу (при неизменных остальных регрессорах) сопровождается наибольшим изменением средней продолжительности жизни мужчины (уменьшением на 0,989).
г) коэффициент эластичности:
Отсюда, увеличение рождаемости на 1% при неизменных остальных регрессорах сопровождается наибольшим процентным изменением средней продолжительности жизни мужчины – ее уменьшением на 0,15%.