Автор: Пользователь скрыл имя, 05 Января 2012 в 15:15, контрольная работа
Построить модель связи между указанными факторами, проверить её адекватность, осуществить точечный и интервальный прогноз.
Если фактическое значение t-критерия меньше табличного (по модулю), то нет оснований отвергать основную гипотезу, т.е. параметр или статистическая характеристика в генеральной совокупности незначимо отличается от нуля при уровне значимости α.
tкрит
(n-m-1;α/2) = (8;0.025) = 2.306
Поскольку
9.97 > 2.306, то статистическая значимость
коэффициента регрессии b подтверждается
(отвергаем гипотезу о равенстве
нулю этого коэффициента).
Вывод:
Поскольку 45.72 > 2.306, то статистическая
значимость коэффициента регрессии a подтверждается
(отвергаем гипотезу о равенстве нулю
этого коэффициента).
5. Проверьте
адекватность модели (уравнения регрессии)
в целом с помощью F-критерия Фишера-Снедекора.
Сформулируйте выводы.
Коэффициент детерминации R2 используется для проверки существенности уравнения линейной регрессии в целом.
Проверка значимости модели регрессии проводится с использованием F-критерия Фишера, расчетное значение которого находится как отношение дисперсии исходного ряда наблюдений изучаемого показателя и несмещенной оценки дисперсии остаточной последовательности для данной модели.
Если
расчетное значение с k1=(m) и k2=(n-m-1)
степенями свободы больше табличного
при заданном уровне значимости, то модель
считается значимой.
где m – число факторов в модели.
Оценка статистической значимости парной линейной регрессии производится по следующему алгоритму:
1. Выдвигается
нулевая гипотеза о том, что
уравнение в целом
2. Далее
определяю фактическое значение F-критерия:
где m=1 для парной регрессии.
3. Табличное
значение определяется по
Fтабл - это максимально возможное значение критерия под влиянием случайных факторов при данных степенях свободы и уровне значимости α. Уровень значимости α - вероятность отвергнуть правильную гипотезу при условии, что она верна. Обычно α принимается равной 0,05 или 0,01.
4. Если фактическое значение F-критерия меньше табличного, то говорят, что нет основания отклонять нулевую гипотезу.
В противном случае, нулевая гипотеза отклоняется и с вероятностью (1-α) принимается альтернативная гипотеза о статистической значимости уравнения в целом.
Табличное значение критерия со степенями свободы k1=1 и k2=8, Fтабл = 5.32
Вывод: Поскольку фактическое значение F > Fтабл, то коэффициент детерминации статистически значим (найденная оценка уравнения регрессии статистически надежна).
Связь
между F-критерием Фишера и t-статистикой
Стьюдента выражается равенством:
6. Дисперсионный анализ.
При анализе качества модели регрессии используется теорема о разложении дисперсии, согласно которой общая дисперсия результативного признака может быть разложена на две составляющие – объясненную и необъясненную уравнением регрессии дисперсии.
Задача дисперсионного анализа состоит в анализе дисперсии зависимой переменной:
∑(yi - ycp)2 = ∑(y(x) - ycp)2 + ∑(y - y(x))2
где
∑(yi - ycp)2 - общая сумма квадратов отклонений;
∑(y(x) - ycp)2 - сумма квадратов отклонений, обусловленная регрессией («объясненная» или «факторная»);
∑(y
- y(x))2 - остаточная сумма квадратов
отклонений.
Источник вариации | Сумма квадратов | Число степеней свободы | Дисперсия на 1 степень свободы | F-критерий |
Модель | 611.86 | 1 | 611.86 | 99.33 |
Остаточная | 49.28 | 8 | 6.16 | 1 |
Общая | 661.14 | 10-1 |
7. Выберите прогнозную точку хп в стороне от основного массива данных. Используя уравнение регрессии, выполните точечный прогноз для величины Y в точке хп .
Решение:
Если
хi=12, то
8. Рассчитайте доверительные
интервалы для уравнения регрессии и для
результирующего признака
при
доверительной вероятности
=95%.
Доверительные интервалы для зависимой переменной.
Экономическое прогнозирование на основе построенной модели предполагает, что сохраняются ранее существовавшие взаимосвязи переменных и на период упреждения. Для прогнозирования зависимой переменной результативного признака необходимо знать прогнозные значения всех входящих в модель факторов.
Прогнозные значения факторов подставляют в модель и получают точечные прогнозные оценки изучаемого показателя.
(a + bxp ± ε)
где
Рассчитаем
границы интервала, в котором будет
сосредоточено 95% возможных значений Y
при неограниченно большом числе наблюдений
и Xp = 7
(101.46 -3.2*7 ± 1.85)
(77.22;80.93)
С вероятностью 95% можно гарантировать, что значения Y при неограниченно большом числе наблюдений не выйдет за пределы найденных интервалов.
Индивидуальные доверительные интервалы для Y при данном значении X.
(a + bxi ± ε)
где
tкрит
(n-m-1;α/2) = (8;0.025) = 2.306
xi | y = 101.46 + -3.2xi | εi | ymin = y - εi | ymax = y + εi |
11.1 | 65.97 | 6.91 | 59.05 | 72.88 |
9 | 72.68 | 6.29 | 66.39 | 78.97 |
7.9 | 76.2 | 6.1 | 70.1 | 82.29 |
8.5 | 74.28 | 6.19 | 68.09 | 80.47 |
5.6 | 83.55 | 6.04 | 77.51 | 89.59 |
6.2 | 81.63 | 6.01 | 75.63 | 87.64 |
5 | 85.47 | 6.1 | 79.37 | 91.57 |
4.7 | 86.43 | 6.14 | 80.29 | 92.57 |
3 | 91.87 | 6.53 | 85.34 | 98.39 |
С вероятностью
95% можно гарантировать, что значения
Y при неограниченно большом
Доверительный интервал для коэффициентов уравнения регрессии.
Определим
доверительные интервалы
(b - tкрит Sb; b + tкрит Sb)
(-3.1976 - 2.306 • 0.32; -3.1976 + 2.306 • 0.32)
(-3.9375;-2.4578)
С вероятностью 95% можно утверждать, что значение данного параметра будут лежать в найденном интервале.
(a - tкрит Sa; a + tкрит Sa)
(101.4586 - 2.306 • 2.22; 101.4586 + 2.306 • 2.22)
(96.3411;106.5762)
С вероятностью
95% можно утверждать, что значение
данного параметра будут лежать
в найденном интервале.
9. Изобразите в одной системе координат:
а) исходные данные,
б) линию регрессии,
в) точечный прогноз,
г) 95% доверительные
интервалы.
Вывод: поскольку 98% точек наблюдения попало в 95% доверительный интервал данная модель и ее доверительные границы могут использоваться для прогнозирования с 95% доверительной вероятностью.