Автор: Пользователь скрыл имя, 17 Апреля 2014 в 04:41, задача
Задача 1. Поле корреляции. На основании поля корреляции можно выдвинуть гипотезу (для генеральной совокупности) о том, что связь между всеми возможными значениями X и Y носит линейный характер.
Задача 2. Оценка уравнения регрессии.
Средняя ошибка аппроксимации
Оценка дисперсии равна:
se2 = (Y - X*Y(X))T(Y - X*Y(X)) = 9405.78
Несмещенная оценка дисперсии равна:
Оценка среднеквадратичного отклонения равна (стандартная ошибка для оценки Y):
Найдем оценку ковариационной матрицы вектора k = S • (XTX)-1
Дисперсии параметров модели определяются соотношением S2i = Kii, т.е. это элементы, лежащие на главной диагонали
Частные коэффициенты эластичности.
С целью расширения возможностей содержательного анализа модели регрессии используются частные коэффициенты эластичности, которые определяются по формуле:
Частный коэффициент эластичности показывает, насколько процентов в среднем изменяется признак-результат у с увеличением признака-фактора хj на 1% от своего среднего уровня при фиксированном положении других факторов модели.
Частный коэффициент эластичности |E1| < 1. Следовательно, его влияние на результативный признак Y незначительно.
Частный коэффициент эластичности |E2| < 1. Следовательно, его влияние на результативный признак Y незначительно.
Сравнительная оценка влияния анализируемых факторов на результативный признак.
Сравнительная оценка влияния анализируемых факторов на результативный признак
Связь между признаком Y факторами X сильная
Коэффициент детерминации.
R2= 0.852 = 0.73
Проверка гипотез относительно коэффициентов уравнения регрессии (проверка значимости параметров множественного уравнения регрессии).
Число v = n - m - 1 называется числом степеней свободы. Считается, что при оценивании множественной линейной регрессии для обеспечения статистической надежности требуется, чтобы число наблюдений, по крайней мере, в 3 раза превосходило число оцениваемых параметров.
1) t-статистика
Tтабл (n-m-1;α/2) = (9;0.025) = 2.262
Находим стандартную ошибку коэффициента регрессии b0:
Статистическая значимость коэффициента регрессии b0 подтверждается.
Находим стандартную ошибку коэффициента регрессии b1:
Статистическая значимость коэффициента регрессии b1 подтверждается.
Находим стандартную ошибку коэффициента регрессии b2:
Статистическая значимость коэффициента регрессии b2 подтверждается.
Доверительный интервал для коэффициентов уравнения регрессии.
Определим доверительные интервалы коэффициентов регрессии, которые с надежность 95% будут следующими:
(bi - ti Sbi; bi + ti Sbi)
b0: (-26.74 - 2.262 • 5.15 ; -26.74 + 2.262 • 5.15) = (-38.39;-15.1)
b1: (0.41 - 2.262 • 0.0439 ; 0.41 + 2.262 • 0.0439) = (0.31;0.51)
b2: (1.73 - 2.262 • 0.0781 ; 1.73 + 2.262 • 0.0781) = (1.55;1.91)
Проверка общего качества уравнения множественной регрессии.
Оценка значимости уравнения множественной регрессии осуществляется путем проверки гипотезы о равенстве нулю коэффициент детерминации рассчитанного по данным генеральной совокупности: R2 или b1 = b2 =... = bm = 0 (гипотеза о незначимости уравнения регрессии, рассчитанного по данным генеральной совокупности).
Для ее проверки используют F-критерий Фишера.
При этом вычисляют фактическое (наблюдаемое) значение F-критерия, через коэффициент детерминации R2, рассчитанный по данным конкретного наблюдения.
По таблицам распределения Фишера-Снедоккора находят критическое значение F-критерия (Fкр). Для этого задаются уровнем значимости α (обычно его берут равным 0,05) и двумя числами степеней свободы k1=m и k2=n-m-1.
2) F-статистика. Критерий Фишера
Чем ближе этот коэффициент к единице, тем больше уравнение регрессии объясняет поведение Y.
Более объективной оценкой является скорректированный коэффициент детерминации:
Добавление в модель новых объясняющих переменных осуществляется до тех пор, пока растет скорректированный коэффициент детерминации.
Проверим гипотезу об общей значимости - гипотезу об одновременном равенстве нулю всех коэффициентов регрессии при объясняющих переменных:
H0: β1 = β2 = ... = βm = 0.
Проверка этой гипотезы осуществляется с помощью F-статистики распределения Фишера.
Если F < Fkp = Fα ; n-m-1, то нет оснований для отклонения гипотезы H0.
Табличное значение при степенях свободы k1 = 2 и k2 = n-m-1 = 12 - 2 - 1 = 9, Fkp(2;9) = 4.26
Поскольку фактическое значение F > Fkp, то коэффициент детерминации статистически значим и уравнение регрессии статистически надежно
Оценка значимости дополнительного включения фактора (частный F-критерий).
Мерой оценки значимости улучшения качества модели, после включения в нее фактора хj, служит частный F-критерий – Fxj:
где m – число оцениваемых параметров.
Оценим с помощью частного F-критерия:
1) целесообразность включения в модель регрессии факторов х1 после введения хj (Fx1).
Определим наблюдаемое значение частного F-критерия:
R2(x2,xn = r2(x2) = 0.80542 = 0.649
Fkp(k1=1;k2=9) = 5.12
Сравним наблюдаемое значение частного F-критерия с критическим:
Fx1>5.12, следовательно, фактор х1 целесообразно включать в модель после введения факторов хj.
2) целесообразность включения в модель регрессии факторов х2 после введения хj (Fx2).
Определим наблюдаемое значение частного F-критерия:
R2(x1,xn = r2(x1) = 0.52392 = 0.275
Сравним наблюдаемое значение частного F-критерия с критическим:
Fx2>5.12, следовательно, фактор х2 целесообразно включать в модель после введения факторов хj.