Автор: Пользователь скрыл имя, 17 Апреля 2014 в 04:41, задача
Задача 1. Поле корреляции. На основании поля корреляции можно выдвинуть гипотезу (для генеральной совокупности) о том, что связь между всеми возможными значениями X и Y носит линейный характер.
Задача 2. Оценка уравнения регрессии.
Умножаем матрицы, (XTX)
В матрице, (XTX) число 12, лежащее на пересечении 1-й строки и 1-го столбца, получено как сумма произведений элементов 1-й строки матрицы XT и 1-го столбца матрицы X
Умножаем матрицы, (XTY)
Находим обратную матрицу (XTX)-1
0.82 |
-0.00318 |
-0.00805 |
-0.00318 |
6.0E-5 |
-3.3E-5 |
-0.00805 |
-3.3E-5 |
0.000189 |
Вектор оценок коэффициентов регрессии равен
Уравнение регрессии (оценка уравнения регрессии)
Y = -26.74 + 0.41X1 + 1.73X2
Матрица парных коэффициентов корреляции.
Число наблюдений n = 12. Число независимых переменных в модели равно 2, а число регрессоров с учетом единичного вектора равно числу неизвестных коэффициентов. С учетом признака Y, размерность матрицы становится равным 4. Матрица, независимых переменных Х имеет размерность (12 х 4).
Матрица, составленная из Y и X
181 |
87 |
91 |
58 |
26 |
56 |
76 |
96 |
44 |
161 |
115 |
88 |
230 |
149 |
99 |
80 |
115 |
35 |
53 |
117 |
38 |
110 |
108 |
51 |
86 |
100 |
50 |
110 |
46 |
27 |
110 |
49 |
58 |
45 |
18 |
56 |
Транспонированная матрица.
1 |
1 |
1 |
1 |
1 |
1 |
1 |
1 |
1 |
1 |
1 |
1 |
181 |
58 |
76 |
161 |
230 |
80 |
53 |
110 |
86 |
110 |
110 |
45 |
87 |
26 |
96 |
115 |
149 |
115 |
117 |
108 |
100 |
46 |
49 |
18 |
91 |
56 |
44 |
88 |
99 |
35 |
38 |
51 |
50 |
27 |
58 |
56 |
Матрица ATA.
12 |
1300 |
1026 |
693 |
1300 |
175652 |
124477 |
86595 |
1026 |
124477 |
106306 |
62539 |
693 |
86595 |
62539 |
45897 |
Полученная матрица имеет следующее соответствие:
∑n |
∑y |
∑x1 |
∑x2 |
∑y |
∑y2 |
∑x1 y |
∑x2 y |
∑x1 |
∑yx1 |
∑x1 2 |
∑x2 x1 |
∑x2 |
∑yx2 |
∑x1 x2 |
∑x2 2 |
Найдем парные коэффициенты корреляции.
Признаки x и y |
∑xi |
∑yi |
∑xiyi |
|||
Для y и x1 |
1026 |
85.5 |
1300 |
108.33 |
124477 |
10373.08 |
Для y и x2 |
693 |
57.75 |
1300 |
108.33 |
86595 |
7216.25 |
Для x1 и x2 |
693 |
57.75 |
1026 |
85.5 |
62539 |
5211.58 |
Признаки x и y |
|||||
Для y и x1 |
1548.58 |
2901.56 |
39.35 |
53.87 |
0.52 |
Для y и x2 |
489.69 |
2901.56 |
22.13 |
53.87 |
0.81 |
Для x1 и x2 |
489.69 |
1548.58 |
22.13 |
39.35 |
0.31 |
Матрица парных коэффициентов корреляции.
- |
y |
x1 |
x2 |
y |
1 |
0.52 |
0.81 |
x1 |
0.52 |
1 |
0.31 |
x2 |
0.81 |
0.31 |
1 |
Проверим значимость полученных парных коэффициентов корреляции с помощью t-критерия Стьюдента. Коэффициенты, для которых значения t-статистики по модулю больше найденного критического значения, считаются значимыми.
Рассчитаем наблюдаемые значения t-статистики для ryx1 по формуле:
где m = 1 - количество факторов в уравнении регрессии.
По таблице Стьюдента находим Tтабл
tкрит(n-m-1;α/2) = (10;0.025) = 2.228
Поскольку tнабл < tкрит, то принимаем гипотезу о равенстве 0 коэффициента корреляции. Другими словами, коэффициент корреляции статистически - не значим
Рассчитаем наблюдаемые значения t-статистики для ryx2 по формуле:
Поскольку tнабл > tкрит, то отклоняем гипотезу о равенстве 0 коэффициента корреляции. Другими словами, коэффициент корреляции статистически - значим
Таким образом, связь между (y и xx2 ) является существенной.
Наибольшее влияние на результативный признак оказывает фактор x2 (r = 0.81), значит, при построении модели он войдет в регрессионное уравнение первым.
Частные коэффициенты корреляции.
На основании частных коэффициентов можно сделать вывод об обоснованности включения переменных в регрессионную модель. Если значение коэффициента мало или он незначим, то это означает, что связь между данным фактором и результативной переменной либо очень слаба, либо вовсе отсутствует, поэтому фактор можно исключить из модели.
Теснота связи не сильная
Определим значимость коэффициента корреляции ryx1 /x2 .
Для этого рассчитаем наблюдаемые значения t-статистики по формуле:
где k = 1 - число фиксируемых факторов.
По таблице Стьюдента находим Tтабл
tкрит(n-k-2;α/2) = (9;0.025) = 2.262
Поскольку tнабл < tкрит, то принимаем гипотезу о равенстве 0 коэффициента корреляции. Другими словами, коэффициент корреляции статистически - не значим
Как видим, связь y и x1 при условии, что x2 войдет в модель, снизилась. Отсюда можно сделать вывод, что ввод в регрессионное уравнение x1 остается нецелесообразным.
Можно сделать вывод, что при построении регрессионного уравнения следует отобрать факторы x2 .
Модель регрессии в стандартном масштабе предполагает, что все значения исследуемых признаков переводятся в стандарты (стандартизованные значения) по формулам:
где хji - значение переменной хji в i-ом наблюдении.
Таким образом, начало отсчета каждой стандартизованной переменной совмещается с ее средним значением, а в качестве единицы изменения принимается ее среднее квадратическое отклонение S.
Если связь между переменными в естественном масштабе линейная, то изменение начала отсчета и единицы измерения этого свойства не нарушат, так что и стандартизованные переменные будут связаны линейным соотношением:
ty = ∑βjtxj
Для оценки β-коэффциентов применим МНК. При этом система нормальных уравнений будет иметь вид:
rx1y=β1+rx1x2•β2 + ... + rx1xm•βm
rx2y=rx2x1•β1 + β2 + ... + rx2xm•βm
...
rxmy=rxmx1•β1 + rxmx2•β2 + ... + βm
Для наших данных (берем из матрицы парных коэффициентов корреляции):
0.524 = β1 + 0.315β2
0.805 = 0.315β1 + β2
Данную систему линейных уравнений решаем методом Гаусса: β1 = 0.3; β2 = 0.711;
Стандартизированная форма уравнения регрессии имеет вид:
y0 = 0.3x1 + 0.711x2
Найденные из данной системы β–коэффициенты позволяют определить значения коэффициентов в регрессии в естественном масштабе по формулам:
Анализ параметров уравнения регрессии.
Перейдем к статистическому анализу полученного уравнения регрессии: проверке значимости уравнения и его коэффициентов, исследованию абсолютных и относительных ошибок аппроксимации
Для несмещенной оценки дисперсии проделаем следующие вычисления:
Несмещенная ошибка ε = Y - Y(x) = Y - X*s (абсолютная ошибка аппроксимации)
Y |
Y(x) |
ε = Y - Y(x) |
ε2 |
(Y-Yср)2 |
|ε : Y| |
181 |
166.49 |
14.51 |
210.58 |
5280.44 |
0.4 |
58 |
80.85 |
-22.85 |
522.08 |
2533.44 |
0.87 |
76 |
88.85 |
-12.85 |
165.25 |
1045.44 |
0.43 |
161 |
172.81 |
-11.81 |
139.37 |
2773.78 |
0.33 |
230 |
205.82 |
24.18 |
584.88 |
14802.78 |
0.53 |
80 |
81.09 |
-1.09 |
1.19 |
802.78 |
0.35 |
53 |
87.1 |
-34.1 |
1163.05 |
3061.78 |
1.04 |
110 |
105.9 |
4.1 |
16.81 |
2.78 |
0.0152 |
86 |
100.88 |
-14.88 |
221.47 |
498.78 |
0.26 |
110 |
38.89 |
71.11 |
5057.27 |
2.78 |
0.0152 |
110 |
93.76 |
16.24 |
263.62 |
2.78 |
0.0152 |
45 |
77.56 |
-32.56 |
1060.22 |
4011.11 |
1.41 |
|
|
0 |
9405.78 |
34818.67 |
5.66 |