Автор: Пользователь скрыл имя, 13 Сентября 2013 в 10:08, контрольная работа
Задание №5
Известен вид модели авторегрессионного преобразования 2-го порядка АР(2):
Тогда автокорреляционная функция γ(τ) имеет вид:
γ ( τ ) = 2,5 γ (τ - 1) + 4,5 γ (τ - 2),
где τ > 0. (τ = 1,2).
Подставляя в автокорреляционную функцию γ(τ) значения τ = 1,2, получим известную систему уравнений Юла-Уокера
Задание 1
Исходные данные о продаже автомобилей записаны в виде следующей таблицы:
х |
22 |
21 |
22 |
21 |
22 |
22 |
23 |
24 |
24 |
23 |
у |
1 |
1 |
2 |
2 |
3 |
4 |
4 |
4 |
5 |
6 |
Трансформируем эту таблицу. Она примет вид:
х |
у |
1 |
22 |
1 |
21 |
2 |
22 |
2 |
21 |
3 |
22 |
4 |
22 |
4 |
23 |
4 |
24 |
5 |
24 |
6 |
23 |
Поскольку одинаковое количество продавцов в разные дни продавали разное количество машин, найдем среднее количество машин. Таблица примет вид:
х |
У |
1 |
21,5 |
2 |
21,5 |
3 |
22,0 |
4 |
23,0 |
5 |
24,0 |
6 |
23,0 |
Поскольку предлагаемая модель регрессии , является нелинейной по переменной х и метод наименьших квадратов применить нельзя, устраним нелинейность по переменной х путем замены переменной: . После этого уравнение регрессии становится линейным: . Для определения параметров a и b запишем следующую расчетную таблицу:
i |
z |
y |
z2 |
zy |
1 |
1.000 |
21.5 |
1 |
21.500 |
2 |
1.414 |
21.5 |
2 |
30.406 |
3 |
1.732 |
22.0 |
3 |
38.105 |
4 |
2.000 |
23.0 |
4 |
46.000 |
5 |
2.236 |
24.0 |
5 |
53.666 |
6 |
2.449 |
23.0 |
6 |
56.338 |
∑ |
10.832 |
135.0 |
21 |
246.015 |
Параметры a и b находим по формулам:
Где ; ;
В данном случае n=6
Подставляя в формулы значения сумм из предыдущей таблицы, получим:
= 1.805; =22.5; = 3.5; = 41.002
Находим значения параметров а и b:
Таким образом, гиперболическая модель регрессии имеет вид:
= 19,63+1,59
Оценим тесноту связи
с помощью показателей
=19,63+1,59·z
Коэффициент корреляции между z и y равен:
А коэффициент детерминации R2 равен:
Где : cov(z.y) =
var(
При этом выполняется равенство:
r
Запишем следующую расчетную таблицу:
i |
z |
y |
z2 |
zy |
(y- |
( |
(y- | |
1 |
1,000 |
21,5 |
1 |
21,500 |
21,219 |
1,000 |
1,640401 |
0,078838 |
2 |
1,414 |
21,5 |
2 |
30,406 |
21,878 |
1,000 |
0,386887 |
0,142882 |
3 |
1,732 |
22,0 |
3 |
38,105 |
22,383 |
0,250 |
0,013573 |
0,147069 |
4 |
2,000 |
23,0 |
4 |
46,000 |
22,810 |
0,250 |
0,095884 |
0,036233 |
5 |
2,236 |
24,0 |
5 |
53,666 |
23,185 |
2,250 |
0,469364 |
0,664059 |
6 |
2,449 |
23,0 |
6 |
56,338 |
23,525 |
0,250 |
1,049672 |
0,275137 |
∑ |
10,832 |
135,0 |
21 |
246,015 |
135,000 |
5,000 |
3,655782 |
1,344218 |
среднее |
1,805 |
22,5 |
3,5 |
41,002 |
22,5 |
0,833 |
0,609 |
0,224 |
var(y) |
var( |
var (e) |
Тогда имеем:
cov(z.y) = 41,002-1,805·22,5 = 0,383
var (z) = 3,5-1,8052 = 0,241
Проверим выполнение равенства
, т.е. расчеты проведены верно.
Чем ближе коэффициент детерминации к единице, тем лучше качество подгонки, т. Е. тем точнее аппроксимирует у.
Значение = 0,731 показывает, что 73,1% вариации зависимой переменной у (количество проданных автомобилей) объясняется регрессией. Определим с помощью среднего коэффициента эластичности силу влияния фактора на результат и оценим с помощью средней ошибки аппроксимации качество уравнения регрессии средний показатель эластичности рассчитывается по формуле.
Это означает, что с увеличением количества продавцов на 1% количество проданных автомобилей возрастет в среднем на 12,76%. Средняя ошибка аппроксимации это среднее отклонение расчетных значений от фактических значений, т.е.
Практически полагают, что значение средней ошибки аппроксимации не должно превышать 12-15% для грубого приближения регрессии к реальной зависимости.
Для расчета воспользуемся следующей таблицей
i |
y |
y- |
(y- |
|(y- | |
1 |
21,5 |
21,219 |
0,281 |
0,01306 |
0,01306 |
2 |
21,5 |
21,878 |
-0,378 |
-0,01758 |
0,017581 |
3 |
22,0 |
22,383 |
-0,383 |
-0,01743 |
0,017432 |
4 |
23,0 |
22,810 |
0,190 |
0,008276 |
0,008276 |
5 |
24,0 |
23,185 |
0,815 |
0,033954 |
0,033954 |
6 |
23,0 |
23,525 |
-0,525 |
-0,02281 |
0,022806 |
∑ |
135,0 |
135,000 |
0,000 |
-0,00253 |
0,113109 |
Таким образом, значение средней ошибки аппроксимации свидетельствует о высоком качестве уравнения регрессии.
Оценим статистическую значимость параметров а и b регрессии и корреляции с помощью t – критерия Стьюдента при уровне значимости α=0,05.
Пусть в теоретической зависимости y= α+ β·z+ε
Случайный член ε распределен
нормально с неизвестной
Выдвигаются нулевая гипотеза Н0 и конкурирующая гипотеза Н1:
Пусть по выборочным данным получена оценка b.
В качестве критерия проверки гипотезы Н0 принимают случайную величину
Которая имеет распределение Стьюдента с ʋ=n-2 степенями свободы вычисляется наблюдаемое значение критерия t. По таблице критических точек распределения Стьюдента по заданному уровню значимости α и числу степеней свободы ʋ=n-2 находят критическую точку tкр. Вычисленный критерий t сравнивается с критическим значением tкр.
Если | t |< tкр, то Н0 принимается;
Если | t |> tкр, то Н0 отвергается.
В экономических исследованиях проверку гипотез проводят при 5% и 1% уровнях значимости. Для установления значимости коэффициента регрессии b используется гипотеза Н0 : β = 0.
Тогда соответствующая t- статистика будет
Где Sb – стандартная ошибка коэффициента регрессии b , которая равна
- остаточная дисперсия.
Поскольку конкурирующая гипотеза Н1 : β ≠ 0 двусторонняя, то и критическая область двусторонняя. Аналогично решается вопрос с параметром a. В этом случае
Где
А также t-критерий для коэффициента корреляции rz,y:
Н0 : ρ = 0
Итак, оценим значимость коэффициента регрессии b=1,59
Найдем стандартную ошибку Sb:
Найдем tкр для α = 0,05 и ʋ = 6 – 2 = 4
tкр = 2,45
Так как tb = 3,3 > tкр = 2,45, то нулевая гипотеза Н0 отвергается, т.е. коэффициент регрессии b=1,59 значим.
Аналогично, имеем для а = 19,63:
tа = 21,7 > tкр = 2,45
Следовательно, коэффициент регрессии а=19,63 значим.
Для rz,y=0,855:
Так как tr = 3,3 > tкр = 2,45, то коэффициент корреляции rz,y=0,855 значим.
И, наконец, на последнем этапе выполним более строгую оценку статистической надежности моделирования с помощью F-критерия Фишера, т.е. проверим значимость коэффициента детерминации R2 по F-критерию. Для этого проверим нулевую гипотезу Н0 о статистической не значимости полученного уравнения регрессии по условию: если при заданном уровне значимости α теоретическое (расчетное) значение F-критерия больше его критического значения Fкр, то нулевая гипотеза отвергается и полученное уравнение регрессии принимается значимым.
Для модели парной регрессии число степеней свободы ʋ1=1 (одна объясняющая переменная) и ʋ2 = n – 2 При этом
Для нашего случая имеем:
Найдем Fкр для α=0,05 и ʋ1=1 и ʋ2 = 6 – 2 = 4:
Fкр=7,71
Так как F=10,87> Fкр=7,41, то нулевая гипотеза отвергается, коэффициент детерминации R2 значим.
Задание 2
Стандартная ошибка коэффициента b в уравнении парной линейной регрессии y = a + b · x + ε равна , т. е. .
Определим значимость коэффициента b с помощью t-критерия Стьюдента с вероятностью 97%. Тогда уровень значимости α=0,03. Поскольку для экономических исследований проверку гипотез проводят для α=0,05 или α=0,1 и , если нулевая гипотеза отклоняется при 1%-ном уровне значимости, то она автоматически отклоняется и при 5%-ном уровне значимости, а если принимается при 5%-ом уровне, то принимается и при 1%-ном уровне. Если же при 5%-ном уровне нулевая гипотеза отклоняется, а при 1%-ном принимается, то результат проверки гипотезы приводятся при двух уровнях значимости.
Тогда имеем:
Поскольку объем выборки не задан, будем считать его большим (n>30). Тогда число степеней свободы ʋ>30. Для таких ʋ критическое значение tкр практически больше t = 2 < tкр. Тогда нулевая гипотеза Н0 принимается для уровня значимости 2 = 0,02, следовательно, она принимается и для α = 0,03.
Таким образом, с вероятностью 97% можно утверждать, что коэффициент регрессии b не значим, следовательно результирующий фактор y не зависит от х.
Задание 3
В результате регрессионного анализа получено уравнение регрессии:
y = 7,1 + 0,6х + 0,4х2 + 0,1х3
t – статистики коэффициентов регрессии равны соответственно 24,5; 9,7; 0,7; 1,3. Коэффициент детерминации R2=0,9.
Оценим надежность уравнения
регрессии в целом с помощью F-