Автор: Пользователь скрыл имя, 02 Февраля 2013 в 18:59, контрольная работа
Корреляция – это статистическая зависимость между случайными величинами, не имеющими строго функционального характера, при которойизменение одной из случайных величин приводит к изменению математического ожидания другой.
Корреляционный анализ имеет своей задачей количественное определение тесноты связи между двумя признаками (при парной связи) и между результативным и множеством факторных признаков (при многофакторной связи).
1. Основные теоретические предпосылки применения 1. Основные теоретические предпосылки применения корреляционного анализа.………………………………………………………………………………....3
Задача 1..……………………………………………………………………...…....4
Список используемой литературы……………………………………………..10.………………………………………………………………………………....3
Задача 1..……………………………………………………………………...…....4
Список используемой литературы……………………………………………..10
Министерство образования и науки Российской Федерации
Федеральное государственное бюджетное
образовательное учреждение
высшего профессионального образования
«СТАВРОПОЛЬСКИЙ ГОСУДАРСТВЕННЫЙ АГРАРНЫЙ УНИВЕРСИТЕТ»
Выполнил: Григорян А.Г.
Студент 3-его курса
Специальности
080105.65- «Финансы и креды»
Преподаватель: Герасимов А.Н.
Ставрополь 2013г.
Задача
1..…………………………………………………………………….
Список используемой литературы……………………………………………..
1. Основные теоретические
предпосылки применения корреляционного
анализа.
Корреляция – это статистическая
зависимость между случайными величинами,
не имеющими строго функционального характера,
при которойизменение одной из случайных
величин приводит к изменению математического
ожидания другой.
Корреляционный
анализ имеет своей задачей количественное
определение тесноты связи между двумя
признаками (при парной связи) и между
результативным и множеством факторных
признаков (при многофакторной связи).
Теоретические предпосылки применения
методики корреляционного анализа:
Перечисленные выше теоретические
предпосылки корреляционного
Задача 1.Построить модель связи между указанными факторами, проверить её адекватность, осуществить точечный прогноз методом экстраполяции.
1.1. Исходные данные отложить на координатной плоскости и сделать предварительное заключение о наличии связи.
Таб.1
X |
Y |
12,5 |
98,5 |
11,1 |
96,3 |
9,0 |
99,6 |
7,9 |
95,4 |
8,5 |
83,7 |
5,6 |
75,7 |
5,0 |
70,0 |
6,2 |
72,2 |
4,7 |
69,5 |
3,0 |
66,0 |
Вывод: Из диаграммы 1 видно, что связь между факторами x и y прямая сильная линейная связь.
1.2.Рассчитайте линейный коэффициент корреляции. Используя t-критерий Стьюдента, проверьте значимость коэффициента корреляции. Сделайте вывод о тесноте связи между факторами х и у, используя шкалу Чеддока.
Таб.2
№ |
xy |
|||||||
1 |
12,5 |
98,5 |
156,25 |
9702,25 |
1231,25 |
103,75 |
-5,25 |
0,053 |
2 |
11,1 |
96,3 |
123,21 |
9273,69 |
1068,93 |
98,009 |
-1,709 |
0,018 |
3 |
9,0 |
99,6 |
81,0 |
9920,16 |
896,4 |
89,42 |
10,18 |
0,102 |
4 |
7,9 |
95,4 |
62,41 |
9101,16 |
753,66 |
84,921 |
10,479 |
0,109 |
5 |
8,5 |
83,7 |
72,25 |
7005,69 |
711,45 |
87,375 |
-3,675 |
0,043 |
6 |
5,6 |
75,5 |
31,36 |
5700,25 |
422,8 |
75,514 |
-0,01 |
0,0001 |
7 |
5,0 |
70,0 |
25,0 |
4900 |
350 |
73,06 |
-3,06 |
0,044 |
8 |
6,2 |
72,2 |
38,44 |
5212,84 |
447,64 |
77,968 |
-5,768 |
0,079 |
9 |
4,7 |
69,5 |
22,09 |
4830,25 |
326,65 |
71,833 |
-2,333 |
0,034 |
10 |
3,0 |
66,0 |
9,0 |
4356 |
198 |
64,88 |
1,12 |
0,017 |
ИТОГО: |
73,5 |
826,7 |
621,01 |
70002,29 |
6406,78 |
826,73 |
0,4991 | |
Среднее зн. |
7,35 |
82,67 |
62,101 |
7000,229 |
640,678 |
82,673 |
0,04991 |
Проверим тесноту связи между факторами, рассчитаем ЛКК:
Вывод: по шкале Чеддока связь сильная.
Проверим статистическую значимость ЛКК по критерию Стьюдента:
1)Критерий Стьюдента: tвыб<=
2)Но: r=0 tкр=2,31
tвыб=rвыб*
Вывод: таким образом поскольку tвыб=5,84<tкр=2,31, то с доверительной вероятностью 90% нулевая гипотеза отвергается, это указывает на наличие сильной линейной связи.
1.3.Полагая, что связь между факторами х и у может быть описана линейной функцией, используя процедуру метода наименьших квадратов, запишите систему нормальных уравнений относительно коэффициентов линейного уравнения регрессии. Любым способом рассчитайте эти коэффициенты.
Последовательно подставляя в уравнение регрессии из графы (2) табл.2, рассчитаем значения и заполним графу (7) табл.2
1.4.Для полученной модели связи между факторами Х и У рассчитайте среднюю ошибку аппроксимации. Сделайте предварительное заключение приемлемости полученной модели.
Для расчета заполним 8-ую и 9-ую графу табл.2
<Екр=12%
Ошибка аппроксимации
в пределах 5%-7% свидетельствует о
хорошем подборе уравнения
Вывод: модель следует признать удовлетворительной.
1.5. Проверьте значимость коэффициента уравнения регрессии A1 на основе t-критерия Стьюдента.
Решение:
|
|
|
|
| ||
1 |
12,5 |
98,5 |
103,75 |
27,563 |
214,6225 |
250,5889 |
2 |
11,1 |
96,3 |
98,009 |
2,921 |
82,81 |
185,7769 |
3 |
9,0 |
99,6 |
89,42 |
103,632 |
40,0689 |
286,6249 |
4 |
7,9 |
95,4 |
84,921 |
109,809 |
8,2369 |
162,0529 |
5 |
8,5 |
83,7 |
87,375 |
13,506 |
0,0081 |
1,0609 |
6 |
5,6 |
75,5 |
75,514 |
0,0001 |
4,7089 |
51,4089 |
7 |
5,0 |
70,0 |
73,06 |
9,364 |
29,7025 |
160,5289 |
8 |
6,2 |
72,2 |
77,968 |
33,270 |
22,6576 |
109,6209 |
9 |
4,7 |
69,5 |
71,833 |
5,443 |
209,0916 |
173,4489 |
10 |
3,0 |
66,0 |
64,88 |
1,254 |
120,7801 |
277,8889 |
ИТОГО: |
73,5 |
826,7 |
826,73 |
306,761 |
732,6871 |
1659,001 |
Среднее |
7,35 |
82,67 |
82,673 |
Для оценки статистической
значимости коэффициентов регрессии
и корреляции рассчитываются t-критерий
Стьюдента и доверительные
Чтобы проверить, значимы ли параметры, т.е. значимо ли они отличаются от нуля для генеральной совокупности использую статистические методы проверки гипотез.
В качестве основной (нулевой) гипотезы выдвигаю гипотезу о незначимом отличии от нуля параметра или статистической характеристики в генеральной совокупности. Наряду с основной (проверяемой) гипотезой выдвигаю альтернативную (конкурирующую) гипотезу о неравенстве нулю параметра или статистической характеристики в генеральной совокупности.
Проверим гипотезу H0 о равенстве отдельных коэффициентов регрессии нулю (при альтернативе H1 не равно) на уровне значимости α=0,05.
В случае если основная гипотеза окажется неверной, мы принимаем альтернативную. Для проверки этой гипотезы используется t-критерий Стьюдента.
Найденное по данным наблюдений значение t-критерия (его еще называют наблюдаемым или фактическим) сравнивается с табличным (критическим) значением, определяемым по таблицам распределения Стьюдента.
Табличное значение определяется в зависимости от уровня значимости (α) и числа степеней свободы, которое в случае линейной парной регрессии равно (n-2), n-число наблюдений.
Если фактическое значение t-критерия больше табличного (по модулю), то основную гипотезу отвергают и считают, что с вероятностью (1-α) параметр или статистическая характеристика в генеральной совокупности значимо отличается от нуля.
Если фактическое значение t-критерия меньше табличного (по модулю), то нет оснований отвергать основную гипотезу, т.е. параметр или статистическая характеристика в генеральной совокупности незначимо отличается от нуля при уровне значимости α.
tкрит (n-m-1;α/2) = (8;0.025) = 2.306
Вывод:Поскольку 15,01> 2.306, то статистическая значимость коэффициента регрессии A1 подтверждается (отвергаем гипотезу о равенстве нулю этого коэффициента).
1.6 Проверьте адекватность модели в целом с помощью F-критерия Фишера-Снедекора. Сформулируйте выводы.
Коэффициент детерминации R2 используется для проверки существенности уравнения линейной регрессии в целом.
Проверка значимости модели регрессии проводится с использованием F-критерия Фишера, расчетное значение которого находится как отношение дисперсии исходного ряда наблюдений изучаемого показателя и несмещенной оценки дисперсии остаточной последовательности для данной модели.
Если расчетное значение с k1=(m) и k2=(n-m-1) степенями свободы больше табличного при заданном уровне значимости, то модель считается значимой.
где m – число факторов в модели.
Оценка статистической значимости парной линейной регрессии производится по следующему алгоритму:
1. Выдвигается нулевая гипотеза о том, что уравнение в целом статистически незначимо: H0: R2=0 на уровне значимости α.
2. Далее определяю фактическое значение F-критерия:
где m=1 для парной регрессии.
3. Табличное значение определяется по таблицам распределения Фишера для заданного уровня значимости, принимая во внимание, что число степеней свободы для общей суммы квадратов (большей дисперсии) равно 1 и число степеней свободы остаточной суммы квадратов (меньшей дисперсии) при линейной регрессии равно n-2.
Fтабл - это максимально возможное значение критерия под влиянием случайных факторов при данных степенях свободы и уровне значимости α.
Уровень значимости α - вероятность отвергнуть правильную гипотезу при условии, что она верна. Обычно α принимается равной 0,05 или 0,01.
4. Если фактическое значение F-критерия меньше табличного, то говорят, что нет основания отклонять нулевую гипотезу.
В противном случае, нулевая гипотеза отклоняется и с вероятностью (1-α) принимается альтернативная гипотеза о статистической значимости уравнения в целом.
Табличное значение критерия со степенями свободы k1=1 и k2=8, Fтабл = 5.32
Вывод: Поскольку фактическое значение F > Fтабл, то коэффициент детерминации статистически значим (найденная оценка уравнения регрессии статистически надежна).Связь между F-критерием Фишера и t-статистикой Стьюдента выражается равенством:
1.7.Рассчитайте средний коэффициент эластичности (Э). Что он означает?
Коэффициент эластичности находится по формуле:
Средний коэффициент эластичности Э показывает, на сколько процентов в среднем по совокупности изменится результат у от своей средней величины при изменении фактора х на 1% от своего среднего значенияю.В нашем случае Это озночает, что если фактор измениться на 1%, то в среднем на 0,36% измениться результат.
1.8.Сформулируйте общий вывод относительно полученной модели.
Вычислив все показатели,
можно сделать вывод о
( ta1=15,01) выше табличного (tкрит=2,306), значение F-критерия Фишера (F=34,11) также значительно больше табличного (Fкрит = 5,32).