Корреляционный анализ

Автор: Пользователь скрыл имя, 02 Февраля 2013 в 18:59, контрольная работа

Краткое описание

Корреляция – это статистическая зависимость между случайными величинами, не имеющими строго функционального характера, при которойизменение одной из случайных величин приводит к изменению математического ожидания другой.
Корреляционный анализ имеет своей задачей количественное определение тесноты связи между двумя признаками (при парной связи) и между результативным и множеством факторных признаков (при многофакторной связи).

Оглавление

1. Основные теоретические предпосылки применения 1. Основные теоретические предпосылки применения корреляционного анализа.………………………………………………………………………………....3
Задача 1..……………………………………………………………………...…....4
Список используемой литературы……………………………………………..10.………………………………………………………………………………....3
Задача 1..……………………………………………………………………...…....4
Список используемой литературы……………………………………………..10

Файлы: 1 файл

Конт.doc

— 184.50 Кб (Скачать)


Министерство образования  и науки Российской Федерации

Федеральное государственное  бюджетное

образовательное учреждение

высшего профессионального  образования 

«СТАВРОПОЛЬСКИЙ ГОСУДАРСТВЕННЫЙ  АГРАРНЫЙ УНИВЕРСИТЕТ»

 

 

 

ИНДИВИДУАЛЬНОЕ  КОНТРОЛЬНОЕ ЗАДАНИЕ

по курсу «Эконометрика»

 

 

 

 

 

                                                                    

Выполнил: Григорян А.Г.

                                                                              Студент 3-его курса

Специальности

080105.65- «Финансы и креды»                                                                Заочного отделения

Преподаватель: Герасимов А.Н.

 

 

 

 

Ставрополь 2013г.

Содержание.

1. Основные  теоретические предпосылки применения  корреляционного анализа.………………………………………………………………………………....3

Задача 1..……………………………………………………………………...…....4

Список используемой литературы……………………………………………..10

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1. Основные теоретические предпосылки применения корреляционного анализа. 
Корреляция – это статистическая зависимость между случайными величинами, не имеющими строго функционального характера, при которойизменение одной из случайных величин приводит к изменению математического ожидания другой.                                    

Корреляционный  анализ имеет своей задачей количественное определение тесноты связи между двумя признаками (при парной связи) и между результативным и множеством факторных признаков (при многофакторной связи). 
Теоретические предпосылки применения методики корреляционного анализа:

  1. Основной предпосылкой применения корреляционного анализа является необходимость подчинения совокупности значений всех факторных (х1,х2,…, хn) и результативного (Y) признаков r-мерному нормальному закону распределения или близость к нему. Если объем исследуемой совокупности достаточно большой (n > 50), то нормальность распределения может быть подтверждена на основе расчета и анализа критериев Пирсона, Ястремского, Боярского, Колмогорова, чисел Вастергарда и т.д. Если n < 50, то закон распределения исходных данных определяется на базе построения и визуального анализа поля корреляции. При этом если в расположении точек имеет место линейная тенденция, то можно предположить, что совокупность исходных данных (Y, х1, х2,…,хk) подчиняется нормальному распределению.
  2. Все случайные процессы xj(f) и yj(f) должны быть стационарными.

Перечисленные выше теоретические  предпосылки корреляционного анализа  являются довольно жесткими ограничениями, однако в ряде случаев они все  же удовлетворяются.

Задача 1.Построить модель связи между указанными факторами, проверить её адекватность, осуществить точечный прогноз методом экстраполяции.

1.1. Исходные данные отложить на координатной плоскости и сделать предварительное заключение о наличии связи.        

      Таб.1                                                                                                         Диагр.1

X

Y

12,5

98,5

11,1

96,3

9,0

99,6

7,9

95,4

8,5

83,7

5,6

75,7

5,0

70,0

6,2

72,2

4,7

69,5

3,0

66,0




Вывод: Из диаграммы 1 видно, что связь между факторами x и y прямая сильная линейная связь.

1.2.Рассчитайте линейный коэффициент корреляции. Используя t-критерий Стьюдента, проверьте значимость коэффициента корреляции. Сделайте вывод о тесноте связи между факторами х и у, используя шкалу Чеддока.

Таб.2

xy

1

12,5

98,5

156,25

9702,25

1231,25

  103,75

-5,25

0,053

2

11,1

96,3

123,21

9273,69

1068,93

98,009

-1,709

0,018

3

9,0

99,6

81,0

9920,16

896,4

89,42

10,18

0,102

4

7,9

95,4

62,41

9101,16

753,66

84,921

10,479

0,109

5

8,5

83,7

72,25

7005,69

711,45

87,375

-3,675

0,043

6

5,6

75,5

31,36

5700,25

422,8

75,514

-0,01

0,0001

7

5,0

70,0

25,0

4900

350

73,06

-3,06

0,044

8

6,2

72,2

38,44

5212,84

447,64

77,968

-5,768

0,079

9

4,7

69,5

22,09

4830,25

326,65

71,833

-2,333

0,034

10

3,0

66,0

9,0

4356

198

64,88

1,12

0,017

ИТОГО:

73,5

826,7

621,01

70002,29

6406,78

826,73

 

0,4991

Среднее зн.

7,35

82,67

62,101

7000,229

640,678

82,673

 

0,04991


Проверим тесноту связи  между факторами, рассчитаем ЛКК:

 

Вывод: по шкале Чеддока связь сильная.

Проверим статистическую значимость ЛКК по критерию Стьюдента:

1)Критерий Стьюдента: tвыб<=tкр

2)Но: r=0  tкр=2,31      

tвыб=rвыб*    

Вывод: таким образом поскольку tвыб=5,84<tкр=2,31, то с доверительной вероятностью 90% нулевая гипотеза отвергается, это указывает на наличие сильной линейной связи.

1.3.Полагая, что связь между факторами х и у может быть описана линейной функцией, используя процедуру метода наименьших квадратов, запишите систему нормальных уравнений относительно коэффициентов линейного уравнения регрессии. Любым способом рассчитайте эти коэффициенты.

Последовательно подставляя в уравнение  регрессии  из графы (2) табл.2, рассчитаем значения  и заполним графу (7) табл.2

1.4.Для полученной модели связи между факторами Х и У рассчитайте среднюю ошибку аппроксимации. Сделайте предварительное заключение приемлемости полученной модели.

Для расчета заполним 8-ую и 9-ую графу  табл.2

<Екр=12%

Ошибка аппроксимации  в пределах 5%-7% свидетельствует о  хорошем подборе уравнения регрессии  к исходным данным.

Вывод: модель следует признать удовлетворительной.

1.5. Проверьте значимость коэффициента уравнения регрессии A1 на основе t-критерия Стьюдента.

Решение:                                                                     Таб.3

 

 

 

 

 

 

1

12,5

98,5

103,75

27,563

214,6225

250,5889

2

11,1

96,3

98,009

2,921

82,81

185,7769

3

9,0

99,6

89,42

103,632

40,0689

286,6249

4

7,9

95,4

84,921

109,809

8,2369

162,0529

5

8,5

83,7

87,375

13,506

0,0081

1,0609

6

5,6

75,5

75,514

0,0001

4,7089

51,4089

7

5,0

70,0

73,06

9,364

29,7025

160,5289

8

6,2

72,2

77,968

33,270

22,6576

109,6209

9

4,7

69,5

71,833

5,443

209,0916

173,4489

10

3,0

66,0

64,88

1,254

120,7801

277,8889

ИТОГО:

73,5

826,7

826,73

306,761

732,6871

1659,001

Среднее

7,35

82,67

82,673

     

 

Для оценки статистической значимости коэффициентов регрессии  и корреляции рассчитываются t-критерий Стьюдента и доверительные интервалы  каждого из показателей. Выдвигается гипотеза Н0 о случайной природе показателей, т.е. о незначимом их отличии от нуля.

Чтобы проверить, значимы  ли параметры, т.е. значимо ли они  отличаются от нуля для генеральной  совокупности использую статистические методы проверки гипотез.

В качестве основной (нулевой) гипотезы выдвигаю гипотезу о незначимом отличии от нуля  параметра или статистической характеристики в генеральной совокупности. Наряду с основной (проверяемой) гипотезой выдвигаю альтернативную (конкурирующую) гипотезу о неравенстве нулю параметра или статистической характеристики в генеральной совокупности.

Проверим гипотезу H0 о равенстве отдельных коэффициентов регрессии нулю (при альтернативе H1 не равно) на уровне значимости α=0,05.

В случае если основная гипотеза окажется неверной, мы принимаем альтернативную. Для проверки этой гипотезы используется t-критерий Стьюдента.

Найденное по данным наблюдений значение  t-критерия (его еще называют наблюдаемым или фактическим) сравнивается с табличным (критическим) значением, определяемым по таблицам распределения Стьюдента.

Табличное значение определяется в зависимости от уровня значимости (α) и числа степеней свободы, которое  в случае линейной парной регрессии  равно (n-2), n-число наблюдений.

Если фактическое значение  t-критерия больше табличного (по модулю), то основную гипотезу отвергают и считают, что с вероятностью (1-α) параметр или статистическая характеристика в генеральной совокупности значимо отличается от нуля.

Если фактическое значение  t-критерия меньше табличного (по модулю), то нет оснований отвергать основную гипотезу, т.е. параметр или статистическая характеристика в генеральной совокупности незначимо отличается от нуля при уровне значимости α.

tкрит (n-m-1;α/2) = (8;0.025) = 2.306

Вывод:Поскольку 15,01> 2.306, то статистическая значимость коэффициента регрессии A1 подтверждается (отвергаем гипотезу о равенстве нулю этого коэффициента).

1.6 Проверьте адекватность модели в целом с помощью F-критерия Фишера-Снедекора. Сформулируйте выводы.

Коэффициент детерминации R2 используется для проверки существенности уравнения линейной регрессии в целом.

Проверка значимости модели регрессии проводится с использованием F-критерия Фишера, расчетное значение которого находится как отношение дисперсии исходного ряда наблюдений изучаемого показателя и несмещенной оценки дисперсии остаточной последовательности для данной модели.

Если расчетное значение с k1=(m) и k2=(n-m-1) степенями свободы больше табличного при заданном уровне значимости, то модель считается значимой.

где m – число факторов в модели.

Оценка статистической значимости парной линейной регрессии  производится по следующему алгоритму:

1. Выдвигается нулевая гипотеза о том, что уравнение в целом статистически незначимо: H0: R2=0 на уровне значимости α.

2. Далее определяю  фактическое значение F-критерия:

 

где m=1 для парной регрессии.

3. Табличное значение определяется по таблицам распределения Фишера для заданного уровня значимости, принимая во внимание, что число степеней свободы для общей суммы квадратов (большей дисперсии) равно 1 и число степеней свободы остаточной суммы квадратов (меньшей дисперсии) при линейной регрессии равно n-2.

Fтабл - это максимально возможное значение критерия под влиянием случайных факторов при данных степенях свободы и уровне значимости α.

Уровень значимости α - вероятность  отвергнуть правильную гипотезу при  условии, что она верна. Обычно α принимается равной 0,05 или 0,01.

4. Если фактическое  значение F-критерия меньше табличного, то говорят, что нет основания  отклонять нулевую гипотезу.

В противном случае, нулевая  гипотеза отклоняется и с вероятностью (1-α) принимается альтернативная гипотеза о статистической значимости уравнения в целом.

Табличное значение критерия со степенями свободы k1=1 и k2=8, Fтабл = 5.32

Вывод: Поскольку фактическое значение F > Fтабл, то коэффициент детерминации статистически значим (найденная оценка уравнения регрессии статистически надежна).Связь между F-критерием Фишера и t-статистикой Стьюдента выражается равенством:

1.7.Рассчитайте средний коэффициент эластичности (Э). Что он означает?

Коэффициент эластичности находится по формуле:

 

Средний коэффициент  эластичности Э показывает, на сколько процентов в среднем по совокупности изменится результат у от своей средней величины при изменении фактора х на 1% от своего среднего значенияю.В нашем случае Это озночает, что если фактор измениться на 1%, то в среднем на 0,36% измениться результат.

1.8.Сформулируйте общий вывод относительно полученной модели.

Вычислив все показатели, можно сделать вывод о качественно  составленной модели, так как фактическое значение t-критерия Стьюдента параметра

( ta1=15,01) выше табличного (tкрит=2,306), значение F-критерия Фишера (F=34,11) также значительно больше табличного (Fкрит = 5,32).

Информация о работе Корреляционный анализ