Автор: Пользователь скрыл имя, 18 Декабря 2012 в 19:09, лабораторная работа
1.Цель работы – изучить методику выполнения корреляционно-регрессионного анализа, по фактическим данным выполнить корреляционно-регрессионный анализ, проанализировать полученные результаты.
Задача: Определить влияние численности на доходы населения.
2. Исходные данные берем с сайта www.gks.ru.
3. Подготовим исходные данные к корреляционно-регрессионному анализу.
Уфа – 2012
Лабораторная работа №1.
Корреляционно-регрессионный анализ
1.Цель работы – изучить методику выполнения корреляционно-регрессионного анализа, по фактическим данным выполнить корреляционно-регрессионный анализ, проанализировать полученные результаты.
Задача: Определить влияние численности на доходы населения.
2. Исходные данные берем с сайта www.gks.ru.
3. Подготовим исходные данные к корреляционно-регрессионному анализу.
Таблица 1- Исходные данные.
Года |
численность населения(у) |
Доходы населения (х) |
2003 |
145 |
5170,4 |
2004 |
144,2 |
6410,3 |
2005 |
143,5 |
811,9 |
2006 |
142,8 |
10196 |
2007 |
142,2 |
12602,7 |
2008 |
142 |
14948 |
2009 |
141,1 |
17008,6 |
Исходные данные являются полными, адекватными, однородными, достоверными, сопоставимыми.
4.1. Корреляционный анализ.
4.1.1. Измерение тесноты связи - количественное выражение согласованности и направленности.
Расчитаем коэффициент корреляции.
Таблица 2- Корреляционная матрица.
Численность населения |
Доходы населения | |
Численность населения |
1 |
|
Доходы населения |
-0,833293772 |
1 |
Корреляционная
матрица (таблица 2) содержит частные
коэффициенты корреляции. Коэффициенты
второго столбца матрицы
4.1.2. Проверка значимости.
Полученный коэффициент корреляции проверяем на значимость с помощью таблицы критических значений Пирсона.
Для этого выбираем уровень ошибки=0,1. Вычисляем df(степень свободы) по формуле df=7-2, df=5. Получаем критический коэффициент r=0,669,так как 0,833>0,669 делаем вывод о значимой корреляции (r=0,833;p≤0,1).
Также значимость коэффициента корреляции можно проверить на основе t-критерия Стьюдента.
4.2.Регрессионный анализ
4.2.1. Выбор регрессионной модели.
Выберем модель с помощью графического анализа (диаграмма рассеивания- корреляционное поле)
Связь близка к линейной, поэтому в качестве формы модели целесообразно выбрать линейную функцию.
4.2.2.Критерием выбора модели является коэффициент детерминации.
Таблица 3- Регрессионная статистика.
Регрессионная статистика |
|
Множественный R |
0,833293772 |
R-квадрат |
0,694378511 |
Нормированный R-квадрат |
0,633254213 |
Стандартная ошибка |
3495,407752 |
Наблюдения |
7 |
Линейный коэффициент корреляции R = 0,83329 показывает, что теснота связи между численностью населения и доходами сильная. Коэффициент детерминации (R-квадрат) D = 0,6944, т.е. 69,44% вариации доходы населения объясняются вариацией численности населения.
Таблица 4- Дисперсионный анализ
df |
SS |
MS |
F |
Значимость F | |
Регрессия |
1 |
138796360,6 |
138796360,6 |
11,36010612 |
0,019879397 |
Остаток |
5 |
61089376,77 |
12217875,35 |
||
Итого |
6 |
199885737,3 |
Проверим
значимость коэффициента корреляции,
для этого воспользуемся F-
Таблица 5- Коэффициенты регрессии
Коэффициенты |
Стандартная ошибка |
t-статистика |
P-Значение | |
Y-пересечение |
144,844394 |
0,63610362 |
227,7056592 |
3,09988E-11 |
Переменная X 1 |
-0,000195252 |
5,79301E-05 |
-3,370475652 |
0,019879397 |
Продолжение таблицы 5
Нижние 95% |
Верхние 95% |
Нижние 95,0% |
Верхние 95,0% | |
Y-пересечение |
143,2092 |
146,4796 |
143,2092 |
146,4796 |
Переменная X 1 |
-0,00034 |
-4,6E-05 |
-0,00034 |
-4,6E-05 |
Используя таблицу 5 составим уравнение регрессии:
У = 144,844 – 0,0002Х
Интерпретация полученных параметров следующая:
а0 = 144,844 – свободный член уравнения регрессии, содержательной интерпретации не подлежит;
а1 = – 0,0002 – коэффициент чистой регрессии свидетельствует о том, что при увеличении доходов населения на 1 тыс.руб. численность населения уменьшатся на 0,0002%
4.2.3.Проверку значимости коэффициентов регрессии осуществим с помощью t-критерия Стьюдента; для этого сравним фактические значения t-критерия с табличным значением t-критерия. При вероятности ошибки α = 0,05 и степени свободы v= n-k-1=7-1-1 =5, где k – число факторов в модели, n – число наблюдений, tтабл =2,57 . Получим: tфакт = -3,37 > tтабл =2,57
Значит, фактор является статистически значимым. В этом случае модель пригодна для принятия решений.
Вывод: Изучив корреляционно-регрессионный анализ получили, что коэффициент корреляции равен -0,83329, это говорит о том, что связь между численностью и доходами населения обратная, сильная. При проверке значимости коэффициента корреляции выявили что, коэффициент корреляции значим и построенная модель в целом адекватна.
Уравнение регрессии У = 518044,79 – 3556,32Х. Проверку значимости регрессии осуществили с помощью t-критерия Стьюдента и из этого следует что модель пригодна для принятия решений. Коэффициент детерминации составляет 0,6944 – такое его значение говорит о том, что 69,44% изменений численности населения обусловлено влиянием вариации показателя доходов населения.