Автор: Пользователь скрыл имя, 13 Марта 2012 в 14:07, контрольная работа
Задачами работы являются:
- изучение построения уравнения множественной регрессии;
- изучение множественной корреляциии
-включение факторов в уравнение множественной регрессии
- проверка качества построенной модели
- оценка мультиколлинеарности факторов
- оценка гетероскедастичности
- рассмотрение изучаемой темы на практических примерах
Введение
1. Множественная регрессия
2. Множественная корреляция
3. Включение факторов в уравнение множественной регрессии
4. Проверка качества построенной модели
5. Оценка мультиколлинеарности факторов
6. Оценка гетероскедастичности
Практическая часть
Пример 1
Пример 2
Заключение
Список литературы
Для определения неизвестных параметров b0 , b1 , b2 уравнения множественной линейной регрессии используем стандартную систему нормальных уравнений, которая имеет вид:
(7)
Для решения этой системы вначале необходимо определить значения величин Σ x12 , Σ x22 , Σ x1y , Σ x2y , Σ x1 x2 . Эти значения определяем из таблицы 1, дополняя ее соответствующими колонками (табл. 2).
Таблица 2
К расчету коэффициентов регрессии
№ п/п | yi | x1i | x2i | x1iyi | x2iyi | x1ix2i | x1i2 | x1i2 |
1 | 1,50 | 5,90 | 5,90 | 8,85 | 8,85 | 34,81 | 34,8 1 | 34,81 |
2 | 5,50 | 53,10 | 27,10 | 292,05 | 149,05 | 1439,01 | 2819,61 | 734,41 |
3 | 2,40 | 18,80 | 11,20 | 45,12 | 26,88 | 210,56 | 353,44 | 125,44 |
4 | 3,00 | 35,30 | 16,40 | 105,90 | 49,20 | 578,92 | 1246,09 | 268,96 |
5 | 4,20 | 71,90 | 32,50 | 301,98 | 136,50 | 2336,75 | 5169,61 | 1056,25 |
6 | 2,70 | 93,60 | 25,40 | 252,72 | 68,58 | 2377,44 | 8760,96 | 645,16 |
7 | 1,60 | 10,00 | 6,40 | 16,00 | 10,24 | 64,00 | 100,00 | 40,96 |
8 | 2,40 | 31,50 | 12,50 | 75,60 | 30,00 | 393,75 | 992,25 | 156,25 |
9 | 3,30 | 36,70 | 14,30 | 121,11 | 47,19 | 524,81 | 1346,89 | 204,49 |
10 | 1,80 | 13,80 | 6,50 | 24,84 | 11,70 | 89,70 | 190,44 | 42,25 |
S | 28,40 | 370,60 | 158,20 | 1244,17 | 538,19 | 8049,75 | 21014,10 | 3308,98 |
Тогда система (7) приобретает вид:
(8)
Для решения данной системы воспользуемся методом Гаусса, который заключается в последовательном исключении неизвестных: делим первое уравнение системы на 10, затем умножаем полученное уравнение на 370,6 и вычитаем его из второго уравнения системы, далее умножаем полученное уравнение на 158,20 и вычитаем его из третьего уравнения системы. Повторяя указанный алгоритм для преобразованных второго и третьего уравнений системы, получим:
.
После преобразования имеем:
. (9)
Откуда
Тогда окончательно зависимость чистого дохода от оборота капитала и использованного капитала в виде линейного уравнения множественной регрессии имеет вид:
. (10)
Из полученного эконометрического уравнения видно, что с увеличением используемого капитала чистый доход увеличивается, и наоборот, с увеличением оборота капитала чистый доход уменьшается. Кроме того, чем больше величина коэффициента регрессии, тем значительнее влияние объясняющей переменной на зависимую переменную. В рассматриваемом примере величина коэффициента регрессии b2 больше, чем величина коэффициента b1 , следовательно, используемый капитал оказывает значительно большее влияние на чистый доход, чем оборот капитала. Для количественной оценки указанного вывода определим частные коэффициенты эластичности[12]:
.
Анализ полученных результатов также показывает, что большее влияние на чистый доход оказывает используемый капитал. Так, в частности, при увеличении используемого капитала на 1% чистый доход увеличивается на 1,17%. В то же время с ростом оборота капитала на 1% чистый доход снижается на 0,5%.
Расчетное значение критерия Фишера Fp :
Где
Величина критического значения FКРИТ определяется по статистическим таблицам и для уровня значимости α = 0,05 равняется 4,74. Так как Fp > FКРИТ, то нулевая гипотеза отвергается, и полученное уравнение регрессии принимается статистически значимым.[13]
Оценка статистической значимости коэффициентов регрессии b1 и b2 по t-критерию сводится к сопоставлению численного значения этих коэффициентов с величиной их случайных ошибок mb1 и mb2 по зависимости:
. (11)
Рабочая формула для расчета теоретического значения t-статистики имеет вид:
, (12)
где парные коэффициенты корреляции и коэффициент множественной корреляции рассчитываются по формулам:
; (13)
; (14)
; (15)
. (16)
Тогда расчетные значения t-статистик соответственно равны:
Поскольку критическое значение t-статистики, определенное по статистическим таблицам для уровня значимости α = 0,05, равное tКРИТ = 2,36, больше по абсолютной величине, чем tb1T = -1,798, то нулевая гипотеза не отвергается и объясняющая переменная x1 является статистически незначимой и ее можно исключить из уравнения регрессии. И наоборот, для второго коэффициента регрессии tb2T > tКРИТ (3,3 >2,36) и объясняющая переменная x2 является статистически значимой.[14]
Для определения средней ошибки аппроксимации воспользуемся формулой (10). Для удобства расчетов преобразуем таблицу 1 в таблицу 3, в которой в колонке рассчитаны текущие значения объясняющей переменной с использованием зависимости .
Таблица 3.
К расчету средней ошибки аппроксимации
№ п/п | yi | x1i | x2i | ||
1 | 1,50 | 5,90 | 5,90 | 1,93 | 0,286 |
2 | 5,50 | 53,10 | 27,10 | 4,59 | 0,165 |
3 | 2,40 | 18,80 | 11,20 | 2,55 | 0,0625 |
4 | 3,00 | 35,30 | 16,40 | 3,02 | 0,0006 |
5 | 4,20 | 71,90 | 32,50 | 5,01 | 0,193 |
6 | 2,70 | 93,60 | 25,40 | 2,69 | 0,0037 |
7 | 1,60 | 10,00 | 6,40 | 1,88 | 0,175 |
8 | 2,40 | 31,50 | 12,50 | 2,34 | 0,025 |
9 | 3,30 | 36,70 | 14,30 | 2,55 | 0,227 |
10 | 1,80 | 13,80 | 6,50 | 1,76 | 0,022 |
Σ | 28,40 | 370,60 | 158,20 | 28,30 | 1,16 |
Тогда средняя ошибка аппроксимации равна:
.
Полученное значение не превышает допустимого предела, равного 12—15%.
Общая теория приведенных выше методов анализа описывается следующим образом. После того как найдено уравнение линейной регрессии, оценивается значимость как уравнения в целом, так и отдельных его параметров. Оценка значимости уравнения регрессии в целом может выполняться с помощью различных критериев. Достаточно распространенным и эффективным является применение F-критерия Фишера. При этом выдвигается нулевая гипотеза H0 , что коэффициент регрессии равен нулю, т.е. b = 0, и, следовательно, фактор х не оказывает влияния на результат у. Непосредственному расчету F-критерия предшествует анализ дисперсии. Центральное место в нем занимает разложение общей суммы квадратов отклонений переменной у от среднего значения на две части — объясненную и необъясненную:
Общая сумма квадратов отклонений индивидуальных значений результативного признака у от его среднего значения вызвана влиянием множества факторов.
Условно разделим всю совокупность причин на две группы: изучаемый фактор х и прочие факторы. Если фактор не оказывает влияния на результат, то линия регрессии на графике параллельна оси ОХ и у = . Тогда вся дисперсия результативного признака обусловлена воздействием прочих факторов и общая сумма квадратов отклонений совпадет с остаточной. Если же прочие факторы не влияют на результат, то у связан с х функционально и остаточная сумма квадратов равна нулю. В этом случае сумма квадратов отклонений, объясненная регрессией, совпадает с общей суммой квадратов. Поскольку не все точки поля корреляции лежат на линии регрессии, то всегда имеет место их разброс, обусловленный как влиянием фактора х, т.е. регрессией у по х, так и действием прочих причин (необъясненная вариация). Пригодность линии регрессии для прогноза зависит от того, какая часть общей вариации признака у приходится на объясненную вариацию.
Очевидно, что если сумма квадратов отклонений, обусловленная регрессией, будет больше остаточной суммы квадратов, то уравнение регрессии статистически значимо и фактор х оказывает существенное воздействие на результат у. Это равносильно тому, что коэффициент детерминации rxy2 будет приближаться к 1. Любая сумма квадратов отклонений связана с числом степеней свободы, т.е. числом свободы независимого варьирования признака. Число степеней свободы связано с числом единиц совокупности и с числом определяемых по ней констант. Применительно к исследуемой проблеме число степеней свободы должно показать, сколько независимых отклонений из n возможных требуется для образования данной суммы квадратов. Так, для общей суммы квадратов требуется (n - 1) независимых отклонений, т.к. по совокупности из единиц n после расчета среднего уровня свободно варьируют лишь отклонения (n - 1). При расчете объясненной, или факторной, суммы квадратов используются теоретические (расчетные) значения результативного признака у, найденные по линии регрессии: у(х) = а + bх.[15]
В работе была рассмотрена тема множественная регрессия и корреляция в экономических исследованиях.
Решены следующие задачи
- рассмотрено построение уравнения множественной регрессии;
- изучена множественная корреляция;
- исследовано включение факторов в уравнение множественной регрессии;
- рассмотрена проверка качества построенной модели;
- исследована оценка мультиколлинеарности факторов и гетероскедастичности;
- решены практические примеры.
При поиске меры и формы связи между данным признаком и несколькими признаками-факторами (множественная корреляция) считается необходимым (на первом шаге) предположительно определить, имеет ли место прямолинейная или криволинейная зависимость (сформулировать соответствующую гипотезу). В случае прямолинейной зависимости составляется соответствующее уравнение множественной регрессии, при решении которого способом наименьших квадратов вычисляются коэффициенты регрессии для каждого из признаков-факторов. При прямолинейной форме связи коэффициент множественной корреляции (совокупный коэффициент корреляции по некоторому числу факторов) может быть вычислен по формуле.
В общем случае чем выше значение коэффициента множественной корреляции, тем лучше подобрано уравнение. Обычно при интерпретации расчетов используется величина R-квадрат (R2, коэффициент детерминации).
При предположении криволинейной зависимости следует выбрать (как и при парной корреляции) определенный тип кривой линии и представить ее в виде алгебраического выражения. Последующие расчеты связаны с выявлением показателей по формулам прямолинейной зависимости в множественной корреляции (регрессии). Часто в этих расчетах прибегают к помощи логарифмов.
Общепринято суждение, что введение в анализ широкого круга факторов и попытка найти такое их сочетание, которое бы почти полностью определяло поведение изучаемого признака, нецелесообразно. Эффективнее произвести отбор сравнительно небольшого числа основных факторов.
При поиске достоверных результатов могут быть применены методы частной регрессии и чистой регрессии. Частный коэффициент корреляции в отличие от коэффициента (полного) парной корреляции между явлениями показывает тесноту связи после устранения изменений, обусловленных влиянием третьего явления на оба коррелируемых признака (из значений корреляционных признаков вычитаются линейные оценки в связи с третьим признаком). Точно так же понимается и определяется частная регрессия. При этом число факторов-явлений, влияние которых исследователь стремится исключить, может быть сколь угодно велико (естественно, в пределах разумного).