Множественная регрессия и корреляция

Автор: Пользователь скрыл имя, 13 Февраля 2012 в 16:59, курсовая работа

Краткое описание

Множественная регрессия широко используется в решении проблем спроса, доходности акций, при изучении функции издержек производства, в макроэкономических расчетах и целом ряде других вопросов эконометрики. В настоящее время множественная регрессия – один из наиболее распространенных методов в эконометрике. Основная цель множественной регрессии – построить модель с большим числом факторов, определив при этом влияние каждого из них в отдельности, а также совокупное их воздействие на моделируемый показатель.

Оглавление

МНОЖЕСТВЕННАЯ РЕГРЕССИЯ И КОРРЕЛЯЦИЯ…………………………..3
Спецификация модели. Отбор факторов при построении уравнения множественной регрессии………………………………………………………….3
Метод наименьших квадратов (МНК)…………………………………………….8
Проверка существенности факторов и показатели качества регрессии….13


СПИСОК ИСПОЛЬЗУЕМОЙ ЛИТЕРАТУРЫ……………………………………..24

Файлы: 1 файл

mno.doc

— 577.50 Кб (Скачать)

   (2.3)

 Для двухфакторной модели данная система  будет иметь вид:

 

 Метод наименьших квадратов применим и  к уравнению множественной регрессии  в стандартизированном масштабе:

        (2.4)

 где – стандартизированные переменные:

  , , для которых среднее значение равно нулю: , а среднее квадратическое отклонение равно единице: ;

   – стандартизированные коэффициенты регрессии.

 Стандартизованные коэффициенты регрессии показывают, на сколько единиц изменится в  среднем результат, если соответствующий  фактор изменится на одну единицу при неизменном среднем уровне других факторов. Стандартизованные коэффициенты регрессии можно сравнивать между собой. Сравнивая их друг с другом, можно ранжировать факторы по силе их воздействия на результат. В этом основное достоинство стандартизованных коэффициентов регрессии в отличие от коэффициентов «чистой» регрессии, которые несравнимы между собой.

 Применяя  МНК к уравнению множественной  регрессии в стандартизированном  масштабе, получим систему нормальных уравнений вида

      (2.5)

 где и – коэффициенты парной и межфакторной корреляции.

 Коэффициенты  «чистой» регрессии  связаны со стандартизованными коэффициентами регрессии следующим образом:

  .         (2.6)

 Поэтому можно переходить от уравнения регрессии  в стандартизованном масштабе (2.4) к уравнению регрессии в натуральном  масштабе переменных (2.1), при этом параметр определяется как .

 Рассмотренный смысл стандартизованных коэффициентов  регрессии позволяет их использовать при отсеве факторов – из модели исключаются факторы с наименьшим значением  .

 На  основе линейного уравнения множественной регрессии

        (2.7)

 могут быть найдены частные уравнения  регрессии:

         (2.8)

 т.е. уравнения регрессии, которые связывают  результативный признак с соответствующим  фактором при закреплении остальных факторов на среднем уровне. В развернутом виде систему (2.8) можно переписать в виде:

 

 При подстановке в эти уравнения  средних значений соответствующих  факторов они принимают вид парных уравнений линейной регрессии, т.е. имеем

         (2.9)

 где

 

 В отличие  от парной регрессии частные уравнения  регрессии характеризуют изолированное  влияние фактора на результат, ибо  другие факторы закреплены на неизменном уровне. Эффекты влияния других факторов присоединены в них к свободному члену уравнения множественной регрессии. Это позволяет на основе частных уравнений регрессии определять частные коэффициенты эластичности:

  ,       (2.10)

 где – коэффициент регрессии для фактора в уравнении множественной регрессии,

   – частное уравнение регрессии. 

 Наряду  с частными коэффициентами эластичности могут быть найдены средние по совокупности показатели эластичности:

  ,         (2.11)

 которые показывают на сколько процентов  в среднем изменится результат, при изменении соответствующего фактора на 1%. Средние показатели эластичности можно сравнивать друг с другом и соответственно ранжировать факторы по силе их воздействия на результат.

 Проверка  существенности факторов и показатели качества регрессии

 Практическая  значимость уравнения множественной  регрессии оценивается с помощью  показателя множественной корреляции и его квадрата – показателя детерминации.

 Показатель  множественной корреляции характеризует  тесноту связи рассматриваемого набора факторов с исследуемым признаком  или, иначе, оценивает тесноту совместного  влияния факторов на результат.

 Независимо  от формы связи показатель множественной  корреляции может быть найден как  индекс множественной корреляции:

  ,        (2.12)

 где – общая дисперсия результативного признака; – остаточная дисперсия.

 Границы изменения индекса множественной  корреляции от 0 до 1. Чем ближе его значение к 1, тем теснее связь результативного признака со всем набором исследуемых факторов. Величина индекса множественной корреляции должна быть больше или равна максимальному парному индексу корреляции:

  .

 При правильном включении факторов в  регрессионную модель величина индекса  множественной корреляции будет  существенно отличаться от индекса  корреляции парной зависимости. Если же дополнительно включенные в уравнение  множественной регрессии факторы третьестепенны, то индекс множественной корреляции может практически совпадать с индексом парной корреляции (различия в третьем, четвертом знаках). Отсюда ясно, что сравнивая индексы множественной и парной корреляции, можно сделать вывод о целесообразности включения в уравнение регрессии того или иного фактора.

 Расчет  индекса множественной корреляции предполагает определение уравнения  множественной регрессии и на его основе остаточной дисперсии:

  .       (2.13)

 Можно пользоваться следующей формулой индекса множественной детерминации:

  .      (2.14)

 При линейной зависимости признаков  формула индекса множественной  корреляции может быть представлена следующим выражением:

  ,       (2.15)

 где – стандартизованные коэффициенты регрессии;

   – парные коэффициенты  корреляции результата с каждым  фактором.

 Формула индекса множественной корреляции для линейной регрессии получила название линейного коэффициента множественной корреляции, или, что то же самое, совокупного коэффициента корреляции.

 Возможно  также при линейной зависимости  определение совокупного коэффициента корреляции через матрицу парных коэффициентов корреляции:

  ,        (2.16)

 где

  – определитель матрицы парных коэффициентов корреляции;

  – определитель матрицы межфакторной корреляции.

 Как видим, величина множественного коэффициента корреляции зависит не только от корреляции результата с каждым из факторов, но и от межфакторной корреляции. Рассмотренная формула позволяет определять совокупный коэффициент корреляции, не обращаясь при этом к уравнению множественной регрессии, а используя лишь парные коэффициенты корреляции.

 В рассмотренных  показателях множественной корреляции (индекс и коэффициент) используется остаточная дисперсия, которая имеет  систематическую ошибку в сторону  преуменьшения, тем более значительную, чем больше параметров определяется в уравнении регрессии при заданном объеме наблюдений . Если число параметров при равно и приближается к объему наблюдений, то остаточная дисперсия будет близка к нулю и коэффициент (индекс) корреляции приблизится к единице даже при слабой связи факторов с результатом. Для того чтобы не допустить возможного преувеличения тесноты связи, используется скорректированный индекс (коэффициент) множественной корреляции.

 Скорректированный индекс множественной корреляции содержит поправку на число степеней свободы, а именно остаточная сумма квадратов делится на число степеней свободы остаточной вариации , а общая сумма квадратов отклонений на число степеней свободы в целом по совокупности .

 Формула скорректированного индекса множественной  детерминации имеет вид:

  ,      (2.17)

 где – число параметров при переменных ;

   – число наблюдений.

 Поскольку , то величину скорректированного индекса детерминации можно представить в виде:

  .       (2.17а)

 Чем больше величина , тем сильнее различия и .

 Как было показано выше, ранжирование факторов, участвующих во множественной линейной регрессии, может быть проведено через стандартизованные коэффициенты регрессии ( -коэффициенты). Эта же цель может быть достигнута с помощью частных коэффициентов корреляции (для линейных связей). Кроме того, частные показатели корреляции широко используются при решении проблемы отбора факторов: целесообразность включения того или иного фактора в модель можно доказать величиной показателя частной корреляции.

 Частные коэффициенты корреляции характеризуют тесноту связи между результатом и соответствующим фактором при устранении влияния других факторов, включенных в уравнение регрессии.

 Показатели  частной корреляции представляют собой  отношение сокращения остаточной дисперсии  за счет дополнительного включения  в анализ нового фактора к остаточной дисперсии, имевшей место до введения его в модель.

 В общем  виде при наличии  факторов для уравнения

 

 коэффициент частной корреляции, измеряющий влияние  на фактора , при неизменном уровне других факторов, можно определить по формуле:

  ,    (2.18)

 где – множественный коэффициент детерминации всех факторов с результатом;

   – тот же показатель  детерминации, но без введения  в модель фактора  .

 При двух факторах формула (2.18) примет вид:

  ;   .   (2.18а)

 Порядок частного коэффициента корреляции определяется количеством факторов, влияние которых исключается. Например, – коэффициент частной корреляции первого порядка. Соответственно коэффициенты парной корреляции называются коэффициентами нулевого порядка. Коэффициенты частной корреляции более высоких порядков можно определить через коэффициенты частной корреляции более низких порядков по рекуррентной формуле:

   (2.19)

 При двух факторах данная формула примет вид:

  ; .        (2.19а)

 Для уравнения регрессии с тремя  факторами частные коэффициенты корреляции второго порядка определяются на основе частных коэффициентов  корреляции первого порядка. Так, по уравнению  возможно исчисление трех частных коэффициентов корреляции второго порядка:

  , , ,

 каждый  из которых определяется по рекуррентной формуле. Например, при  имеем формулу для расчета :

  .      (2.20)

 Рассчитанные  по рекуррентной формуле частные  коэффициенты корреляции изменяются в  пределах от –1 до +1, а по формулам через  множественные коэффициенты детерминации – от 0 до 1. Сравнение их друг с другом позволяет ранжировать факторы по тесноте их связи с результатом. Частные коэффициенты корреляции дают меру тесноты связи каждого фактора с результатом в чистом виде. Если из стандартизованного уравнения регрессии следует, что , т.е. no силе влияния на результат порядок факторов таков: , , , то этот же порядок факторов определяется и по соотношению частных коэффициентов корреляции, .

Информация о работе Множественная регрессия и корреляция