Автор: Пользователь скрыл имя, 21 Февраля 2013 в 18:26, курсовая работа
Цель работы: рассмотреть применение корреляционно-регрессионного анализа в социально-экономических исследованиях
Задачи работы:
Раскрыть сущность и роль корреляционно-регрессионного анализа в обработке экономических данных.
Изучить возможности корреляционно-регрессионного анализа.
Определить задачи корреляционно-регрессионного анализа.
Введение…………………………………………………………………………...3
Теоритические основы корреляционно-регрессионного анализа…………………………………..…………………………………..4
Сущность и возможности корреляционно-регрессионного анализа в обработке экономических данных…………………………………………………………..……4
Задачи корреляционно-регрессионного анализа………………...12
Условия применения и ограничения корреляционно-регрессионного анализа……………………………………………20
Применение корреляционно-регрессионного анализа на практическом примере……………………………………………………………………23
Предпосылки применения и принципы корреляционно-регрессионного анализа……………………………………………22
Практический пример применения корреляционно-регрессионного анализа……………………………………………25
Заключение………………………………………………………………..28
Список литературы……………………………………………………….29
Используя правило сложения дисперсий, можно вычислить индекс корреляции.
При прямолинейной форме связи показатель тесноты связи определяется по формуле линейного коэффициента корреляции r:
Для оценки значимости коэффициента корреляции r применяется t-критерий Стьюдента с учетом заданного уровня значимости и числа степеней свободы k.
Если , то величина коэффициента корреляции признается существенной.
Для оценки значимости индекса корреляции R применяется F-критерий Фишера. Фактическое значение критерия FR определяется по формуле:
, где m – число параметров уравнения регрессии.
Величина FR сравнивается с критическим значением FK, которое определяется по таблице F – критерия с учетом принятого уровня значимости и числа степеней свободы k1=m-1 и k2=n-m.
Если FR> FK, то величина индекса корреляции признается существенной.
По степени тесноты связи различают количественные критерии оценки тесноты связи.
Величина коэффициента корреляции |
Характер связи |
до 0,3 |
практически отсутствует |
0,3-0,5 |
слабая |
0,5-0,7 |
умеренная |
0,7-1,0 |
сильная |
С целью расширения возможностей экономического анализа используются частные коэффициенты эластичности:
Он показывает, на сколько процентов в среднем изменится значение результативного признака при изменении факторного на 1%.
Изучив возможности
1.2 Задачи корреляционно-регрессионного анализа.
В соответствии с сущностью корреляционной связи ее изучение имеет две цели:
1) измерение параметров
уравнения, выражающего связь
средних значений зависимой
2) измерение тесноты связи двух (или большего числа) процессов или явлений между собой.
Вторая задача специфична для статистических связей, а первая разработана для функциональных связей и является общей. Основным методом решения задачи нахождения параметров уравнения связи является метод наименьших квадратов (МНК), разработанный К. Ф. Гауссом (1777-1855). Он состоит в минимизации суммы квадратов отклонений фактически измеренных значений зависимой переменной «у» от ее значений, вычисленных по уравнению связи с факторным признаком (многими признаками) «х».
Для измерения тесноты связи применяется несколько показателей. При парной связи теснота связи измеряется прежде всего корреляционным отношением, которое обозначается греческой буквой «п».
Квадрат корреляционного отношения - это отношение межгрупповой дисперсии результативного признака, которая выражает влияние различий группировочного факторного признака на среднюю величину результативного признака, к общей дисперсии результативного признака, выражающей влияние на него всех причин и условий. Квадрат корреляционного отношения называется коэффициентом детерминации:
, (1.1.)
где k — число групп по факторному признаку;
N - число единиц совокупности;
yi - индивидуальные значения результативного признака;
уj - его средние групповые значения;
у - его общее среднее значение;
fj - частота в j-й группе.
Формула (1.1) применяется при расчете показателя тесноты связи по аналитической группировке. При вычислении корреляционного отношения по уравнению связи (уравнению парной или множественной регрессии) применяется формула (1.2):
, (1.2)
где уi - индивидуальные значения у по уравнению связи.
Сумма квадратов в числителе - это объясненная связью с фактором «х» (факторами) дисперсия результативного признака «у». Она вычисляется по индивидуальным данным, полученным для каждой единицы совокупности на основе уравнения регрессии.
Если уравнение выбрано
неверно или сделана ошибка при
расчете его параметров, то сумма
квадратов в числителе может
оказаться большей, чем в знаменателе,
и отношение утратит тот смысл,
который оно должно иметь, а именно
какова доля общей вариации результативного
признака, объясняемая на основе выбранного
уравнения связи его с
В числителе формулы (1.3) стоит сумма квадратов отклонений фактических значений признака «у» от его индивидуальных расчетных значений, т. е. доля вариации этого признака, не объясняемая за счет входящих в уравнение связи признаков-факторов. Эта сумма не может стать равной нулю, если связь не является функциональной. При неверной формуле уравнения связи или ошибке в расчетах возрастают расхождения фактических и расчетных значений, и корреляционное отношение снижается, как логически и должно быть.
В основе перехода от формулы (1.2) к формуле (1.3) лежит известное правило разложения сумм квадратов отклонений при группировке совокупности:
Согласно этому правилу можно вместо межгрупповой (факторной) дисперсии использовать разность:
При расчете η не по группировке, а по уравнению корреляционной связи (уравнению регрессии) мы используем формулу (1.3). В этом случае правило разложения суммы квадратов отклонений результативного признака записывается как
Важнейшее положение, которое следует усвоить для правильного применения метода корреляционно-регрессионного анализа, состоит в интерпретации формул (1.2) и (1.3). Это положение гласит:
Уравнение корреляционной связи
измеряет зависимость между вариацией
результативного признака и вариацией
факторного признака (признаков). Меры
тесноты связи измеряют долю вариации
результативного признака, которая
связана корреляционно с
Интерпретировать
Из вышеприведенного положения
об интерпретации показателей
Итак, метод корреляционно-
Следующий общий вопрос - это вопрос о «чистоте» измерения влияния каждого отдельного факторного признака. Группировка совокупности по одному факторному признаку может отразить влияние именно данного фактора на результативный признак при условии, что все другие факторы не связаны с изучаемым, а случайные отклонения и ошибки взаимопогасились в большой совокупности. Если же изучаемый фактор связан с другими факторами, влияющими на результативный признак, будет получена не «чистая» характеристика влияния только одного фактора, а сложный комплекс, состоящий как из непосредственного влияния фактора, так и из его косвенных влияний, через его связь с другими факторами и их влияние на результативный признак. Данное положение полностью относится и к парной корреляционной связи.
Однако коренное отличие
метода корреляционно-регрессионного
анализа от аналитической группировки
состоит в том, что корреляционно-
Наконец, развивающиеся на
базе корреляционно-регрессионного анализа
многомерные методы (факторный анализ)
позволяют синтезировать
Правильное применение и
интерпретация результатов
Необходимо сказать и о других задачах применения корреляционно-регрессионного метода, имеющих не формально математический, а содержательный характер:
1. Задача выделения важнейших
факторов, влияющих на результативный
признак (т.е. на вариацию его
значений в совокупности). Эта
задача решается в основном
на базе мер тесноты связи
факторов с результативным
2. Задача оценки хозяйственной
деятельности по эффективности
использования имеющихся
3. Задача прогнозирования
возможных значений
Такая задача решается путем подстановки ожидаемых, или планируемых, или возможных значений факторных признаков в уравнение связи и вычисления ожидаемых значений результативного признака.
Приходится решать и обратную
задачу: вычисление необходимых значений
факторных признаков для
4. Задача подготовки данных,
необходимых в качестве
При решении каждой из названных
задач нужно учитывать