Направления совершенствования линейной регрессионной модели

Реферат, 22 Ноября 2012, автор: пользователь скрыл имя

Краткое описание

Важным этапом регрессионного анализа является определение типа функции, с помощью которой характеризуется зависимость между признаками. Приблизительное представление о линии связи можно получить на основе эмпирической линии зависимости, которая строится по полученным для исследования данным и имеет вид ломаной. Различают линейные (определяются линейной функцией) и нелинейные (определяются нелинейными функциями) модели.

Скачать в ZIP (222.14 Кб) Сколько стоит заказать работу?

Файлы: 1 файл

эконометрика.doc

— 437.50 Кб (Скачать)

Направления совершенствования линейной регрессионной модели

линейная ;
гиперболическая ;
параболическая ;
логарифмическая ;
показательная ;
степенная .

Линейная регрессионная модель.

Уравнение линейной регрессионной модели в общем виде представляется равенством

, . Где:

х_t – неслучайная величина, независимая переменная, фактор-признак;
- случайная величина, зависимая переменная, признак-результат;
- случайная величина.

К основным причинам случайности можно отнести следующие:

1. Модель является упрощением действительности. На самом деле существуют и другие параметры, от которых результат может зависить. Так зарплата может зависить от уровня образования, стажа работы, пола сотрудника, формы собственности предприятия и многих других факторов.

2. Трудности в измерении данных (т.е. присутствуют ошибки измерений). Так при рассмотрении зависимости расходов на питание от доходов семьи мы можем опираться лишь на данные, составленные членами этой семьи.

Следовательно, - случайная величина с некоторой функцией распределения, которая соответствует функции распределения случайной величины .

В дальнейшем нашей задачей будет задача составления уравнения регрессии линейной модели в виде , коэффициенты которого можно определить методом наименьших квадратов.

Параметр b называется коэффициентом регрессии. Данный коэффициент показывает среднее изменение результата при изменении фактора на единицу. Коэффициент регрессии является постоянным в рамках одной зависимости. Возможность четкой экономической интерпретации данного коэффициента сделала линейную модель достаточно распространенной в эконометрических исследованиях.

Формально а - значение у при х=0. Если признак-фактор х не имеет и не может иметь нулевого значения, то вышеуказанная трактовка свободного члена а не имеет смысла. Параметр а может не имеет экономического содержания. Интерпретировать можно лишь знак при параметре а. Если а > 0, то относительное изменение результата происходит медленнее, чем изменение фактора. Если же а < 0, то наблюдается опережение изменения результата над изменением фактора.

Коэффициент регрессии применяют для определения коэффициента эластичности Э_i, который показывает, на сколько процентов изменится величина результативного признака у при изменении признака – фактора на один процент.

Понятие эластичности функции дается в математическом анализе. Эластичность функции – это предел отношения относительного приращения функции у к относительному приращению аргумента х при :

Исходя из определения, коэффициент эластичности линейной функции определяется формулой . Видно, что это переменный коэффициент, поскольку его значение зависит от значения признака-фактора. В общем виде можно записать .

Часто рассчитывается средний показатель эластичности , где - средние значения признаков.

Раннее отмечалось, что показателями степени тесноты корреляционной связи являются коэффициенты корреляции.

К простейшим подобным показателям относят коэффициент Фехнера - коэффициент корреляции знаков. Он основан на сравнении поведения отклонений индивидуальных значений каждого признака от своей средней величины. При этом во внимание принимаются не величины отклонений, а только их знаки. Совпадения знаков отклонений обозначают через d, а несовпадений – с. Коэффициент Фехнера вычисляется по формуле , где

- число совпадений знаков отклонений,

- число несовпадений знаков отклонений.

Коэффициент Фехнера может принимать различные значения в пределах от -1 до +1. Причем, если Н > 0, то между признаками наблюдается прямая связь; при Н < 0 – связь имеет обратное направление.

В силу того, что данный коэффициент учитывает только знаки отклонений, а не их величины, коэффициент Фехнера на практике характеризует в большей мере лишь наличие и направление связи.

Более совершенным показателем степени тесноты связи является линейный коэффициент корреляции, который был предложен английским ученым К. Пирсоном. Данный коэффициент учитывает значения отклонений индивидуальных значений каждого признака от своей средней величины. Вычисление этого коэффициента удобно проводить по формуле

Линейный коэффициент корреляции может принимать любые значения в пределах от -1 до +1. Чем ближе коэффициент корреляции по абсолютной величине к 1, тем теснее связь между признаками. Знак при линейном коэффициенте корреляции, так же как и коэффициент Фехнера, указывает на направление связи между признаками. Если , то говорят о наличии функциональной связи. В том случаи, когда r = 0 линейная связь между исследуемыми параметрами отсутствует.

Интерпретируя значение линейного коэффициента корреляции, следует иметь в виду, что он рассчитан для ограниченного числа наблюдений и подвержен случайным колебаниям. Следовательно, как любой выборочный показатель, он содержит случайную ошибку и не всегда однозначно отражает действительно реальную связь между изучаемыми признаками. Оценка значимости линейного коэффициента корреляции основана на сопоставлении абсолютного значения самого коэффициента с его средней квадратической ошибкой . Коэффициент корреляции считается значимым, если его абсолютное значение более чем в три раза превышает свою среднюю квадратическую ошибку: т.е. .

В зависимости от числа наблюдений n различают следующие методы расчета средней квадратической ошибки:

1. если число наблюдений велико (), то ;

2. при небольшом числе наблюдений ( ) .

Оценка надежности линейной модели.

Обоснованность выбора линейной функции в качестве уравнения регрессии.

1.Оценка существенности линейного коэффициента корреляции (через распределение Стьюдента).

Данная оценка дает возможность распространить выводы по результатам выборки на всю генеральную совокупность.

✔ Вычисляется показатель , где

r – линейный коэффициент корреляции,

n – длина выборки.

✔ Определить значение t_табл.

определяется по таблице распределения Стьюдента в зависимости от числа степеней свободы k = n – 2 и уровня значимости α = 5%.

✔ Сравнить t_расч. и t_табл.

если t_р_а_с_ч_. > t_т_а_б_л_., то с вероятностью 95 % во всей генеральной совокупности действительно существует линейная зависимость между изучаемыми признаками.

2. Оценка обоснованности выбора линейной функции в качестве уравнения регрессии.

✔ Вычислить:

среднеквадратическую ошибку
среднеквадратическое отклонение
индекс корреляции

✔ Анализ параметров:

II. Прогноз значений результативного признака по уравнению регрессии.

Средняя квадратическая ошибка уравнения S_e дает нам возможность в каждом конкретном случае с определённой вероятностью указать, что величина результативного признака расположена в определённом интервале относительно значения, вычисленного по уравнению регрессии. Данный интервал называют доверительным.

✔ Определить границы доверительного интервала.

вычислить дисперсию ;
определить множитель ;
определить значение t_т_а_б_л_. по таблице распределения Стьюдента в зависимости от числа степеней свободы и уровня значимости α = 5%;
рассчитать отклонение ;
вычислить границы доверительного интервала;
построить диаграммы:

практическую (эмпирическая линия),
прогноз (теоретическая линия),
доверительный интервал:

нижняя граница
верхняя граница

Значения t_γ,k – критерия Стьюдента

k	Вероятность γ		k	Вероятность γ		k	Вероятность γ
k	0,95	0,99	k	0,95	0,99	k	0,95	0,99
1	12,71	63,66	12	2,18	3,05	23	2,07	2,81
2	4,30	9,92	13	2,16	3,01	24	2,06	2,80
3	3,18	5,84	14	2,14	2,98	25	2,06	2,79
4	2,78	4,60	15	2,13	2,95	26	2,06	2,78
5	2,57	4,03	16	2,12	2,92	27	2,05	2,77
6	2,45	3,71	17	2,11	2,90	28	2,05	2,76
7	2,36	3,50	18	2,10	2,88	29	2,04	2,76
8	2,31	3,35	19	2,09	2,86	30	2,04	2,75
9	2,36	3,25	20	2,09	2,84	40	2,02	2,70
10	2,23	3,17	21	2,08	2,83	60	2,00	2,66
11	2,2,	3,11	22	2,07	2,82	120	1,98	2,62

Задачи корреляционно-регрессионного анализа решаются по следующему алгоритму:

строится эмпирическая линия по данным наблюдения (по виду этой линии определяется тип регрессионной модели);
определяется теснота связи между признаками. В качестве показателей тесноты связи между признаками используются коэффициенты корреляции. (определяется значимость указанных коэффициентов);
составляется уравнение регрессии, коэффициенты которого определяются методом наименьших квадратов;
рассчитываются коэффициенты эластичности;
строится теоретическая линия;
проводится прогноз значений результативного признака;
делаются выводы.

Выбрав вид функции регрессии, т.е. вид рассматриваемой модели зависимости Y от Х (или Х от У), например, линейную модель y_x=a+bx, необходимо определить конкретные значения коэффициентов модели.

При различных значениях а и b можно построить бесконечное число зависимостей вида y_x=a+bx т.е на координатной плоскости имеется бесконечное количество прямых, нам же необходима такая зависимость, которая соответствует наблюдаемым значениям наилучшим образом. Таким образом, задача сводится к подбору наилучших коэффициентов.

Линейную функцию a+bx ищем, исходя лишь из некоторого количества имеющихся наблюдений. Для нахождения функции с наилучшим соответствием наблюдаемым значениям используем метод наименьших квадратов.

Обозначим: Y_i- значение, вычисленное по уравнению Y_i=a+bx_i. y_i- измеренное значение, ε_i=y_i-Y_i- разность между измеренными и вычисленными по уравнению значениям, ε_i=y_i-a-bx_i.

В методе наименьших квадратов требуется, чтобы ε_i, разность между измеренными y_iи вычисленными по уравнению значениям Y_i, была минимальной. Следовательно, находим коэффициенты а и b так, чтобы сумма квадратов отклонений наблюдаемых значений от значений на прямой линии регрессии оказалась наименьшей:

Исследуя на экстремум эту функцию аргументов а и с помощью производных, можно доказать, что функция принимает минимальное значение, если коэффициенты а и b являются решениями системы:

(2)

Если разделить обе части нормальных уравнений на n, то получим:

Учитывая, что (3)

Получим , отсюда , подставляя значение a в первое уравнение, получим:

Направления совершенствования линейной регрессионной модели

Краткое описание

Файлы: 1 файл

эконометрика.doc

Информация о работе Направления совершенствования линейной регрессионной модели

Связанные документы

Классическая регрессионная модель

Модель множественной линейной регрессии

Сетевые модели

Модель Марковица

Модели принятия решения

Модели сетевого планирования

Национальные модели рынка труда

Совершенствование работы с клиентами банка

Современные направления электроники

Планетарная модель по Нильсу Бору

Современные модели учета затрат

Совершенствование бюджетного процесса

Похожие темы

Линейная модель

Основные направления совершенствования

Направления совершенствования организации