Матричное уравнение для расчета коэффициентов регрессии

Автор: Пользователь скрыл имя, 22 Ноября 2012 в 21:36, реферат

Краткое описание

Основными задачами корреляционного анализа являются оценка силы связи и проверка статистических гипотез о наличии и силе корреляционной связи. При анализе явлений рассматриваются также связи между случайными и неслучайными величинами. Такие связи называются регрессионными, а метод математической статистики, их изучающий, называется регрессионным анализом.

Оглавление

Введение 3
1. Понятие и роль корреляционного и регрессионного анализа 4
2. Построение эмпирических моделей по данным активного эксперимента 8
3. Полный факторный эксперимент и обработка его результатов 11
4. Определение кодированных коэффициентов регрессии 14
5. Определение значимости кодированных коэффициентов регрессии 17
6. Проверка адекватности уравнения регрессии 18
Заключение 19
Список использованных источников 20

Файлы: 1 файл

Основы научного исследования 2012.doc

— 151.50 Кб (Скачать)


 

 

 

 

Реферат по дисциплине «Основы  научного исследования»

 

Тема «Матричное уравнение  для расчета коэффициентов регрессии»

 

 

 

Содержание

 

 

Введение

3

 

1.

Понятие и роль корреляционного и регрессионного анализа

4

2.

Построение эмпирических моделей по данным активного эксперимента

8

3.

Полный факторный эксперимент  и обработка его результатов

11

4.

Определение кодированных коэффициентов регрессии

14

5.

Определение значимости кодированных коэффициентов регрессии 

17

6.

Проверка адекватности уравнения регрессии

18

 

Заключение

19

 

Список использованных источников

20


 

 

 

 

 

 

 

 

 

 

 

 

 

 

Введение

 

Обработка статистических данных уже давно применяется  в самых разнообразных видах  человеческой деятельности. Трудно назвать  сферу, в которой она бы не использовалась. Всесторонний и глубокий анализ информации, так называемых статистических данных, предполагает использование различных специальных методов, важное место среди которых занимает корреляционный и регрессионный анализы обработки статистических данных.

В научных исследованиях часто решают задачу выявления факторов, определяющих уровень и динамику какого-либо процесса. Такая задача чаще всего решается методами корреляционного и регрессионного анализа. Для достоверного отображения объективно существующих процессов необходимо выявить существенные взаимосвязи и не только выявить, но и дать им количественную оценку. Этот подход требует вскрытия причинных зависимостей. Под причинной зависимостью понимается такая связь между процессами, когда изменение одного из них является следствием изменения другого.

Основными задачами корреляционного  анализа являются оценка силы связи  и проверка статистических гипотез  о наличии и силе корреляционной связи. При анализе явлений рассматриваются также связи между случайными и неслучайными величинами. Такие связи называются регрессионными, а метод математической статистики, их изучающий, называется регрессионным анализом.

 

 

 

 

1. Понятие и роль корреляционного и регрессионного анализа

 

В экономико-математическом словаре РЕГРЕССИЯ [regression] - зависимость среднего значения какой-либо случайной величины от некоторой другой величины или нескольких величин (в последнем случае - имеем множественную Р) [2].

Пользуясь методами корреляционно-регрессионного анализа, аналитики измеряют тесноту  связей показателей с помощью коэффициента корреляции. При этом обнаруживаются связи, различные по силе (сильные, слабые, умеренные и др.) и различные по направлению (прямые, обратные). Если связи окажутся существенными, то целесообразно будет найти их математическое выражение в виде регрессионной модели и оценить статистическую значимость модели. В экономике значимое уравнение используется, как правило, для прогнозирования изучаемого явления или показателя.

Регрессионный анализ называют основным методом современной математической статистики для выявления неявных и завуалированных связей между данными наблюдений. Электронные таблицы делают такой анализ легко доступным. Таким образом, регрессионные вычисления и подбор хороших уравнений - это ценный, универсальный исследовательский инструмент в самых разнообразных отраслях деловой и научной деятельности (маркетинг, торговля, медицина и т. д.). Усвоив технологию использования этого инструмента, можно применять его по мере необходимости, получая знание о скрытых связях, улучшая аналитическую поддержку принятия решений и повышая их обоснованность.

Корреляционно-регрессионный анализ считается одним из главных методов  в маркетинге, наряду с оптимизационными расчетами, а также математическим и графическим моделированием трендов (тенденций). Широко применяются как однофакторные, так и множественные регрессионные модели.

Для решения задач экономического анализа и прогнозирования очень  часто используются статистические, отчетные или наблюдаемые данные. При этом полагают, эти данные являются значениями случайной величины.

Случайной величиной называется переменная величина, которая в зависимости  от случая принимает различные значения с некоторой вероятностью. Закон  распределения случайной величины показывает частоту ее тех или иных значений в общей их совокупности.

При исследовании взаимосвязей между  экономическими показателями на основе статистических данных, часто между ними наблюдается стохастическая зависимость. Она проявляется в том, что изменение закона распределения одной случайной величины происходит под влиянием изменения другой. Взаимосвязь между величинами может быть полной (функциональной) и неполной (искаженной другими факторами).

Пример функциональной зависимости - выпуск продукции и ее  потребление  в условиях дефицита.

Неполная зависимость наблюдается, например, между стажем рабочих и  их производительностью труда. Обычно рабочие с большим стажем работы работают лучше молодых, но под влиянием  дополнительных  факторов - образование, здоровье и т.д. эта зависимость может быть искажена [1].

Раздел математической статистики, посвященный изучению взаимосвязей между случайными величинами называется корреляционным анализом (от лат. correlatio -  соотношение, соответствие). Основная задача корреляционного анализа - это установление характера и тесноты связи между результативными (зависимыми) и факторными (независимыми) показателями (признаками) в данном явлении или процессе. Корреляционную связь можно обнаружить только при массовом сопоставлении фактов[3].

Характер связи между показателями определяется по корреляционному полю. Если Y- зависимый признак, а Х- независимый, то отметив каждый случай X(i) с координатами xi и yi получим корреляционное поле. По расположению точек можно судить о характере связи (рис. 1).


Y                       Y                                   Y

 

 

 

 

X                               X                                X

               а)                               б)                             в)

 

Рис. 1. Примеры корреляционных полей: а) переменные Х и Y не коррелируют; б) наблюдается сильная положительная корреляция; в) наблюдается слабая отрицательная корреляция.

Теснота связи определяется с помощью  коэффициента корреляции, который рассчитывается специальным образом и лежит в интервалах от минус единицы до плюс единицы. Если значение коэффициента корреляции лежит в интервале от 1 до 0,9 по модулю, то отмечается очень сильная корреляционная зависимость. В случае, если значение коэффициента корреляции лежит в интервале от 0,9 до 0,6, то говорят, что имеет место слабая корреляционная зависимость. Наконец, если значение коэффициента корреляции  находится в интервале от -0,6 до 0,6, то говорят об очень слабой корреляционной зависимости или полной ее отсутствии.

Таким образом, корреляционный анализ применяется для нахождения характера и тесноты связи между случайными величинами.

Регрессионный анализ своей целью имеет  вывод, определение (идентификацию) уравнения регрессии, включая статистическую оценку его параметров. Уравнение регрессии позволяет найти значение зависимой переменной, если величина независимой или независимых переменных известна.

Практически, речь идет о том, чтобы  анализируя множество точек на графике (т.е. множество статистических данных), найти линию, по возможности, точно  отражающую заключенную в этом множестве закономерность (тренд, тенденцию) - линию регрессии.

По числу факторов различают  одно-, двух- и многофакторные уравнения регрессии.

По характеру связи однофакторные  уравнения регрессии подразделяются на:

а) линейные:

,

где X - экзогенная (независимая)  переменная;

    Y - эндогенная (зависимая, результативная) переменная;

a,  b - параметры.

б) степенные:

в) показательные:

    

г) прочие.

 

 

 

 

 

 

 

 

 

 

 

2. Построение эмпирических моделей по данным активного эксперимента

 

При проведении опытных исследований различают пассивный и активный эксперимент.

Методология пассивного экспериментирования  предполагает проведение большой серии опытных исследований с поочередным варьированием значений входных переменных  и анализом результатов измерений выходной переменной  y  (лабораторный эксперимент или эксперимент на пилотной установке).

К пассивному эксперименту принято относить также и сбор опытных данных в режиме эксплуатации промышленной установки – т.н. промышленный эксперимент.

Обработка результатов пассивного эксперимента проводится методами регрессионного и корреляционного анализа, и  выбор вида эмпирической модели (уравнения регрессии), т.е. решение задачи структурной идентификации является достаточно сложной задачей.

Это связано с тем, что вид  уравнения регрессии необходимо определять по характеру изменения  переменных на графике эмпирической линии регрессии, полученной по выборке экспериментальных данных.

Для решения этой задачи для одной  входной переменной  x  предложены эффективные методы, в которых  предусматривается преобразование системы координат как для  входной ( x ), так и для выходной переменной ( y ). При большем числе входных переменных  ( x1,…xm )  надёжных методов определения вида уравнения регрессии (вида эмпирической модели) в настоящее время не существует.

Активный эксперимент проводится по заранее составленному плану, в соответствии с которым ставится задача не только определения оптимальных условий проведения эксперимента, но и оптимизации процесса (оптимальное планирование эксперимента).

При этом уравнения регрессии (эмпирические модели) описывают данные активного  эксперимента, в основном, в двух ограниченных областях и имеют следующий вид:

-  вдали от экстремального  значения выходной переменной y :

-  вблизи экстремального значения  выходной переменной y («в почти  стационарной области»):

Приведённые уравнения являются линейными относительно коэффициентов регрессии  и имеют достаточно простой вид.

 

Они включают слагаемые с двойным  взаимодействием входных переменных

и не учитывают взаимодействия более высоких порядков (тройные, четверные и т.д.), вероятность  которых существенно меньше.

Последнее уравнение  включает слагаемые с квадратами входных переменных

и его коэффициенты получаются при обработке результатов активных экспериментов II-го порядка (верхний индекс II при ) – например, ОЦКП – ортогонального центрального композиционного плана эксперимента.

Предпоследнее уравнение  не включает слагаемые с квадратами входных переменных и его коэффициенты получаются при обработке результатов активных экспериментов I-го порядка – верхний индекс I при - например, ПФЭ – полный факторный эксперимент.

При определении оптимальных  условий проведения процесса с использованием эмпирических моделей (например, методом  Бокса-Вильсона) выходная переменная является критерием оптимальности или целевой функцией.

В теории активного экспериментирования  выходную (зависимую) переменную принято  называть функцией отклика, а входные (независимые) переменные – факторами. Соответственно - координатное пространство с координатами  ( x1, x2, …xm ) - факторным пространством, а геометрическое изображение функции отклика в факторном пространстве – поверхностью отклика.

Активный эксперимент  планируется таким образом, чтобы  упростить обработку его результатов методами регрессионного и корреляционного анализа.

Ортогональные планы  экспериментов, используемые при активном экспериментировании, обеспечивают диагональный вид корреляционной матрицы  при регрессионном анализе и, соответственно, статистическую независимость коэффициентов регрессии.

К другим достоинствам активного  экспериментирования относятся:

  • возможность предсказания количества опытов, которые следуют провести;
  • определение точек факторного пространства, где следует проводить опыты;
  • отсутствие проблем, связанных с выбором вида уравнения регрессии;
  • возможность определения оптимальных параметров процесса экспериментально-статистическим методом;
  • сокращение объёма опытных исследований [5].

Информация о работе Матричное уравнение для расчета коэффициентов регрессии