Дисперсионный анализ

Автор: Пользователь скрыл имя, 24 Марта 2012 в 10:51, практическая работа

Краткое описание

Цель работы: получение практических навыков статистической обработки многовариантных, многофакторных экспериментов, когда анализируется влияние одного, двух, трех и большего числа факторов на изменение величины какого-либо признака.

Файлы: 1 файл

Дисперсионный анализ.doc

— 281.50 Кб (Скачать)


 

ПРАКТИЧЕСКАЯ РАБОТА 5

ДИСПЕРСИОННЫЙ АНАЛИЗ

 

Цель работы: получение практических навыков статистической обработки многовариантных, многофакторных экспериментов, когда анализируется влияние одного, двух, трех и большего числа факторов на изменение величины какого-либо признака.

Порядок выполнения работы:

1.        Установление основных источников варьирования и определение объемов вариации по источникам образования.

2.        Определение числа степеней свободы вариации.

3.        Вычисление дисперсий и анализ соотношений между ними.

4.        Интерпретация полученных результатов анализа.

 

Дисперсионный анализ быстро вошел в употребление благодаря следующим основным преимуществам:

  1. В дисперсионном анализе используется обобщенная ошибка средних, которая опирается на большое число наблюдений.
  2. Этим методом можно обрабатывать данные простых и сложных, однолетних и многолетних, однофакторных и многофакторных опытов.
  3. Позволяет компактно в виде существенных разностей представить итоги статистической обработки.

При дисперсионном анализе проводят расчет дисперсий:

               общей (дисперсия комплекса);

               межгрупповой (факторная);

               внутригрупповой (остаточная).

Общая дисперсия () измеряет вариацию признака во всей совокупности под влиянием всех факторов, обусловивших эту вариацию:

.

Межгрупповая дисперсия () характеризует систематическую вариацию, т.е. различия в величине изучаемого признака, возникающие под влиянием признака-фактора, положенного в основание группировки.

,

где - групповые средние,

- численность единиц в группе.

Внутригрупповая дисперсия () отражает случайную вариацию, т.е. часть вариации, происходящую под влиянием неучтенных факторов и не зависящую от признака-фактора, положенного в основание группировки:

- для несгруппированных данных;

- для сгруппированных данных.

Средняя из внутригрупповых дисперсий определяется следующим образом:

.

Существует закон, связывающий три вида дисперсии. Общая дисперсия равна сумме средней из внутригрупповых и межгрупповой дисперсий:

.

Данное соотношение называют правилом сложения дисперсий.

Правило сложения дисперсий широко применяется при исчислении показателей тесноты связи.

В статистическом анализе широко используется показатель, представляющий собой долю межгрупповой дисперсии в общей дисперсии. Он носит название эмпирического коэффициента детерминации ():

.

Этот коэффициент показывает долю (удельный вес) общей вариации изучаемого признака, обусловленную вариацией группировочного признака.

Эмпирическое корреляционное отношение () характеризует влияние признака, положенного в основание группировки, на вариацию результативного признака:

.

Эмпирическое корреляционное отношение изменяется в пределах от 0 до 1. Если , то группировочный признак не оказывает влияния на результативный. Если , то результативный признак изменяется только в зависимости от признака, положенного в основание группировки, а влияние прочих факторных признаков равно нулю.

 

Дисперсионный анализ – метод оценки существенности различий нескольких средних. Его применяют при статистической обработке многовариантных, многофакторных опытов.

Критерий, используемый для оценки различий между выборочными средними, назван в честь Р.Фишера критерием F – распределения. Критерий F представляет собой отношение двух дисперсий:

где и - средние квадраты (дисперсии), рассчитанные по выборочным данным с учетом числа степеней свободы вариации[1].

Теоретическое значение F показывает случайную величину отношения двух дисперсий при данном уровне вероятности суждения и соответствующем числе степеней свободы анализируемых дисперсий. Критерий F связывают с вероятностью. Наиболее часто применяют уровни вероятности суждения – 0,95 и 0,99 (5 и 1%-ный уровни). Это означат, что только в пяти (в одном) случаях из 100 значение F может достигать табличного уровня или быть больше него для отношения дисперсий двух выборок, сделанных из одной и той же генеральной совокупности.

Табличное значение F используется как критерий для оценки фактических отношений дисперсий, рассчитанных по выборочным  данным. Если Fфакт > F табл, мало вероятно, что такое отношение случайное. А, значит, и различия в вариации нельзя отнести только за счет случайного колебания их уровня, и разница между средними существенна. В случае, когда Fфакт ≤ F табл, при данном уровне вероятности суждения и соответствующем числе степеней свободы это означает, что различия между сравниваемыми дисперсиями находятся в пределах возможных случайных колебаний.

Порядок проведения дисперсионного анализа идентичен при простых моделях, когда группировочный признак один, и при сложных моделях, когда группировочных признаков два или больше. Но с увеличением числа группировочных признаков более сложен процесс расчленения вариации по источникам образования.

При группировке по одному признаку общий объем вариации можно разложить на вариацию, связанную с действием группировочного признака, и вариацию внутригрупповую (остаточную):

.

Исходные данные для проведения однофакторного дисперсионного анализа могут быть представлены в виде статистической таблицы (таблица 1).

Таблица 1

Исходные данные

Вариант

Исходные данные, y

1

y11

y12

y1n

2

y21

y22

y2n

i

yi1

yi2

yin


 

При группировке по одному признаку группы могут быть равными и неравными, сформированы в случайном порядке, когда наблюдения одной группы не связаны с наблюдением другой группы, или неслучайном, когда наблюдения одной группы связаны с наблюдениями другой группы.

В опытах, где формируются группы соответственно числу повторностей по каждому варианту, схема дисперсионного анализа предусматривает исключение из общего объема вариации тех колебаний, которые обусловлены влиянием фактора, различиями в повторах и индивидуальными различиями внутри каждой группы.

Таким образом, общая сумма квадратов подразделяется на сумму квадратов отклонений вариантов опыта (групповая), сумму квадратов отклонений повторений и остаточную сумму квадратов:

.

Данные для обработки такого вида комплекса можно представить в виде статистической таблицы (таблица 2):

Таблица 2

Расположение данных в таблице для проведения дисперсионного анализа однофакторного сопряженного статистического комплекса

Вариант

Повторения

1

2

3

n

1

y11

y12

y13

y1n

2

y21

y22

y23

y2n

i

yi1

yi2

yi3

yin


 

При группировке данных по двум признакам общая сумма квадратов отклонений будет иметь уже две групповые суммы квадратов и сумму квадратов отклонений взаимодействия факторов и остаточную:

.

Исходные данные для проведения двухфакторного дисперсионного анализа с повторениями представлены в виде таблицы (таблица 3):

Таблица 3

Расположение данных в таблице для двухфакторного дисперсионного анализа с повторениями

Вариант

Аm

В1

В2

Вn

1

y11

y12

y1n

2

y21

y22

y2n

i

yi1

yi2

yin

Информация о работе Дисперсионный анализ