Автор: Пользователь скрыл имя, 24 Марта 2012 в 10:51, практическая работа
Цель работы: получение практических навыков статистической обработки многовариантных, многофакторных экспериментов, когда анализируется влияние одного, двух, трех и большего числа факторов на изменение величины какого-либо признака.
ПРАКТИЧЕСКАЯ РАБОТА 5
ДИСПЕРСИОННЫЙ АНАЛИЗ
Цель работы: получение практических навыков статистической обработки многовариантных, многофакторных экспериментов, когда анализируется влияние одного, двух, трех и большего числа факторов на изменение величины какого-либо признака.
Порядок выполнения работы:
1. Установление основных источников варьирования и определение объемов вариации по источникам образования.
2. Определение числа степеней свободы вариации.
3. Вычисление дисперсий и анализ соотношений между ними.
4. Интерпретация полученных результатов анализа.
Дисперсионный анализ быстро вошел в употребление благодаря следующим основным преимуществам:
При дисперсионном анализе проводят расчет дисперсий:
общей (дисперсия комплекса);
межгрупповой (факторная);
внутригрупповой (остаточная).
Общая дисперсия () измеряет вариацию признака во всей совокупности под влиянием всех факторов, обусловивших эту вариацию:
.
Межгрупповая дисперсия () характеризует систематическую вариацию, т.е. различия в величине изучаемого признака, возникающие под влиянием признака-фактора, положенного в основание группировки.
,
где - групповые средние,
- численность единиц в группе.
Внутригрупповая дисперсия () отражает случайную вариацию, т.е. часть вариации, происходящую под влиянием неучтенных факторов и не зависящую от признака-фактора, положенного в основание группировки:
- для несгруппированных данных;
- для сгруппированных данных.
Средняя из внутригрупповых дисперсий определяется следующим образом:
.
Существует закон, связывающий три вида дисперсии. Общая дисперсия равна сумме средней из внутригрупповых и межгрупповой дисперсий:
.
Данное соотношение называют правилом сложения дисперсий.
Правило сложения дисперсий широко применяется при исчислении показателей тесноты связи.
В статистическом анализе широко используется показатель, представляющий собой долю межгрупповой дисперсии в общей дисперсии. Он носит название эмпирического коэффициента детерминации ():
.
Этот коэффициент показывает долю (удельный вес) общей вариации изучаемого признака, обусловленную вариацией группировочного признака.
Эмпирическое корреляционное отношение () характеризует влияние признака, положенного в основание группировки, на вариацию результативного признака:
.
Эмпирическое корреляционное отношение изменяется в пределах от 0 до 1. Если , то группировочный признак не оказывает влияния на результативный. Если , то результативный признак изменяется только в зависимости от признака, положенного в основание группировки, а влияние прочих факторных признаков равно нулю.
Дисперсионный анализ – метод оценки существенности различий нескольких средних. Его применяют при статистической обработке многовариантных, многофакторных опытов.
Критерий, используемый для оценки различий между выборочными средними, назван в честь Р.Фишера критерием F – распределения. Критерий F представляет собой отношение двух дисперсий:
где и - средние квадраты (дисперсии), рассчитанные по выборочным данным с учетом числа степеней свободы вариации[1].
Теоретическое значение F показывает случайную величину отношения двух дисперсий при данном уровне вероятности суждения и соответствующем числе степеней свободы анализируемых дисперсий. Критерий F связывают с вероятностью. Наиболее часто применяют уровни вероятности суждения – 0,95 и 0,99 (5 и 1%-ный уровни). Это означат, что только в пяти (в одном) случаях из 100 значение F может достигать табличного уровня или быть больше него для отношения дисперсий двух выборок, сделанных из одной и той же генеральной совокупности.
Табличное значение F используется как критерий для оценки фактических отношений дисперсий, рассчитанных по выборочным данным. Если Fфакт > F табл, мало вероятно, что такое отношение случайное. А, значит, и различия в вариации нельзя отнести только за счет случайного колебания их уровня, и разница между средними существенна. В случае, когда Fфакт ≤ F табл, при данном уровне вероятности суждения и соответствующем числе степеней свободы это означает, что различия между сравниваемыми дисперсиями находятся в пределах возможных случайных колебаний.
Порядок проведения дисперсионного анализа идентичен при простых моделях, когда группировочный признак один, и при сложных моделях, когда группировочных признаков два или больше. Но с увеличением числа группировочных признаков более сложен процесс расчленения вариации по источникам образования.
При группировке по одному признаку общий объем вариации можно разложить на вариацию, связанную с действием группировочного признака, и вариацию внутригрупповую (остаточную):
.
Исходные данные для проведения однофакторного дисперсионного анализа могут быть представлены в виде статистической таблицы (таблица 1).
Таблица 1
Исходные данные
Вариант | Исходные данные, y | |||
1 | y11 | y12 | … | y1n |
2 | y21 | y22 | … | y2n |
… | … | … | … | … |
i | yi1 | yi2 | … | yin |
При группировке по одному признаку группы могут быть равными и неравными, сформированы в случайном порядке, когда наблюдения одной группы не связаны с наблюдением другой группы, или неслучайном, когда наблюдения одной группы связаны с наблюдениями другой группы.
В опытах, где формируются группы соответственно числу повторностей по каждому варианту, схема дисперсионного анализа предусматривает исключение из общего объема вариации тех колебаний, которые обусловлены влиянием фактора, различиями в повторах и индивидуальными различиями внутри каждой группы.
Таким образом, общая сумма квадратов подразделяется на сумму квадратов отклонений вариантов опыта (групповая), сумму квадратов отклонений повторений и остаточную сумму квадратов:
.
Данные для обработки такого вида комплекса можно представить в виде статистической таблицы (таблица 2):
Таблица 2
Расположение данных в таблице для проведения дисперсионного анализа однофакторного сопряженного статистического комплекса
Вариант | Повторения | ||||
1 | 2 | 3 | … | n | |
1 | y11 | y12 | y13 | … | y1n |
2 | y21 | y22 | y23 | … | y2n |
… | … | … | … | … | … |
i | yi1 | yi2 | yi3 | … | yin |
При группировке данных по двум признакам общая сумма квадратов отклонений будет иметь уже две групповые суммы квадратов и сумму квадратов отклонений взаимодействия факторов и остаточную:
.
Исходные данные для проведения двухфакторного дисперсионного анализа с повторениями представлены в виде таблицы (таблица 3):
Таблица 3
Расположение данных в таблице для двухфакторного дисперсионного анализа с повторениями
Вариант | Аm | |||
В1 | В2 | … | Вn | |
1 | y11 | y12 | … | y1n |
2 | y21 | y22 | … | y2n |
… | … | … | … | … |
i | yi1 | yi2 | … | yin |