Дисперсионный анализ

Автор: Пользователь скрыл имя, 24 Марта 2012 в 10:51, практическая работа

Краткое описание

Цель работы: получение практических навыков статистической обработки многовариантных, многофакторных экспериментов, когда анализируется влияние одного, двух, трех и большего числа факторов на изменение величины какого-либо признака.

Файлы: 1 файл

Дисперсионный анализ.doc

— 281.50 Кб (Скачать)

 

Если формирование групп будет неслучайным, разложение сумм квадратов усложнится. В итоге при группировке по двум признакам и неслучайном распределении повторностей по группам дисперсионный анализ проводится по следующей схеме:

.

После того, как определены  суммы квадратов, необходимо установить степени свободы вариации, соответствующие каждой сумме квадратов.

При группировке данных по одному признаку и случайному распределению повторностей в группах общее число степеней свободы составит , для групповой вариации (количество средних k минус 1), для остаточной вариации (общее число степеней свободы минус число степеней свободы для групповой вариации). Определение числа степеней свободы при группировке по одному (двум) признакам и неслучайном распределении повторностей далее рассмотрено на конкретных примерах.

После определения числа степеней свободы и суммы квадратов отклонений рассчитываются групповая и остаточная дисперсии:

Дисперсия групповая () характеризует в среднем вариацию, обусловленную влиянием группировочного признака и определяется так:

.

Дисперсия остаточная () измеряет вариацию, обусловленную случайными причинами, которые не учитывались при распределении данных наблюдений на группы:

.

Если групповая дисперсия значительно больше остаточной, то фактор оказывает существенное влияние на величину признака. Фактическое отношение групповой дисперсии к остаточной () сравнивают с табличным значением F.

Отношение дисперсий групповой и остаточной позволяет сделать с определенной вероятностью вывод о том, достоверны ли различия в средних. Если есть необходимость сделать заключение об отдельных парах средних, этот вывод недостаточен.

Поэтому результаты дисперсионного анализа дополняются оценкой достоверности разности между двумя средними.

Для этого рассчитывается средняя ошибка выборочных средних на основе остаточной дисперсии:

.

Средняя ошибка разности двух средних - корень квадратный из суммы квадратов средних ошибок сравниваемых средних, но так как m2 одинакова для всех средних,

.

Принимая доверительный уровень вероятности по таблицам t Стьюдента, определяют критическую величину t.

На основе средней ошибки разности двух средних и tтабл вычисляют возможную предельную ошибку этой разности:

.

Предельная ошибка сопоставляется с разностью двух сравниваемых средних:

.

Если разница между средними больше по абсолютной величине возможной предельной ошибки, то делается вывод о существенности разности средних. Если же , то разница между средними лежит в границах возможных случайных колебаний, т.е. она недостоверна.

Величину принято называть наименьшей существенной разностью.

Рассмотрим дисперсионный анализ на конкретных примерах.

 

Пример 1.

Имеются данные о заработной плате 20 работников фирмы:

Таблица 4

Данные о заработной плате работников фирмы

№п/п

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

З/пл, тыс. руб.

1,3

1,7

2,3

2,7

3,0

3,2

3,4

3,5

3,6

3,7

3,9

4,2

4,4

4,5

4,7

4,8

5,0

5,2

5,7

5,8

 

Используя правило сложения дисперсий, определить степень влияния уровня образования работников на заработную плату, если работники со средним специальным образованием имеют заработную плату до 3,5 тыс. руб., с высшим – более 3,5 тыс. руб.

 

Для определения степени влияния образования работников на их заработную плату, определяем группировочный признак и строим таблицу. Результативным признаком является заработная плата, факторным – образование работников.

 

Таблица 5

Распределение заработной платы работников в зависимости от уровня образования

Среднее специальное

Высшее

№ п/п

з/пл, тыс. руб. xi

 

 

№ п/п

з/пл, тыс. руб. xi

 

 

1

1,3

-1,3

1,69

1

3,6

-1,0

1,00

2

1,7

-0,9

0,81

2

3,7

-0,9

0,81

3

2,3

-0,3

0,09

3

3,9

-0,7

0,49

4

2,7

0,1

0,01

4

4,2

-0,4

0,16

5

3,0

0,4

0,16

5

4,4

-0,2

0,04

6

3,2

0,6

0,36

6

4,5

-0,1

0,01

7

3,4

0,8

0,64

7

4,7

0,1

0,01

8

3,5

0,9

0,81

8

4,8

0,2

0,04

 

 

 

 

9

5,0

0,4

0,16

 

 

 

 

10

5,2

0,6

0,36

 

 

 

 

11

5,7

1,1

1,21

 

 

 

 

12

5,8

1,2

1,44

Итого:

21,1

 

4,57

Итого:

55,5

 

5,73


 

 

 

 

 

Внутригрупповые дисперсии определим по формуле:

Внутригрупповые дисперсии показывают вариацию заработной платы по группам, вызванные всеми возможными факторами (стаж работы, квалификация, должность, производительность труда и др.), кроме образования работников.

Среднюю из внутригрупповых дисперсий определим по формуле:

.

Межгрупповая дисперсия исчисляется по формуле:

.

Определим общую среднюю по формуле средней арифметической простой:

Межгрупповая дисперсия показывает вариацию заработной платы, обусловленную влиянием образования работников.

Общую дисперсию определяем на основании правила сложения дисперсий:

Определим долю межгрупповой дисперсии в общей с помощью эмпирического коэффициента детерминации:

На 64,9% вариация заработной платы обусловлена влиянием уровня образования работников и на 35,1% (100-64,9) влиянием прочих факторов, не учтенных в группировке.

Эмпирическое корреляционное отношение:

.

Эмпирическое корреляционное отношение показывает тесноту связи между результативным и факторным признаком. Оно равно 0,81, следовательно, связь между заработной платой и уровнем образования работников - тесная.

 

Пример 2. Дисперсионный анализ при группировке данных по одному признаку (неслучайное распределение наблюдений в группах).

 

Правление фирмы решает изучить результаты продвижения на книжный рынок научной литературы, надеясь извлечь из них информацию, которой можно было бы воспользоваться при организации и проведении компании по распространению  новых изданий.

С этой целью была выделена контрольная группа продавцов, не имеющих опыта работы. Вторая группа имела стаж работы 1-3 года. Третью группу составляли работники со стажем более 3-х лет.

Чтобы обеспечить по всем трем вариантам выровненные условия, были сформированы пять групп, приблизительно равноценных по показателям. Каждая группа включала 3 человека. Результаты работы приведены в таблице 6.

Таблица 6   Количество проданной научной литературы, шт. (в среднем за месяц)

Варианты опыта

Повторности

Суммы

Средние

1

2

3

4

5

I группа (контр.)

347

331

335

333

327

1673

335

II группа

373

379

366

345

349

1812

362

III группа

395

383

388

357

362

1885

377

Суммы

1115

1093

1089

1035

1038

5370

358

Средние

372

364

363

345

346

358

Х


 

Проведение исследования таково, что наблюдения в каждом варианте связаны общностью условий, т.е. распределение повторностей в группах неслучайное. Порядок построения опыта делает необходимым исключение из общей суммы квадратов отклонений вариации, определяемой стажем, повторностями и остаточной вариацией:

.

Требуется статистически оценить результаты исследований в целом и попарно сравнить средние по стажу. Уровень вероятности суждения 0,05.

Решение.

  1. Выдвинем гипотезу, что различия в средних стажа работы случайны, и рассчитаем показатели, необходимые для заключения выдвинутой гипотезы.
  2. Данные таблицы 6 для удобства вычислений целесообразно уменьшить на постоянную величину (А), близкую к значению средней. Результаты занесем в таблицу 7.

Таблица 7

Отклонения от условного начала  у = х – А, А = 350

Вариант опыта

Повторности

Сумма

1

2

3

4

5

I группа (контр.)

-3

-19

-15

-17

-23

-77

II группа

23

29

16

-5

-1

62

III группа

45

33

38

7

12

135

Суммы

65

43

39

-15

-12

120 =

Информация о работе Дисперсионный анализ