Автор: Пользователь скрыл имя, 30 Октября 2012 в 23:39, контрольная работа
По исходным данным необходимо:
построить интервальный вариационный ряд распределения, дать его графическое изображение;
рассчитать показатели центра распределения: среднюю арифметическую, моду и медиану;
определить абсолютные и относительные показатели вариации, сделать выводы об однородности совокупности;
определить показатели формы распределения;
проверить соответствие эмпирического распределения закону нормального распределения, используя критерий согласия Пирсона, изобразить эмпирическое и теоретическое распределения на одном и том же графике.
Задание для задачи №2:
По исходным данным необходимо:
11 |
9 |
2 |
8 |
11 |
5 |
10 |
8 |
4 |
9 |
7 |
6 |
11 |
5 |
18 |
6 |
10 |
7 |
11 |
4 |
12 |
14 |
13 |
8 |
9 |
12 |
5 |
17 |
13 |
17 |
11 |
9 |
1 |
10 |
1 |
5 |
8 |
8 |
0 |
3 |
17 |
3 |
8 |
7 |
4 |
15 |
16 |
3 |
16 |
1 |
Ряд распределения – упорядоченное расположение единиц (элементов) изучаемой совокупности по группам в соответствии с выбранным группировочным признаком.
Ряд распределения представляет собой таблицу, которая состоит из двух основных колонок. В первой указываются значения, которые принимает признак в изучаемой совокупности, а во второй – количество, того или иного значения, т.е. частота. Для признака, имеющего непрерывное изменение, строится интервальный ряд распределения. При его построении отдельные значения признака указываются в первой колонке в виде интервалов «от - до».
В некоторых случаях, в зависимости от целей исследования, ряд распределения, состоящий из двух граф, иногда дополняется другими графами, необходимыми для вычисления отдельных статистических показателей.
Для построения интервального ряда вначале определяем размер интервала:
где xmax – максимальное значение признака в совокупности;
xmin - минимальное значение признака в совокупности;
m – число интервалов
Количество интервалов определим с помощью формулы Стерджесса:
где n – объем совокупности (количество исходных значений). В нашем случае n=50.
Количество интервалов обязательно должно быть целым числом. Поскольку формула Стерджесса дает лишь приблизительную оценку количества интервалов, то можно принять либо m=6, либо m=7. Для удобства дальнейших вычислений примем m=6. Тогда размер интервала будет равен:
Определяем
границы интервалов. Нижняя граница
первого интервала равна
Далее подсчитываем количество значений признака из заданной совокупности, попавших в тот или иной интервал и заносим это число в колонку «Частота». Если значение попадает на границу между k-ым и (k+1)-ым интервалами, то его относят в (k+1)-ый интервал. Сумма всех частот обязательно должна совпадать с объемом совокупности (в нашем случае со значением 50).
Вычисляем частости, т.е. частоты, выраженные в процентах к общему объему совокупности:
и т. д.
Таблица 1.
Интервальный ряд распределения
№ Инт. |
Значение признака (х) от - до |
Частота (f) |
Частость (w), % |
Накопленная частота (S) |
Плотность распределения (ρ) |
1 |
0-3 |
5 |
10 |
5 |
1,667 |
2 |
3-6 |
10 |
20 |
15 |
3,333 |
3 |
6-9 |
11 |
22 |
26 |
3,667 |
4 |
9-12 |
12 |
24 |
38 |
4 |
5 |
12-15 |
5 |
10 |
43 |
1,667 |
6 |
15-18 |
7 |
14 |
50 |
2,333 |
Итого: |
50 |
100 |
- |
- |
Накопленная частота показывает, сколько единиц изучаемой совокупности имеет значение признака не более чем некоторое заданное. Она вычисляется по формуле:
Последнее значение накопленной частоты должно быть равно объему совокупности.
Плотность распределения показывает, сколько единиц совокупности приходятся на единицу длины интервала:
Строим графические изображения ряда распределения.
Рис. 1. Структурная диаграмма
Рис.2. Полигон распределения
Рис. 3. Гистограмма распределения
К показателям центра распределения относятся: средняя арифметическая, мода и медиана.
Средняя арифметическая
где xi –середина i-го интервала.
Таблица 2.
№ Инт. |
Значение признака (х) от - до |
середина интервала xi |
Частота (f) |
xi fi |
Накопленная частота (S) |
1 |
0-3 |
1,5 |
5 |
7,5 |
5 |
2 |
3-6 |
4,5 |
10 |
45 |
15 |
3 |
6-9 |
7,5 |
11 |
82,5 |
26 |
4 |
9-12 |
10,5 |
12 |
126 |
38 |
5 |
12-15 |
13,5 |
5 |
67,5 |
43 |
6 |
15-18 |
16,5 |
7 |
115,5 |
50 |
Итого: |
50 |
444 |
Мода – значение признака наиболее часто встречающееся в изучаемой совокупности.
Для нахождения моды по интервальному ряду распределения в начале определяем модальный интервал, т.е. интервал с максимальной частотой. В нашем случае таким интервалом будет интервал от 9 до 12 (4-й интервал).
Далее величину моды вычисляем по формуле
где – нижняя граница модального интервала;
- размер модального интервала;
- частота модального интервала;
- частота интервала,
- частота интервала, следующего за модальным.
Медиана – значение признака, которое лежит в середине ранжированного ряда и делит этот ряда на две равные по численности части.
Для нахождения медианы по интервальному ряду распределения в начале определяем медианный интервал. Им будет первый сверху интервал, в котором накопленная частота больше или равна половине объема совокупности. В нашем случае половина объема совокупности n/2=50/2=25. Первый сверху интервал, в котором накопленная частота больше чем 25 – это интервал от 6 до 9 (в нем накопленная частота равна 26), поэтому этот интервал является медианным.
Далее величина медианы вычисляется по формуле
где – нижняя граница медианного интервала;
- размер медианного интервала;
- частота медианного интервала;
- накопленная частота интервала,
Вариация – различие индивидуальных значений признака внутри изучаемой совокупности.
Для характеристики изменчивости отдельных значений признака в статистике используют абсолютные и относительные показатели вариации.
Абсолютные показатели вариации:
Размах
Среднее линейное отклонение
где - средняя арифметическая найденная ранее
Для расчета заполним таблицу:
Таблица 3.
Интервал |
xi |
fi |
||
0-3 |
1,5 |
5 |
36,9 |
272,322 |
3-6 |
4,5 |
10 |
43,8 |
191,844 |
6-9 |
7,5 |
11 |
15,18 |
20,948 |
9-12 |
10,5 |
12 |
19,44 |
31,493 |
12-15 |
13,5 |
5 |
23,1 |
106,722 |
15-18 |
16,5 |
7 |
53,34 |
406,451 |
∑ |
50 |
191,760 |
1029,780 |
Дисперсия рассчитывается по формуле:
Получаем:
Среднее квадратическое отклонение:
Получаем:
Относительные показатели вариации:
Коэффициент осцилляции
Относительное линейное отклонение
Коэффициент вариации
Поскольку коэффициент вариации больше 33%, то совокупность по изучаемому признаку является неоднородной.
4. Определение
показателей формы
Показатель асимметрии
На основе показателя асимметрии могут быть сделаны следующие выводы.
Если As < 0, то асимметрия левосторонняя, а если As > 0 – то правосторонняя.
Чем ближе по модулю As к 1, тем асимметрия существеннее:
В нашем случае асимметрия правосторонняя и незначительная, так как <0.25.
В нашем случае асимметрия правосторонняя, незначительная.
Эксцесс является показателем островершинности распределения. Он рассчитывается для симметричных распределений на основе центрального момента 4-ого порядка . При симметричных распределениях Ех=0. Если Ех>0, то распределение относится к островершинным, если Ех<0 – к плосковершинным.
Показатель эксцесса (островершинности)
где μ4 – центральный момент 4-го порядка
Таблица 4.
Интервал |
xi |
fi |
|
0-3 |
1,5 |
5 |
14831,854 |
3-6 |
4,5 |
10 |
3680,412 |
6-9 |
7,5 |
11 |
39,894 |
9-12 |
10,5 |
12 |
82,650 |
12-15 |
13,5 |
5 |
2277,917 |
15-18 |
16,5 |
7 |
23600,322 |
∑ |
50 |
44513,049 |