Автор: Пользователь скрыл имя, 30 Октября 2012 в 23:39, контрольная работа
По  исходным данным необходимо:
    построить интервальный вариационный ряд распределения, дать его графическое изображение;
    рассчитать показатели центра распределения: среднюю арифметическую, моду и медиану;
    определить абсолютные и относительные показатели вариации, сделать выводы об однородности совокупности;
    определить показатели формы распределения;
    проверить соответствие эмпирического распределения закону нормального распределения, используя критерий согласия Пирсона, изобразить эмпирическое и теоретическое распределения на одном и том же графике.
Задание для задачи №2:
По исходным данным необходимо:
11  | 
  9  | 
  2  | 
  8  | 
  11  | 
  5  | 
  10  | 
  8  | 
  4  | 
  9  | 
7  | 
  6  | 
  11  | 
  5  | 
  18  | 
  6  | 
  10  | 
  7  | 
  11  | 
  4  | 
12  | 
  14  | 
  13  | 
  8  | 
  9  | 
  12  | 
  5  | 
  17  | 
  13  | 
  17  | 
11  | 
  9  | 
  1  | 
  10  | 
  1  | 
  5  | 
  8  | 
  8  | 
  0  | 
  3  | 
17  | 
  3  | 
  8  | 
  7  | 
  4  | 
  15  | 
  16  | 
  3  | 
  16  | 
  1  | 
Ряд распределения – упорядоченное расположение единиц (элементов) изучаемой совокупности по группам в соответствии с выбранным группировочным признаком.
Ряд распределения представляет собой таблицу, которая состоит из двух основных колонок. В первой указываются значения, которые принимает признак в изучаемой совокупности, а во второй – количество, того или иного значения, т.е. частота. Для признака, имеющего непрерывное изменение, строится интервальный ряд распределения. При его построении отдельные значения признака указываются в первой колонке в виде интервалов «от - до».
В некоторых случаях, в зависимости от целей исследования, ряд распределения, состоящий из двух граф, иногда дополняется другими графами, необходимыми для вычисления отдельных статистических показателей.
Для построения интервального ряда вначале определяем размер интервала:
где xmax – максимальное значение признака в совокупности;
xmin - минимальное значение признака в совокупности;
m – число интервалов
Количество интервалов определим с помощью формулы Стерджесса:
где n – объем совокупности (количество исходных значений). В нашем случае n=50.
Количество интервалов обязательно должно быть целым числом. Поскольку формула Стерджесса дает лишь приблизительную оценку количества интервалов, то можно принять либо m=6, либо m=7. Для удобства дальнейших вычислений примем m=6. Тогда размер интервала будет равен:
Определяем 
границы интервалов. Нижняя граница 
первого интервала равна 
Далее подсчитываем количество значений признака из заданной совокупности, попавших в тот или иной интервал и заносим это число в колонку «Частота». Если значение попадает на границу между k-ым и (k+1)-ым интервалами, то его относят в (k+1)-ый интервал. Сумма всех частот обязательно должна совпадать с объемом совокупности (в нашем случае со значением 50).
Вычисляем частости, т.е. частоты, выраженные в процентах к общему объему совокупности:
и т. д.
 
Таблица 1.
Интервальный ряд распределения
№ Инт.  | 
  Значение признака (х) от - до  | 
  Частота (f)  | 
  Частость (w), %  | 
  Накопленная частота (S)  | 
  Плотность распределения (ρ)  | 
1  | 
  0-3  | 
  5  | 
  10  | 
  5  | 
  1,667  | 
2  | 
  3-6  | 
  10  | 
  20  | 
  15  | 
  3,333  | 
3  | 
  6-9  | 
  11  | 
  22  | 
  26  | 
  3,667  | 
4  | 
  9-12  | 
  12  | 
  24  | 
  38  | 
  4  | 
5  | 
  12-15  | 
  5  | 
  10  | 
  43  | 
  1,667  | 
6  | 
  15-18  | 
  7  | 
  14  | 
  50  | 
  2,333  | 
Итого:  | 
  50  | 
  100  | 
  -  | 
  -  | |
Накопленная частота показывает, сколько единиц изучаемой совокупности имеет значение признака не более чем некоторое заданное. Она вычисляется по формуле:
Последнее значение накопленной частоты должно быть равно объему совокупности.
Плотность распределения показывает, сколько единиц совокупности приходятся на единицу длины интервала:
Строим графические изображения ряда распределения.
Рис. 1. Структурная диаграмма
Рис.2. Полигон распределения
Рис. 3. Гистограмма распределения
К показателям центра распределения относятся: средняя арифметическая, мода и медиана.
Средняя арифметическая
где xi –середина i-го интервала.
Таблица 2.
№ Инт.  | 
  Значение признака (х) от - до  | 
  середина интервала xi  | 
  Частота (f)  | 
  xi fi  | 
  Накопленная частота (S)  | 
1  | 
  0-3  | 
  1,5  | 
  5  | 
  7,5  | 
  5  | 
2  | 
  3-6  | 
  4,5  | 
  10  | 
  45  | 
  15  | 
3  | 
  6-9  | 
  7,5  | 
  11  | 
  82,5  | 
  26  | 
4  | 
  9-12  | 
  10,5  | 
  12  | 
  126  | 
  38  | 
5  | 
  12-15  | 
  13,5  | 
  5  | 
  67,5  | 
  43  | 
6  | 
  15-18  | 
  16,5  | 
  7  | 
  115,5  | 
  50  | 
Итого:  | 
  50  | 
  444  | 
  |||
Мода – значение признака наиболее часто встречающееся в изучаемой совокупности.
Для нахождения моды по интервальному ряду распределения в начале определяем модальный интервал, т.е. интервал с максимальной частотой. В нашем случае таким интервалом будет интервал от 9 до 12 (4-й интервал).
Далее величину моды вычисляем по формуле
где – нижняя граница модального интервала;
- размер модального интервала;
- частота модального интервала;
- частота интервала, 
- частота интервала, следующего за модальным.
Медиана – значение признака, которое лежит в середине ранжированного ряда и делит этот ряда на две равные по численности части.
Для нахождения медианы по интервальному ряду распределения в начале определяем медианный интервал. Им будет первый сверху интервал, в котором накопленная частота больше или равна половине объема совокупности. В нашем случае половина объема совокупности n/2=50/2=25. Первый сверху интервал, в котором накопленная частота больше чем 25 – это интервал от 6 до 9 (в нем накопленная частота равна 26), поэтому этот интервал является медианным.
Далее величина медианы вычисляется по формуле
где – нижняя граница медианного интервала;
- размер медианного интервала;
- частота медианного интервала;
- накопленная частота интервала,
Вариация – различие индивидуальных значений признака внутри изучаемой совокупности.
Для характеристики изменчивости отдельных значений признака в статистике используют абсолютные и относительные показатели вариации.
Абсолютные показатели вариации:
Размах
Среднее линейное отклонение
где - средняя арифметическая найденная ранее
Для расчета заполним таблицу:
 
Таблица 3.
Интервал  | 
  xi  | 
  fi  | 
  ||
| 
   0-3  | 
  1,5  | 
  5  | 
  36,9  | 
  272,322  | 
3-6  | 
  4,5  | 
  10  | 
  43,8  | 
  191,844  | 
6-9  | 
  7,5  | 
  11  | 
  15,18  | 
  20,948  | 
9-12  | 
  10,5  | 
  12  | 
  19,44  | 
  31,493  | 
12-15  | 
  13,5  | 
  5  | 
  23,1  | 
  106,722  | 
15-18  | 
  16,5  | 
  7  | 
  53,34  | 
  406,451  | 
∑  | 
  50  | 
  191,760  | 
  1029,780  | 
Дисперсия рассчитывается по формуле:
Получаем:
Среднее квадратическое отклонение:
Получаем:
Относительные показатели вариации:
Коэффициент осцилляции
Относительное линейное отклонение
Коэффициент вариации
Поскольку коэффициент вариации больше 33%, то совокупность по изучаемому признаку является неоднородной.
4. Определение 
показателей формы 
Показатель асимметрии
На основе показателя асимметрии могут быть сделаны следующие выводы.
Если As < 0, то асимметрия левосторонняя, а если As > 0 – то правосторонняя.
Чем ближе по модулю As к 1, тем асимметрия существеннее:
В нашем случае асимметрия правосторонняя и незначительная, так как <0.25.
В нашем случае асимметрия правосторонняя, незначительная.
Эксцесс является показателем островершинности распределения. Он рассчитывается для симметричных распределений на основе центрального момента 4-ого порядка . При симметричных распределениях Ех=0. Если Ех>0, то распределение относится к островершинным, если Ех<0 – к плосковершинным.
Показатель эксцесса (островершинности)
где μ4 – центральный момент 4-го порядка
Таблица 4.
Интервал  | 
  xi  | 
  fi  | 
  |
| 
   0-3  | 
  1,5  | 
  5  | 
  14831,854  | 
3-6  | 
  4,5  | 
  10  | 
  3680,412  | 
6-9  | 
  7,5  | 
  11  | 
  39,894  | 
9-12  | 
  10,5  | 
  12  | 
  82,650  | 
12-15  | 
  13,5  | 
  5  | 
  2277,917  | 
15-18  | 
  16,5  | 
  7  | 
  23600,322  | 
∑  | 
  50  | 
  44513,049  |