Анализ эмпирического распределения

Автор: Пользователь скрыл имя, 13 Марта 2012 в 19:19, курсовая работа

Краткое описание

Основной целью написания курсовой работы является изучение методики статистического анализа рядов распределения. Для достижения поставленной цели были поставлены и выполнены следующие основные задачи:
1. Освещено понятие и виды статистических рядов распределения, и основные формы их представления.
2. Рассчитаны и проанализированы показатели, характеризующие центральную тенденцию, вариацию, структуру и форму ряда распределения.
3. Проведено сглаживание эмпирического распределения и проверены гипотезы о законе распределения.

Оглавление

ВВЕДЕНИЕ.
1) ТАБЛИЧНОЕ И ГРАФИЧЕСКОЕ ПРЕДСТАВЛЕНИЕ ВАРИАЦИОННОГО РЯДА.
2) ХАРАКТЕРИСТИКА ЦЕНТРАЛЬНОЙ ТЕНДЕНЦИИ РАСПРЕДЕЛЕНИЯ.
3) ОЦЕНКА ВАРИАЦИИ ИЗУЧАЕМОГО ПРИЗНАКА.
4) ХАРАКТЕРИСТИКА СТРУКТУРЫ РАСПРЕДЕЛЕНИЯ.
5) ХАРАКТЕРИСТИКА ФОРМЫ РАСПРЕДЕЛЕНИЯ.
6) СГЛАЖИВАНИЕ ЭМПИРИЧЕСКОГО РАСПРЕДЕЛЕНИЯ. ПРОВЕРКА ГИПОТЕЗЫ О ЗАКОНЕ РАСПРЕДЕЛЕНИЯ.
ЗАКЛЮЧЕНИЕ.
СПИСОК ИСПОЛЬЗОВАННОЙ ЛИТЕРАТУРЫ.

Файлы: 1 файл

Оля.doc

— 393.00 Кб (Скачать)

 

б)

 

Count

Cumulative Count

Percent

Cumulative Percent

-466,955<x<=490,9545

2

2

10,52632

10,5263

490,9545<x<=1448,864

16

18

84,21053

94,7368

1448,864<x<=2406,773

0

18

0,00000

94,7368

2406,773<x<=3364,682

0

18

0,00000

94,7368

3364,682<x<=4322,591

0

18

0,00000

94,7368

4322,591<x<=5280,500

0

18

0,00000

94,7368

5280,500<x<=6238,409

0

18

0,00000

94,7368

6238,409<x<=7196,318

0

18

0,00000

94,7368

7196,318<x<=8154,227

0

18

0,00000

94,7368

8154,227<x<=9112,136

0

18

0,00000

94,7368

9112,136<x<=10070,05

0

18

0,00000

94,7368

10070,05<x<=11027,95

1

19

5,26316

100,0000


 

 

 

 

 

 

 

 

 

в)

 

Count

Cumulative Count

Percent

Cumulative Percent

-297,912<x<=321,9118

2

2

10,52632

10,5263

321,9118<x<=941,7353

13

15

68,42105

78,9474

941,7353<x<=1561,559

3

18

15,78947

94,7368

1561,559<x<=2181,382

0

18

0,00000

94,7368

2181,382<x<=2801,206

0

18

0,00000

94,7368

2801,206<x<=3421,029

0

18

0,00000

94,7368

3421,029<x<=4040,853

0

18

0,00000

94,7368

4040,853<x<=4660,676

0

18

0,00000

94,7368

4660,676<x<=5280,500

0

18

0,00000

94,7368

5280,500<x<=5900,324

0

18

0,00000

94,7368

5900,324<x<=6520,147

0

18

0,00000

94,7368

6520,147<x<=7139,971

0

18

0,00000

94,7368

7139,971<x<=7759,794

0

18

0,00000

94,7368

7759,794<x<=8379,618

0

18

0,00000

94,7368

8379,618<x<=8999,441

0

18

0,00000

94,7368

8999,441<x<=9619,265

0

18

0,00000

94,7368

9619,265<x<=10239,09

0

18

0,00000

94,7368

10239,09<x<=10858,91

1

19

5,26316

100,0000


 

Выбирая окончательный вариант табличного представления вариационного ряда из представленных вариантов, остановимся на третьем – n=18.

При n=12 наблюдает много малонаполненных групп и нулевой интервал, хотя  второй вариант практически ни чем не отличается, хотя имеет более короткий нулевой интервал, поэтому в практическом плане более удобен для дальнейших расчётов и анализа. При n=6 также имеются малонаполненные группы и нулевой, но она менее информативна.

В таблицах первая непроименованная графа (From To) содержит интервалы значений признака «численность населения РМ (оценка на конец года; тысяч человек) за период с 1995 по 2009 гг.».

Второй столбец «Count» – абсолютные частоты (fi), т.е. число единиц совокупности, обладающих указанным значением признака.

Cumulative Count – накопленные абсолютные частоты, получаемые последовательным суммированием частот по группам. Сумма накопленных частот по каждой строке означает, какое количество единиц совокупности (регионов) имеет значение признака, не превышающее значения верхней границы данного интервала.

Percent – частости (относительные частоты, wi; выражаются в процентах).

Cumulative percent – накопленные частости – это результат последовательного суммирования относительных частот по группам, итоговая сумма, очевидно, равна 100%.

Рассмотренная процедура построения таблиц частот не всегда является справедливой, поскольку необходимо учитывать суть и возможные значения исходных данных.

На основе таблиц строятся графики, наглядно представляющие закономерность распределения анализируемой статистической совокупности.                                                          Графическое представление может быть осуществлено как с использованием абсолютных, так и относительных частот.

Для более наглядного представления вариационного ряда построим статистические графики.

Традиционно для изображения вариационных рядов распределения в отечественной практике используются графики: гистограмма, полигон, кумулята.

 

Рис. 1.1 Гистограмма численности РМ (оценка на конец года; тысяч человек) за период с 1995 по 2009 гг. в с наложенной кривой нормального распределения с числом интервалов (k =6).

 

Рис. 1.2 Гистограмма численности РМ (оценка на конец года; тысяч человек) за период с 1995 по 2009 гг. с наложенной кривой нормального распределения с числом интервалов (k=12).

 

Рис. 1.3 Гистограмма численности РМ (оценка на конец года; тысяч человек) за период с 1995 по 2009 гг. с наложенной кривой нормального распределения с числом интервалов (k=18).

 

Для построения полигона на основе абсолютных частот необходимо выделить столбец Count в таблице частот.

 

Рис. 1.4 Полигон численности РМ (оценка на конец года; тысяч человек) за период с 1995 по 2009 гг. с числом интервалов (k=6).

 

 

 

 

 

 

 

 

 

 

 

 

Рис. 1.5 Полигон численности РМ (оценка на конец года; тысяч человек) за период с 1995 по 2009 гг. с числом интервалов (k=12).

 

Рис. 1.6 Полигон численности РМ (оценка на конец года; тысяч человек) за период с 1995 по 2009 гг. с числом интервалов (k=18).

 

Для построения полигона по относительным частотам, кумуляты по абсолютным и относительным частотам выбираются соответственно столбцы Percent, Cumulative count , Cumulative percent в таблице частот.

 

Рис. 1.7 Кумулята численности РМ (оценка на конец года; тысяч человек) за период с 1995 по 2009 гг. с числом интервалов (k=18) (абсолютные частоты).

 

 

 

 

 

 

 

 

 

 

 

 

Рис. 1.8 Кумулята численности РМ (оценка на конец года; тысяч человек) за период с 1995 по 2009 гг. с числом интервалов (k=18) (относительные частоты).

 

 

2. ХАРАКТЕРИСТИКА ЦЕНТРАЛЬНОЙ ТЕНДЕНЦИИ РАСПРЕДЕЛЕНИЯ

 

Расчет и анализ показателей центра распределения: среднего арифметического значения, моды и медианы.

Mean — средняя арифметическая.

Median — медиана.

Mode — мода (Мо) определяется непосредственно по исходным

данным (запись в строке Multiple означает, что распределение имеет не одну моду).

             

Табл. 1.4 Расчет показателей центра распределения.

ЧИСЛЕННОСТЬ НАСЕЛЕНИЯ Ульяновская область
(оценка на конец года; тысяч человек)

Mean

1299,618

Median

871

Mode

1,000


 

Значение средней арифметическая, медианы и моды рассчитаем с помощью ППП «Statistica» и их значения составят: средняя арифметическая (mean) — 1299,618; медиана (median) — 871; мода (mode) — 1. (табл. 1.4)

 

3. Оценка вариации изучаемого признака

 

Расчет и анализ следующих показателей: размах вариации, дисперсия, среднее квадратическое отклонение, коэффициент вариации.

Variance — дисперсия.

Standard deviation — среднее квадратическое (стандартное) отклонение.

Range — размах вариации.

 

Табл. 1.5 Расчет вариации изучаемого признака

ЧИСЛЕННОСТЬ НАСЕЛЕНИЯ Ульяновская область
(оценка на конец года; тысяч человек)

Range

10537,00

Variance

5090419

Std.Dev.

2256,196


 

Значение дисперсии, среднего квадратического (стандартного) отклонения и размаха вариации рассчитаем с помощью ППП «Statistica» и их значения составят: дисперсия (variance) — 5090419; среднее квадратическое отклонение (standard deviation) — 2256,196; размах вариации (range) — 10537,00. (табл. 1.5)

 

4.      Характеристика структуры распределения

 

Расчет и анализ показателей: медиана, квартили.

Median — медиана.

Lower (Lower quartile) — нижний (первый) квартиль — Q1.

Upper (Upper quartile) — верхний (третий) квартиль —Q3.

 

 

Табл. 1.6 Расчет структуры распределения

ЧИСЛЕННОСТЬ НАСЕЛЕНИЯ Ульяновская область
(оценка на конец года; тысяч человек)

Median

871

Lower

833

Upper

908

Информация о работе Анализ эмпирического распределения