Автор: Пользователь скрыл имя, 13 Марта 2012 в 19:19, курсовая работа
Основной целью написания курсовой работы является изучение методики статистического анализа рядов распределения. Для достижения поставленной цели были поставлены и выполнены следующие основные задачи:
1. Освещено понятие и виды статистических рядов распределения, и основные формы их представления.
2. Рассчитаны и проанализированы показатели, характеризующие центральную тенденцию, вариацию, структуру и форму ряда распределения.
3. Проведено сглаживание эмпирического распределения и проверены гипотезы о законе распределения.
ВВЕДЕНИЕ.
1) ТАБЛИЧНОЕ И ГРАФИЧЕСКОЕ ПРЕДСТАВЛЕНИЕ ВАРИАЦИОННОГО РЯДА.
2) ХАРАКТЕРИСТИКА ЦЕНТРАЛЬНОЙ ТЕНДЕНЦИИ РАСПРЕДЕЛЕНИЯ.
3) ОЦЕНКА ВАРИАЦИИ ИЗУЧАЕМОГО ПРИЗНАКА.
4) ХАРАКТЕРИСТИКА СТРУКТУРЫ РАСПРЕДЕЛЕНИЯ.
5) ХАРАКТЕРИСТИКА ФОРМЫ РАСПРЕДЕЛЕНИЯ.
6) СГЛАЖИВАНИЕ ЭМПИРИЧЕСКОГО РАСПРЕДЕЛЕНИЯ. ПРОВЕРКА ГИПОТЕЗЫ О ЗАКОНЕ РАСПРЕДЕЛЕНИЯ.
ЗАКЛЮЧЕНИЕ.
СПИСОК ИСПОЛЬЗОВАННОЙ ЛИТЕРАТУРЫ.
б)
| Count | Cumulative Count | Percent | Cumulative Percent |
-466,955<x<=490,9545 | 2 | 2 | 10,52632 | 10,5263 |
490,9545<x<=1448,864 | 16 | 18 | 84,21053 | 94,7368 |
1448,864<x<=2406,773 | 0 | 18 | 0,00000 | 94,7368 |
2406,773<x<=3364,682 | 0 | 18 | 0,00000 | 94,7368 |
3364,682<x<=4322,591 | 0 | 18 | 0,00000 | 94,7368 |
4322,591<x<=5280,500 | 0 | 18 | 0,00000 | 94,7368 |
5280,500<x<=6238,409 | 0 | 18 | 0,00000 | 94,7368 |
6238,409<x<=7196,318 | 0 | 18 | 0,00000 | 94,7368 |
7196,318<x<=8154,227 | 0 | 18 | 0,00000 | 94,7368 |
8154,227<x<=9112,136 | 0 | 18 | 0,00000 | 94,7368 |
9112,136<x<=10070,05 | 0 | 18 | 0,00000 | 94,7368 |
10070,05<x<=11027,95 | 1 | 19 | 5,26316 | 100,0000 |
в)
| Count | Cumulative Count | Percent | Cumulative Percent |
-297,912<x<=321,9118 | 2 | 2 | 10,52632 | 10,5263 |
321,9118<x<=941,7353 | 13 | 15 | 68,42105 | 78,9474 |
941,7353<x<=1561,559 | 3 | 18 | 15,78947 | 94,7368 |
1561,559<x<=2181,382 | 0 | 18 | 0,00000 | 94,7368 |
2181,382<x<=2801,206 | 0 | 18 | 0,00000 | 94,7368 |
2801,206<x<=3421,029 | 0 | 18 | 0,00000 | 94,7368 |
3421,029<x<=4040,853 | 0 | 18 | 0,00000 | 94,7368 |
4040,853<x<=4660,676 | 0 | 18 | 0,00000 | 94,7368 |
4660,676<x<=5280,500 | 0 | 18 | 0,00000 | 94,7368 |
5280,500<x<=5900,324 | 0 | 18 | 0,00000 | 94,7368 |
5900,324<x<=6520,147 | 0 | 18 | 0,00000 | 94,7368 |
6520,147<x<=7139,971 | 0 | 18 | 0,00000 | 94,7368 |
7139,971<x<=7759,794 | 0 | 18 | 0,00000 | 94,7368 |
7759,794<x<=8379,618 | 0 | 18 | 0,00000 | 94,7368 |
8379,618<x<=8999,441 | 0 | 18 | 0,00000 | 94,7368 |
8999,441<x<=9619,265 | 0 | 18 | 0,00000 | 94,7368 |
9619,265<x<=10239,09 | 0 | 18 | 0,00000 | 94,7368 |
10239,09<x<=10858,91 | 1 | 19 | 5,26316 | 100,0000 |
Выбирая окончательный вариант табличного представления вариационного ряда из представленных вариантов, остановимся на третьем – n=18.
При n=12 наблюдает много малонаполненных групп и нулевой интервал, хотя второй вариант практически ни чем не отличается, хотя имеет более короткий нулевой интервал, поэтому в практическом плане более удобен для дальнейших расчётов и анализа. При n=6 также имеются малонаполненные группы и нулевой, но она менее информативна.
В таблицах первая непроименованная графа (From To) содержит интервалы значений признака «численность населения РМ (оценка на конец года; тысяч человек) за период с 1995 по 2009 гг.».
Второй столбец «Count» – абсолютные частоты (fi), т.е. число единиц совокупности, обладающих указанным значением признака.
Cumulative Count – накопленные абсолютные частоты, получаемые последовательным суммированием частот по группам. Сумма накопленных частот по каждой строке означает, какое количество единиц совокупности (регионов) имеет значение признака, не превышающее значения верхней границы данного интервала.
Percent – частости (относительные частоты, wi; выражаются в процентах).
Cumulative percent – накопленные частости – это результат последовательного суммирования относительных частот по группам, итоговая сумма, очевидно, равна 100%.
Рассмотренная процедура построения таблиц частот не всегда является справедливой, поскольку необходимо учитывать суть и возможные значения исходных данных.
На основе таблиц строятся графики, наглядно представляющие закономерность распределения анализируемой статистической совокупности.
Для более наглядного представления вариационного ряда построим статистические графики.
Традиционно для изображения вариационных рядов распределения в отечественной практике используются графики: гистограмма, полигон, кумулята.
Рис. 1.1 Гистограмма численности РМ (оценка на конец года; тысяч человек) за период с 1995 по 2009 гг. в с наложенной кривой нормального распределения с числом интервалов (k =6).
Рис. 1.2 Гистограмма численности РМ (оценка на конец года; тысяч человек) за период с 1995 по 2009 гг. с наложенной кривой нормального распределения с числом интервалов (k=12).
Рис. 1.3 Гистограмма численности РМ (оценка на конец года; тысяч человек) за период с 1995 по 2009 гг. с наложенной кривой нормального распределения с числом интервалов (k=18).
Для построения полигона на основе абсолютных частот необходимо выделить столбец Count в таблице частот.
Рис. 1.4 Полигон численности РМ (оценка на конец года; тысяч человек) за период с 1995 по 2009 гг. с числом интервалов (k=6).
Рис. 1.5 Полигон численности РМ (оценка на конец года; тысяч человек) за период с 1995 по 2009 гг. с числом интервалов (k=12).
Рис. 1.6 Полигон численности РМ (оценка на конец года; тысяч человек) за период с 1995 по 2009 гг. с числом интервалов (k=18).
Для построения полигона по относительным частотам, кумуляты по абсолютным и относительным частотам выбираются соответственно столбцы Percent, Cumulative count , Cumulative percent в таблице частот.
Рис. 1.7 Кумулята численности РМ (оценка на конец года; тысяч человек) за период с 1995 по 2009 гг. с числом интервалов (k=18) (абсолютные частоты).
Рис. 1.8 Кумулята численности РМ (оценка на конец года; тысяч человек) за период с 1995 по 2009 гг. с числом интервалов (k=18) (относительные частоты).
2. ХАРАКТЕРИСТИКА ЦЕНТРАЛЬНОЙ ТЕНДЕНЦИИ РАСПРЕДЕЛЕНИЯ
Расчет и анализ показателей центра распределения: среднего арифметического значения, моды и медианы.
Mean — средняя арифметическая.
Median — медиана.
Mode — мода (Мо) определяется непосредственно по исходным
данным (запись в строке Multiple означает, что распределение имеет не одну моду).
Табл. 1.4 Расчет показателей центра распределения.
ЧИСЛЕННОСТЬ НАСЕЛЕНИЯ Ульяновская область | |
Mean | 1299,618 |
Median | 871 |
Mode | 1,000 |
Значение средней арифметическая, медианы и моды рассчитаем с помощью ППП «Statistica» и их значения составят: средняя арифметическая (mean) — 1299,618; медиана (median) — 871; мода (mode) — 1. (табл. 1.4)
3. Оценка вариации изучаемого признака
Расчет и анализ следующих показателей: размах вариации, дисперсия, среднее квадратическое отклонение, коэффициент вариации.
Variance — дисперсия.
Standard deviation — среднее квадратическое (стандартное) отклонение.
Range — размах вариации.
Табл. 1.5 Расчет вариации изучаемого признака
ЧИСЛЕННОСТЬ НАСЕЛЕНИЯ Ульяновская область | |
Range | 10537,00 |
Variance | 5090419 |
Std.Dev. | 2256,196 |
Значение дисперсии, среднего квадратического (стандартного) отклонения и размаха вариации рассчитаем с помощью ППП «Statistica» и их значения составят: дисперсия (variance) — 5090419; среднее квадратическое отклонение (standard deviation) — 2256,196; размах вариации (range) — 10537,00. (табл. 1.5)
4. Характеристика структуры распределения
Расчет и анализ показателей: медиана, квартили.
Median — медиана.
Lower (Lower quartile) — нижний (первый) квартиль — Q1.
Upper (Upper quartile) — верхний (третий) квартиль —Q3.
Табл. 1.6 Расчет структуры распределения
ЧИСЛЕННОСТЬ НАСЕЛЕНИЯ Ульяновская область | |
Median | 871 |
Lower | 833 |
Upper | 908 |