Автор: Пользователь скрыл имя, 13 Марта 2012 в 19:19, курсовая работа
Основной целью написания курсовой работы является изучение методики статистического анализа рядов распределения. Для достижения поставленной цели были поставлены и выполнены следующие основные задачи:
1. Освещено понятие и виды статистических рядов распределения, и основные формы их представления.
2. Рассчитаны и проанализированы показатели, характеризующие центральную тенденцию, вариацию, структуру и форму ряда распределения.
3. Проведено сглаживание эмпирического распределения и проверены гипотезы о законе распределения.
ВВЕДЕНИЕ.
1) ТАБЛИЧНОЕ И ГРАФИЧЕСКОЕ ПРЕДСТАВЛЕНИЕ ВАРИАЦИОННОГО РЯДА.
2) ХАРАКТЕРИСТИКА ЦЕНТРАЛЬНОЙ ТЕНДЕНЦИИ РАСПРЕДЕЛЕНИЯ.
3) ОЦЕНКА ВАРИАЦИИ ИЗУЧАЕМОГО ПРИЗНАКА.
4) ХАРАКТЕРИСТИКА СТРУКТУРЫ РАСПРЕДЕЛЕНИЯ.
5) ХАРАКТЕРИСТИКА ФОРМЫ РАСПРЕДЕЛЕНИЯ.
6) СГЛАЖИВАНИЕ ЭМПИРИЧЕСКОГО РАСПРЕДЕЛЕНИЯ. ПРОВЕРКА ГИПОТЕЗЫ О ЗАКОНЕ РАСПРЕДЕЛЕНИЯ.
ЗАКЛЮЧЕНИЕ.
СПИСОК ИСПОЛЬЗОВАННОЙ ЛИТЕРАТУРЫ.
Значение нижнего (первого) квартиля, верхнего (третьего) квартиля, медианы рассчитаем с помощью ППП «Statistica» и их значения составят: медиана (median) — 871; нижний (первый) квартиль (lower (lower quartile)) — 833; верхний (третий) квартиль (upper (upper quartile)) — 908. (табл. 1.6)
5. Характеристика формы распределения
Расчет и анализ показателей: коэффициент асимметрии, коэффициент эксцесса (куртозис).
Skewness — асимметрия.
Kurtosis — коэффициент эксцесса (куртозис).
Табл. 1.7 Расчета формы распределения
ЧИСЛЕННОСТЬ НАСЕЛЕНИЯ Ульяновская область | |
Skewness | 4,249169 |
Kurtosis | 18,36602 |
Значение асимметрии и коэффициента эксцесса (куртозиса) рассчитаем с помощью ППП «Statistica» и их значения составят: асимметрия (skewness) — 4,249169; коэффициент эксцесса (куртозис) (kurtosis) — 18,36602 (табл. 1.7)
Сопоставим показатели, рассчитанные вручную по сгруппированным данным, и показатели, полученные с помощью программы Statistica на основе исходного ряда данных (табл. 1.8).
Табл. 1.8 Сравнение статистических показателей,
рассчитанных различными способами
№ | Название показателя | Значение в ППП Statistica | Значение после ручного расчета |
1. 1 | Средняя арифметическая | 1299,618 | 1298,426 |
2. 2 | Медиана | 871 | 872 |
3. 3 | Мода | 1,000 | 0,9456 |
4. 4 | Дисперсия | 5090419 | 5389214 |
5. 5 | Нижний квартиль | 833 | 824 |
6. 6 | Верхний квартиль | 908 | 916 |
6. Сглаживание эмпирического распределения. Проверка гипотезы о законе распределения
Одна из важнейших задач анализа вариационных рядов заключается в выявлении закономерности распределения и определении ее характера. Основной путь в выявлении закономерности распределения – построение вариационных рядов для достаточно больших совокупностей. Важное значение для выявления закономерности распределения имеет правильное построение самого вариационного ряда: выбор числа групп и размера интервала варьирующего признака.
Говоря о характере, типе закономерности распределения, имеем в виду отражение в нем общих условий вариации. При этом речь всегда идет о распределениях качественно однородных явлений. Общие условия, определяющие тип закономерности распределения, познаются анализом сущности явления, тех его свойств, которые определяют вариацию изучаемого признака. Следовательно, должна быть выдвинута какая-то научная гипотеза, обосновывающая тип теоретической кривой распределения.
Под теоретической кривой распределения понимается графическое изображение ряда в виде непрерывной линии изменения частот в вариационном ряду, функционально связанного с изменением вариантов (значений признака).
Теоретическое распределение может быть выражено аналитически – формулой, которая связывает частоты вариационного ряда и соответствующие значения признака. Такие алгебраические формулы носят название законов распределения.
Процедура выравнивания, сглаживания анализируемого распределения заключается в замене эмпирических частот теоретическими, определяемыми по формуле теоретического распределения, но с учетом фактических значений переменной. На основе сопоставления эмпирических и теоретических частот рассчитываются критерии согласия, которые используются для проверки гипотезы о соответствии исследуемого распределения тому или иному типу теоретического распределении.
Для проверки статистической гипотезы о законе распределения будем использовать критерий – критерий Пирсона (Chi-square test).
С помощью ППП Statistica проведем сглаживание рассматриваемого распределения и проверим статистическую гипотезу о законе распределения.
Рис. 6.1. Проверка гипотезы о нормальном распределении переменной Var1
Из рис. 6.1. видно, что критерий для нормального распределения не известен, дальнейшая проверка гипотезы о нормальном распределении переменной Var1 нецелесообразна.
Заключение
В курсовой работе были проанализированы данные о численности РМ (оценка на конец года; тысяч человек) за период с 1995 по 2009 гг.
Для удобства анализа данные были представлены в виде группировочных таблиц с количеством интервалов n=6, 12 и 18. Наболее пригодной для анализа оказалась группировочная таблица с восемнадцатью интервалами.
Также для удобства анализа вариационного ряда используется графическое представление. В работе были использованы такие виды графиков, как полигон, кумулята и гистограмма. Полигон, построенный на основе абсолютных частот, показывает форму распределения. Из рисунка видно, что распределение имеет одну вершину, форма его симметрична и очень крута.
Также с помощью графика можно определить модальный интервал (321,9118 - 941,7353). Гистограмма позволяет сделать такие же выводы.
Кумулята показывает накопленные частоты распределения (абсолютные или относительные). С помощью кумуляты легко определить медианный интервал распределения (321,9118 - 941,7353) – это интервал, на котором кумулята переваливает за середину распределения, т.е. за 40 (для абсолютных частот) или 50% (для относительных частот). Так как модальный и медианный интервалы распределения совпадают, то распределение симметрично.
Центральная тенденция распределения характеризуется такими показателями, как среднее арифметическое значение, мода и медиана. Все показатели были определены с помощью программы Statistica по исходному ряду данных и вручную по сгруппированным данным. Среднее арифметическое значение вариационного ряда составило 1299,618 (по исходным данным) и 1298,426 (по группировочной таблице).
Медиана – это величина признака, делящая распределение на две равные части. По исходным данным медиана составила 871, а по сгруппированным данным – 872.
Мода – это значение признака с наибольшей частотой. Ее значение составило 1,000. Очевидно, что и среднее арифметическое, и медиана, и мода принадлежат одному интервалу и незначительно отличаются по значениям. Это свидетельствует о симметричности распределения относительно центра.
Вариация – это различие в значениях какого-либо признака у разных единиц данной совокупности в один и тот же период или момент времени. К показателям, характеризующим вариацию распределения, относятся размах вариации, дисперсия и среднее квадратическое отклонение и коэффициент вариации.
Размах вариации показывает амплитуду вариации и определяется как разница между максимальным и минимальным значением распределения и составляет 135.
Дисперсия признака представляет собой средний квадрат отклонений вариантов от их средней величины. Дисперсия, рассчитанная по исходным данным, составила 5090419, а по сгруппированным – 5389214. Более удобным для анализа показателем является среднее квадратическое отклонение, которое определяется как корень из дисперсии. Среднее квадратическое отклонение, рассчитанное на основании исходного ряда распределения, равно 1182,38 а отклонение, определенное по сгруппированным данным, – 248,43. Оно показывает, что значение признака отклоняется от среднего арифметического значения в среднем на 475, 542.
Коэффициент вариации определяется как отношение среднего квадратического отклонения к среднему арифметическому значению. Этот показатель используют для характеристики однородности совокупности. Значение коэффициента вариации для исследуемого ряда данных составило 32,47%. Поскольку рассчитанное значение коэффициента меньше 33%, то данная совокупность является количественно однородной.
Структура распределения характеризуется такими показателями, как медиана и квартили. Медиана делит совокупность на две равные части, квартили – на четыре части. Медиана распределения составляет 871, нижний квартиль – 833, верхний квартиль – 908. Разница между первым и вторым квартилем (медианой) составляет 48; между вторым и третьим – 75.
Очевидно, что квартили расположены очень близко один к другому, что говорит о высокой плотности середины распределения. Форма распределения характеризуется асимметрией и эксцессом. Коэффициент асимметрии показывает, как следует из названия, степень асимметричности распределения и определяется как отношение третьего центрального момента к стандартному отклонению в кубе.
Эксцесс характеризует «крутизну» распределения и определяется как отношение четвертого центрального момента к стандартному отклонению в четвертой степени. Для нормального распределения величина эксцесса равна трем, поэтому от рассчитанного значения отнимают 3. Значение эксцесса для анализируемого распределения равно 18,36602 (рассчитанное вручную по группировочной таблице – 17,61854). Это означает, что исследуемое распределение гораздо «круче» нормального.
Одна из важнейших задач анализа вариационных рядов заключается в выявлении закономерности распределения и определении ее характера. Для этого осуществляется процедура выравнивания и проверка гипотезы о соответствии эмпирического ряда данных теоретическому распределению. В данной работе были проверены гипотезы соответствия эмпирического вариационного ряда нормальному, с помощью критерия Пирсона. Для этого с помощью программы Statistica было осуществлено сглаживание эмпирического ряда данных путем расчета теоретических частот и сравнение полученных значений с эмпирическими частотами. В результате этих расчетов не было получено значение .
СПИСОК ИСПОЛЬЗОВАННОЙ ЛИТЕРАТУРЫ
1. Венецкий И.Г., Основные математико-статистические понятия и формулы в экономическом анализе. Справочник / И.Г. Венецкий, В.И. Венецкая. – 2-е изд., перераб. и доп. – М. : Статистика, 1979. – 477 с.
2. Гмурнан В.Э. Теория вероятностей и математическая статистика: Учеб. пособие. – М.: Высш. шк., 2003. – 479 с.
3. Гусаров В.М. Статистика: Учеб. пособие для вузов. – М.: ЮНИТИ-ДАНА, 2003. – 463 с.
4. Елисеева И.И., Юзбашев М.М. Общая теория статистики: Учебник / Под ред. И.И. Елисеевой. – 5-е изд., перераб. и доп. – М.: Финансы и статистика, 2004. – 656 с.
5. Закс Л., Статистическое оценивание: Пер. с нем / Л. Закс. – М.: Статистика, 1976. – 597 с.
6. Н.В. Куприенко, О.А. Пономарева, Д.В. Тихонов. Статистика. Анализ эмпирических распределений. СПб.: Изд-во Политехн. ун-та, 2011. – 95 с.
7. Общая теория статистики: Статистическая методология в изучении коммерческой деятельности: Учебник. / Под ред. А.А. Спирина, О.Э. Башиной. – М.: Финансы и статистика, 1996. – 296 с.
8. Общая теория статистики: учеб. / М.Р. Ефимова, Е.В. Петрова, В.Н. Румянцев. – М.: ИНФРА-М, 2002. – 416 с.
9. Орлов А.И. Прикладная статистика. Учебник. / А.И. Орлов. – М.: Издательство «Экзамен», 2004. – 656 с.
10. Регионы России. Социально-экономические показатели.2010.
11. Теория статистики.: учеб. /Под ред. Р.А. Шмойловой. – М.: Финансы и статистика, 2005. – 560 с.
12. Теория статистики: учеб. / Под ред. проф. Г.Л. Громыко. – 2-е изд., перераб. и доп. – М.: ИНФРА-М, 2006. – 476 с.
13. Экономическая статистика: Учебник. / Под ред. Ю.Н. Иванова. – М.: ИНФРА-М, 2004. – 480 с.
- 2 -