Анализ эмпирического распределения

Автор: Пользователь скрыл имя, 13 Марта 2012 в 19:19, курсовая работа

Краткое описание

Основной целью написания курсовой работы является изучение методики статистического анализа рядов распределения. Для достижения поставленной цели были поставлены и выполнены следующие основные задачи:
1. Освещено понятие и виды статистических рядов распределения, и основные формы их представления.
2. Рассчитаны и проанализированы показатели, характеризующие центральную тенденцию, вариацию, структуру и форму ряда распределения.
3. Проведено сглаживание эмпирического распределения и проверены гипотезы о законе распределения.

Оглавление

ВВЕДЕНИЕ.
1) ТАБЛИЧНОЕ И ГРАФИЧЕСКОЕ ПРЕДСТАВЛЕНИЕ ВАРИАЦИОННОГО РЯДА.
2) ХАРАКТЕРИСТИКА ЦЕНТРАЛЬНОЙ ТЕНДЕНЦИИ РАСПРЕДЕЛЕНИЯ.
3) ОЦЕНКА ВАРИАЦИИ ИЗУЧАЕМОГО ПРИЗНАКА.
4) ХАРАКТЕРИСТИКА СТРУКТУРЫ РАСПРЕДЕЛЕНИЯ.
5) ХАРАКТЕРИСТИКА ФОРМЫ РАСПРЕДЕЛЕНИЯ.
6) СГЛАЖИВАНИЕ ЭМПИРИЧЕСКОГО РАСПРЕДЕЛЕНИЯ. ПРОВЕРКА ГИПОТЕЗЫ О ЗАКОНЕ РАСПРЕДЕЛЕНИЯ.
ЗАКЛЮЧЕНИЕ.
СПИСОК ИСПОЛЬЗОВАННОЙ ЛИТЕРАТУРЫ.

Файлы: 1 файл

Оля.doc

— 393.00 Кб (Скачать)

 

Значение нижнего (первого) квартиля, верхнего (третьего) квартиля, медианы рассчитаем с помощью ППП «Statistica» и их значения составят: медиана (median) — 871; нижний (первый) квартиль (lower (lower quartile)) — 833; верхний (третий) квартиль (upper (upper quartile)) — 908. (табл. 1.6)

 

5. Характеристика формы распределения

 

Расчет и анализ показателей: коэффициент асимметрии, коэффициент эксцесса (куртозис).

Skewness — асимметрия.

Kurtosis — коэффициент эксцесса (куртозис).

 

Табл. 1.7 Расчета формы распределения

ЧИСЛЕННОСТЬ НАСЕЛЕНИЯ Ульяновская область
(оценка на конец года; тысяч человек)

Skewness

4,249169

Kurtosis

18,36602


 

Значение асимметрии и коэффициента эксцесса (куртозиса) рассчитаем с помощью ППП «Statistica» и их значения составят: асимметрия (skewness) — 4,249169; коэффициент эксцесса (куртозис) (kurtosis) — 18,36602 (табл. 1.7)

Сопоставим показатели, рассчитанные вручную по сгруппированным данным, и показатели, полученные с помощью программы Statistica на основе исходного ряда данных (табл. 1.8).

 

 

 

 

Табл. 1.8 Сравнение статистических показателей,

рассчитанных различными способами

Название показателя

Значение в

ППП Statistica

Значение

после ручного расчета

1.        1

Средняя арифметическая

1299,618

1298,426

2.        2

Медиана

871

872

3.        3

Мода

1,000

0,9456

4.        4

Дисперсия

5090419

5389214

5.        5

Нижний квартиль

833

824

6.        6

Верхний квартиль

908

916


 

 

6. Сглаживание эмпирического распределения. Проверка гипотезы о законе распределения

 

Одна из важнейших задач анализа вариационных рядов заключается в выявлении закономерности распределения и определении ее характера. Основной путь в выявлении закономерности распределения – построение вариационных рядов для достаточно больших совокупностей. Важное значение для выявления закономерности распределения имеет правильное построение самого вариационного ряда: выбор числа групп и размера интервала варьирующего признака.

Говоря о характере, типе закономерности распределения, имеем в виду отражение в нем общих условий вариации. При этом речь всегда идет о распределениях качественно однородных явлений. Общие условия, определяющие тип закономерности распределения, познаются анализом сущности явления, тех его свойств, которые определяют вариацию изучаемого признака. Следовательно, должна быть выдвинута какая-то научная гипотеза, обосновывающая тип теоретической кривой распределения.

Под теоретической кривой распределения понимается графическое изображение ряда в виде непрерывной линии изменения частот в вариационном ряду, функционально связанного с изменением вариантов (значений признака).

Теоретическое распределение может быть выражено аналитически – формулой, которая связывает частоты вариационного ряда и соответствующие значения признака. Такие алгебраические формулы носят название законов распределения.

Процедура выравнивания, сглаживания анализируемого распределения заключается в замене эмпирических частот теоретическими, определяемыми по формуле теоретического распределения, но с учетом фактических значений переменной. На основе сопоставления эмпирических и теоретических частот рассчитываются критерии согласия, которые используются для проверки гипотезы о соответствии исследуемого распределения тому или иному типу теоретического распределении.

Для проверки статистической гипотезы о законе распределения будем использовать критерий – критерий Пирсона (Chi-square test).

С помощью ППП Statistica проведем сглаживание рассматриваемого распределения и проверим статистическую гипотезу о законе распределения.

 

Рис. 6.1. Проверка гипотезы о нормальном распределении переменной Var1

Из рис. 6.1. видно, что критерий для нормального распределения не известен, дальнейшая проверка гипотезы о нормальном распределении переменной Var1 нецелесообразна.

 

Заключение

 

В курсовой работе были проанализированы данные о численности РМ (оценка на конец года; тысяч человек) за период с 1995 по 2009 гг.

Для удобства анализа данные были представлены в виде группировочных таблиц с количеством интервалов n=6, 12 и  18. Наболее пригодной для анализа оказалась группировочная таблица с восемнадцатью интервалами.

Также для удобства анализа вариационного ряда используется графическое представление. В работе были использованы такие виды графиков, как полигон, кумулята и гистограмма. Полигон, построенный на основе абсолютных частот, показывает форму распределения. Из рисунка видно, что распределение имеет одну вершину, форма его симметрична и очень крута.

Также с помощью графика можно определить модальный интервал (321,9118 - 941,7353). Гистограмма позволяет сделать такие же выводы.

Кумулята показывает накопленные частоты распределения (абсолютные или относительные). С помощью кумуляты легко определить медианный интервал распределения (321,9118 - 941,7353) – это интервал, на котором кумулята переваливает за середину распределения, т.е. за 40 (для абсолютных частот) или 50% (для относительных частот). Так как модальный и медианный интервалы распределения совпадают, то распределение симметрично.

Центральная тенденция распределения характеризуется такими показателями, как среднее арифметическое значение, мода и медиана. Все показатели были определены с помощью программы Statistica по исходному ряду данных и вручную по сгруппированным данным. Среднее арифметическое значение вариационного ряда составило 1299,618 (по исходным данным) и 1298,426 (по группировочной таблице).

Медиана – это величина признака, делящая распределение на две равные части. По исходным данным медиана составила 871, а по сгруппированным данным – 872.

Мода – это значение признака с наибольшей частотой. Ее значение составило 1,000. Очевидно, что и среднее арифметическое, и медиана, и мода принадлежат одному интервалу и незначительно отличаются по значениям. Это свидетельствует о симметричности распределения относительно центра.

Вариация – это различие в значениях какого-либо признака у разных единиц данной совокупности в один и тот же период или момент времени. К показателям, характеризующим вариацию распределения, относятся размах вариации, дисперсия и среднее квадратическое отклонение и коэффициент вариации.

Размах вариации показывает амплитуду вариации и определяется как разница между максимальным и минимальным значением распределения и составляет 135.

Дисперсия признака представляет собой средний квадрат отклонений вариантов от их средней величины. Дисперсия, рассчитанная по исходным данным, составила 5090419, а по сгруппированным – 5389214. Более удобным для анализа показателем является среднее квадратическое отклонение, которое определяется как корень из дисперсии. Среднее квадратическое отклонение, рассчитанное на основании исходного ряда распределения, равно 1182,38 а отклонение, определенное по сгруппированным данным, – 248,43. Оно показывает, что значение признака отклоняется от среднего арифметического значения в среднем на 475, 542.

Коэффициент вариации определяется как отношение среднего квадратического отклонения к среднему арифметическому значению. Этот показатель используют для характеристики однородности совокупности. Значение коэффициента вариации для исследуемого ряда данных составило 32,47%. Поскольку рассчитанное значение коэффициента меньше 33%, то данная совокупность является количественно однородной.

Структура распределения характеризуется такими показателями, как медиана и квартили. Медиана делит совокупность на две равные части, квартили – на четыре части. Медиана распределения составляет 871, нижний квартиль – 833, верхний квартиль – 908. Разница между первым и вторым квартилем (медианой) составляет 48; между вторым и третьим – 75.

Очевидно, что квартили расположены очень близко один к другому, что говорит о высокой плотности середины распределения. Форма распределения характеризуется асимметрией и эксцессом. Коэффициент асимметрии показывает, как следует из названия, степень асимметричности распределения и определяется как отношение третьего центрального момента к стандартному отклонению в кубе.

Эксцесс характеризует «крутизну» распределения и определяется как отношение четвертого центрального момента к стандартному отклонению в четвертой степени. Для нормального распределения величина эксцесса равна трем, поэтому от рассчитанного значения отнимают 3. Значение эксцесса для анализируемого распределения равно 18,36602 (рассчитанное вручную по группировочной таблице – 17,61854). Это означает, что исследуемое распределение гораздо «круче» нормального.

Одна из важнейших задач анализа вариационных рядов заключается в выявлении закономерности распределения и определении ее характера. Для этого осуществляется процедура выравнивания и проверка гипотезы о соответствии эмпирического ряда данных теоретическому распределению. В данной работе были проверены гипотезы соответствия эмпирического вариационного ряда нормальному, с помощью критерия Пирсона. Для этого с помощью программы Statistica было осуществлено сглаживание эмпирического ряда данных путем расчета теоретических частот и сравнение полученных значений с эмпирическими частотами. В результате этих расчетов не было получено значение .

 

 

 

СПИСОК ИСПОЛЬЗОВАННОЙ ЛИТЕРАТУРЫ

 

1.      Венецкий И.Г., Основные математико-статистические понятия и формулы в экономическом анализе. Справочник / И.Г. Венецкий, В.И. Венецкая. – 2-е изд., перераб. и доп. – М. : Статистика, 1979. – 477 с.

2.      Гмурнан В.Э. Теория вероятностей и математическая статистика: Учеб. пособие. – М.: Высш. шк., 2003. – 479 с.

3.      Гусаров В.М. Статистика: Учеб. пособие для вузов. – М.: ЮНИТИ-ДАНА, 2003. – 463 с.

4.      Елисеева И.И., Юзбашев М.М. Общая теория статистики: Учебник / Под ред. И.И. Елисеевой. – 5-е изд., перераб. и доп. – М.: Финансы и статистика, 2004. – 656 с.

5.      Закс Л., Статистическое оценивание: Пер. с нем / Л. Закс. – М.: Статистика, 1976. – 597 с.

6.      Н.В. Куприенко, О.А. Пономарева, Д.В. Тихонов. Статистика. Анализ эмпирических распределений. СПб.: Изд-во Политехн. ун-та, 2011. – 95 с.

7.      Общая теория статистики: Статистическая методология в изучении коммерческой деятельности: Учебник. / Под ред. А.А. Спирина, О.Э. Башиной. – М.: Финансы и статистика, 1996. – 296 с.

8.      Общая теория статистики: учеб. / М.Р. Ефимова, Е.В. Петрова, В.Н. Румянцев. – М.: ИНФРА-М, 2002. – 416 с.

9.      Орлов А.И. Прикладная статистика. Учебник. / А.И. Орлов. – М.: Издательство «Экзамен», 2004. – 656 с.

10. Регионы России. Социально-экономические показатели.2010.

11. Теория статистики.: учеб. /Под ред. Р.А. Шмойловой. – М.: Финансы и статистика, 2005. – 560 с.

12. Теория статистики: учеб. / Под ред. проф. Г.Л. Громыко. – 2-е изд., перераб. и доп. – М.: ИНФРА-М, 2006. – 476 с.

13. Экономическая статистика: Учебник. / Под ред. Ю.Н. Иванова. – М.: ИНФРА-М, 2004. – 480 с.

 

- 2 -

 



Информация о работе Анализ эмпирического распределения