Статистический анализ рядов распределения. Проверка гипотезы о законе распределения

Автор: Пользователь скрыл имя, 04 Января 2012 в 00:36, курсовая работа

Краткое описание

Ряд распределения – это распределение единиц совокупности по значению того или иного признака в конкретных условиях места и времени.
Ряды распределения могут быть:
• вариационным, если они строятся на основе количественного признака;
• атрибутивным, если они строятся на основе атрибутивного признака.

Оглавление

ВВЕДЕНИЕ 4
1. Табличное и графическое представление вариационного ряда 5
2. Характеристика центральной тенденции распределения 10
3. Оценка вариации изучаемого признака 12
4. Характеристика структуры распределения 14
5. Характеристика формы распределения 15
6. Сглаживание эмпирического распределения. Проверка гипотезы о законе распределения. 17
ЗАКЛЮЧЕНИЕ 22
СПИСОК ИСПОЛЬЗУЕМОЙ ЛИТЕРАТУРЫ 23

Файлы: 1 файл

Баталова.doc

— 407.50 Кб (Скачать)

Государственное образовательное учреждение

высшего профессионального образования

«Санкт-Петербургский  государственный политехнический университет» 
 

Факультет экономики и менеджмента 

Кафедра «Предпринимательство и коммерция» 
 
 
 

КУРСОВОЙ  ПРОЕКТ 

по дисциплине «Статистика»

на тему «Статистический анализ рядов распределения.  
Проверка гипотезы о законе распределения»
 
 
 

     Выполнила студентка з 4077/26 группы 

     ___________________

       (подпись)

       (Фамилия И.О.) 

     Принял  _ к.э.н., доцент__

      (должность, ученая  степень)

     __________________

       (подпись)

     _ Пономарева О.А._

     (Фамилия  И.О.)

     __________________

     (Дата) 
 

     Санкт-Петербург

     2011

 

    Статистический анализ рядов распределения. Проверка гипотезы о законе распределения: Курсовой проект по дисциплине «Статистика». – СПб.: СПбГПУ, 2011, стр. 21, табл. 6, рис. 7. 

    КВАРТИЛЬ, МЕДИАНА, МОДА, РАЗМАХ ВАРИАЦИИ, ДИСПЕРСИЯ, РЯД РАСПРЕДЕЛЕНИЯ, КОЭФФИЦИЕНТ ЭКСЦЕССА, КОЭФФИЦИЕНТ АСИММЕТРИИ, СРЕДНЕЕ КВАДРАТИЦНОЕ ОТКЛАНЕНИЕ. 

    В качестве исходных данных для анализа  в курсовом проекте были использованы данные ввода в движение жилых домов в различных регионах России в 2001 году (из сборника «Регионы России» за 2008 год).

 
СОДЕРЖАНИЕ
 
 

 
Введение

    Ряд распределения – это распределение  единиц совокупности по значению того или иного признака в конкретных условиях места и времени.

    Ряды  распределения могут быть:

  • вариационным, если они строятся на основе количественного признака;
  • атрибутивным, если они строятся на основе атрибутивного признака.

    Изучение  вариационных рядов распределения  позволяет:

  • определить типический уровень признака в изучаемой совокупности;
  • определить наличие выбросов и решить вопрос о необходимости их самостоятельного изучения;
  • оценить степень разброса значений признака вокруг типического уровня;
  • изучить структуру совокупности;
  • охарактеризовать форму распределения;
  • подобрать теоретическое распределение, на основе которого можно моделировать поведение распределения изучаемой совокупности.

    Комплексный анализ рядов распределения включает в себя:

  1. Построение ряда распределения и его графическое представление.
  2. Расчет показателей центра и структуры распределения.
  3. Расчет и анализ показателей вариации.
  4. Характеристика формы распределения.
  5. Выравнивание эмпирического распределения и оценка соответствия теоретическому распределению.
 

 

1. Табличное и графическое  представление вариационного ряда 

    Анализ  распределений направлен на выявление  закономерности изменения частот в  зависимости от значений варьирующего признака и анализ различных характеристик изучаемого распределения. Прежде, чем приступить к вычислению специальных статистических показателей, необходимо из исходной совокупности исключить единицы, не подчиняющиеся общей закономерности распределения, так называемые выбросы. Выбросы – это значения признака, резко отличающиеся как в большую, так и в меньшую сторону, от значений признака у основной части единиц совокупности. 

    Таблица 1

    Исходные  данные, ранжированные  по возрастанию значений 
признака

№ региона Ввод в действие жилых домов в 2001 г. № региона Ввод в действие жилых домов в 2001 г. № региона Ввод в действие жилых домов в 2001 г. № региона Ввод в действие жилых домов в 2001 г. № региона Ввод в действие жилых домов в 2001 г. № региона Ввод в действие жилых домов в 2001 г.
1 2 15 66 29 128 43 194 57 356 71 568
2 5 16 73 30 130 44 197 58 376 72 573
3 7 17 75 31 131 45 206 59 386 73 585
4 8 18 77 32 163 46 208 60 396 74 595
5 8 19 78 33 164 47 219 61 401 75 636
6 8 20 86 34 174 48 221 62 407 76 657
7 9 21 92 35 176 49 221 63 415 77 689
8 10 22 92 36 180 50 237 64 439 78 749
9 10 23 93 37 183 51 239 65 441 79 956
10 12 24 94 38 184 52 242 66 496 80 1263
11 15 25 100 39 184 53 246 67 508 81 1401
12 25 26 102 40 184 54 246 68 509 82 1440
13 34 27 116 41 185 55 259 69 525 83 1548
14 38 28 118 42 193 56 277 70 533 84 2828
 
 

    В табл. 1 зеленым цветом выделены выбросы, которые необходимо исключить из изучаемой совокупности.

    Вариационным  называется ряд распределения, построенный  по количественному признаку. Он может  быть представлен в виде таблицы  и графически. Табличное представление позволяет не только выявить ту или иную закономерность распределения, но и подробно охарактеризовать структуру изучаемой совокупности.

    Таблицы вариационных рядов строятся по принципам  группировки. Известные проблемы возникают при определении числа групп, поскольку формула Стерджеса (1.1), рекомендуемая для этих целей, дает приемлемые результаты только в условиях больших статистических совокупностей. Процесс определения числа выделяемых групп, в значительной степени, носит творческий характер и требует от исследователя применения не только теоретических знаний, но и практического опыта и интуиции.

    Формула Стерджеса: 

            ,   (1.1)

    где k – число групп; N – объем совокупности.

    Использование ППП значительно упрощает задачу табличного представления вариационного ряда, поскольку позволяет с малыми временными затратами просмотреть несколько таблиц с разным числом групп и размером группировочного интервала. Конечный вариант таблицы должен отвечать следующим требованиям: в таблице не должно быть малонаполненных и нулевых групп; нужно стремиться к получению мономодального распределения (т.е. по обе стороны от максимальной частоты должно наблюдаться закономерное убывание частот). Если не удается избавиться от многовершинности в распределении, это, как правило, означает, что изучаемая статистическая совокупность неоднородна и требует более детального изучения. В этих условиях следует либо работать с выбросами, либо, если единицы совокупности не подчиняются единой закономерности распределения, разбить совокупность на объективно существующие группы, и анализировать их раздельно.

    Далее представлены таблицы вариационного  ряда, построенные с использованием разного числа интервалов. 

Рис. 1.1. Распределение регионов России по вводу в действие жилых домов в 2001 году. 
С числом интервалов k = 15.
 

Рис. 1.2. Распределение регионов России по вводу в действие жилых домов в 2001 году. 
С числом интервалов k = 6.
 

    При k = 15 получено много малонаполненных групп, что является нежелательным для анализа ряда распределения. Выбирая окончательный вариант табличного представления вариационного ряда в работе, следует остановиться на группировке с использованием 6 групп. Тогда величина группировочного интервала составит 285,2.

     Необходимо  подвести предварительные итоги  (на примере первой строки): в пятидесяти пяти регионах России, что составляет 66,27% от общего числа регионов, ввод в действие жилых домов в 2001 году составляло от 2 до 259,67 тыс. кв.м. общей площади.

     Табличное представление вариационного ряда позволяет получить подробную информацию о составе и структуре изучаемой совокупности, т.е. определить какое количество единиц изучаемой совокупности обладает тем или иным значением признака и какова доля этой группы единиц в общем объеме совокупности, а также выявить закономерность изменения частот.

    На  основе таблиц строятся графики, наглядно представляющие закономерность распределения анализируемой статистической совокупности. Графическое представление может быть осуществлено как использованием абсолютных, так и относительных частот. 

Рис. 1.3. Полигон распределения регионов России по вводу в действие жилых домов в 2001 году по абсолютным частотам (k = 6).

Рис. 1.4. Гистограмма распределение регионов России по вводу в действие жилых домов в 2001 году (k = 6). 

Рис. 1.5. Кумулята распределение регионов России по вводу в действие жилых домов в 2001 году по абсолютным частотам (k = 6).

 

2. Характеристика центральной  тенденции распределения 

    Среднее значение признаков совокупности, мода и медиана характеризуют центральную тенденцию распределения, указывают тот уровень признака, который является типичным, характерным для данной совокупности. Использование того или иного показателя распределения зависит от типа исходных данных и цели исследования. Поскольку средняя величина рассчитывается на единицу совокупности, но с использованием всех индивидуальных значений признака, она является обобщённой характеристикой всей совокупности.

    Средняя арифметическая простая: 

        ,    (2.1)

где – значение признака у i-ой единицы совокупности; n – объём совокупности.

    Мода: 

    ,  (2.2)

где - нижняя граница модального интервала; - величина группировочного интервала; – частота модального интервала; / – частота интервала, предшествующего / следующего за модальным.

    Медиана:

      ,   (2.3)

где – нижняя граница медианного интервала; – величина группировочного интервала; – сумма частот ( ); – накопленная частота интервала, предшествующего медианному; – частота медианного интервала. 
 
 

    Таблица 2

    Показатели  центра распределения

Показатель центра распределения Значение
Среднее значение 299,66
Мода  
Медиана 193
 

    В среднем в регионах России ввод в действие жилых домов в 2001 году составляло 299,66 тыс. кв.м. общей площади. В половине регионов России ввод в действие жилых домов в 2001 году было более 193 тыс. кв.м. общей площади, а в другой половине – меньше. Данное распределение имеет не одну моду.

 

3. Оценка вариации  изучаемого признака 

    Вариация  – различия у индивидуального  значения признака изучаемой совокупности. Расчёт показателей центра сопровождается расчётом показателей вариации. Показатели вариации бывают:

  • абсолютные (размах вариации, среднее линейное отклонение, дисперсия, среднее квадратическое отклонение);
  • относительные (коэффициент осцилляции, относительное линейное отклонение, коэффициент вариации).

    Размах  вариации:

      ,    (3.1)

где и – максимальное и минимальное значение признака совокупности.

Информация о работе Статистический анализ рядов распределения. Проверка гипотезы о законе распределения