Статистический анализ рядов распределения. Проверка гипотезы о законе распределения

Автор: Пользователь скрыл имя, 04 Января 2012 в 00:36, курсовая работа

Краткое описание

Ряд распределения – это распределение единиц совокупности по значению того или иного признака в конкретных условиях места и времени.
Ряды распределения могут быть:
• вариационным, если они строятся на основе количественного признака;
• атрибутивным, если они строятся на основе атрибутивного признака.

Оглавление

ВВЕДЕНИЕ 4
1. Табличное и графическое представление вариационного ряда 5
2. Характеристика центральной тенденции распределения 10
3. Оценка вариации изучаемого признака 12
4. Характеристика структуры распределения 14
5. Характеристика формы распределения 15
6. Сглаживание эмпирического распределения. Проверка гипотезы о законе распределения. 17
ЗАКЛЮЧЕНИЕ 22
СПИСОК ИСПОЛЬЗУЕМОЙ ЛИТЕРАТУРЫ 23

Файлы: 1 файл

Баталова.doc

— 407.50 Кб (Скачать)

    Дисперсия:

      ,    (3.2)

где – значение признака у i-ой единицы совокупности; – средняя арифметическая; – частота у i-ой единицы совокупности; – сумма частот ( ).

    Среднее квадратическое (стандартное) отклонение:

      .   (3.3) 

     Коэффициент вариации:

      .   (3.4) 

Таблица 3

Показатели  вариации

Показатели  вариации Значение
Размах  вариации 1546
Дисперсия 106829,1
Среднее квадратическое отклонение 326,85
Коэффициент вариации 109,07%
 

    Размах  вариации, разность между максимальным и минимальным значениями совокупности, составляет 1546 единиц. Коэффициент вариации, в данном случае равный 109,07%. Коэффициент вариации оценивает степень количественной однородности изучаемой совокупности. В данном случае совокупность можно признать не однородной, т.к. коэффициент вариации больше 33%.

    В 2001 году в регионах России ввод в действие жилых домов отличалось от среднего по стране на 326,85 тыс. кв.м. общей площади.

 

4. Характеристика структуры  распределения 

    К показателям структуры, кроме медианы, также относят квартили, которые делят совокупность на четыре части, децили (10 частей) и прочие перцентили. Использование тех или иных характеристик зависит от цели исследования и от объёма изучаемой совокупности (с увеличением объёма растёт число групп). В данной работе необходимо подсчитать только медиану и квартили.

    Нижний  квартиль:

.   (4.1) 

    Верхний квартиль:

.   (4.2) 

    Таблица 4

Показатели  структуры распределения

Показатели  структуры распределения Значение
Нижний  квартиль 92
Медиана 193
Верхний квартиль 415
 

    В половине регионов России ввод в действие жилых домов в 2001 году, составило от 92 до 415 тыс. кв.м. общей площади.

 

5. Характеристика формы  распределения 

    Показатели  формы распределения помогают понять, как распределены единицы совокупности относительно центра распределения. К показателям формы распределения относятся: коэффициент асимметрии, стандартизованная асимметрия, коэффициент эксцесса и стандартизованный эксцесс.

    Коэффициент асимметрии:

,    (5.1)

где - коэффициент асимметрии; - среднее значение признака в совокупности; - значение моды; - среднеквадратическое отклонение.

    Коэффициент эксцесса (куртозис):

.  (5.2)

    Стандартизованный коэффициент асимметрии:

,       ,   (5.3)

где - стандартизованный коэффициент асимметрии; - коэффициент асимметрии (берется по модулю, поскольку может быть положительным и отрицательным); - стандартная ошибка коэффициента асимметрии; n - объем совокупности.

    Стандартизованный эксцесс (куртозиз):

,       ,   (5.4)

где - стандартизованный эксцесс; - коэффициент эксцесса (берется по модулю, поскольку может быть положительным и отрицательным); - стандартная ошибка коэффициента эксцесса; n - объем совокупности. 
 

Таблица 5

Показатели  формы распределения

Показатели  формы распределения Значение
Коэффициент асимметрии 2,084341
Коэффициент эксцесса 4,814513
Стандартизованный коэффициент асимметрии 7,752341
Стандартизованный эксцесс 8,953352
 

    Распределение имеет положительную (правостороннюю) асимметрию, асимметрия признается существенной, то есть сформированной под влиянием неслучайных факторов,  величина коэффициента асимметрии является статистически значимой.

    Присутствие существенного положительного эксцесса в эмпирическом распределении означает, что в совокупности есть сформировавшееся ядро, то есть у большинства единиц совокупности близки значения признака. Эксцесс является существенный.

 

6. Сглаживание эмпирического  распределения. Проверка   
гипотезы о законе распределения.
 

     Процедура выравнивания, сглаживания анализируемого распределения заключается в замене эмпирических частот теоретическими, определяемыми по формуле теоретического распределения, но с учетом фактических значений переменной. На основе сопоставления эмпирических и теоретических частот рассчитываются критерии согласия, которые используются для проверки гипотезы о соответствии исследуемого распределения тому или иному типу теоретических распределении.

     Выбор конкретного типа модельного распределения  осуществляется исходя из самых общих соображений, опирающихся на визуальный анализ построенных графиков распределения. В практическом анализе обязательной является проверка соответствия изучаемого распределения нормальному закону распределения. Необходимость этого связана с тем, что условием применения значительного числа статистических характеристик и оценок является наличие нормального распределения.

    Для проверки гипотезы о предполагаемом законе распределения  используются специальные критерии, получившие название критериев согласия. В основе критериев лежит сопоставление значений теоретических и фактических частот.

    Наиболее  используемым являются критерии Пирсона (χ2) – хи квадрат:

,   (6.1)

    где - частота фактическая; - частота теоретическая.

Рис. 6.1. Проверка гипотезы о нормальном распределении регионов России по вводу в действие жилых домов в 2001 году. 

    Функция нормального распределения:

   (6.2)

    Плотность нормального распределения определяется по формуле:

   (6.3)

    где х – значение изучаемого признака; – средняя арифметическая величина; – среднее квадратическое отклонение изучаемого признака; – математические константы; – нормированное отклонение.

    Теоретические частоты нормального распределения  рассчитываются по следующей формуле:

    (6.4)

    где N – объем совокупности; h – величина интервала.

    В таблице на рис. 6.1. видно, что критерий для нормального распределения составил 15,46752 при количестве степеней свободы 1 и расчетном уровне значимости 0,00008.

    Для принятия решения о справедливости гипотезы о законе распределения необходимо сравнить рассчитанный критерий с критическим значением. 

Рис. 6.2. Гистограмма и расчетная кривая нормального распределения регионов России по вводу в действие жилых домов в 2001 году.

Таблица 6

Результаты  решения задачи сглаживания

Тип 
распределения
Число степеней свободы r Расчетное значение критерия
Табличное значение критерия

(расчетное  значение уровня значимости)

1. Нормальное 1 15,46752 3,841 0,00008
 

    Окончательные выводы по проверке гипотез о законе распределения:

    1. Так как

      и

     ,

    то  гипотеза о нормальном распределении  регионов России по вводу в действие жилых домов в 2001 году противоречит статистическим данным.

 

ЗАКЛЮЧЕНИЕ 

    В курсовой работе были проанализированы данные о вводе в действие жилых домов в 2001 г.

    В пятидесяти пяти регионах России, что составляет 66,27% от общего числа регионов, ввод в действие жилых домов в 2001 году составляло от 2 до 259,67 тыс. кв.м. общей площади.

    В среднем в регионах России ввод в действие жилых домов в 2001 году составляло 299,66 тыс. кв.м. общей площади. В половине регионов России ввод в действие жилых домов в 2001 году было более 193 тыс. кв.м. общей площади, а в другой половине – меньше. Данное распределение имеет не одну моду.

    Размах вариации, разность между максимальным и минимальным значениями совокупности, составляет 1546 единиц. Коэффициент вариации, в данном случае равный 109,07%. Коэффициент вариации оценивает степень количественной однородности изучаемой совокупности. В данном случае совокупность можно признать не однородной, т.к. коэффициент вариации больше 33%.

    В 2001 году в регионах России ввод в действие жилых домов отличалось от среднего по стране на 326,85 тыс. кв.м. общей площади.

    В половине регионов России ввод в действие жилых домов в 2001 году, составило от 92 до 415 тыс. кв.м. общей площади.

    Распределение имеет положительную (правостороннюю) асимметрию, асимметрия признается существенной, то есть сформированной под влиянием неслучайных факторов, величина коэффициента асимметрии является статистически значимой.

    Присутствие существенного положительного эксцесса в эмпирическом распределении означает, что в совокупности есть сформировавшееся ядро, то есть у большинства единиц совокупности близки значения признака. Эксцесс является существенный.

    Гипотеза  о нормальном распределении противоречат статистическим данным.

 

СПИСОК ИСПОЛЬЗУЕМОЙ ЛИТЕРАТУРЫ 

    1. Конспект лекций по дисциплине «Статистика» / О.А. Пономарева, 2008. – 29 с.

    2. Статистика. Анализ эмпирических распределений: Метод. указания / Н.В. Куприенко, О.А. Пономарева, Д.В. Тихонов. – СПб.: Изд-во Политехн. ун-та, 2010. – 95 с.

Информация о работе Статистический анализ рядов распределения. Проверка гипотезы о законе распределения