Критерий согласия Пирсона

Автор: Пользователь скрыл имя, 07 Декабря 2011 в 00:19, курсовая работа

Краткое описание

1. Основные непрерывные распределения: равномерное, экспоненциальное, нормальное.
2. Распределение χ-квадрат.

Файлы: 1 файл

курсовая копия.docx

— 71.64 Кб (Скачать)
 
 
 
 
 
 
 
 
 
 

Курсовая  работа

по курсу  теории вероятности

и математической статистике

по теме: «Критерий согласия Пирсона»

Вариант №17 
 
 
 
 

                                                                                                    
 
 
 
 
 
 
 
 
 
 
 
 

 
 
 
 
 
 
 

Москва 2009

Теоретическая часть.

      1. Основные  непрерывные распределения:  равномерное, экспоненциальное, нормальное.

 

   Функцией  распределения F(x) непрерывной случайной величины X называется вероятность того, что она примет значение меньшее, чем аргумент функции x:

F (x) = P (X≤ x). 

   Непрерывные распределения характеризуются  функцией плотности вероятности f (x), по определению равной f (x) = .

   Одним из основных свойств этой функции  является условие нормировки:

   ,

которое означает, что плотность вероятности есть неотрицательная функция, площадь  под которой всегда равна единице. 
 

   Рассмотрим  основные распределения.  

Равномерное распределение. 

   Равномерное распределение имеет непрерывная случайная величина Х, в некотором интервале [а; b], если ее плотность вероятности постоянна, т.е. если все значения X в этом интервале равновероятны: 

. 

   Числовые  харакьеристики равны: 
 
 
 
 
 
 

   Ниже  приведены графики плотности  и функции равномерного распределения: 
 

 
 

Экспоненциальное  распределение.

 

   Экспоненциальное  распределение с параметром λ (l > 0) имеет непрерывная случайная величина X, принимающая только положительные значения, если ее плотность вероятности и функция распределения равны: 

, 

   Числовые  характеристики равны: 
 
 
 
 

   Ниже  приведены графики плотности  и функции экспоненциального

распределения при l = 1. 
 
 

 
 
 
 

Нормальное  распределение (гауссовское). 

   Нормальное  распределение (распределение Гаусса) с параметрами μ и имеет непрерывная случайная величина Х, т.е. Xесли ее плотность вероятности и функция распределения равны: 
 
 

   Так как  первообразная для в аналитическом виде не существует, то для вычисления значений функции распределения и вероятностей событий,

связанных с  нормальной случайной величиной, используется табулированная

функция Лапласа. При использовании таблицы значений функции Лапласа

следует учитывать, что Ф(-x) = -Ф(x), Ф(0) = 0, Ф(∞) = 0,5. 

- функция Лапласа. 

   Числовые  характеристики нормальной случайной  величины: 

, 

D(x) = . 

   Ниже  приведены графики плотности  и функции нормального распределения при μ = 1, σ = 1.

 

2. Распределение χ-квадрат.

   Пусть Ui, i=1…n, - набор из n независимых случайных величин с распределением N(0,1), тогда случайная величина

имеет распределение хи-квадрат (χ2 –распределение) с n степенями свободы, что обозначается как

   Случайная величина имеет следующие моменты:

= n

D(x) = 2n.

   При n → ∞  χ2(n) → N(n,2n). 
 

3. Выборка, вариационный  ряд, выборочная (эмпирическая) функция распределения и гистограмма.

 

      Выборкой  объема называется  n независимых случайных величин, имеющих один и тот же закон распределения F(x).

     Реализацией выборки называется неслучайный вектор, компонентами которого являются реализации случайных величин.

     Выборка является математической моделью  n независимых измерений, проводимых в одинаковых условиях.    

     Вариационным  рядом называется выборка , полученная в

результате расположения значений исходной выборки в порядке  возрастания.

Значения называются вариантами.  

      Эмпирическая  функция распределения (или выборочная функция распределения) случайной величины X равна частоте того, что X примет значение меньшее, чем аргумент функции x

   Эмпирическая  функция распределения является наилучшей оценкой закона распределения (несмещенной, состоятельной, эффективной (см. ниже)).  

   Гистограмма – статистический аналог графика плотности вероятности случайной величины, и она строится по интервальному статистическому ряду.

      Для равноинтервального метода все прямоугольники гистограммы

имеют одинаковую ширину, а для равновероятностного  метода – одинаковую

площадь. Сумма  площадей всех прямоугольников гистограммы  равна 1. 
 

4. Точечные оценки и метод правдоподобия.

 

Точечные  оценки числовых характеристик. 

   Статистической оценкой параметра Q распределения называется приближенное значение параметра, вычисленное по результатам эксперимента (по выборке). Статистические оценки делятся на точечные и интервальные.

   Точечной называется оценка, определяемая одним числом. Точечная

оценка  параметра Q случайной величины X в общем случае равна , где xi – значения выборки.

   Очевидно, что оценка - это случайная величина, так как она является

функцией от n-мерной случайной величины (X1, X2, …, Xn), где Хi – значение

величины Х в i-м опыте, и значения будут изменяться от выборки к выборке случайным образом.

   Свойства  оценок:

      1. Оценка называется состоятельной, если при увеличении объема

выборки n она сходится по вероятности к значению параметра Q: 
 
 

    Состоятельность – это минимальное требование к оценкам.

      2. Оценка называется несмещенной, если ее математическое ожидание точно равно параметру Q для любого объема выборки: 
 

   Несмещенная оценка является состоятельной, если

     3. Оценка называется эффективной, если она имеет (при заданном объеме выборки n) наименьшую возможную дисперсию. 

     Так же у любого распределения моментные  характеристики, если они существуют, выражаются через основные его параметры. Поэтому можно искать и оценки моментных характеристик, это будут  косвенные оценки параметров распределения.

     Стандартные выборочные оценки математического  ожидания и дисперсии определяются по формулам: 
 
 
 
 

Метод максимального правдоподобия. 

   При известном  виде распределения случайной величины, зависящем от

Q =( Q1, ..., Qn), оценки этого параметра можно находить различными способами. Так, при определенных условиях удобно использовать метод максимального правдоподобия. Этот метод использует функцию правдоподобия , которая в случае непрерывной наблюдаемой случайной величины X – плотность распределения 

где - плотность распределения случайной величины X, а в случае дискретной наблюдаемой случайной величины X – произведение вероятностей 

где - вероятность события .

   Оценка  наибольшего правдоподобия является аргументом, соответствующим максимуму  той функции.

   Поскольку функцию правдоподобия и ее логарифм ln достигают максимума при одних и тех же значениях Q, то часто вместо рассматривают логарифмическую функцию правдоподобия ln : 
 
 
 
 
 

Найденные корни  выбранной системы уравнений  являются оценками неизвестных параметров Q1, ..., Qn.. 
 

5. Проверка статистической гипотезы о законе распределения по критерию χ -квадрат Пирсона. 

1. Построить  интервальный статистический ряд  и гистограмму.

2. По виду  гистограммы выдвинуть гипотезу:

H0 – величина X распределена по такому-то закону: ,

H1 – величина X не распределена по такому-то закону: ,

где , – плотность и функция гипотетического закона распределения.

3. Используя  метод максимального правдоподобия, определить оценки неизвестных параметров гипотетического закона распределения.

4. Вычислить  значение критерия по формуле: 

При этом область  значений вариационного ряда разбита  на n интервалов. - частота попадания значений выборки в i-ый интервал, - теоретическая вероятность этого события при условии, что гипотеза H0 верна.

 

Практическая  часть.

 
  1. Дана  выборка измерений случайной величины Х:
 
47,1 45,1 50,3 50,8 62,9
51,9 52,2 51,5 49,2 38,1
57,9 48,3 52,9 54,3 40,4
51,9 60,9 58,7 44,7 61,9
47,4 62,4 47,1 35,7 54,1
65,8 48,5 61,2 79,3 51,6
60,9 33 42,1 38,1 43,7
54,5 39,6 50,6 51,9 57,5
45,4 66,2 54,8 59,4 47,8
59,6 60,5 60,2 62,2 34,7

Информация о работе Критерий согласия Пирсона