Автор: Пользователь скрыл имя, 07 Декабря 2011 в 00:19, курсовая работа
1. Основные  непрерывные распределения:  равномерное, экспоненциальное, нормальное.
2. Распределение χ-квадрат.
Курсовая работа
по курсу теории вероятности
и математической статистике
по теме: «Критерий согласия Пирсона»
Вариант 
№17 
 
 
 
 
                                                       
 
 
 
 
 
 
 
 
 
 
 
 
Москва 2009
Функцией распределения F(x) непрерывной случайной величины X называется вероятность того, что она примет значение меньшее, чем аргумент функции x:
F (x) = 
P (X≤ x). 
Непрерывные распределения характеризуются функцией плотности вероятности f (x), по определению равной f (x) = .
Одним из основных свойств этой функции является условие нормировки:
,
которое означает, 
что плотность вероятности есть 
неотрицательная функция, площадь 
под которой всегда равна единице. 
 
   Рассмотрим 
основные распределения.  
Равномерное 
распределение. 
   Равномерное 
распределение 
имеет непрерывная случайная величина 
Х, в некотором интервале [а; b], если ее 
плотность вероятности постоянна, т.е. 
если все значения X в этом интервале равновероятны: 
. 
   Числовые 
харакьеристики равны: 
 
 
 
 
 
 
   Ниже 
приведены графики плотности 
и функции равномерного распределения: 
 
Экспоненциальное распределение.
   Экспоненциальное 
распределение с параметром λ (l 
> 0) имеет непрерывная случайная величина 
X, принимающая только положительные значения, 
если ее плотность вероятности и функция 
распределения равны: 
, 
   Числовые 
характеристики равны: 
 
 
 
 
Ниже приведены графики плотности и функции экспоненциального
распределения 
при l 
= 1. 
 
 
Нормальное 
распределение (гауссовское). 
   Нормальное 
распределение (распределение Гаусса) 
с параметрами μ 
и имеет 
непрерывная 
случайная величина Х, т.е. X∼если 
ее плотность вероятности 
и функция распределения 
равны: 
 
 
Так как первообразная для в аналитическом виде не существует, то для вычисления значений функции распределения и вероятностей событий,
связанных с нормальной случайной величиной, используется табулированная
функция Лапласа. 
При использовании таблицы 
следует учитывать, 
что Ф(-x) = -Ф(x), 
Ф(0) = 0, Ф(∞) = 0,5. 
 - 
функция Лапласа. 
   Числовые 
характеристики нормальной случайной 
величины: 
, 
D(x) 
= . 
Ниже приведены графики плотности и функции нормального распределения при μ = 1, σ = 1.
 
Пусть Ui, i=1…n, - набор из n независимых случайных величин с распределением N(0,1), тогда случайная величина
имеет распределение хи-квадрат (χ2 –распределение) с n степенями свободы, что обозначается как
Случайная величина имеет следующие моменты:
= n
D(x) = 2n.
   При n 
→ ∞  χ2(n) → N(n,2n). 
 
Выборкой объема называется n независимых случайных величин, имеющих один и тот же закон распределения F(x).
Реализацией выборки называется неслучайный вектор, компонентами которого являются реализации случайных величин.
     Выборка 
является математической моделью 
n независимых измерений, проводимых 
в одинаковых условиях.    
Вариационным рядом называется выборка , полученная в
результате расположения значений исходной выборки в порядке возрастания.
Значения называются 
вариантами.  
Эмпирическая функция распределения (или выборочная функция распределения) случайной величины X равна частоте того, что X примет значение меньшее, чем аргумент функции x
   Эмпирическая 
функция распределения является 
наилучшей оценкой закона распределения 
(несмещенной, состоятельной, эффективной 
(см. ниже)).  
Гистограмма – статистический аналог графика плотности вероятности случайной величины, и она строится по интервальному статистическому ряду.
Для равноинтервального метода все прямоугольники гистограммы
имеют одинаковую ширину, а для равновероятностного метода – одинаковую
площадь. Сумма 
площадей всех прямоугольников гистограммы 
равна 1. 
 
Точечные 
оценки числовых характеристик. 
Статистической оценкой параметра Q распределения называется приближенное значение параметра, вычисленное по результатам эксперимента (по выборке). Статистические оценки делятся на точечные и интервальные.
Точечной называется оценка, определяемая одним числом. Точечная
оценка параметра Q случайной величины X в общем случае равна , где xi – значения выборки.
Очевидно, что оценка - это случайная величина, так как она является
функцией от n-мерной случайной величины (X1, X2, …, Xn), где Хi – значение
величины Х в i-м опыте, и значения будут изменяться от выборки к выборке случайным образом.
Свойства оценок:
1. Оценка называется состоятельной, если при увеличении объема
выборки n она 
сходится по вероятности к значению параметра 
Q: 
 
 
Состоятельность – это минимальное требование к оценкам.
      2. 
Оценка называется несмещенной, если 
ее математическое ожидание точно равно 
параметру Q для любого объема выборки: 
 
Несмещенная оценка является состоятельной, если
     3. 
Оценка называется эффективной, если 
она имеет (при заданном объеме выборки 
n) наименьшую возможную дисперсию. 
Так же у любого распределения моментные характеристики, если они существуют, выражаются через основные его параметры. Поэтому можно искать и оценки моментных характеристик, это будут косвенные оценки параметров распределения.
     Стандартные 
выборочные оценки математического 
ожидания и дисперсии определяются 
по формулам: 
 
 
 
 
Метод 
максимального правдоподобия. 
   При известном 
виде распределения случайной 
Q =( Q1, 
..., Qn), 
оценки этого параметра можно находить 
различными способами. Так, при определенных 
условиях удобно использовать метод 
максимального правдоподобия. Этот 
метод использует функцию 
правдоподобия , 
которая в случае 
непрерывной наблюдаемой случайной величины 
X – плотность распределения 
где  
- плотность распределения 
случайной величины X, 
а в случае дискретной наблюдаемой случайной 
величины X – произведение вероятностей 
где - вероятность события .
   Оценка 
наибольшего правдоподобия 
   Поскольку 
функцию правдоподобия  
и ее логарифм ln  достигают 
максимума при одних 
и тех же значениях 
Q, то часто вместо  
рассматривают логарифмическую 
функцию правдоподобия ln : 
 
 
 
 
 
Найденные корни 
выбранной системы уравнений 
являются оценками неизвестных 
параметров Q1, 
..., Qn.. 
 
5. 
Проверка статистической 
гипотезы о законе распределения 
по критерию χ -квадрат 
Пирсона. 
1. Построить 
интервальный статистический 
2. По виду 
гистограммы выдвинуть 
H0 – величина X распределена по такому-то закону: ,
H1 – величина X не распределена по такому-то закону: ,
где , – плотность и функция гипотетического закона распределения.
3. Используя 
метод максимального 
4. Вычислить 
значение критерия по формуле: 
При этом область значений вариационного ряда разбита на n интервалов. - частота попадания значений выборки в i-ый интервал, - теоретическая вероятность этого события при условии, что гипотеза H0 верна.
 
| 47,1 | 45,1 | 50,3 | 50,8 | 62,9 | 
| 51,9 | 52,2 | 51,5 | 49,2 | 38,1 | 
| 57,9 | 48,3 | 52,9 | 54,3 | 40,4 | 
| 51,9 | 60,9 | 58,7 | 44,7 | 61,9 | 
| 47,4 | 62,4 | 47,1 | 35,7 | 54,1 | 
| 65,8 | 48,5 | 61,2 | 79,3 | 51,6 | 
| 60,9 | 33 | 42,1 | 38,1 | 43,7 | 
| 54,5 | 39,6 | 50,6 | 51,9 | 57,5 | 
| 45,4 | 66,2 | 54,8 | 59,4 | 47,8 | 
| 59,6 | 60,5 | 60,2 | 62,2 | 34,7 |