Автор: Пользователь скрыл имя, 07 Декабря 2011 в 00:19, курсовая работа
1. Основные непрерывные распределения: равномерное, экспоненциальное, нормальное.
2. Распределение χ-квадрат.
Курсовая работа
по курсу теории вероятности
и математической статистике
по теме: «Критерий согласия Пирсона»
Вариант
№17
Москва 2009
Функцией распределения F(x) непрерывной случайной величины X называется вероятность того, что она примет значение меньшее, чем аргумент функции x:
F (x) =
P (X≤ x).
Непрерывные распределения характеризуются функцией плотности вероятности f (x), по определению равной f (x) = .
Одним из основных свойств этой функции является условие нормировки:
,
которое означает,
что плотность вероятности есть
неотрицательная функция, площадь
под которой всегда равна единице.
Рассмотрим
основные распределения.
Равномерное
распределение.
Равномерное
распределение
имеет непрерывная случайная величина
Х, в некотором интервале [а; b], если ее
плотность вероятности постоянна, т.е.
если все значения X в этом интервале равновероятны:
.
Числовые
харакьеристики равны:
Ниже
приведены графики плотности
и функции равномерного распределения:
Экспоненциальное распределение.
Экспоненциальное
распределение с параметром λ (l
> 0) имеет непрерывная случайная величина
X, принимающая только положительные значения,
если ее плотность вероятности и функция
распределения равны:
,
Числовые
характеристики равны:
Ниже приведены графики плотности и функции экспоненциального
распределения
при l
= 1.
Нормальное
распределение (гауссовское).
Нормальное
распределение (распределение Гаусса)
с параметрами μ
и имеет
непрерывная
случайная величина Х, т.е. X∼если
ее плотность вероятности
и функция распределения
равны:
Так как первообразная для в аналитическом виде не существует, то для вычисления значений функции распределения и вероятностей событий,
связанных с нормальной случайной величиной, используется табулированная
функция Лапласа.
При использовании таблицы
следует учитывать,
что Ф(-x) = -Ф(x),
Ф(0) = 0, Ф(∞) = 0,5.
-
функция Лапласа.
Числовые
характеристики нормальной случайной
величины:
,
D(x)
= .
Ниже приведены графики плотности и функции нормального распределения при μ = 1, σ = 1.
Пусть Ui, i=1…n, - набор из n независимых случайных величин с распределением N(0,1), тогда случайная величина
имеет распределение хи-квадрат (χ2 –распределение) с n степенями свободы, что обозначается как
Случайная величина имеет следующие моменты:
= n
D(x) = 2n.
При n
→ ∞ χ2(n) → N(n,2n).
Выборкой объема называется n независимых случайных величин, имеющих один и тот же закон распределения F(x).
Реализацией выборки называется неслучайный вектор, компонентами которого являются реализации случайных величин.
Выборка
является математической моделью
n независимых измерений, проводимых
в одинаковых условиях.
Вариационным рядом называется выборка , полученная в
результате расположения значений исходной выборки в порядке возрастания.
Значения называются
вариантами.
Эмпирическая функция распределения (или выборочная функция распределения) случайной величины X равна частоте того, что X примет значение меньшее, чем аргумент функции x
Эмпирическая
функция распределения является
наилучшей оценкой закона распределения
(несмещенной, состоятельной, эффективной
(см. ниже)).
Гистограмма – статистический аналог графика плотности вероятности случайной величины, и она строится по интервальному статистическому ряду.
Для равноинтервального метода все прямоугольники гистограммы
имеют одинаковую ширину, а для равновероятностного метода – одинаковую
площадь. Сумма
площадей всех прямоугольников гистограммы
равна 1.
Точечные
оценки числовых характеристик.
Статистической оценкой параметра Q распределения называется приближенное значение параметра, вычисленное по результатам эксперимента (по выборке). Статистические оценки делятся на точечные и интервальные.
Точечной называется оценка, определяемая одним числом. Точечная
оценка параметра Q случайной величины X в общем случае равна , где xi – значения выборки.
Очевидно, что оценка - это случайная величина, так как она является
функцией от n-мерной случайной величины (X1, X2, …, Xn), где Хi – значение
величины Х в i-м опыте, и значения будут изменяться от выборки к выборке случайным образом.
Свойства оценок:
1. Оценка называется состоятельной, если при увеличении объема
выборки n она
сходится по вероятности к значению параметра
Q:
Состоятельность – это минимальное требование к оценкам.
2.
Оценка называется несмещенной, если
ее математическое ожидание точно равно
параметру Q для любого объема выборки:
Несмещенная оценка является состоятельной, если
3.
Оценка называется эффективной, если
она имеет (при заданном объеме выборки
n) наименьшую возможную дисперсию.
Так же у любого распределения моментные характеристики, если они существуют, выражаются через основные его параметры. Поэтому можно искать и оценки моментных характеристик, это будут косвенные оценки параметров распределения.
Стандартные
выборочные оценки математического
ожидания и дисперсии определяются
по формулам:
Метод
максимального правдоподобия.
При известном
виде распределения случайной
Q =( Q1,
..., Qn),
оценки этого параметра можно находить
различными способами. Так, при определенных
условиях удобно использовать метод
максимального правдоподобия. Этот
метод использует функцию
правдоподобия ,
которая в случае
непрерывной наблюдаемой случайной величины
X – плотность распределения
где
- плотность распределения
случайной величины X,
а в случае дискретной наблюдаемой случайной
величины X – произведение вероятностей
где - вероятность события .
Оценка
наибольшего правдоподобия
Поскольку
функцию правдоподобия
и ее логарифм ln достигают
максимума при одних
и тех же значениях
Q, то часто вместо
рассматривают логарифмическую
функцию правдоподобия ln :
Найденные корни
выбранной системы уравнений
являются оценками неизвестных
параметров Q1,
..., Qn..
5.
Проверка статистической
гипотезы о законе распределения
по критерию χ -квадрат
Пирсона.
1. Построить
интервальный статистический
2. По виду
гистограммы выдвинуть
H0 – величина X распределена по такому-то закону: ,
H1 – величина X не распределена по такому-то закону: ,
где , – плотность и функция гипотетического закона распределения.
3. Используя
метод максимального
4. Вычислить
значение критерия по формуле:
При этом область значений вариационного ряда разбита на n интервалов. - частота попадания значений выборки в i-ый интервал, - теоретическая вероятность этого события при условии, что гипотеза H0 верна.
47,1 | 45,1 | 50,3 | 50,8 | 62,9 |
51,9 | 52,2 | 51,5 | 49,2 | 38,1 |
57,9 | 48,3 | 52,9 | 54,3 | 40,4 |
51,9 | 60,9 | 58,7 | 44,7 | 61,9 |
47,4 | 62,4 | 47,1 | 35,7 | 54,1 |
65,8 | 48,5 | 61,2 | 79,3 | 51,6 |
60,9 | 33 | 42,1 | 38,1 | 43,7 |
54,5 | 39,6 | 50,6 | 51,9 | 57,5 |
45,4 | 66,2 | 54,8 | 59,4 | 47,8 |
59,6 | 60,5 | 60,2 | 62,2 | 34,7 |