Математическая статистика

Автор: Пользователь скрыл имя, 03 Июня 2013 в 20:00, реферат

Краткое описание

Математическая статистика. Определение понятий: генеральная совокупность, выборочная совокупность, повторная и бесповторная выборка в вариационный ряд. Математическая статистика - это раздел прикладной математики, в котором рассматриваются методы отыскания законов и характеристик случайных величин по результатам наблюдений и экспериментов. Анализ статистических данных включает оценку вероятностей события, функции распределения вероятностей или плотности вероятностей, оценку параметров известного распределения, оценку связей между случайными величинами.

Файлы: 1 файл

Математическая статистика.doc

— 1.12 Мб (Скачать)

 

 

 

 

 

Таблица 7

1

 

     


 

Второй  способ.                              

 

где  - объем выборки, ,

       - вероятность попадания в - й интервал,

      -  значение функции Лапласа (Приложение 2).

Полагают  , .

 

Для вычисления  составляем табл. 8.

                                                                                            Таблица 8

Границы интервала

Границы интервала

1

-0,5

0,5

   

       

1


3. Сравниваем эмпирические  ( ) и теоретические ( ) частоты с помощью критерия Пирсона.

 

 

Для этого:

1)  составляем  расчетную  табл.9 , по которой находим

- наблюдаемое значение критерия  

 

 

Таблица 9.

1

     

   

 

Контроль: 

 

2) Находим число степеней свободы :   

 

где - число интервалов; - число параметров предполагаемого распределения,

 

Для нормального распределения  , так как (нормальный закон распределения характеризуется двумя параметрами и ).

 

4. В таблице критических точек (квантилей) распределения по заданному уровню значимости и числу степеней свободы

находим правосторонней критической области.

Если  - нет оснований отвергнуть гипотезу 

о нормальном распределении  генеральной совокупности.

Если  - гипотезу отвергаем.

 

Замечание. 

1) Объем выборки должен  быть достаточно велик   .

  2) Малочисленные частоты следует объединить. В этом случае и соответствующие им теоретические частоты также надо сложить.

 

Если производилось  объединение частот, то при определении  числа степеней свободы по формуле  следует в качестве принять число интервалов, оставшихся после объединения частот.

 

1.7. Определение интервальной оценки. 

 

При оценке вероятностных  характеристик по ограниченному  числу опытов могут быть допущены ошибки, т. е. отклонения этой оценки от истинного значения характеристики случайной величины.

Чтобы убедиться в  том, что мы не допускаем чрезмерно  грубой ошибки в оценке какой-то вероятностной  характеристики, в теории вероятностей и математической статистике пользуются так называемыми доверительными интервалами и доверительными вероятностями.

Интервальной называют оценку, которая определяется двумя числами – концами интервала.

Допустим, что для изучения некоторой случайной величины X (признака генеральной совокупности) необходимо по статистическим данным произвести оценку неизвестного ее параметра θ (это может быть М(Х), D(Х) или р) с определенной степенью точности и надежности, т. е. надо указать границы, в которых практически достоверно лежит этот неизвестный параметр θ.

Это означает, что надо найти такую выборочную оценку   для искомого параметра θ, при которой с наибольшей вероятностью (надежностью) будет выполняться неравенство:

Отсюда видно, что чем  меньше e, тем точнее характеризуется неизвестный параметр θ с помощью выборочной оценки  . Следовательно, число eхарактеризует точность оценки параметра θ.

Надежность выполнения неравенства   оценивается числом         g (α = 1 – γ), которое называют доверительной вероятностью:

g = Р( ).                                             

Итак, число e характеризует точность оценки параметра θ; число g – характеризует надежность оценки параметра θ.

В практических задачах  либо заранее задается надежность g (риск α) и надо найти точность оценки, либо, наоборот, задается точность e, а требуется определить надежность оценки.

Как правило, доверительную  вероятность g задают числом, близким к единице: 0,95; 0,97; 0,99; 0,999.

Формула означает, что с вероятностью g  неизвестное значение параметра θ находится в интервале I= (  – e,   + e). 

Очевидно, чем больше требуется точность e (т. е., чем меньше длина интервала), тем меньше вероятность накрыть интервалом Iискомый параметр θ, и, наоборот, с уменьшением точности e (увеличением длины интервала) увеличивается надежность g накрыть интервалом Iпараметр θ (рис. 1.5). 

 

 

 

Рис. Доверительный интервал  

 

Замечание. Если число g = 0,95, это означает, что в среднем в 95 случаях из 100 интервал Iнакроет параметр θ и в 5 случаях из 100 не накроет его. 

Оценка  , будучи функцией случайной выборки, является случайной величиной, ε также случайна: ее значение зависит от вероятности γ и, как правило, от выборки. Поэтому доверительный интервал случаен и выражение следует читать так: «Интервал ( –ε,  +ε) накроет параметр θ с вероятностью γ», а не «Параметр θ попадет в интервал ( –ε,  +ε) с вероятностью γ».

В формуле границы  доверительного интервала симметричны  относительно точечной оценки  . Однако не всегда удается построить интервал, обладающий таким свойством. Для получения доверительного интервала наименьшей длины при заданном объеме выборки п и заданной доверительной вероятности γ в качестве оценки   параметра θ следует брать эффективную или асимптотически эффективную оценку.

Существует два подхода  к построению доверительных интервалов. Первый подход, если его удается реализовать, позволяет строить доверительные интервалы при каждом конечном объеме выборки п. Он основан на подборе такой функции  , называемой в дальнейшем статистикой, чтобы

1)  ее закон распределения был известен и не зависел от θ;

2)  функция   была непрерывной и строго монотонной по θ.

Задавшись доверительной  вероятностью γ, связанной с риском α формулой γ = 1 – α, находят двусторонние критические границы   и  , отвечающие вероятности α. Тогда с вероятностью γ выполняется неравенство                                       

.                                        

Решив это неравенство  относительно θ, находят границы доверительного интервала для θ. Если плотность распределения статистики   симметрична относительно оси Оу, то доверительный интервал симметричен относительно  .

Второй  подход, получивший название асимптотического подхода, более универсален; однако он использует асимптотические свойства точечных оценок и поэтому пригоден лишь при достаточно больших объемах выборки.

Рассмотрим первый подход на примерах доверительного оценивания параметров нормального распределения.  

 

Интервальная  оценка математического ожидания 

при известной  дисперсии 

 

Итак, Х ~ N(а,σ) (случайная величина Х имеет нормальное распределение с параметрами а и σ), причем значение параметра а не известно, а значение дисперсии σизвестно.

При  ~  эффективной оценкой параметра а является  , при этом  ~ . Статистика   имеет распределение N(0; 1) независимо от значения параметра а и как функция параметра а непрерывна и строго монотонна. Следовательно, с учетом неравенства и симметричности двусторонних критических границ распределения N(0; 1) будем иметь:

Р(–uа < Z < uа) = 1 – α = γ.

Решая неравенство   относительно а, получим, что с вероятностью 1 – α выполняется неравенство

,                               

 

при этом                                          

.                                               

Число uа находят по прил. 3 из условия Ф(uа) = γ/2.

Замечание. Если п велико, оценку можно использовать и при отсутствии нормального распределения величины Х, так как в силу следствия из центральной предельной теоремы при случайной выборке большого объема п

.

В частности, если Х = μ, где μ – случайное число успехов в большом числе п испытаний Бернулли, то

,

и с вероятностью ≈1 – α для вероятности р успеха в единичном испытании выполняется неравенство

.                        

Заменяя значения р и q = 1 – р в левой и правой частях неравенства (1.15) их оценками   и  , что допустимо при большом п, получим приближенный доверительный интервал для вероятности р:                                         

< p <  .                           

 

Интервальная  оценка математического ожидания

при неизвестной диcперсии  

 

Итак, Х ~ N(а,σ), причем числовые значения ни а, ни σне известны. По случайной выборке найдем эффективную оценку параметра а:   и оценку

параметра σ2.

Построение интервальной оценки для а основано на статистике

,

которая при случайной выборке из генеральной совокупности Х ~ N(а,σ) имеет распределение Стьюдента с (п – 1) степенью свободы независимо от значения параметра а и как функция параметра а непрерывна и строго монотонна.

Информация о работе Математическая статистика