Элементарные статистические процедуры

Автор: Пользователь скрыл имя, 04 Декабря 2011 в 20:43, лекция

Краткое описание

При решении многих прикладных задач необходимые вероятностные характеристики случайных величин неизвестны исследователю и добываются экспериментально. Такое статистическое описание результатов наблюдений составляет содержание математической статистики.

Файлы: 1 файл

Лекции.doc

— 798.50 Кб (Скачать)

1.2. Элементарные статистические  процедуры

Статистическое  оценивание параметров распределения

    При решении многих прикладных задач  необходимые вероятностные характеристики случайных величин неизвестны исследователю  и добываются экспериментально. Такое  статистическое описание результатов наблюдений составляет содержание математической статистики.

    Фундаментальным понятием статистической теории являются понятия генеральной совокупности и выборки.

    Генеральная совокупность обычно интерпретируется как совокупность всех мыслимых результатов наблюдений над случайной величиной, которые в принципе могут быть проведены в данных условиях.

    Для определения свойств ГС исследуется  некоторая ее часть, называемая выборкой, т.е. это конечный набор значений случайной величины. Число элементов выборки назевается ее объемом. Если, например, y1 , y2,….., yn - наблюдаемые значения случайной величины Y, то объем данной выборки равен N.

    Смысл статистических методов заключается  в том, чтобы по выборке ограниченного  объема N высказать, обоснованное суждение о свойствах ГС в целом. Подобное суждение может быть получено оцениванием параметров (характеристик) ГС с помощью некоторых подходящих функций от результатов наблюдений - оценок.

    При многократном извлечении выборок одного и того же объема и последующем нахождении множества оценок одного и того же параметра подучаются различные числовые значения этих оценок. Т.е. любая оценка произвольного параметра Q есть случайная величина. В этом ее принципиальное отличие от самого оцениваемого параметра Q, являющегося неслучайным. Чтобы подчеркнуть указанное существенное обстоятельство для параметров генеральной совокупности и их оценок, вводятся различные обозначения. В общем случае оценка произвольного параметра обозначается через . Оценка математического ожидания my чаше обозначается через , оценка дисперсии s2y через S2y,

    Для оценивания одного и того же параметра  ГС можно использовать различные  оценки. Чтобы выбрать наилучшие  из них необходимо сформулировать некоторые требования к свойствам оценок, желательные с точки зрений практики.

    Оценка  параметра Q называется состоятельной, если при неограниченном увеличении объема выборки N значение с полной мерой достоверности (с вероятностью единица) стремится к теоретическому значению Q. Т.е. при Nൠматематическое ожидание оценки стремится к оцениваемому параметру, а ее дисперсия к нулю.

    Оценка  называется несмещенной, если m для любого N. Несмещенность означает отсутствие систематической погрешности яри оценивании параметра Q.

    Оценка  называется эффективной если среди оценок параметра Q она обладает наименьшей дисперсией s2 , т.е. оценка имеет min случайную ошибку и в этом смысле является наиболее точной.

Точечные  оценки математического  ожидания и дисперсии

    Точечные  оценки – это оценки некоторых  неизвестных числовых параметров распределения. Они представляют собой числа, полученные путем подстановки выборочных значений y1,y2,…..,yN в формулу для оценивания искомого параметра. Математическое ожидание и дисперсию обычно оценивают

              

 (1.8)

              

 (1.9)

    Указанные оценки являются состоятельными и несмещенными. Несмещенность оценки S2y достигается использованием в знаменателе величины fQ=N-1 вместо очевидного на первый взгляд значения N . Величину fQ называют числом степеней свободы.

    Оценку  S2y часто называет средним квадратом отклонений опытных значений yi oт среднего . В математической статистике он определяется как отношение некоторой суммы квадратов отклонений Q к числу степеней свободы этой суммы fQ

              

  (1.10)

    Число степеней свободы fQ равно числу независимых слагаемых в сумме квадратов. Так в формуле S2y имеется N слагаемых (yi- ) , но в силу вычисления среднего наложена одна связь Поэтому число независимых слагаемых (N-1) и эта величина является числом степеней свободы fQ , (fQ – равна разности между числом имеющихся экспериментальных значений N по которым вычисляют оценку дисперсии, и количеством дополнительных параметров, входящих в формулу для оценки этой дисперсии и вычисляемых в виде линейных комбинаций тех же самых наблюдений (в данном случае это всего один параметр ).

    Вычисления  по формуле (1.9) трудоемки и при  малых значениях разностей (yi- ) могут порождать большие ошибки. Поэтому вместо выражения (1.9), играющего роль определяющего понятия, пользуются тождественными соотношениями:

Здесь основные преобразования:

  Сумма всех отклонений от среднеарифметического равна нулю.

 Интервальные оценки математического  ожидания и дисперсии.

    Точечные  оценки параметров не дают информации о степени близости оценки к соответствующему теоретическому параметру Q. Поэтому более информативный способ оценивания неизвестных параметров состоит не в определении единичного точечного значения, а в построении интервала, в котором с заданной степенью достоверности окажется оцениваемый параметр, т.е. в построении так называемой интервальной оценки.

    Интервальной  оценкой параметра Q называется интервал, границы которого являются функциями выборочных значений y1,y2,…..,yN и который с заданной вероятностью p накрывает оцениваемый параметр Q 

              

 (1.12)

    Интервал ( ) называется доверительным, его границы изъявляющиеся случайными величинами, соответственно нижним и верхним доверительными интервалами, а вероятность р – доверительной вероятностью, а величина a=1-р уровнем значимости, используемым при построении доверительного интервала и при проверке различных гипотез.

Проверка  статистических гипотез

    Статистическая  гипотеза есть некоторое предположение  относительно свойств генеральной  совокупности, из которой извлекается выборка.

    Критерий  статистической гипотезы – это правило  позволяющее принять или отвергнуть данную гипотезу на основании выборки. При построении такого правила используются определение функции результатов  наблюдений g(y1,y2,…..,yN) называемые статистиками для проверки гипотез. Все возможные значения подобных статистик делятся на две части: область принятия гипотезы и критическая область. Проверка гипотезы сводится к выяснению того, попадает или нет конкретное значение статистики, вычисленное по выборке, в критическую область: если нет – гипотеза принимается, как не противоречащая результатам наблюдения, если да – гипотеза отвергается. При этом всегда возможно совершить ошибку, различные типы которых показаны в таблице: 

Гипотеза Объективно  верна Объективно неверна
Принимается Правильное  решение Ошибка рода
Отвергается Ошибка рода Правильное  решение
 

    Вероятность совершить ошибку I рода называется уровнем значимости критерия и обозначается a. Обычно уровень значимости выбирается 0,01; 0,1 и наиболее часто 0,05.

    Критерии  значимости – это критерии, с  помощью которых проверяют гипотезы об абсолютных значениях или о  соотношениях между ними для генеральных  совокупностей с известной функцией распределения.

    Для пояснения идеи построения критериев  значимости предположим, что некоторая оценка (mx,sx и т.д.), используемая затем в качестве статистики, вычислена по выборке объема N . Пусть имеется причина считать, что истинное значение оцениваемого параметра Q в генеральной совокупности равно Qо. Это проверяемое предположение называется нулевой гипотезой H0 и пишут H0: Q=Q0

    Если, даже нулевая гипотеза справедлива, то выборочное значение обычно не совпадает с Q0 , поскольку оно является одним из конкретных значений случайной величины , порожденной всевозможными выборками объема N . Спрашивается: насколько сильно должно отличаться от Q0 , чтобы в достаточной мере обоснованно можно было бы отвергнуть нулевую гипотезу? Если известна функция плотности вероятности оценки f( ), построенная теоретически в предположении справедливости нулевой гипотезы, то с ее помощью несложно найти такую зону, вероятность случайного попадания в которую (когда Но верна) мала (равна малому значению q). Эта зона и может использоваться в качестве критической.

     Вид критической области полностью  определяется характером альтернативной гипотезы Hi , т.е. гипотезы, противопоставляемой нулевой, той гипотезы, в пользу которой склоняется исследователь, отвергая проверяемую гипотезу. Если нулевой гипотезе Н0: Q=Q0 противопоставлена альтернативная гипотеза Н1: Q¹Q0, то критерии для проверки Н0 будет двухсторонний.

    Мы  будем пользоваться t – критерием, F, и т.д. и заданный критерий значимости a будем находить по таблицам в зависимости от степеней свободы. 

2. ПОЛНЫЙ И ДРОБНЫЙ  ФАКТОРНЫЕ ЭКСПЕРИМЕНТЫ 

2.1. Введение в математическую  теорию эксперимента

    Математическая  теория планирования эксперимента –  пример системного подхода в изучении сложных систем.

    В настоящее время при изучении сложных технических объектов широко применяется системный подход, исходные предпосылки которого заключаются  в стремлении с максимальной полнотой учесть все входные и выходные характеристики объекта и в проблемно-ориентированной организации исследования.

    Наиболее  разработанными и эффективными методами практической реализации системного подхода  являются, методы математической теории эксперимента или планирования эксперимента, представляющие собой развитие идей многофакторного анализа. Эти методы в короткий срок получили широкое применение в большинстве областей исследования – в химии, металлургий, промышленности строительных материалов, медицине, биологии, электронике, автоматике, вычислительной технике и др. областях, благодаря своей универсальности и существенному повышению эффективности исследований.

    Хотя  математические методы планирования наиболее эффективно работают при исследовании физических объектов путем постановки опытов с этими объектами в  реальных условиях их работе, планирование эксперимента, если под экспериментом иметь в виду любое действие с системой или ее моделью, позволяет существенно поднять эффективность решений на математических моделях, набранных на АВМ и ЦВМ, как в линейной, так и нелинейной постановке задач. И в этом плане применение математической теории эксперимента при моделировании задач на вычислительных машинах дозволяет поднять производительность научного труда на всех стадиях исследования, разработки и проектирования сложных систем.

    Математические  методы планирования эксперимента основаны на кибернетическом представлении  об объеме исследования. В этом случае наиболее подходящей моделью исследуемого объекта являются кибернетическая  система, называемая «черным ящиком»  и изображенная на рис 2.1.

Рис. 2.1. Схема кибернетической системы 

Информация о работе Элементарные статистические процедуры