Математическая статистика
Автор: Пользователь скрыл имя, 03 Июня 2013 в 20:00, реферат
Краткое описание
Математическая статистика. Определение понятий: генеральная совокупность, выборочная совокупность, повторная и бесповторная выборка в вариационный ряд. Математическая статистика - это раздел прикладной математики, в котором рассматриваются методы отыскания законов и характеристик случайных величин по результатам наблюдений и экспериментов. Анализ статистических данных включает оценку вероятностей события, функции распределения вероятностей или плотности вероятностей, оценку параметров известного распределения, оценку связей между случайными величинами.
Файлы: 1 файл
Математическая статистика.doc
— 1.12 Мб (Скачать)
Пример 3. Результаты измерений отклонений от нормы диаметров
50 подшипников дали численные значения ( в мкм ), приведенные в табл. 4.
Таблица 4.
-1,760 |
-0,291 |
-0,110 |
-0,450 |
0,512 |
-0,158 |
1,701 |
0,634 |
0,720 |
0,490 |
1,531 |
-0,433 |
1,409 |
1,740 |
-0,266 |
-0,058 |
0,248 |
-0,095 |
-1,488 |
-0,361 |
0,415 |
-1,382 |
0,129 |
-0,361 |
-0,087 |
-0,329 |
0,086 |
0,130 |
-0,244 |
-0,882 |
0,318 |
-1,087 |
0,899 |
1,028 |
-1,304 |
0,349 |
-0,293 |
0,105 |
-0,056 |
0,757 |
-0,059 |
-0,539 |
-0,078 |
0,229 |
0,194 |
0,123 |
0,318 |
0,367 |
-0,992 |
0,529 |
Для данной выборки: - построить интервальный вариационный ряд;
- построить гистограмму и полигон частостей.
1. Строим интервальный ряд.
По данным таблицы 4 определяем: ;
Для определения длины интервала используем формулу Стерджеса:
Число интервалов .
Примем =0,6 , .
За начало первого интервала примем величину
Конец последнего интервала должен удовлетворять условию:
Действительно, ; .
Строим интервальный
ряд (табл. 5).
Таблица 5.
Интервалы |
||||
|
Подсчет частот |
||||
Частоты |
2 |
6 |
11 |
15 |
Частости |
|
Интервалы |
||||
|
Подсчет частот |
||||
Частоты |
11 |
3 |
2 |
|
Частости |
Строим гистограмму частостей.
Вершинами полигона являются
середины верхних оснований
Убедимся, что площадь гистограммы равна 1.
1.3. Эмпирическая функция распределения. График.
Пусть получено статистическое распределение выборки и каждому варианту из этой выборки поставлена в соответствие его частость.
Эмпирической функцией (функцией распределения выборки) называется функция , определяющая для каждого значения частость события ,
,
- где - объем выборки, - число наблюдений, меньших .
При увеличении объема выборки частость события приближается к вероятности этого события. Эмпирическая функция является оценкой интегральной функции в теории вероятностей.
Функция обладает теми же свойствами, что и функция :
1. ;
2. -неубывающая функция;
3. , .
Пример.
Построить эмпирическую функцию и ее график по данным табл.1
1.4. Числовые характеристики выборки. Понятия обычных условных и центральных моментов. Метод произведения для вычисления выборки средней и выборочной дисперсии.
Выборочным средним называется среднее арифметическое всех значений выборки:
Выборочное среднее можно записать и так: ,
где - частость.
В случае интервального статистического ряда в качестве берут середины интервалов, а - соответствующие им частоты.
Начальным выборочным моментом порядка называется среднее арифметическое - х степеней всех значений выборки:
или .
Из определения следует, что начальный выборочный момент первого порядка: .
Центральным выборочным моментом порядка называется среднее арифметическое - х степеней отклонений наблюдаемых значений выборки от выборочного среднего :
Из определения следует, что центральный выборочный момент второго порядка:
Метод произведений вычисления выборочных средней и дисперсии.
При больших значениях вариантов и соответствующих им частот вычисление выборочного среднего, дисперсии и выборочных моментов по приведенным ниже формулам приводит к громоздким вычислениям.
В этом случае используют условные варианты , определяемые по формулам: , где числа и выбираются произвольно.
Чтобы упростить вычисления в качестве выбирают вариант, который имеет наибольшую частоту или находится в середине ряда. Число называется «ложным нулем». В качестве выбирают число равное длине интервала ( в случае интервального ряда) или наибольший общий делитель разностей .
Для вычисления числовых
характеристик выборки
Таблица 6.
|
|
||||||
|
|
||||||
|
|
||||||
Контроль:
С помощью сумм, полученных в нижней строке таблицы, находим условные моменты:
, ,
, .
Числовые характеристики выборки вычисляем по формулам:
; ; ;
; ,
где и находим по формулам:
1.5. Статистическая гипотеза: нулевая и конкурирующая, простая и сложная. Ошибки 1 и 2 рода.
Статистической гипотезой называется всякое высказывание о генеральной совокупности (случайной величине), проверяемое по выборке (то есть по результатам наблюдений).
Примеры статистических гипотез:
- математическое ожидание
случайной величины равно
- генеральная совокупность распределена по нормальному закону.
Гипотезы могут быть параметрические (гипотезы о параметрах распределения известного вида) и непараметрические (гипотезы о виде неизвестного распределения).
Различают гипотезы простые, содержащие только одно предположение, и сложные, содержащие более одного предположения.
Например, гипотеза - простая;
а гипотеза : , ( где ) – сложная гипотеза, потому что она состоит из бесконечного множества простых гипотез.
Процедура сопоставления гипотезы с выборочными данными называется проверкой гипотезы. Для проверки гипотез используют аналитические и статистические методы.
Ошибки 1 и 2 рода.
В соответствии с поставленной задачей и на основании выборочных данных формулируется (выдвигается) гипотеза , которая называется основной или нулевой. Одновременно с выдвинутой гипотезой , рассматривается противоположная ей гипотеза , которая называется конкурирующей или альтернативной.
Для проверки нулевой гипотезы вводят специально подобранную случайную величину , распределение которой известно и называют ее критерием.
Поскольку гипотеза для генеральной совокупности принимается по выборочным данным, то она может быть ошибочной. При этом возможны ошибки двух родов.
Ошибка первого рода состоит в том, что отвергается гипотеза , когда она на самом деле верна.
Ошибка второго рода состоит в том, что отвергается альтернативная гипотеза , когда она на самом деле верна.
1) Для определения вероятности ошибки первого рода вводится параметр :
- вероятность того, что будет принята гипотеза , при условии, что верна.
Величину называют уровнем значимости. Обычно выбирают в пределах .
2) Вероятность ошибки второго рода определяется параметром :
- вероятность того, что будет принята гипотеза , при условии, что верна.
Величину , то есть недопустимость ошибки второго рода (отвергнуть неверную и принять верную гипотезу ) называют мощностью критерия.
1.6. Проверка гипотезы о нормальном распределении генеральной совокупности по критерию Пирсона.
Пусть выборка из генеральной совокупности задана в виде статистического интервального ряда ряда:
|
|
где - интервальные частоты, - объем выборки,
- число интервалов, - длина интервала, - середина интервала.
Требуется проверить гипотезу о том, что генеральная совокупность распределена по нормальному закону, применяя критерий Пирсона. (К.Пирсон, 1857-1936 г; английский математик, биолог, философ).
Правило проверки
1. Вычисляем и ( см. Пример 5).
2. Находим теоретические частоты .
Их можно вычислить двумя способами.
Первый способ
где - объем выборки, - шаг, ;
- функция Гаусса, значение которой в точке
находим по таблице.
- вероятность попадания значений случайной
величины в - й интервал.
Для вычисления составляем табл. 7.