Автор: Пользователь скрыл имя, 03 Июня 2013 в 20:00, реферат
Математическая статистика. Определение понятий: генеральная совокупность, выборочная совокупность, повторная и бесповторная выборка в вариационный ряд. Математическая статистика - это раздел прикладной математики, в котором рассматриваются методы отыскания законов и характеристик случайных величин по результатам наблюдений и экспериментов. Анализ статистических данных включает оценку вероятностей события, функции распределения вероятностей или плотности вероятностей, оценку параметров известного распределения, оценку связей между случайными величинами.
Пример 3. Результаты измерений отклонений от нормы диаметров
50 подшипников дали численные значения ( в мкм ), приведенные в табл. 4.
Таблица 4.
-1,760 |
-0,291 |
-0,110 |
-0,450 |
0,512 |
-0,158 |
1,701 |
0,634 |
0,720 |
0,490 |
1,531 |
-0,433 |
1,409 |
1,740 |
-0,266 |
-0,058 |
0,248 |
-0,095 |
-1,488 |
-0,361 |
0,415 |
-1,382 |
0,129 |
-0,361 |
-0,087 |
-0,329 |
0,086 |
0,130 |
-0,244 |
-0,882 |
0,318 |
-1,087 |
0,899 |
1,028 |
-1,304 |
0,349 |
-0,293 |
0,105 |
-0,056 |
0,757 |
-0,059 |
-0,539 |
-0,078 |
0,229 |
0,194 |
0,123 |
0,318 |
0,367 |
-0,992 |
0,529 |
Для данной выборки: - построить интервальный вариационный ряд;
- построить гистограмму и полигон частостей.
1. Строим интервальный ряд.
По данным таблицы 4 определяем: ;
Для определения длины интервала используем формулу Стерджеса:
Число интервалов .
Примем =0,6 , .
За начало первого интервала примем величину
Конец последнего интервала должен удовлетворять условию:
Действительно, ; .
Строим интервальный
ряд (табл. 5).
Таблица 5.
Интервалы |
||||
Подсчет частот |
||||
Частоты |
2 |
6 |
11 |
15 |
Частости |
Интервалы |
||||
Подсчет частот |
||||
Частоты |
11 |
3 |
2 |
|
Частости |
Строим гистограмму частостей.
Вершинами полигона являются
середины верхних оснований
Убедимся, что площадь гистограммы равна 1.
1.3. Эмпирическая функция распределения. График.
Пусть получено статистическое распределение выборки и каждому варианту из этой выборки поставлена в соответствие его частость.
Эмпирической функцией (функцией распределения выборки) называется функция , определяющая для каждого значения частость события ,
,
- где - объем выборки, - число наблюдений, меньших .
При увеличении объема выборки частость события приближается к вероятности этого события. Эмпирическая функция является оценкой интегральной функции в теории вероятностей.
Функция обладает теми же свойствами, что и функция :
1. ;
2. -неубывающая функция;
3. , .
Пример.
Построить эмпирическую функцию и ее график по данным табл.1
1.4. Числовые характеристики выборки. Понятия обычных условных и центральных моментов. Метод произведения для вычисления выборки средней и выборочной дисперсии.
Выборочным средним называется среднее арифметическое всех значений выборки:
Выборочное среднее можно записать и так: ,
где - частость.
В случае интервального статистического ряда в качестве берут середины интервалов, а - соответствующие им частоты.
Начальным выборочным моментом порядка называется среднее арифметическое - х степеней всех значений выборки:
или .
Из определения следует, что начальный выборочный момент первого порядка: .
Центральным выборочным моментом порядка называется среднее арифметическое - х степеней отклонений наблюдаемых значений выборки от выборочного среднего :
Из определения следует, что центральный выборочный момент второго порядка:
Метод произведений вычисления выборочных средней и дисперсии.
При больших значениях вариантов и соответствующих им частот вычисление выборочного среднего, дисперсии и выборочных моментов по приведенным ниже формулам приводит к громоздким вычислениям.
В этом случае используют условные варианты , определяемые по формулам: , где числа и выбираются произвольно.
Чтобы упростить вычисления в качестве выбирают вариант, который имеет наибольшую частоту или находится в середине ряда. Число называется «ложным нулем». В качестве выбирают число равное длине интервала ( в случае интервального ряда) или наибольший общий делитель разностей .
Для вычисления числовых
характеристик выборки
Таблица 6.
|
||||||
|
||||||
|
||||||
Контроль:
С помощью сумм, полученных в нижней строке таблицы, находим условные моменты:
, ,
, .
Числовые характеристики выборки вычисляем по формулам:
; ; ;
; ,
где и находим по формулам:
1.5. Статистическая гипотеза: нулевая и конкурирующая, простая и сложная. Ошибки 1 и 2 рода.
Статистической гипотезой называется всякое высказывание о генеральной совокупности (случайной величине), проверяемое по выборке (то есть по результатам наблюдений).
Примеры статистических гипотез:
- математическое ожидание
случайной величины равно
- генеральная совокупность распределена по нормальному закону.
Гипотезы могут быть параметрические (гипотезы о параметрах распределения известного вида) и непараметрические (гипотезы о виде неизвестного распределения).
Различают гипотезы простые, содержащие только одно предположение, и сложные, содержащие более одного предположения.
Например, гипотеза - простая;
а гипотеза : , ( где ) – сложная гипотеза, потому что она состоит из бесконечного множества простых гипотез.
Процедура сопоставления гипотезы с выборочными данными называется проверкой гипотезы. Для проверки гипотез используют аналитические и статистические методы.
Ошибки 1 и 2 рода.
В соответствии с поставленной задачей и на основании выборочных данных формулируется (выдвигается) гипотеза , которая называется основной или нулевой. Одновременно с выдвинутой гипотезой , рассматривается противоположная ей гипотеза , которая называется конкурирующей или альтернативной.
Для проверки нулевой гипотезы вводят специально подобранную случайную величину , распределение которой известно и называют ее критерием.
Поскольку гипотеза для генеральной совокупности принимается по выборочным данным, то она может быть ошибочной. При этом возможны ошибки двух родов.
Ошибка первого рода состоит в том, что отвергается гипотеза , когда она на самом деле верна.
Ошибка второго рода состоит в том, что отвергается альтернативная гипотеза , когда она на самом деле верна.
1) Для определения вероятности ошибки первого рода вводится параметр :
- вероятность того, что будет принята гипотеза , при условии, что верна.
Величину называют уровнем значимости. Обычно выбирают в пределах .
2) Вероятность ошибки второго рода определяется параметром :
- вероятность того, что будет принята гипотеза , при условии, что верна.
Величину , то есть недопустимость ошибки второго рода (отвергнуть неверную и принять верную гипотезу ) называют мощностью критерия.
1.6. Проверка гипотезы о нормальном распределении генеральной совокупности по критерию Пирсона.
Пусть выборка из генеральной совокупности задана в виде статистического интервального ряда ряда:
|
где - интервальные частоты, - объем выборки,
- число интервалов, - длина интервала, - середина интервала.
Требуется проверить гипотезу о том, что генеральная совокупность распределена по нормальному закону, применяя критерий Пирсона. (К.Пирсон, 1857-1936 г; английский математик, биолог, философ).
Правило проверки
1. Вычисляем и ( см. Пример 5).
2. Находим теоретические частоты .
Их можно вычислить двумя способами.
Первый способ
где - объем выборки, - шаг, ;
- функция Гаусса, значение которой в точке
находим по таблице.
- вероятность попадания значений случайной
величины в - й интервал.
Для вычисления составляем табл. 7.