Автор: Пользователь скрыл имя, 03 Июня 2013 в 20:00, реферат
Математическая статистика. Определение понятий: генеральная совокупность, выборочная совокупность, повторная и бесповторная выборка в вариационный ряд. Математическая статистика - это раздел прикладной математики, в котором рассматриваются методы отыскания законов и характеристик случайных величин по результатам наблюдений и экспериментов. Анализ статистических данных включает оценку вероятностей события, функции распределения вероятностей или плотности вероятностей, оценку параметров известного распределения, оценку связей между случайными величинами.
Раздел I
Математическая статистика. Определение понятий: генеральная совокупность, выборочная совокупность, повторная и бесповторная выборка в вариационный ряд.
Математическая статистика - это раздел прикладной математики, в котором рассматриваются методы отыскания законов и характеристик случайных величин по результатам наблюдений и экспериментов.
Основные задачи математической статистики.
1. Создание методов сбора и группировки обрабатываемого статистического материала, полученного в результате наблюдений за случайными процессами.
2. Разработка методов анализа полученных статистических данных.
3. Получение выводов по данным наблюдений.
Анализ статистических
данных включает оценку
Математическая статистика опирается на теорию вероятностей и в свою
очередь служит основой для разработки методов обработки и анализа статистических результатов в конкретных областях человеческой деятельности.
Генеральная совокупность и выборка.
Основными понятиями математической статистики являются генеральная совокупность и выборка.
Генеральная совокупность – это совокупность всех мысленно возможных объектов данного вида, над которыми проводятся наблюдения с целью получения конкретных значений определенной случайной величины.
Генеральная совокупность может быть конечной или бесконечной в зависимости от того, конечна или бесконечна совокупность составляющих ее объектов.
Не следует смешивать понятие генеральной совокупности с реально существующими совокупностями. Например, на склад поступила продукция некоторого цеха за месяц, что является реально существующей совокупностью, которую нельзя назвать генеральной, поскольку выпуск продукции можно мысленно продолжить сколь угодно долго.
Выборкой (выборочной совокупностью) называется совокупность случайно отобранных объектов из генеральной совокупности.
Выборка должна быть репрезентативной (представительной), то есть ее объекты должны достаточно хорошо отражать свойства генеральной совокупности.
Выборка может быть повторной, при которой отобранный объект (перед отбором следующего) возвращается в генеральную совокупность, и бесповторной, при которой отобранный объект не возвращается в генеральную совокупность.
Применяют различные способы получения выборки.
1) Простой отбор – случайное извлечение объектов из генеральной совокупности с возвратом или без возврата.
2) Типический отбор, когда объекты отбираются не из всей генеральной совокупности, а из ее «типической» части.
3) Серийный отбор – объекты отбираются из генеральной совокупности не по одному, а сериями.
4) Механический отбор - генеральная совокупность «механически» делится на столько частей, сколько объектов должно войти в выборку и из каждой части выбирается один объект.
Число объектов генеральной совокупности и число объектов выборки называют объемами генеральной и выборочной совокупностей соответственно. При этом предполагают, что (значительно больше).
Вариационные ряды
Полученные различными способами отбора данные образуют выборку, обычно это множество чисел, расположенных в беспорядке. По такой выборке трудно выявить какую-либо закономерность их изменения (варьирования).
Для обработки данных используют операцию ранжирования, которая заключается в том, что результаты наблюдений над случайной величиной, то есть наблюдаемые значения случайной величины располагают в порядке возрастания.
Пример 1. Дана выборка :
¦ Проведем ранжирование выборки :
После проведения операции ранжирования значения случайной величины объединяют в группы, то есть группируют так, что в каждой отдельной группе значения случайной величины одинаковы. Каждое такое значение называется вариантом. Варианты обозначаются строчными буквами латинского алфавита с индексами, соответствующими порядковому номеру группы .
Изменение значения варианта называется варьированием.
Последовательность вариантов, записанных в возрастающем порядке, называется вариационным рядом.
Число, которое показывает,
сколько раз встречаются
Отношение частоты данного варианта к общей сумме частот называется относительной частотой или частостью (долей) соответствующего варианта и обозначается или , где - число вариантов. Частость является статистической вероятностью появления варианта . Естественно считать частость аналогом вероятности появления значения случайной величины .
Дискретным статистическим рядом называется ранжированная совокупность вариантов с соответствующими им частотами или частостями .
Дискретный статистический ряд удобно записывать в виде табл.1.
Таблица 1 (для примера 1)
1 |
2 |
3 |
4 |
7 |
||
2 |
2 |
3 |
1 |
2 |
||
Характеристики дискретного статистического ряда:
1. Размах варьирования .
2. Мода - вариант, имеющий наибольшую частоту
( в примере 1. ).
3. Медиана - значение случайной величины, приходящееся на середину ряда.
Пусть - объем выборки.
Если , то есть ряд имеет четное число членов, то . Если , то есть ряд имеет нечетное число членов, то .
( в примере 1. ).
Если изучаемая случайная величина является непрерывной или число значений ее велико, то составляют интервальный статистический ряд.
Сначала определяют число интервалов , в зависимости от объема выборки, с помощью табл.2.
Таблица 2.
Объем выборки |
25-40 |
40-60 |
60-100 |
100-200 |
более 200 |
Число интервалов |
5-6 |
6-8 |
7-10 |
8-12 |
10-15 |
Затем определяют длину частичного интервала :
Более точно шаг можно рассчитать с помощью формулы Стерджеса:
Если шаг окажется дробным, то за длину интервала берут ближайшее целое число или ближайшую простую дробь (обычно берут интервалы одинаковые по длине, но могут быть интервалы и разной длины).
За начало первого интервала рекомендуется брать величину , а конец последнего должен удовлетворять условию . Промежуточные интервалы получают, прибавляя к концу предыдущего интервала шаг.
Просматривая результаты наблюдений, определяют сколько значений случайной величины попало в каждый конкретный интервал. При этом в интервал включают значения, большие или равные нижней границе интервала, и меньшие – верхней границы.
В первую строку таблицы статистического распределения вписывают частичные промежутки .
Во второю строку статистического ряда вписывают количество наблюдений (где ) попавших в каждый интервал; то есть частоты соответствующих интервалов.
Подсчет частот для каждого интервала удобно проводить методом «конвертиков». Этот метод состоит в том, что попадание значения случайной величины в тот или иной интервал, отмечается точкой, а также и черточкой. В результате каждому десятку будет соответствовать фигура, похожая на конверт.
При вычислении интервальных частостей округление результатов следует производить таким образом, чтобы сумма частостей была равна 1.
Иногда интервальный статистический ряд, для простоты исследований, условно заменяют дискретным. В этом случае серединное значение -го интервала принимают за вариант , а соответствующую интервальную частоту - за частоту этого варианта.
1.2. Полигоны и гистограммы
Статистическое распределение изображается графически с помощью полигона и гистограммы.
Полигоном частот называют ломаную, отрезки которой соединяют точки с координатами ; полигоном частостей – с координатами , где , .
Полигон служит для изображения
дискретного статистического
Полигон частостей является аналогом многоугольника распределения дискретной случайной величины в теории вероятностей.
Гистограммой частот (частостей) называют ступенчатую фигуру, состоящую из прямоугольников, основания которых расположены на оси и длины их равны длинам частичных интервалов , а высоты равны отношению:
- для гистограммы частот; - для гистограммы частостей.
Гистограмма является графическим изображением интервального ряда.
Площадь гистограммы частот равна , а гистограммы частостей равна 1.
Можно построить полигон для интервального ряда, если его преобразовать в дискретный ряд. В этом случае интервалы заменяют их серединными значениями и ставят в соответствие интервальные частоты (частости). Полигон получим, соединив отрезками середины верхних оснований прямоугольников гистограммы.
Пример 2. Дана выборка значений случайной величины объема 20:
12, 14, 19, 15, 14, 18, 13, 16, 17, 12
18, 17, 15, 13, 17, 14, 14, 13, 14, 16
Требуется: - построить дискретный вариационный ряд;
- найти размах варьирования , моду , медиану ;
- построить полигон частостей.
1) Ранжируем выборку : 12, 12, 13, 13, 13, 14, 14, 14, 14, 14,
2) Находим частоты вариантов и строим дискретный вариационный ряд (табл.3)
Значения вариантов |
12 |
13 |
14 |
15 |
16 |
17 |
18 |
19 |
|
Частоты |
2 |
3 |
5 |
2 |
2 |
3 |
2 |
1 |
|
Частости |
|
|
|
|
|
|
|
|
|
3) По результатам таблицы 3 находим:
, ,
4) Строим полигон частостей.