- Заключается в проведении n числа испытаний, оценкой вероятностей
в которых является частость . Частоты mi и частости mi/n (относительные частоты ) характеризуют
появление одинаковых значений СВ (сумма mi =n ; сумма mi
/n=1) Устойчивость: при
оценка вер стрем. к истинному
знач вер.
- В теории вер. Вводятся правила, которые
позволяют: 1) по вероятностям одних СС
вычислять вероятности других, более сложных
событий; 2) по числовым характеристикам
и ф- циям распр. одних СВ подсчитывать
функции распределения и числ характеристики
других СВ.
- Генеральной
совокупн. – н- ся вероятностное пространство
(т.е. простр. Элементарных событий
с заданным на нем полем
событий S и вероятностями P) и определенная на этом пространстве случайная
величина Х. Случайной
выборкой объема n , называется последовательность
, n независимых одинаково
распределенных СВ, распределение которых
совпадает с распределением исследуемой
СВ Х
- Генеральной
совокупн. бывает конечной или бесконечной
в зависимости от того, конечна или бесконечна
совокупность всех мыслимых наблюдений.
5. Случайной
выборкой объема n , называется последовательность
, n независимых одинаково
распределенных СВ, распределение которых
совпадает с распределением исследуемой
СВ Х.Суть:Статистический анализ св-в исл.
СВ
выполняется на основе выборки
из генер совокупности По результатам
выборки мы омжем решить след задачи: 1)
о типе распр. СВ 2) оценить числ. Хар. 3)
оцен. параметры гипотетич. Ф-ции
распр. и.т.д.
6.
Случайной выборкой объема n , называется последовательность
, n независимых одинаково
распределенных СВ, распределение которых
совпадает с распределением исследуемой
СВ Х.
Требования:1)выборка
является репрезентативной
т.е. выборка хорошо отображает с-ва генеральной
совокупности.2) выборка
получена в рез-те n независимых
испытаний и все исходы
являются значениями одной
и той же СВ.
- Функц.
завис.,когда некоторая переменная
определяется как однозначная ф-я одной
или нескольких других переменных.
- Статистической
зависимостью между СВ
и
называется правило,которе
каждому числу Х из множества значений
СВ
) ставит в соответствие условное
распределение СВ
- Регресионная
зависимость – зависим. Между случаиной переменной
и условным мат ожиданием М(
СВ
- Эмпирической ф – цией распределения
( ф – цией распределения
выборки ) называют ф – цию
, определяющую для каждого значения
х относительную частоту события Х<х
:
, где nx – число вариант, меньших х; n – объем выборки. Свойства: 1) значение
эмпирической ф – ции принадлежит отрезку [0;1].
2)
- неубывающая ф – ция. 3) Если х1 – наименьшая варианта, а хк – наибольшая, то
при х <= х1 и
при х > хк .
- Эмпирической функцией распределения
наз. функцию
, определяющую для каждого значения
х относительную частоту события Х < x. В отличае от эмпирической
функции распределения
генеральной совокупности наз.
теоретической функцией распределения.
Различие лишь состоит в том, что теоретическая
функция
определяет вероятность события
Х < x, а эмпирическая относительную
частоту.
- Статистической оценкой
неизвестного
параметра
теоретического распределения
наз. функцию
от наблюдаемых с.в.
. Точечной наз. оценку, которая определяется
одним числом. Интервальной наз. оценку, которая определяется
2-мя числами конца интервала. При выборке
малого объема точечная оценка может значительно
отличатся от оцениваемого параметра,
приводить к грубым ошибкам. По этой причине
следует использовать интервальные оценки.
12. Точенной называют статистическую
оценку, которая определяется 1 числом
,где x1,x2,…xn – результаты n наблюдений
над количественным признаком X.
С-ва несмещенности:
Оценка
называется несмещенной (т.е.
оценкой без систематической ошибки),
если ее математическое ожидание = оцениваемому
параметру
.
13. Точенной называют статистическую оценку,
которая определяется 1 числом
,где x1,x2,…xn – результаты n наблюдений
над количественным признаком X.
Оценка
называется
Состоятельной,
если при увеличении числа испытаний n
оценка приближается к оцениваемому параметру
.
14.
Точенной называют статистическую оценку,
которая определяется 1 числом
,где x1,x2,…xn – результаты n наблюдений
над количественным признаком X.
Оценка
называется
Эффективной
если она обладает по сравнению с другими
оценками минимальной дисперсией.
- Статистической называют гипотезу о виде неизвестного
распределения или о параметрах известных
распределений. Непараметрическая – если в ней сформулированы предположения
относительно вида ф – ции распределения. Параметрическая
- если в ней сформулированы предположения относительно значений
параметров функций распределения известного
вида.
- Статистической называют гипотезу о виде неизвестного
распределения или о параметрах известных
распределений. Ошибка первого рода состоит в том, что будет отвергнута
правильная нулевая гипотеза . Ошибка второго рода состоит в том, что будет принята
неправильная нулевая гипотеза.
23. Для проверки статистических
гипотез используются специальным образом
подобраннее случайные величины (выборочные
статистики), точное или приближенное
распределение которых известно. Значения
и
, называются критическими точками
(квантилями) R-распраделения, обозначаются
,
и находятся по таблицам R-pacnределений.
Алгоритм: Проверка истинности нулевой
гипотезы Н0 по результатам выборки основывается
на таких рассуждениях. Допустим, мы зададим
вероятность в настолько малой, что попадание
с.в. R в области (-
,
) и (
,+
) (см. рис.) будет маловероятным. т.
е. практически невозможным событием.
Тогда значение с. в.R, полученное на основании выборки
{x1,x2,…xn}, должно обязательно попасть
в интервал
,если гипотеза Н0 справедлива. Если же вычисленное
по выборке значение с.в. R попадает в области
(-
),
(
), то считается, что с вероятностью
1 -
проверяемая нулевая гипотеза
несправедлива.
Статистическим критерием – н – ся случайная величина R, с помощью которой принимаются
решения о принятии или отклонении выдвинутой
нулевой гипотезы.
- Ошибка
первого рода состоит в том, что будет отвергнута
правильная нулевая гипотеза . Ошибка второго рода состоит в том, что будет принята
неправильная нулевая гипотеза. Уровнем значимости статистического критерия н – ся вероятность
совершения ошибки первого
рода. Мощностью М критеря R называется вероятность
не совершения ошибки второго рода. М – это вероятность отклонения
неверной гипотезы
- Перечень наблюденных
значений СВ
(или разрядов наблюденных значений
) и соответствующих им частостей mi/n называется статистическим
законом распределения СВ
статистический закон распределения
задается интервальным (если СВ непрерывна
группировка закл в разбиении интервала
(Х1 ; Хn)наблюденных знач СВ на к разрядов
иподсчет частот и частостей ) и методом
сгруппировки (если СВ дискретна располог наблюденные
знач в порядке возрастания подсчитываем
частоты и частости )
- Предполжим,
что эксперимент описывается некоторой
случайной величиной
с неизвестной ф – цией распределения F(x). В ходе эксперимента из гениральной совокупности извлекается
случайная выборка объема n: {х1,х2,…,хn} Где х1,х2,…,хnявляются исходами n независимых испытаний, повтор
при соблюдении одних и тех же условий.
Исходы эксперимента предст в виде табл.,
состоящей из двух строк: с номерами испытаний и исходами – таблицу такого вида называют
статистическим рядомю. Интервальный
(если СВ непрерывна группировка закл
в разбиении интервала (Х1 ; Хn)наблюденных знач СВ на к разрядов
иподсчет частот и частостей ) и методом
сгруппированный (если СВ дискретна располог наблюденные
знач в порядке возрастания подсчитываем
частоты и частости )
- Интервальной называют
оценку, которая определяется двумя числами – концами интервала,
покрывающего оцениваемый параметр. Доверительным
называют интервал, который с заданной надежностью
покрывает заданный параметр.
Доверительная вероятность –
при которой выполняется
неравенство
- Интервальной называют оценку,
которая определяется двумя числами – концами интервала, покрывающего оцениваемый
параметр. При увеличении объема выборки
ширина доверит интервала уменьшается.
При увеличении доверительной вероятности
увеличивается
,что приводит к увеличению
доверительного интервала.
- Интервальной
называют оценку, которая определяется
двумя числами – концами интервала, покрывающего
оцениваемый параметр. Алгоритм: Для построения
доверительного интервала составим стандартизированную
СВ
Случайная величина U имеет стандартизированное
нормальное распр. : U
N (0;1) вероятность того, что
стандартизированная СВ U отклонится от своего мат ожидания
на величину
Находится по формуле:
используя формулу Лапласса запишем
найдем неизвестное нам
запишем исходя из определений
- Стасистическим
критерием называется случайная величина R, с помощью которой принимаются
решения опринятии или отклонении выдвинутой нулевой гипотезы. Уровень
значимости статистического критерия
н –ся вероятность совершения ошибки
первого рода (откл. верн гипотезы ) Мощностью
н – ся вероятность несовершения
ошибки второго рода (отклонение неверной
гипотезы) С увеличением уровня увеличивается мощность.
- Стасистическим
критерием значимости называется случайная
величина R, с помощью которой принимаются
решения опринятии или отклонении выдвинутой
нулевой гипотезы с зарание зафиксированным
уровнем значимости и без учета вероятности
совершения ошибки второго рода. Выводы:
Стасистический критерий значимости не
позволяет принимать решение : '' нулевая
гипотеза Н0 является правильной '' , так
как при применении указанных критериев
вероятность ошибки второго рода остается
неизвестной.
- Стасистическим критерием значимости называется
случайная величина R, с помощью которой принимаются
решения опринятии или отклонении выдвинутой
нулевой гипотезы с зарание зафиксированным
уровнем значимости и без учета вероятности
совершения ошибки второго рода. Если критическая область распологается
справа и слева от математического ожидания
СВ R, то критическая область н – ся двухсторонней, а если с одной
стороны, то односторонней. Уровень значимости
статистического критерия наз. вероятность
совершения ошибки первого рода (откл. верн гипотезы ) при
его увеличении увеличивается критическая
область критерия.
- 1
- 2
- 1
- Статистическая гипотеза называется непараметрической, если в ней сформулированы
предположения относительно вида функций
распределения. Нулевая непараметрическая гипотеза, подлежащая проверке,
может быть сформулирована в виде:
, где функция
задана полностью. Нулевая непараметрическая
гипотеза, в которой однозначно фиксируется
функция распределения, наз. простой гипотезой. Нулевая непараметрическая
гипотеза, в которой фиксируется семейство
функций распределений, наз сложной нулевой
гипотезой.
- Проверка непараметрической
гипотезы состоит в выяснении насколько
хорошо подобрана вероятностная модель.
Для проверки гипотез такого типа используются непараметрические
критерии значимости, критерии согласия
(Пирсона, Колмогорова, Смирнова и др.).
Критерий
основан на сопоставлений эмпирических
и теоретических частот попадания значений
и с.в. в рассматриваемые частичные разряды. В качестве меры
расхождения эмпирического и теоретического
распределений используется статистика
, которая при
независимо от вида предполагаемого
распределения стремится к распределению
с
степенями свободы. Критическое
значение
определяется по таблице квантилей
распределения
в зависимости от уровня значимости
и числа степеней свободы
.
- Проверка непараметрической
гипотезы состоит в выяснении насколько
хорошо подобрана вероятностная модель.
Для проверки гипотез такого типа используются
непараметрические критерии значимости,
критерии согласия (Пирсона, Колмогорова,
Смирнова и др.). Критерий
основан на сопоставлений эмпирических
и теоретических частот попадания значений
и с.в. в рассматриваемые частичные разряды. Алгоритм: 1) Выборочные данные представляются
в виде интервального или сгруппированного
статистического ряда; 2) Выбираем уровень значимости
; 3) Формулируем гипотезу о виде
закона распределения исслед. с.в.; 4) Вычитаются
вероятности
попадания значений с.в. в рассматриваемые
разряды разбиения по формуле
; 5) Определяются значения теоретических
частот
; 6) Вычисляется наблюдаемое
значение
; 7) По таблицам квантилей распределения,
определяется критическое значение
.
- Отличии: 1. Критерий Пирсона
применяется для сравнения эмпирических
и теоретических частот распределения,
а критерий Колмогорова – для сравнения эмпирической
функции распределения и гипотетической
функции распределения. 2. При применении
критерия Колмогорова предполагается,
что значение параметров гипотетической
функции распределения известны (в критерии
согласия Пирсона они могут определятся
по данным выборки). 3. Критерий Колмогорова жестче, чем критерий Пирсона.
- Статистической независимостью между
СВ
и
называется правило, которое
каждому числу Х из множества значений
СВ
) не ставит в соответствие условное
распределение СВ
- Если гипотеза о
равенстве нулю генерального коэффициента
корреляции будет отвергнута, то выборочный коэффициент значим, а величины X и Y коррелированы; если гипотеза принята, то выборочный
коэффициент незначим, а величины X и Y не коррелированы.
- Предметом регрессионного
анализа является нахождение вида уравнений
регрессионной зависимости между случайными величинами. Первым шагом в
поиске уравнения регрессии между с.в.
является графическое отображение 2-мерной
с.в. ввиде точек (х1, у1), …, (хn, yn) на плоскости ХУ. Такое изображение
называется диаграммой рассеяния. Визуальный
анализ диаграммы рассеяния позволяет сделать предположение
о виде линии регрессии и подобрать уравнение.
- Наилучшие
(несмещенные, состоятельные и эффективные)
оценки неизвестных параметров линейной
регрессии
и
могут быть получены методом
наименьших квадратов, т.е. лучший математический
метод оценки уравнения регрессии. Оценки
МНК параметров таких уравнений регрессии
являются несмещенными, состоятельными
и эффективными, в предположении, что значения
ошибок
, являются взаимно независимыми с.в. с нормальным
распределением, с нулевым мат. Ожиданием
и пост. дисперсией.
- Наилучшие
(несмещенные, состоятельные и эффективные)
оценки неизвестных параметров линейной
регрессии
и
могут быть получены методом наименьших квадратов,
т.е. лучший математический метод оценки
уравнения регрессии. Суть метода заключается
в том, что среди множества прямых (кривых)
выбирается такая, у которая наименьшая
сумма квадратов отклонений.
- Совокупность
методов оценки корреляционных характеристик
и проверки стат. гипотез о них по выборочным
данным, называется корреляционным
анализом. В нем используются следующие
основные приемы: 1. Построение корреляционного
поля и составление корреляционной таблицы.
2. Построение выборочных коэффициентов, корреляц.
отношений. 3. Проверку стат. гипотез о
значимости связи.
- Основной
числовой характеристикой, определяющей
тесноту линейной регрессионной зависимости
между 2-мя с.в., является коэффициент корреляции,
вычисляемый по формуле:
, где M(XY) – мат. ожидание произведения
с.в. Х и У. Возможн. значен. 1) если
, то между переменными
и
существует линейная положительная
функциональная связь; 2) если
, то между переменными
и
существует линейная отрицательная
функциональная связь; 3) если
, то линейная зависимость
между переменными
и
отсутствует, но при этом может оказаться,
что между переменными
и
отсутствует связь нелинейного
вида 4) ; если
, то чем ближе по модулю коэффициент
корреляции к единице , тем теснее линейная
зависимость между
и
- Оценка коэф. корреляции явл.
с.в., т.к. для различных выборок из одной
и той же генеральной совокупности может
принимать различные значения. Поэтому
часто при нахождении оценок коэф. кор.
используется проверка значимости этих оценок,
которая позволяет сделать вывод о существенности
описания действительной зависимости
уравнения регрессии. Фактически – это нахождение интервальных
оценок этих коэффициентов и анализ принадлежности
этому интервалу значения
. Проверка значимости позволяет
сделать вывод либо о существенности описания
зависимости уравнением регрессии, либо
о том, что данное уравнение практически
никак не определяет существенную зависимость
между с.в.