Автор: Пользователь скрыл имя, 07 Января 2012 в 13:59, реферат
Различие индивидуальных значений признака внутри изучаемой совокупности в статистике называется вариацией признака. Она возникает в результате того, что его индивидуальные значения складываются под совокупным влиянием разнообразных факторов(условий), которые по разному сочетаются в каждом отдельном случае. Колеблемость отдельных значений характеризуют показатели вариации.
Термин "вариация" произошел от латинского variatio – из
1
Различие индивидуальных значений признака внутри изучаемой совокупности в статистике называется вариацией признака. Она возникает в результате того, что его индивидуальные значения складываются под совокупным влиянием разнообразных факторов(условий), которые по разному сочетаются в каждом отдельном случае. Колеблемость отдельных значений характеризуют показатели вариации.
Термин "вариация" произошел от латинского variatio – изменение, колеблемость, различие. Однако не всякие различия принято называть вариацией. Под вариацией в статистике понимают такие количественные изменения величины исследуемого признака в пределах однородной совокупности, которые обусловлены перекрещивающимся влиянием действия различных факторов. Различают вариацию признака: случайную и систематическую. Анализ систематической вариации позволяет оценить степень зависимости изменений в изучаемом признаке от определяющих ее факторов.
Вариацией значений какого-либо признака в совокупности называется различие его значений у разных единиц данной совокупности в один и тот же период или момент времени. В отличие от вариации различия значений признака у одного и того же объекта, у одной и той же единицы совокупности в разные периоды или моменты времени следует называть изменениями во времени и колебаниями. Методы их измерения и изучения отличаются принципиально от методов измерения вариации.
Причиной вариации являются разные условия существования разных единиц совокупности. Даже однояйцовые близнецы в процессе развития приобретают различия в росте, весе, не говоря уже о таких признаках, как специальность, образование, заработная плата (доход), число детей и т.д. Еще больше причин влияют на различия промышленных предприятий, магазинов и пр.
Первым этапом статистического изучения вариации являются построение вариационного ряда — упорядоченного распределения единиц совокупности по возрастающим (чаще) или по убывающим (реже) значениям признака и подсчет числа единиц с тем или иным значением признака. Существуют три формы вариационного ряда: ранжированный, дискретный, интервальный. Вариационный ряд часто называют рядом распределения. Этот термин употребляется при изучении вариации как количественных, так и неколичественных признаков. Ряд распределения представляет собой структурную группировку.
Ранжированный ряд — это перечень отдельных единиц совокупности в порядке возрастания (убывания) изучаемого признака.
Если численность единиц совокупности достаточно велика, ранжированный ряд становится громоздким, а его построение, даже с помощью компьютера, занимает длительное время. В таких случаях вариационный ряд строится с помощью группировки единиц совокупности по значениям изучаемого признака.
Число групп в дискретном вариационном ряду определяется числом реально существующих значений варьирующего признака. Если признак принимает дискретные значения, но их число очень велико (например, поголовье скота на 1 января года в разных сельскохозяйственных предприятиях может составить от нуля до десятков тысяч голов), то строится интервальный вариационный ряд. Интервальный вариационный ряд строится и для изучения признаков, которые могут принимать любые, как целые, так и дробные значения в области своего существования. Таковы, например, рентабельность реализованной продукции, себестоимость единицы продукции, доход на одного жителя города, доля лиц с высшим образованием среди населения разных территорий и вообще все вторичные признаки, значения которых рассчитываются путем деления величины одного первичного признака на величину другого.
Интервальный вариационный ряд представляет собой таблицу, состоящую из двух граф (или строк) — интервалов признака, вариация которого изучается, и числа единиц совокупности, попадающих в данный интервал (частот), или долей этого числа от общей численности совокупности.
Наиболее часто используются два вида интервальных вариационных рядов: равноинтервальный и равночастотный. Равноинтервальный ряд применяется, если вариация признака не очень сильна, т.е. для однородной совокупности, распределение которой по данному признаку близко к нормальному закону. Равночастотный ряд применяется, если вариация признака очень сильна, однако распределение не является нормальным, а, например, гиперболическим.
При построении равноинтервального ряда число групп выбирается так, чтобы в достаточной мере отразились разнообразие значений признака в совокупности и в то же время закономерность распределения, его форма не искажалась случайными колебаниями частот. Если групп будет слишком мало, не проявится закономерность вариации; если групп будет чрезмерно много, случайные скачки частот исказят форму распределения.
Заданием статистического изучения вариации является исследование однородности совокупности как базы для дальнейшего анализа.
Измерение уровней вариации производится путем применения системы показателей:
- размах вариации;
- среднее линейное и среднее квадратическое отклонение;
- дисперсия;
- коэффициент вариации.
В зависимости от исходной информации вышеприведенные показатели могут быть как простыми, так и взвешенными.
Изучение
вариации как признака в совокупности
является измерение характеристик силы,
величины вариации. Простейшим из них
может служить размах, или амплитуда вариации,
— абсолютная разность между максимальным
и минимальным значениями признака из
имеющихся в изучаемой совокупности значений.
Таким образом, размах вариации вычисляется
по формуле:
Поскольку величина размаха характеризует лишь максимальное различие значений признака, она не может измерять закономерную силу его вариации во всей совокупности. Предназначенный для данной цели показатель должен учитывать и обобщать все различия значений признака в совокупности без исключения. Число таких различий равно числу сочетаний по два из всех единиц совокупности. Поэтому показателем силы вариации выступает не алгебраическая средняя отклонений, а средний модуль отклонения, или среднее линейное отклонение.
Этот показатель рассчитывается по формуле:
Для
несгруппированных данных:
Для
сгруппированных данных:
где:
xi – середина i-ого интервала переменной х;
– среднее значение
fi – частота i-ого интервала;
n – число групп
Квадрат среднего квадратического отклонения дает величину дисперсии. Формула дисперсии:
-
для несгруппированных данных:
или
-
для сгруппированных данных:
Или
Равенство результатов расчетов по этим формулам выполняется только при точном значении средней арифметической величины. Если же средняя округлена, то дисперсию следует вычислять только по формулам:
Простая
Взвешенная
Среднее квадратичное отклонение находим на базе дисперсии:
простое:
взвешенное:
Для большей наглядности, а так же с целью сравнения вариации разных признаков, или одного признака в разных совокупностях (вариация цены на хлеб, масло и.т.п.) используют относительные показатели вариации:
Линейный
коэффициент вариации:
квадратичный
коэффициент вариации:
(2.13)
коэффициент
осцилляции:
(2.14)
|
Пусть — выборка из распределения , зависящего от параметра . Пусть есть функция , такая что g(X) интегрируема относительно меры , и
,
где — биекция. Тогда оценка
называется оценкой параметра методом моментов.
то есть оценка методом моментов получается путём приравнивания теоретического среднего g(X) с выборочным средним.
.
Если , то есть функция f непрерывна, то оценка метода моментов состоятельна.
Пусть — выборка из гамма распределения с неизвестными параметрами α и β. Тогда
.
Тогда оценки метода моментов удовлетворяют системе уравнений:
откуда
,
и
.
В известной
мере, при оценке параметров из известного
семейства вероятностных