Автор: Пользователь скрыл имя, 14 Ноября 2011 в 21:51, реферат
Статистика (stato - состояние ) - это совокупность данных наблюдений ,
статистическая совокупность - это, как правило, количественная оценка
исследуемого явления, собранная одномоментно из разных источников или в
одном месте в разное время (числовые значения).
Статистической совокупностью - называется генеральной совокупностью, если
включает в себя все возможные значения данного явления. Такую совокупность
практически трудно создать в силу бесконечного ее объема, поэтому чаще
всего статисты работают с некоторой частью генеральной совокупности,
которая называется - выборкой. Работая с выборкой должны получать
результаты, которые соответствуют генеральной совокупности.
i=1,2, ..., k - текущие
значения;
k - количество
различных значений
Для больших по объему совокупностей весь статистический анализ разумно
вести, представив
совокупность в виде
Тогда средняя
интервального вариационного
- средняя
арифметическая интервального
xi - среднеинтервальное
значение (середина интервала i );
mi - частота
интервала (количество
интервале);
i=1,2, ..., k - текущие
значения интервала;
k - количество
интервалов.
Среди непараметрических средних значений рассмотрим медиану и моду.
Медиана,
также как и
интервальной.
Медиана
- среднее значение
Поэтому,
если рассмотреть
пути определения
медианы.
Для случая
интервального вариационного
медианный
интервал, то есть определить
интервал в который входят
медиана.
Определяется
медианный интервал по
для которого
выполняется соотношение и
Меинт -
медиана интервального ряда,
h - величина
интервала интервального ряда,
(xmin) k - нижняя
граница медианного интервала,
Мk-1 - накопленная
частота интервала,
mk - частота
медианного интервала,
k - номер
медианного интервала.
Из определений Медискр и Меинт ясно, что их значения близки но не
совпадают.
Кроме того, очевидно, что значения Xa и Ме достаточно близки по своим
значениям,
т.к. определяют среднюю и
совокупность
достаточно однородна, то эти
значения достаточно близки
к другу.
Другой
не параметрической средней
Мо - наиболее
часто встречающееся значение
совокупности.
Или, иначе , мода - значение совокупности с наибольшей частотой, Мо=xi при
mi=max{m}. Различают совокупности одно, двухмодальные, трехмодальные и
т.д.
Одномодальная совокупность имеет наблюдение наибольшей частотой, и
характеризуется
одним значением моды.
В двухмодальной
совокупности есть два
частотами,
т.е. совокупность
случае для дальнейшего исследования выбирают моду, близкую к
среднеарифметическому
значению.
Различно
рассчитывают значение моды
И более
того- для дискретного ряда не
всегда можно определить
моды, т.к. может существовать несколько наблюдений с равными и
максимальными
частотами. Поэтому часто
совокупность к интервальному виду. Но тогда, сначала, как и в случае
расчета
медианы, необходимо
интервал имеет наибольшую частоту. А внутри этого интервала мода
определяется
как
где:
Моинт -
мода интервального ряда,
h - величина
интервала интервального ряда,
(xmin) k - нижняя
граница модального интервала,
mk - частота
модального интервала,
mk-1 - частота
интервала, предшествующего
mk+1 - частота
интервала, следующего за
k - номер
модального интервала.
Для однородной
совокупности характерна
Вычисления.
Xi 1470 2006 2030
2073 2305 2444 2535 2625 2710 N
mi 1 1 1 1 1 1 1 1
1 9
Табл. 3
№№ X min X max
Xi m1 ni Mi
1 2 3 4 5 6
1 1300 1700 1500 1
0,111 1
2 1700 2100 1900 3
0,333 4
3 2100 2500 2300 2
0,222 6
4 2500 2900 2700 3
0,333 9
Табл. 4
Определим
значение Ме.
Для определения
моды - Мо - также используем теже
данные.
k=2
h=400
=2100
mk=m2=3
mk-1=m2-1=m1=1
mk+1=m2+1=m3=2
Оценки Xa Ме
Мо
Дискретные
2244 2305 ------
Взвешенные
2244 2305 ------
Интервальные
2211 2567 2367
Табл. 5
1.5. Вычисление
характеристик меры и степени
вариации .
1.0 Показатели
колеблемости (вариации).
Общие положения.
Средние
величины характеризуют
характеристики
не отражают изменчивости
признака
в данной совокупности.
В статистике
принято несколько способов
Самая простая
оценка - вариационный размах.
R - вариационный размах - определяется как разность между экстремальными
значениями ранжированной совокупности, где Xmax - наибольшее значение ,
Xmin - наименьшее
значение совокупности.
Размах
во многом зависит от
выборок одного признака , а потому может быть применен как
приблизительная,
неустойчивая оценка вариации.
Более значимой
является простое среднее
Простое
среднее отклонение является
средним арифметическим
абсолютной величине) отдельных значений (вариант) от общего
среднеарифметического,
где
xi - отдельное
значение совокупности,
дискр, взв
- среднеарифметическое значение
совокупности,
N- количество
наблюдений в совокупности.
Простое
отклонение может быть
и как
взвешенное:
Наиболее
полной оценкой вариации
отклонения дисперсия 2 - дисперсия - рассчитывается как средний квадрат
отклонений
отдельных значений от
Как и простое среднее отклонение , дисперсия может быть рассчитана как
дискретная
или как взвешенная :
для дискретных
значений;
для взвешенных
значений.
Эта оценка
наиболее часто используется
на практике как мера
признака.
Среднеквадратическое
собой квадратный корень из дисперсии. Также как и предыдущие оценки,
стандарт
может рассчитываться как
Как правило
в статистическом анализе
интервальному вариационному ряду. Это вполне относится к вычислению
дисперсии
и стандарта, где
- среднеинтервальное
значение интервала i ;
mi - частота
интервала i ;
2инт - дисперсия
интервального вариационного
инт - стандартного
интервального вариационного
Иногда
статистический анализ
за пределами
нашего рассмотрения.
Как покажут дальнейшие исследования, стандартное отклонение необходимо
учитывать
при любом статистическом
являются абсолютными величинами, их выражают в тех же единицах измерения ,
что и
значение признака и они
очень часто
используют относительные
Эти коэффициенты
имеют смысл только при
Коэффициент вариации, величина которой превышает 30%, свидетельствует о
большой
колеблемости значений
Стандартное отклонение часто используется при построении интервального
вариационного
ряда.
Учитывая, что чаще всего вариационный ряд укладывается в границе , можно
выбрать интервалы вариационного ряда равными или 2/3 или /2 и
соответственно
получить 6 или 9 или 12 интервалов.
Аналогичным образом можно построить 9 или 12 интервалов, если принять
h=2/3 или
h= /2 .
При этом практически все значения (98%) совокупности будут включены в
интервальный
вариационный ряд.
Вычисления.
Для расчета вариации признака используем исходную совокупность, а также
таблицы
№3 и №4.
Простое
среднее отклонение можно
служить
проверкой правильности
Как видим,
интервальные значения
естественно, так как интервальные оценки являются более усредненными.
Простое среднее отклонение - одна из необходимых характеристик при
проведении статистического анализа, и мы будем использовать его в
дальнейшем.
Основные
характеристики вариации - дисперсия
и стандарты.
Эти характеристики также могут быть вычислены как дискретные, взвешенные и
интервальные.