Статистический анализ

Автор: Пользователь скрыл имя, 14 Ноября 2011 в 21:51, реферат

Краткое описание

Статистика (stato - состояние ) - это совокупность данных наблюдений ,
статистическая совокупность - это, как правило, количественная оценка
исследуемого явления, собранная одномоментно из разных источников или в
одном месте в разное время (числовые значения).
Статистической совокупностью - называется генеральной совокупностью, если
включает в себя все возможные значения данного явления. Такую совокупность
практически трудно создать в силу бесконечного ее объема, поэтому чаще
всего статисты работают с некоторой частью генеральной совокупности,
которая называется - выборкой. Работая с выборкой должны получать
результаты, которые соответствуют генеральной совокупности.

Файлы: 1 файл

Основы статистического анализа.docx

— 60.31 Кб (Скачать)

   i=1,2, ..., k - текущие  значения; 

   k - количество  различных значений совокупности. 

   Для больших  по объему совокупностей весь  статистический анализ разумно

   вести, представив  совокупность в виде интервального  вариационного ряда. 

   Тогда средняя  интервального вариационного ряда  вычисляется по формуле, где 

   - средняя  арифметическая интервального ряда; 

   xi - среднеинтервальное  значение (середина интервала i ); 

   mi - частота  интервала (количество значений  совокупности в i-ом

   интервале); 

   i=1,2, ..., k - текущие  значения интервала; 

   k - количество  интервалов. 

   Среди непараметрических  средних значений рассмотрим  медиану и моду.

   Медиана,  также как и среднеарифметическая, может быть дискретной и

   интервальной. 

   Медиана  - среднее значение ранжированной  совокупности. 

   Поэтому,  если рассмотреть ранжированную  совокупность, то могут быть два

   пути определения  медианы. 

   Для случая  интервального вариационного ряда  надо с начала определить

   медианный  интервал, то есть определить  интервал в который входят  медиана. 

   Определяется  медианный интервал по накопленной  частоте М. Первый интервал

   для которого  выполняется соотношение и является  медианным, где: 

   Меинт - медиана интервального ряда, 

   h - величина  интервала интервального ряда, 

   (xmin) k - нижняя  граница медианного интервала, 

   Мk-1 - накопленная  частота интервала, предшествующего  медианному, 

   mk - частота  медианного интервала, 

   k - номер  медианного интервала. 

   Из определений  Медискр и Меинт ясно, что их  значения близки но не

   совпадают. 

   Кроме того, очевидно, что значения Xa и Ме  достаточно близки по своим

   значениям,  т.к. определяют среднюю и срединную  часть совокупности. Если

   совокупность  достаточно однородна, то эти  значения достаточно близки друг

   к другу. 

   Другой  не параметрической средней характеристикой  является мода - Мо. 

   Мо - наиболее  часто встречающееся значение  совокупности. 

   Или, иначе  , мода - значение совокупности с  наибольшей частотой, Мо=xi при

   mi=max{m}. Различают  совокупности одно, двухмодальные,  трехмодальные и

   т.д. 

   Одномодальная  совокупность имеет наблюдение  наибольшей частотой, и

   характеризуется  одним значением моды. 

   В двухмодальной  совокупности есть два наблюдения  с равными наибольшими

   частотами,  т.е. совокупность характеризуется  двумя значениями моды. В этом

   случае  для дальнейшего исследования  выбирают моду, близкую к

   среднеарифметическому  значению. 

   Различно  рассчитывают значение моды для  дискретного и интервального  ряда.

   И более  того- для дискретного ряда не  всегда можно определить значение

   моды, т.к.  может существовать несколько  наблюдений с равными и

   максимальными  частотами. Поэтому часто необходимо  моду определять, приведя

   совокупность  к интервальному виду. Но тогда,  сначала, как и в случае

   расчета  медианы, необходимо определить  модальный интервал. Модальный

   интервал  имеет наибольшую частоту. А  внутри этого интервала мода

   определяется  как 

   где: 

   Моинт - мода интервального ряда, 

   h - величина  интервала интервального ряда, 

   (xmin) k - нижняя  граница модального интервала, 

   mk - частота  модального интервала, 

   mk-1 - частота  интервала, предшествующего модальному, 

   mk+1 - частота  интервала, следующего за модальным, 

   k - номер  модального интервала. 

   Для однородной  совокупности характерна близость  значений Xa, Ме и Мо. 

   Вычисления. 

   Xi 1470 2006 2030 2073 2305 2444 2535 2625 2710 N 

   mi 1 1 1 1 1 1 1 1 1 9 

   Табл. 3 

   №№ X min X max Xi m1 ni Mi 

   1 2 3 4 5 6 

   1 1300 1700 1500 1 0,111 1 

   2 1700 2100 1900 3 0,333 4 

   3 2100 2500 2300 2 0,222 6 

   4 2500 2900 2700 3 0,333 9 

   Табл. 4 

   Определим  значение Ме. 

   Для определения  моды - Мо - также используем теже  данные. 

   k=2 

   h=400 

   =2100 

   mk=m2=3 

   mk-1=m2-1=m1=1 

   mk+1=m2+1=m3=2 

   Оценки Xa Ме  Мо 

   Дискретные 2244 2305 ------ 

   Взвешенные 2244 2305 ------ 

   Интервальные 2211 2567 2367 

   Табл. 5 

   1.5. Вычисление  характеристик меры и степени  вариации . 

   1.0 Показатели  колеблемости (вариации). 

   Общие положения. 

   Средние  величины характеризуют вариационный  ряд одним числом. Но тогда  эти

   характеристики  не отражают изменчивости признака , не учитывают вариацию

   признака  в данной совокупности. 

   В статистике  принято несколько способов измерения  вариации. 

   Самая простая  оценка - вариационный размах. 

   R - вариационный  размах - определяется как разность  между экстремальными

   значениями  ранжированной совокупности, где  Xmax - наибольшее значение ,

   Xmin - наименьшее  значение совокупности. 

   Размах  во многом зависит от случайных  обстоятельств, различен для разных

   выборок  одного признака , а потому может  быть применен как

   приблизительная,  неустойчивая оценка вариации. 

   Более значимой  является простое среднее отклонение. 

   Простое  среднее отклонение является  средним арифметическим отклонением  (по

   абсолютной  величине) отдельных значений (вариант)  от общего

   среднеарифметического, 

   где 

   xi - отдельное  значение совокупности, 

   дискр, взв  - среднеарифметическое значение  совокупности, 

   N- количество  наблюдений в совокупности. 

   Простое  отклонение может быть вычислено  как дискретное (как показано  выше)

   и как  взвешенное: 

   Наиболее  полной оценкой вариации признака  является средний квадрат

   отклонения  дисперсия 2 - дисперсия - рассчитывается  как средний квадрат

   отклонений  отдельных значений от среднего  арифметического. 

   Как и  простое среднее отклонение , дисперсия  может быть рассчитана как

   дискретная  или как взвешенная : 

   для дискретных  значений; 

   для взвешенных  значений. 

   Эта оценка  наиболее часто используется  на практике как мера колеблемости

   признака. Среднеквадратическое отклонение (или  стандарт) представляет

   собой квадратный  корень из дисперсии. Также  как и предыдущие оценки,

   стандарт  может рассчитываться как дискретный  и взвешенный. 

   Как правило  в статистическом анализе выполняются  характеристики по

   интервальному  вариационному ряду. Это вполне  относится к вычислению

   дисперсии  и стандарта, где 

   - среднеинтервальное  значение интервала i ; 

   mi - частота  интервала i ; 

   2инт - дисперсия  интервального вариационного ряда ; 

   инт - стандартного  интервального вариационного ряда ; 

   Иногда  статистический анализ использует  и другие формулы расчета , но они

   за пределами  нашего рассмотрения. 

   Как покажут  дальнейшие исследования, стандартное  отклонение необходимо

   учитывать  при любом статистическом исследовании  и анализе. Все эти оценки

   являются  абсолютными величинами, их выражают  в тех же единицах измерения  ,

   что и  значение признака и они характеризуют  колеблемость признака. Но

   очень часто  используют относительные показатели  и коэффициенты вариации. 

   Эти коэффициенты  имеют смысл только при положительных  значениях признаках.

   Коэффициент  вариации, величина которой превышает  30%, свидетельствует о

   большой  колеблемости значений признака  в данной совокупности. 

   Стандартное  отклонение часто используется  при построении интервального

   вариационного  ряда. 

   Учитывая, что чаще всего вариационный  ряд укладывается в границе  , можно

   выбрать  интервалы вариационного ряда  равными или 2/3 или /2 и

   соответственно  получить 6 или 9 или 12 интервалов. 

   Аналогичным  образом можно построить 9 или  12 интервалов, если принять

   h=2/3 или  h= /2 . 

   При этом  практически все значения (98%) совокупности  будут включены в

   интервальный  вариационный ряд. 

   Вычисления. 

   Для расчета  вариации признака используем  исходную совокупность, а также

   таблицы  №3 и №4. 

   Простое  среднее отклонение можно рассчитать  и как взвешенное, что и будет

   служить  проверкой правильности расчета. 

   Как видим,  интервальные значения отличаются  от дискретных. И это

   естественно,  так как интервальные оценки  являются более усредненными.

   Простое  среднее отклонение - одна из необходимых  характеристик при

   проведении  статистического анализа, и мы  будем использовать его в

   дальнейшем. 

   Основные  характеристики вариации - дисперсия  и стандарты. 

   Эти характеристики  также могут быть вычислены  как дискретные, взвешенные и

   интервальные. 

Информация о работе Статистический анализ