Статистический анализ

Автор: Пользователь скрыл имя, 14 Ноября 2011 в 21:51, реферат

Краткое описание

Статистика (stato - состояние ) - это совокупность данных наблюдений ,
статистическая совокупность - это, как правило, количественная оценка
исследуемого явления, собранная одномоментно из разных источников или в
одном месте в разное время (числовые значения).
Статистической совокупностью - называется генеральной совокупностью, если
включает в себя все возможные значения данного явления. Такую совокупность
практически трудно создать в силу бесконечного ее объема, поэтому чаще
всего статисты работают с некоторой частью генеральной совокупности,
которая называется - выборкой. Работая с выборкой должны получать
результаты, которые соответствуют генеральной совокупности.

Файлы: 1 файл

Основы статистического анализа.docx

— 60.31 Кб (Скачать)

   Как видим,  дисперсии, вычисленные с разным  усреднением , довольно резко

   отличаются  друг от друга. 

   Значения  дисперсии позволяют вычислить  значения стандартного отклонения.

   Стандартное  отклонение необходимо для дальнейшего  статистического анализа. 

   Оценки  вариации совокупности. 

   Оценки R 2 

   Дискретные 1240 310 13553 116 

   Взвешенные --- 310 13553 116 

   Интервальные --- 365 169877 412 

   Табл. 6 

   средние  хар-ки хар - ки вариа - ции 

   Ме Мо 2 V V 

   Дискр 2244 2305 ---- 310 13553 116 13.8 5.1 

   Взв 2244 2305 ---- 310 13553 116 13.8 5.1 

   Инт 2211 2567 2367 365 169877 412 16.5 18.6 

   Табл. 7 

   1.6. Установление  возможной подчиненности вариационного 

   ряда нормальному  закону распределения . 

   Общие положения. 

   Все характеристики, полученные ранее необходимы  для выполнения

   поставленной  задачи. 

   Каждая  характеристика с какой-то своей  стороны определяла имеющуюся

   совокупность. Но общее суждение о совокупности  можно вынести только,

   собрав  воедино все соображения. 

   Любой статистический  анализ проходит некоторые, общие  по форме, стадии. 

   Первая  стадия- высказывание гипотезы. Гипотезу  называют ноль-гипотеза и

   обозначают  Но. Как правило, гипотеза Но ,- эта гипотеза о том, что мы

   ожидаем  на данном этапе статистического  анализа. Этой гипотезе Но

   противостоит  другая гипотеза - Н1 ,- конкурирующая  гипотеза. 

   Гипотеза  Но, и Н1 могут быть простыми  и сложными. 

   Вторая  стадия статистического анализа  - проверка правильности высказанной

   гипотезы  Но. Для этого используются разработанные  и принятые в статистике

   критерии. 

   Если критерий  удовлетворяется , то можно сказать,  что данная совокупность

   не противоречит  высказанной гипотезе. Здесь важно  отметить, что гипотеза

   Но не  принимается безоговорочно, что  есть всегда вероятность принять  (или

   не принять)  гипотезу Но ошибочной. 

   Если критерий  не удовлетворяется, то гипотеза  Но отвергается. 

   Выскажем  гипотезу, состоящую в том, что  наша одномерная совокупность

   подчиняется  нормальному закону распределения. 

   В этом  случае можно считать, что совокупность  собрана в одинаковых

   условиях  и все вариации признаки являются  воздействия случайностей. Ошибки

   измерений  носят случайный характер и  могут быть описаны кривой  нормального

   распределения. 

   В случае  согласия с высказанной гипотезой,  данная совокупность может быть

   принята  для дальнейшего анализа, в  противном случае надо внимательнее

   изучить  условия получения значения совокупности  и провести наблюдения еще

   раз. 

   В качестве  критерия выступает специально  разработанные соотношения.

   Полученные  расчетные значения критериев  для данной совокупности

   сравниваются  со значениями критериев, найденными  по таблицам или

   специальным  соотношением. Сравнение расчетных  и табличных значений

   позволяет  сделать вывод о согласии ( или  несогласии) о высказанной

   гипотезе. 

   В случае  согласия с высказанной гипотезой  статистическое исследование

   продолжается , в случае несогласия - возвращается  к предыдущему этапу,

   т.е. к  высказыванию другой гипотезы. 

   Для данной  совокупности высказывается гипотеза  Но - о том, что полученное

   эмпирическое  распределение достаточно хорошо  описывается теоретической

   кривой  нормального распределения. 

   При этом  все значения получены как  дискретные, так и интервальные. 

   Будем рассматривать  только интервальные значения, т.к.  интервальные

   значения  являются сглаженными, усредненными  и лучше отражают общую

   тенденцию  совокупности. 

   В предыдущих  частях работы получены: 

   средние  хар-ки хар - ки вариа - ции 

   Ме Мо 2 V V 

   Дискр 2244 2305 ---- 310 13553 116 13.8 5.1 

   Взв 2244 2305 ---- 310 13553 116 13.8 5.1 

   Инт 2211 2567 2367 365 169877 412 16.5 18.6 

   Табл. 7 

   Отсюда  видно, что средние характеристики  хотя и отличаются по значениям

   друг от  друга , но различия эти невелики  и могут быть результатом

   округленней  в промежуточных расчетах. 

   Но в  целом можно признать, что эмпирическое  распределение соответствует

   теоретическому  нормальному, имеет подобно нормальному  распределению

   колоколообразный  характер, а средние характеристики  близки к друг другу. 

   Поэтому  будем считать, что полученные  результаты не противоречат

   высказанной  гипотезе . 

   Практически  любое статистическое исследование  базируется на некоторой

   выборке,  состоящих из случайных величин. 

   Под случайной  величиной понимается величина, которая в результате опыта

   может принять  то или иное значение, неизвестно  заранее - какое именно. 

   Различаются  случайные величины прерывного (дискретного  ) и непрерывного

   типа. Возможные  значения непрерывных величин  не могут быть заранее

   перечислены  и непрерывно заполняют некоторый  промежуток. В дальнейшем

   рассматриваются  только прерывные (дискретные) величины. Пусть прерывная

   случайная  величина может принимать значения  х1, х2, . . . ,хN. 

   Каждое  из этих значений возможно, но  не достоверно, поэтому может  принять

   каждое  из них с некоторой вероятностью pi.. 

   Сумма вероятностей  всех возможных значений равна  единице. 

   Суммарная  вероятность каким-то образом  распределена между отдельными

   значениями. Случайная величина будет полностью  описана с вероятностной

   точки зрения, если будет определенно это  распределение. 

   Указание, какой вероятностью обладает  каждое из событий , дает возможность

   установить  закон распределения случайной  величины. 

   Под законом  распределения понимается соотношение,  устанавливающее связь

   между возможными  значениями случайной величины  и соответствующим им

   вероятностями. 

   Простейшей  формой задания этого закона  является таблица соответствий

   возможных  значений и вероятностей. Такая  таблица носит название - ряд

   распределения. 

   Графическое  представление - полигон, гистограмма. 

   Для большого  количества наблюдений и большого  множества возможных

   дискретных  значений признака, а также для  непрерывных случайных величин

   табличное  представление оказывается трудоемким  или невозможным. 

   Поэтому,  применяется вероятность не отдельного  значения события , а

   некоторого  интервала значений, т.е. применяется  функция распределения. Эта

   функция  иногда называется интегральной  функцией распределения или

   интегральным  законом распределения 

   Функция  - производная функции распределения  - характеризует плотность

   распределения.  Кривая, изображающая плотность  распределения случайной

   величины, называется кривой распределения. 

   Особое  место в теории занимают распределения  распределения : нормальное,

   биомиальное  и распределение Пуассона. 

   Нормальное  распределение связано с именем  Гаусса (конец 18 в) . 

   В данной  работе проверяются гипотезы  нормального закона распределения. 

   Подготовка  исходной информации. 

   Вся совокупность, подлежащая анализу представляется  в виде интервального

   вариационного  ряда. 

   Интервалы  одинаковые и вычисляются по  формуле, где X max- наибольшее

   значение  совокупности; 

   X min - наименьшее  значение совокупности; 

   N - количество  наблюдений. 

   i X min X max Xi mi ni 

   1 1300 1700 1500 1 0,111 

   2 1700 2100 1900 3 0,333 

   3 2100 2500 2300 2 0,222 

   4 2500 2900 2700 3 0,333 

   Табл. 8 

   Принятые  обозначения : 

   (xmax -xmin) - верхняя  и нижняя границы i-го интервала, 

   xmin - наибольшее  значение совокупности входит  в первый интервал, 

   xmax - наибольшее  значение совокупности входит  в последний, 

   n-й интервал, n - количество интервалов, i - текущий  номер интервала, 

   i=1,2, . . . ,n, 

   - среднее  значение i- го интервала 

   mi - частота  i - го интервала, абсолютное количество  наблюдений, входящих

   в i -й  интервал. 

   Контроль  правильности расчета : 

   ni - относительная  частота i-го интервала. , 

   Контроль  правильности расчетов : , 0,999 1 

   В дальнейшем  рассматривается вариационный ряд,  состоящий из

   среднеинтервальных  значений xi и соответствующих значений  частоты mi . 

   Нормальный  закон распределения имеет вид  : 

   - среднеквадратическое  отклонение : 

   - среднеарифметическое  значение : - 

   При этом  и - параметры нормального закона  распределения. 

   Расчеты. 

   = 2 10 -4 

   = 7 10 -4 

   = 9,6 10 - 4 10 10 - 4 

   = 4,8 10 - 4 5 10 - 4 

   Xi f 

   1500 2 10 - 4 

   1900 7 10 - 4 

   2300 10 10 - 4 

   2700 5 10 - 4 

   Табл. 9 

   Кривая  нормального закона распределения 

Информация о работе Статистический анализ