Статистический анализ

Автор: Пользователь скрыл имя, 14 Ноября 2011 в 21:51, реферат

Краткое описание

Статистика (stato - состояние ) - это совокупность данных наблюдений ,
статистическая совокупность - это, как правило, количественная оценка
исследуемого явления, собранная одномоментно из разных источников или в
одном месте в разное время (числовые значения).
Статистической совокупностью - называется генеральной совокупностью, если
включает в себя все возможные значения данного явления. Такую совокупность
практически трудно создать в силу бесконечного ее объема, поэтому чаще
всего статисты работают с некоторой частью генеральной совокупности,
которая называется - выборкой. Работая с выборкой должны получать
результаты, которые соответствуют генеральной совокупности.

Файлы: 1 файл

Основы статистического анализа.docx

— 60.31 Кб (Скачать)

В в е д е  н и е. 

   Статистика (stato - состояние ) - это совокупность  данных наблюдений ,

   статистическая  совокупность - это, как правило,  количественная оценка

   исследуемого  явления, собранная одномоментно  из разных источников или в

   одном месте  в разное время (числовые значения). 

   Статистической  совокупностью - называется генеральной  совокупностью, если

   включает  в себя все возможные значения  данного явления. Такую совокупность

   практически  трудно создать в силу бесконечного  ее объема, поэтому чаще

   всего статисты  работают с некоторой частью  генеральной совокупности,

   которая  называется - выборкой. Работая с  выборкой должны получать

   результаты, которые соответствуют генеральной  совокупности. 

   Задачи  статистики : 

   1.Учет явлений  (как правило в количественном  измерении) ; 

   2.На основе  учета проводится деление (обобщение)  однородных явлений ; 

   3.При любых  статистических исследованиях обязательно  должно быть много

   наблюдений (испытаний, опытов) ; это необходимо  для того, чтобы получить

   достоверные  результаты ; 

   4.Аккуратная  регистрация наблюдений (опытов) ; 

   5.Строгое  соблюдение размеренности величин,  соответствие точности. 

   Целью статистических  исследований является : 

   а)анализ  существующего положения ; 

   б)выявление  тенденций ; 

   в)прогнозирование  на будущий период своих показателей. 

   1.2. Построение  дискретного и интервального  вариационного ряда. 

   Анализ  работы горного предприятия начинается  с анализа одного показателя.

   Как правило,  в качестве первого показателя  выбирается результирующий

   показатель  и для него проводится полный  анализ. Эта одномерная

   совокупность  представляется в виде вариационного  ряда. 

   Основная  цель - установить вид распределения  этой одномерной совокупности. 

   Ранжированный  ряд (табл. 2) представляется как  ряд исходных значений

   (вариант), расположенных в некотором порядке  (убывания или возрастания)

   значений. Обычно значения располагаются  от меньшего к большему. 

   Дискретный  вариационный ряд (табл. 3) принимается  как ранжированный ряд

   распределения,  где каждому значению варианта  ставятся в соответствие его

   частота  и частость. Частота - абсолютное  число значений данного варианта  в

   данном  ряду, частость 

   - относительное  число значений данного варианта (отнесенное к общему числу

   наблюдений). 

   Хi mi Хi mi 

   1470 1 1470 1 

   2006 1 2006 1 

   2030 1 2030 1 

   2073 1 2073 1 

   2305 1 2305 1 

   2444 1 2444 1 

   2535 1 2535 1 

   2625 1 2625 1 

   2710 1 2710 1 

   N 9 

   Табл. 2 Табл. 3 

   где : 

   Хi - текущее  значение вариант; 

   mi - частота  i-го варианта; 

   N - количество  наблюдений. 

   Формирование  интервального вариационного ряда. 

   Общие положения. 

   Будем считать,  что предварительно проведены  исследования статистической

   возможности  использования данной совокупности. 

   Установлено,  что совокупность достаточна  по объему, репрезентативна. и  в

   совокупности  нет ошибок и промахов. 

   Вариационным  рядом - называется ранжированная  совокупность дискретных

   значений  и соответствующая каждому значению  частота . 

   Такой ряд  называется дискретным. Вариационный  ряд может быть дискретным  и

   интервальным. 

   Вариационный  ряд можно считать распределенным  признаком. 

   Если совокупность  очень велика по объему , или  не имеет повторяющихся

   значений, или состоит из непрерывных  значений, то совокупность

   представляется  в виде интервального вариационного  ряда. 

   Интервальный  вариационный ряд состоит не  из конкретных значений

   совокупности, а из некоторых интервалов  этих значений и соответствующих

   каждому  интервалу частот. 

   Другими  словами, в интервальном вариационном  ряде объединяются несколько

   значений  совокупности, как некоторый интервал. Интервалы могут быть

   разными  или одинаковыми для совокупности . 

   Размер (ширина, величина) интервала может быть  рассчитана по эмпирической

   формуле  Стерджесса или назначена из  других соображений. 

   Для простоты  рассуждений в данной работе  вычислим интервал по формуле  и

   назначим  его близким к вычисленному  и одинаковым по всей совокупности. 

   Пусть имеется  совокупность в N значений - х1,,х2,...,хN  представленную в

   порядке  наблюдений. Расположим ее по  рангу, т.е. от меньшего к  большему (

   но можно  и от большего к меньшему). 

   Получим  совокупность в другом порядке,  но того же объема - N значений .

   Обозначим  ее так же как х1,,,х2,...,хN. 

   Для построения  интервального вариационного ряда  определяется ширина

   интервала  ряда распределения (h). 

   Приближенное  значение h вычисляется по эмпирической  формуле Стерджесса: 

   где X max- наибольшее значение варианта  в данном ряду; 

   X min - наименьшее  значение варианта в данном  ряду; 

   N - общее  число наблюдений в данном  ряду или количество вариант  (объем

   выборки). 

   За окончательное  значение h принимается значение, близкое  к расчетному, но

   округленное  так, чтобы интервалы оказались  удобными для расчетов. 

   Ширину  интервалов можно принимать одинаковой  и разной для различных

   интервалов  вариационного ряда. 

   В каждом  интервале различают верхнюю  и нижнюю границу. 

   Нижнюю  границу (меньшее значение) первого  интервала следует выбрать так,

   чтобы меньшее  значение ряда было включено  в первый интервал и среднее

   интервальное  значение первого интервала было  удобным для дальнейших

   расчетов. В конкретный интервал включаются  все значения варианта,

   удовлетворяющие  неравенству 

   где Xj - значение  варианта ряда; 1,2, ..., N; 

   (X min)i - нижняя  граница (меньше значение) i- го  интервала; 

   (X max)i - верхняя  граница (большее значение) i- го  интервала. 

   Значение (X min)i и (X max)i связано с соотношением  с (X max)i = (X min)i

   + h 

   Начальный  (первый) и конечный (последний) интервалы  можно сделать

   открытыми. 

   Интервальный  вариационный ряд представлен  в табл. 4. 

   №№ X min X max Xi m1 ni Mi 

   1 1300 1700 1500 1 0,111 1 

   2 1700 2100 1900 3 0,333 4 

   3 2100 2500 2300 2 0,222 6 

   4 2500 2900 2700 3 0,333 9 

   Табл. 4 

   Первый  и последний интервалы могут  быть открытыми, т.е. для них  определены

   только  либо Xmin, либо Xmax. Это бывает удобно  в случае, когда есть

   большой  отрыв значений совокупности  либо в начале либо в конце  см. табл.

   4А. 

   Для каждого  интервала (Xmin--Xmax)i рассчитываются  частоты - mi, частость

   - ni, накопленная  частота - Мi, среднее интервальное  значение - Xi.

   Частота  - mi - абсолютное количество значений  совокупности, включенных в

   интервал i. 

   Частость - ni - относительная частота или  частота , отнесенная к общему

   количеству  наблюдений , т.е. ni = mi / N. 

   Накопленная  частота - Мi - абсолютное количество  значений совокупности,

   включенных  в данный и все предыдущие  интервалы. Поэтому для первого

   интервала  M1 = m1,, для последовательного интервала  М1 = m1 = N 

   Среднеинтервальное  значение - Хi - представляет середину  интервала,

   является  вместе с частотой mi как бы  представителем данного интервала,

   рассчитывается  по формуле Стерджесса. 

   Отсюда  видно, что интервалы (Xmin —  Xmax) надо назначить так, чтобы

   получить  простое для расчетов значение Xi , которое используется в

   дальнейшем  статистическом анализе. 

   Все рассчитанные  значения заполняют таблицу вида  “Интервальный

   вариационный  ряд” (табл. 4). 

   Если открытым  интервалом является первый, то  для расчета

   среднеинтервального  X1 - формируют для первого интервала  (Xmin)1= (Xmax)1

   - h 

   аналогично, если открытым является последний  интервал, то формируют Xmax

   для последнего  интервала равным (Xmax)n=(Xmin)+h, вне зависимости  от того,

   какие истинные  значения в интервале. 

   1.3. Графическое  изображение вариационного ряда. 

   Общие положения. 

   Одномерная  совокупность, представляется в  виде вариационного ряда, может

   быть изображена  в виде полигона, гистограммы,  кумуляты, кривой Лоренца,

   огивы. 

   Полигонная  ломаная, или полигон, или многоугольник  распределения -

   строится  в прямоугольной системе координат. 

   Полигон  может быть построен для дискретного  вариационного ряда и для

   интервального.  Полигон для дискретного вариационного  ряда: 

   По оси  абсцисс откладывают значение  вариант, а по оси ординат  - значения

   частот . 

   Полученные  на пересечении этих значений  точки соединяют отрезками прямой.

   Такой график, как очевидно, можно построить  только для случая часто

   повторяющихся  вариант в совокупности. 

   На практике  чаще всего случается, что наблюдений  слишком много, а потому

Информация о работе Статистический анализ