Сводка и группировка статистических данных. Виды группировок

Автор: Пользователь скрыл имя, 05 Апреля 2015 в 20:24, курсовая работа

Краткое описание

Цель данного исследования состоит в:
изучение понятия и сущности сводки и группировки;
рассмотрения основных задач сводки и группировки;
изучение их видов;
раскрытие принципов образования групп и интервалов группировки.

Оглавление

Введение ……………………………………………………................................ 3
Глава 1. Теоретическая часть………………………………………………….4
1.1. Понятие и сущность статистической сводки ……………………………...4
1.2. Понятие, сущность и задачи статистических группировок, и их значение в экономическом исследовании…………………………....................................7
1.3. Виды статистических группировок ………………………………………..9
1.4. Основные правила образования групп и интервалов …………………….16
1.5. Статистические ряды распределения……………………………………...20
Глава 2. Практическая часть…………..............................................................25
2.1. Решение задачи на тему: «Группировка данных статистических наблюдений»……………………………………………………………………..25
Заключение ………………………………………………………………………32
Список используемой литературы ………………………

Файлы: 1 файл

курсовая работа по статистике.docx

— 889.39 Кб (Скачать)

 

 

 

 

Таблица 1.2.

   На практике структурная группировка с комплексным решением задач встречается довольно часто. Однако нередко применяется другой вид группировки. Так, для изучения явления, а также связи между отдельными признаками явления используются аналитические группировки.

   С их помощью определяют наличие связи между признаками и их характеризующими. Аналитические группировки характеризуют взаимосвязь между двумя и более признаками, из которых один рассматривается как результат, другой (другие) – как фактор (факторы). Т.е. выделяются факторные и результативные признаки. Факторными называются признаки, под воздействием которых изменяются другие, результативные признаки.

   Особенностью аналитической группировки является то, что в основании группировки кладется факторный признак, затем подсчитывается количество единиц совокупности и общее суммарное значение результативного признака по каждой выделенной группе и даже производится расчет среднего значения результативного признака по выделенным группам. Взаимосвязь проявляется в том, что с возрастанием (убыванием) роли факторного признака систематически возрастает (убывает) среднее значение результативного признака (таблица1.3.).

Таблица 1.3.

  Данные таблицы 1.3. показывают, что с ростом процентной ставки, под которую выдается кредит, средняя сумма кредита, выдаваемая одним банком, уменьшается. Это говорит о том, что между исследуемыми признаками существует обратная связь.

   Деление на три вида носит условный характер, так как группировка может быть универсальной, т.е. одновременно выделяя типы, показывать структуру совокупности и отражать закономерности изменения значений признака в зависимости от  другого.

   Этапы аналитической  группировки:

  1. Факторный признак кладется в основание группировки (группированный признак);
  2. По каждой выделенной группе подсчитывают:
    • Число единиц изучаемой совокупности;
    • Общий объем результативного признака;
    • Среднее значение результативного признака

3) Сравнивают как по  мере изменения (увеличения) факторного  признака изменяются результативные;

4) Делают выводы.

   Рассмотренные типы  группировок являются классическими  видами. На практике одна и  та же группировка решает сразу  несколько задач, таким образом, составляет в себе разные типы.

   По числу группировочных признаков различают:

  • Простые группировки (один признак) (таблица 1.1);
  • Сложные группировки (два и более признаков);
    • Комбинационные (два – четыре признака) (таблица 1.4.);
    • Многомерные (любое число признаков свыше четырех).

   Принцип построения комбинационной группировки заключается в том, что сначала группы формируется по одному признаку, затем они делятся на подгруппы по другому признаку, а эти, в свою очередь, делятся по третьему и т.д. При этом группировочных признаки принято располагать, начиная с атрибутивного, в определенной последовательности, исходя из логики взаимосвязи показателей. Обычно на практике строят комбинационные группировки не более чем по трем признакам, т.к. если будет недостаточное количество наблюдений, то численность единиц может оказаться недостаточной, что приведет к малообоснованным выводам.

   Сохранить сложность  описания групп и преодолеть  недостатки комбинационной группировки  позволяют методы многомерных  группировок, или многомерных классификаций. Цель этих методов – классификация  данных, т.е. группировка на основе  множества признаков благодаря  использованию компьютеров, позволяющих  разрабатывать любые объемы информации  с различной степенью детализации.

 

 

Таблица 1.4.

 

 

 

 

1.4. Основные правила  образования групп и интервалов

   Вопрос о количестве и образовании групп решается в зависимости от признака, положенного в основание группировки и задач, решаемых группировками. Если в основание группировки кладётся атрибутивный признак, то вопрос о выборе числа групп не стоит: сколько значений признака, столько и групп.

   При группировке по количественным признакам во внимание, прежде всего, принимается то, какие задачи решаются с помощью группировок.

   Если в основании группировки положен количественный признак, то число групп (n) в зависимости от численности единиц совокупности (N) определяется по формуле американского ученого Стерджесса (Sturges):  

n=1+3,3222 lnN;

 
   На основании этой формулы можно составить следующую номограмму:  

   Недостаток формулы состоит в том, что ее применение дает хорошие результаты, если совокупность состоит из большего числа единиц и распределение единиц по признаку, положенному в основание группировки, близко к нормальному.

   Другой способ определения числа групп основан на применении показателя среднего квадратического отклонения (σ).  При этом весь диапазон изменения показателя предполагается равным. Если величина интервала равна 0,5σ, то совокупность разбивается на 12 групп, а когда величина интервала равна 2/3σ и σ, то совокупность делится на 9 и 6 групп соответственно. Однако при определении числа групп данными методами существует большая вероятность получения «пустых» (группы в которые не попала ни одна единица совокупности) или малочисленных групп. Поэтому данными формулами нельзя пользоваться механически, т.к. их показания требуют корректировки.

    После определения числа групп решается задача определения интервалов группировки.

   Интервал группировки – это интервал значений варьирующего признака, лежащих в пределах определенной группы.

   Ширина интервала – разница между максимальным и минимальным значением признака в каждой группе или разницы между верхней и нижней границей.  
   Интервалы могут быть равными и неравными в зависимости от характера распределения единиц совокупности по данному признаку. Неравные интервалы, в свою очередь, делятся на:

    • прогрессивно возрастающие;
    • прогрессивно убывающие;
    • произвольные;
    • специализированные.

   Если распределение носит более или менее равномерный характер, то устанавливают равные интервалы. Так поступают, например, при группировке рабочих по уровню заработной платы или посевов сельскохозяйственных культур по величине урожайности. Величина интервала определяется путем деления размаха вариации на число групп:  

 

   Полученная по данной  формуле величина называется  шагом интервала.

   Если шаг интервала будет  иметь один знак до запятой (например, 0,75; 5,43 и т.д.), то в этом  случае полученные значения необходимо  округлить до десятых долей. А  если шаг интервала имеет 2 знака  перед запятой и много знаков  после, то его необходимо округлять  до целого числа (например, 12,756 следует  округлить до 13). А в случае, если рассчитанный шаг интервала представляет собой трехзначное число и более, то эту величину необходимо округлить до ближайшего целого числа кратного 100 или 50. Например, 249 следует округлить до 250.

   Если размах вариации признака в совокупности велик и значения признака варьируют неравномерно, то надо использовать группировку с неравными интервалами. Неравные интервалы могут быть получены в процессе объединения пустых, не содержащих ни одной единицы совокупности, равных интервалов. Это происходит в том случае, если после построения равных интервалов по изучаемому признаку образуются группы, содержащие мало или не содержащие вообще ни одной единицы, т.е. группы, не отражающие определенных типов изучаемого явления по признаку. В этом случае возникает необходимость в увеличении интервалов группировки.  
Также неравные интервалы могут быть прогрессивно возрастающие или прогрессивно убывающие в арифметической или геометрической прогрессии. Величина интервалов, изменяющихся в арифметической и геометрической прогрессии определяются следующим образом:

 
а в геометрической прогрессии:

 

 
где а – константа: для прогрессивно-возрастающих интервалов имеет знак «+», а при прогрессивно-убывающих – знак «-».  
q – константа: для прогрессивно – возрастающих – больше «1»; для прогрессивно-убывающих – меньше «1».  
   Применение неравных интервалов обусловлено тем, что в первых группах небольшая разница в показателях имеет большое значение, а в последних группах эта разница не существенна.

   Еще одна классификация интервалов группировок могут быть закрытые и открытые интервалы.  
   Закрытыми называются интервалы, у которых имеются обе границы: верхняя и нижняя границы.  
   Открытые – это интервалы, у которых указана только одна граница: как правило, верхняя – у первого интервала и нижняя – у последнего.

   Применение открытых интервалов целесообразно в тех случаях, когда в совокупности встречается незначительное число единиц наблюдения с очень малыми или очень большими значениями вариантов, которые резко, в несколько раз, отличаются от всех остальных значений изучаемого признака.

   Специализированные интервалы – применяются для выделения из совокупности одних и тех же типов по одному и тому же признаку для явлений, находящихся в различных условиях. Например, среднесписочная численность 75 – 100 человек. В строительной промышленности это группа малых предприятий, в непроизводственной сфере – крупных.

   Произвольные интервалы (ни прогрессивно возрастающие, ни прогрессивно убывающие).

Группировка с произвольными интервалами может быть построена с помощью коэффициента вариации, определяемого по формуле:

   После определения  группировочного признака и границ  групп, строится ряд распределения.

 

1.5. Статистические  ряды распределения

   Результаты сводки и группировки материалов статистического наблюдения оформляются в виде статистических рядов распределения и таблиц.

   Статистические ряды распределения – это ряд цифровых показателей, представляющих распределение единиц совокупности по одному существенному признаку, разновидности которого расположены в определенной последовательности.

   Ряды распределения, образованные по качественному признаку, называют атрибутивными. При группировке по количественному признаку получаются вариационные ряды.

   Вариационные ряды по способу построения бывают:

  • дискретными (прерывными), т.е. в этом ряду группы составлены по признаку, изменяющемуся дискретно и принимающему только целые значения (таблица 1.5);
  • интервальными (непрерывными), т.е. в этом ряду в группировочный признак, составляющий основание группировки, может принимать в определенном интервале любые значения. В случае, если интервальный вариационный ряд распределения построен с равными интервалами, частоты позволяют судить о степени заполнения интервала единицами совокупности. При построении неравных интервалов нельзя получить информацию о степени заполнения каждого интервала. (таблица 1.6.)

 

 

 

 

 

Таблица 1.5.

 

Таблица 1.6.

   Для различных целей бывает уместным осуществлять еще одно преобразование ряда распределения, заключается он в построении ряда накопленных частот (кумулятивного ряда). Этот ряд показывает число случаев ниже или выше определенного уровня. Отсюда и возникают два варианта в построении ряда накопленных частот: один показывает число случаев, менее определенного значения варьирующего признака, а другой – число случаев, превышающее определенное значение варьирующего признака. Накопленные частоты приведены в таблице 1.5.

   Для изображения  вариационных рядов применяются  линейные и плоскостные диаграммы, построенные в прямоугольной  системе координат, рассмотрим : полигон частот, гистограмму, кумуляту и огиву.

   Полигон используется для изображения дискретных вариационных рядов. По оси абсцисс откладываются ранжированные значения варьирующего признака, а по оси ординат – частоты. Рассмотрим пример на основании таблицы 1.5. (рисунок 4).

Рис. 4. Распределение семей по числу детей в одном из района города.

   По оси абсцисс  откладывается количество детей, а по оси ординат откладываем  количество семей, получаем совокупность  точек. После соединим эти точки  между собой последовательно  отрезками прямой. Если провести  перпендикуляр из последней и  первой точек, то получится замкнутая  фигура в виде многоугольника.

   Гистограмма применяется для изображения интервального вариационного ряда, который представляют столбики с основаниями, равными ширине интервалов, и высотой, соответствующей частоты. Гистограмма может быть преобразована в полигон распределения, если найти середины сторон прямоугольников и затем эти точки соединить прямыми линиями (на рис.5. изображается пунктиром). В качестве примера рассмотрим таблицу 1.6. (рисунок 5.)

Рис.5. Гистограмма распределения семей по размеру живой площади, приходящейся на одного человека

   При построении гистограммы распределения вариационного ряда с неравными интервалами по оси ординат наносят не частоты, а плотность распределения признака. Это делают для того, чтобы устранить влияние величины интервала и получить возможность сравнивать частоты.

   Так же для графического изображения вариационного ряда может использоваться кумулятивная кривая. С ее помощью изображают ряд накопленных частот. Накопленные частоты показывают, сколько единиц совокупности имеют значение признака не более чем рассматриваемое значение. На оси абсцисс откладывают варианты, а по оси ординат – накопленные частоты. Затем соединяем данную совокупность точек (рис.6.) и получаем так называемую кумуляту.

Информация о работе Сводка и группировка статистических данных. Виды группировок