Основные приемы и методы обработки и анализа статистических данных

Автор: Пользователь скрыл имя, 07 Марта 2015 в 11:40, курсовая работа

Краткое описание

В настоящее время насчитывается около тысячи определений статистики. Первое из них относится к 1749 году. Затем на протяжении 250 лет определение уточнялось и дополнялось. Определить статистику как науку пытались философы, математики, экономисты, социологи, государственные деятели и, конечно, сами статистики. Сначала статистику определяли как «Staaten Kunde» - государствоведение (описание достопримечательностей государств).

Оглавление

Введение………………………………………………………………….……..3
Тема 1. «Средние величины»…………………………………………….……6
Задание 1…………………………………………………………….…..….8
Тема 2. «Ряды распределения и их основные характеристики»……..……..10
Задание 2……………………………………………………………....…..15
Тема 3. «Ряды динамики»……………………………………………….……18
Задание 3……………………………………………………...…………..22
Тема 4. «Методы выравнивания рядов динамики»……………..………….30
Задание 4………………………………………………………..…….…..31
Тема 5. «Индексы»………………………………………………….….…….35
Задание 5…………………………………………………………………41
Тема 6. «Выборочные наблюдения»………………………………………. Задание 6………………………………………………………………
Тема 7. «Статистика населения»………………………………………
Задание 7………………………………………………………….
Тема 8. «Система национальных счетов»……………………………..
Задание 8………………………………………………………..
Заключение……………………………………………………………

Файлы: 1 файл

Федеральное агентство железнодорожного транспорт1.docx

— 164.81 Кб (Скачать)

 

                                (2.4)

 

 

 – медиана

- нижняя граница  интервала, в которой находится  медиана

- величина (размах) интервала

- накопленная  частота в интервале, предшествуя  медианному

- частота в  медианном интервале

-  сумма частот ряда

 

          Моду и медиану можно определить на основе графического изображения ряда. Мода определяется по гистограмме распределения. Для этого правую вершину модального прямоугольника соединяют с правым верхним углом предыдущего прямоугольника, а левую вершину модального прямоугольника – с левым углом последующего прямоугольника. Абсцисса точки пересечения этих прямых и будет модой распределения.

          Медиана определяется по кумуляте. Для ее определения высоту наибольшей ординаты, которая соответствует общей численности, делят пополам. Через полученную точку проводят прямую, параллельную оси абсцисс, до пересечения ее с кумулятой. Абсцисса точки пересечения является медианной величиной.

          Для характеристики размеров колеблемости признаков в статистике применяются следующие показатели: размах вариации, среднее линейное отклонение, дисперсия, среднее квадратическое отклонение, коэффициент вариации.

    1. Размах вариации (R) показывает насколько велико различие между единицами совокупности, имеющими самое маленькое и самое большое значение признака.

                                                   (2.5)

 

где, и соответственно наибольшее и наименьшее значение варьирующего признака.

 

 

    1. Среднее линейное отклонение (d) – представляет собой среднюю величину из отклонений вариантов признака от их средней. Его можно рассчитать по формуле средней арифметической, как взвешенной, так и невзвешенной.

 

 невзвешенное  среднее линейное отклонение           (2.6)

 

 взвешенное  среднее линейное отклонение            (2.7)

 

 

    1. Дисперсия ( ) представляет собой среднее квадратическое отклонение индивидуального значения признака от их средней величины. Дисперсия вычитается по формулам простой невзвешенной и взвешенной:

 

                            невзвешенная                      (2.8)

 

                           взвешенная                     (2.9)

 

 

    1. Среднее квадратическое отклонение () представляет собой корень второй степени из среднего квадратического отклонения отдельного значения признака от их средней:

 

                         невзвешенное                        (2.10)

 

                         взвешенное                       (2.11)

 

 

    1. Коэффициент вариации:

 

     (2.12)

 

                        (2.13)

 

 

 

 

 

 

 

 

 

 

 

 

 

Задание 2

 

          Основываясь на ниже приведенных данных, определить аналитическим и графическим методами показатели центра распределения (моду и медиану), а так же показатели вариации: размах вариации, среднее линейное отклонение, среднее квадратическое отклонение, дисперсию и коэффициент вариации.

Имеются следующие данные о тарифных разрядах рабочих механического цеха:

3

2

4

5

5

6

5

5

4

5

6

5

2

4

3

4

6

3

4

3

4

2

6

6

5

3

2

3

5

3

4

2

6

6

5

3

2

3

5

3


Постройте дискретный ряд распределения. Вычислите показатели центра распределения  и показатели вариации.

Решение:

Определим число групп дискретного ряда (n), оно соответствует числу вариантов признака, то есть n=5.

Общее число единиц совокупности (N) по данным из задания равно числу 40.

Сгруппируем  данные о тарифных разрядах рабочих механического цеха:

 

 

Таблица 2.1

Группировка данных  рабочих по тарифным разрядам.

Тарифные разряды (x)

Количество рабочих, чел. (f)

Накопленные частоты (S)

2

6

6

3

10

16

4

7

23

5

10

33

6

7

40


 

S = 6


= 6+10=16                               Посчитали накопленную частоту

= 16+7=23

= 23+10=33

= 33+7=40

 

Далее вычислим показатели вариации:

  1. Размах вариации (по формуле 2.5):

R= 6 - 2 =4 (разряд)

То есть разряд равен 4

  1. Среднее линейное отклонение (по формуле 2.7):

Вычислим среднюю арифметическую взвешенную, т.к. исходные значения признака представлены в виде вариационного ряда.

x =


d =


 

Таким образом, среднее линейное отклонение количества рабочих механического цеха составило: 1,16

  1. Дисперсия (по формуле 2.9):

 

 

  1. Среднее квадратическое отклонение (по формуле 2.11):

 

 

  1. Коэффициент вариации (по формуле 2.13):

 

Совокупность однородна, так как коэффициент вариации

не превышает 33%.

 

Вычислим показатели центра распределения (моду и медиану).

  • Вычислим моду, (в дискретном ряду это варианта с наибольшей частотой):

 

Так как в этом дискретном ряду варианта с наибольшей частотой встречается 2 раза. (f=10)

  • Вычислим медиану (срединная варианта):

Анализируя данные из таблицы 2.1. можно сделать вывод, что x=4, f=7, следовательно, упорядоченный ряд состоит из 5 членов, поэтому Ме=4.

 

Графическое изображение моды и медианы представлено в приложении.

 

Вывод: построен дискретный ряд распределения, рассчитан размах вариации, среднее линейное отклонение, дисперсия, среднее квадратическое отклонение, коэффициент вариации для того что бы узнать однородна или неоднородна совокупность дискретного ряда. Так же вычислена мода и построен график, затем медиана и построен график.

 

 

Тема 3. «Ряды динамики»

Для характеристики и анализа социально – экономических явлений за некоторый период применяют показатели и методы, характеризующие эти процессы во времени (динамики).

Ряд динамики – это ряд последовательно расположенных статистических показателей в хронологическом порядке, изменение которых показывает определенную тенденцию развития изучаемого явления.

В каждом ряду динамики имеются 2 основных элемента:

  1. Показатель времени (t)
  2. Уровень ряда (y)

Классификация рядов динамики:

  • В зависимости от способа выражения уровней ряды динамики подразделяются на ряды: абсолютных, относительных и средних величин.
  • В зависимости от того, выражают ли уровни ряда величину явления на определенные моменты времени (даты) или его величину за определенные интервалы времени, различают соответственно моментные и интервальные ряда динамики. Уровни интервального ряда динамики абсолютных величин характеризуют суммарный итог какого-либо явления за определенный отрезок времени. Они зависят от продолжительности этого периода и поэтому их можно суммировать. Отдельные уровни моментного ряда динамики абсолютных величин суммировать нельзя.
  • В зависимости от расстояния между уровнями ряды динамики подразделяются на ряды динамики с равностоящими уровнями и неравностоящими уровнями во времени.

 

Средний уровень интервального ряда определяют по формуле:

 

                                                                                        (3.1)

 

где – уровень ряда динамики

       n - число членов ряда динамики.

 

Средний уровень моментного ряда определяют по формуле средней хронологической:

                         (3.2)

 

Абсолютный прирост DY показывает на сколько единиц увеличился (или уменьшился) анализируемый уровень ряда относительно базисного уровня (по базисной схеме) или уровня предшествующего года   (по цепной схеме). Соответственно его определяют по формулам:

                        - (по базисной схеме)                (3.3)

                        (по цепной схеме)              (3.4)

 

Темп роста показывает, во сколько раз анализируемый уровень ряда увеличился (или уменьшился) по сравнению с уровнем, принятым за базу сравнения (по базисной схеме) или предшествующим уровнем (по цепной схеме). Темп роста выражают в процентах или отвлеченных числах (коэффициент роста). Его определяют по формулам:

               *100% (по базисной схеме)                     (3.5)

               (по цепной схеме)                      (3.6)

 

Темп прироста показывает, на сколько процентов увеличился (или уменьшился) анализируем уровень ряда по сравнению с базисным (по базисной схеме) ли предшествующим уровнем (по цепной схеме). Его определяют как отношение абсолютного прироста к уровню, принятому за базу сравнения, по формулам:

              (по базисной схеме)             (3.7)

              ( по цепной схеме)               (3.8)

 

Темпы роста и прироста связаны между собой, что видно из формул их расчеты:

       (3.9)

 

Это дает основание определить темп прироста через темп роста:

                                                                                 (3.10)

 

Средний темп роста и средний темп прироста характеризуют соответственно темпы роста и прироста за период в целом. Средний темп роста рассчитывается по данным ряда динамики по формуле средней геометрической:

                                                                            (3.11)

где n – количество уровней ряда.

Исходя из соотношения темпов роста и прироста, средний темп прироста определяется по формуле:

                                                                                (3.12)

Абсолютное значение одного процента прироста A - это отношение цепного абсолютного прироста к цепному темпу прироста, выраженному в процентах. Оно определяется по формуле:

                                                                          (3.13)

Как видно из расчета, абсолютное значение одного процента прироста равно 0,01 предшествующего уровня.

С помощью рядов динамики изучают явления, имеющие сезонный характер. Сезонными колебаниями называются устойчивые внутригодовые колебания в ряду динамики, обусловленные специфическими условиями производства, потребления или продажи продукции или услуг.

Уровень сезонности оценивается с помощью индексов сезонности. Индекс сезонности показывает, во сколько раз фактический уровень ряда в тот или иной момент времени больше среднего уровня. Он определяется по формуле:

 

                                                                               (3.14)

 

где – текущий уровень ряда динамики;

- средний  уровень ряда.

Графически индекс сезонности может быть представлен с помощью полигона – основного вида графиков, используемого для графического изображения рядов динамики.

 

 

 

 

 

 

Задание 3

По данным таблицы 3.1 вычислите:

1)Основные аналитические  показатели ряда динамики (по  цепной и базисной схемам):

  • Абсолютный прирост;
  • Темпы роста;
  • Темпы прироста;
  • Абсолютное значение 1% прироста.

Информация о работе Основные приемы и методы обработки и анализа статистических данных