Статистический метод группировки

Автор: Пользователь скрыл имя, 14 Февраля 2013 в 18:23, курсовая работа

Краткое описание

Переход к рыночной экономике наполняет новым содержанием работу коммерсантов,
экономистов и менеджеров. Это предъявляет повышенные требования к уровню их
статистической подготовки. Овладение статистической методологией – одно из
непременных условий познания конъюнктуры рынка, изучения тенденций и
прогнозирования спроса и предложения, принятия оптимальных решений на всех
уровнях управления, коммерческой деятельности на рынке товаров и услуг.
Цель курсовой работы – изучить некоторые статистические методы: группировка и
корреляционный анализ.

Оглавление

Введение
3

1. Статистический метод группировки 5
1.1. Понятие группировки 5
1.2. Виды статистических группировок 5
1.3. Принципы построения группировки 7
1.4. Применение метода группировки при изучении состава кадров на
промышленном предприятии
10
2. Корреляционный анализ 14
2.1. Понятие корреляционной связи 14
2.2. Статистические методы выявления наличия корреляционной связи
между двумя признаками 15
2.3. Множественная корреляция 19
2.4. Применение множественной корреляции к изучению состава кадров на
промышленном предприятии
22
2.5. Анализ коэффициентов регрессии 24

Заключение
24

Список литературы 27

Приложение
28

Файлы: 1 файл

Введени1.doc

— 254.50 Кб (Скачать)

 

Согласно  результатам полученной группировки подавляющее большинство

работников  составляют работники со стажем до 5 лет (37%),средний стаж этих

работников 3,3 года, по 20%  составляют работники  со стажем 8-11 лет и 11-14

лет. Работники с высоким стажем работы (от 14 лет и больше) составляют всего

14%, что выявляет тенденцию к снижению работников с высоким стажем,

следовательно, с большим опытом и более высокой  квалификацией. Эту тенденцию

подтверждает  график (см. рис.1.1.):

                  Гистограмма распределения работников  по стажу                 

    


 

Рис. 1.1.

2.Второй  группировочный признак – разряд. Число групп – 6. Результаты

группировки представлены в таблице 1.2.:

                                                                    Таблица 1.2.

Группировка работников по разряду

    

разряд

число работников, чел.

1

2

2

1

3

2

4

8

5

8

6

5

7

6


 

Группировка по разряду свидетельствует  о том, что на данном промышленном

предприятии персонал среднеквалифицированный, т.к. наблюдается наличие

большего количества работников 4 и 5 разрядов чем работников 6 и 7 разрядов

(соответственно 54% и 37%). Данные  выводы отражены на рис.1.2.:

    


 

Рис.1.2.

3.Третий группировочный признак  – профессия. Группировка представлена  в

таблице 1.3.:

                                                                    Таблица 1.3.

Распределение работников по профессии

    

профессия

число рабочих

в % к итогу

бурильщик

7

23

проходчик

6

20

взрывник

5

17

помощник бурильщика

11

37

горнорабочий

1

3


 

Из группировки следует, что  работа на данном  предприятии распределена

рационально, т.е. наибольшее число  помощников бурильщиков (37%), примерно

одинаковое количество бурильщиков, проходчиков и взрывников (примерно по

20%).

2.КОРРЕЛЯЦИОННЫЙ АНАЛИЗ

2.1.Понятие корреляционной связи

Содержание теории корреляции составляет изучение зависимости вариации

признака от окружающих условий.

При изучении конкретных зависимостей выявляют факторные и результативные

признаки. В корреляционных связях между изменениями факторного и

результативного признака нет полного  соответствия, воздействие отдельных

факторов проявляется лишь в  среднем при массовом наблюдении фактических

данных.

Кроме того, сам признак-фактор в  свою очередь может зависеть от изменения

ряда обстоятельств. В сложном  взаимодействии находится результативный признак

– в более общем виде он выступает  как фактор изменения других признаков.

Отсюда  результаты корреляционного анализа  имеют значение в данной связи, а

интерпретация этих результатов в более общем  виде требует построения системы

корреляционных  связей.

При исследовании корреляционных зависимостей между признаками решению

подлежит  широкий круг вопросов, к которым  следует отнести :

1)Предварительный  анализ свойств моделируемой  совокупности единиц;

2)Установление  факта наличия связи, определение  её формы и направления;

3)Измерение  степени тесноты связи между  признаками;

4)Построение  регрессивной модели, т.е. нахождение  аналитического выражения

связи;

5)Оценка  адекватности модели, её экономическая  интерпретация и практическое

использование.

Для того, чтобы результаты корреляционного анализа нашли практическое

применение  и дали желаемый результат, должны выполняться  определённые

требования.

1.Требование  однородности тех единиц, которые  подвергаются изучению.

2.Количественная  оценка однородности исследуемой  совокупности по комплексу

признаков (расчет относительных показателей  вариации, коэффициент вариации,

отношение размаха вариации к среднему квадратическому  отклонению).

3.Достаточное  число наблюдений.

4.Исследуемая совокупность должна  иметь нормальное распределение.

5.Факторы должны иметь количественное  выражение.

2.2.Статистические методы выявления  наличия корреляционной

связи между двумя признаками

Простейшим приёмом обнаружения  связи является сопоставление двух параллельных

рядов – ряда значений признака-фактора  и соответствующих ему значений

результативного признака. Значение факторного признака располагается  в

возрастающем порядке и затем  прослеживается направление изменения  величины

результативного признака. Результативный признак (функция) обозначается через

y, а факторный признак через  x.

Ниже приведён пример обнаружения  корреляционной связи между стажем (факторный

признак) и заработной платой (результативный признак). В таблице 2.1

работники ранжированы по стажу.

                                                                    Таблица 2.1.

                   Сведения о стаже и заработной  плате рабочих                  

                           на промышленном предприятии                          

  

 

                             

Можно видеть, что в целом для  всей совокупности  увеличение стажа  приводит к

увеличению заработной платы, т.е. связь – прямая,  хотя в отдельных  случаях

наличие такой связи не усматривается.

Наличие большого числа различных  значений результирующего признака затрудняет

восприятие таких параллельных рядов. В таких случаях целесообразнее

воспользоваться для установления факта наличия связи корреляционной таблицей.

Корреляционная таблица позволяет изложить материал сжато, компактно и

наглядно.

Построение корреляционной таблицы  начинают с группировки значений

фактического и результативного  признаков. В первый столбик следует  вписать

значения факторного признака (x), а  первую строку заполнить значениями

результативного признака (y). Числа, полученные на пересечении строк и

столбцов, означают частоту повторения данного сочетания значений x и y.

                                                                    Таблица 2.2.

Корреляционная таблица зависимости заработной платы от стажа

    

Центральные значения

660

830

1170

1340

1515

   

Группы по х

Группы по у

   
 

До 745

745-915

1085-1255

1255-1425

Свыше 1425

fx

yj

До 5 лет

7

4

     

11

722

5-8 лет

3

2

2

1

 

8

915

8-11 лет

 

3

1

   

4

915

11-14

 

2

 

1

 

3

1000

14-17

       

2

2

1515

Свыше17 лет

       

2

2

1515

fy

10

11

3

2

4

30

 

 

Примечание: В таблице используются следующие обозначения:

yj – среднее значение результативного признака для j-той группы

значений факторного признака;

fx – частота повторения данного варианта значения факторного

признака во всей совокупности;

fy – частота повторения результативного признака во всей

совокупности.

Данная корреляционная таблица  уже при общем знакомстве даёт возможность

выдвинуть предположение о наличии  или отсутствии связи, а также выяснить её

направление, Если частоты расположены  по диагонали из верхнего левого угла в

правый нижний, то связь между  признаками прямая. Если же частоты  расположены

по диагонали справа налево, - то связь обратная. В данном случае можно

предположить наличие прямой связи.

Корреляционная зависимость чётко  обнаруживается только при рассмотрении

средних значений результативного  признака, соответствующих определённым

значениям факторного признака, т.к. при  достаточно большом числе наблюдений в

каждой группе влияние прочих случайных факторов будет взаимопогашаться, и

чётче выступит зависимость результирующего  признака от фактора, положенного в

основу группировки.

Для предварительного выявления наличия  связи и раскрытия её характера,

применяют графический метод. Используя данные об индивидуальных значениях

признака-фактора и соответствующих  ему значениях результативного  признака,

строится в прямоугольных координатах  точечный график, который называют «полем

корреляции». Для данного примера  поле корреляции имеет следующий вид ( см.

рис. 2.1).

    

 

 

Рис.2.1.

Точки корреляционного поля не лежат  на одной линии, они вытянуты определённой

полосой слева на право. Нанеся средние значения факторного и результирующего

признаков на график и соединяя последовательно  отрезками прямых

соответствующие им точки, получают эмпирическую линию связи.

Если эмпирическая линия связи  по своему виду приближается к прямой линии, то

это свидетельствует о наличии прямолинейной корреляционной связи между

признаками. Если же имеется тенденция  неравномерного изменения значений

результирующего признака, и эмпирическая линия связи будет приближаться к

какой-либо кривой, то это может  быть связано с наличием криволинейной

корреляционной связи.

2.3. Множественная корреляция

Проведенный выше анализ статистических совокупностей позволяет изучить

взаимосвязь только двух переменных.

На практике же часто приходится исследовать зависимость результирующего

признака от нескольких факторных  признаков. В этом случае статистическая

модель может быть представлена уравнением регрессии с несколькими

переменными. Такая регрессия называется множественной (множественная

корреляция).

Например, линейная регрессия с m независимыми переменными имеет вид:

yi = a0x0 + a1x1 + a2x2 + . + amxm,                                  (2.1)

где    а0, а1, а2, ., аm – параметры уравнения регрессии,

m – число независимых  переменных,

х0, х1, х2, ., хm – значения факторного признака,

yi – значение результирующего признака.

При оценке параметров этого уравнения  в каждом i-том наблюдении фиксируют

значения результирующего признака у и факторных признаков хi0

im.

Оценки параметров уравнения регрессии  находятся с помощью метода наименьших

квадратов, который в случае множественной  регрессии удобнее представить  в

матричной форме.

Применяются следующие обозначения:

а = (аj), j = 0,1,.,m – вектор оценок параметров, m – число

неизвестных параметров;

у = (уi), i = 1,2,.,n – вектор значений зависимой переменной, n –

число наблюдений;

х = (хij) – матрица значений независимых переменных размерностью n(m+1);

е = (ei) – вектор ошибок в уравнении с оцененными параметрами.

Уравнение регрессии с оцененными параметрами имеет вид:

у = Ха,                                                         (2.2)

Линейная модель (2.1) в векторном  виде имеет вид:

у = Ха + е.                                                    (2.3)

Сумма квадратов отклонений равна:

Q = åеi2 = eTe = (y-Xa)T(y-Xa) = yTy – aTXTy – yTXa + aTXTXa =

= yTy – 2aTXTy + aTXTXa,

(2.4)

где    Т – знак операции транспонирования, т.е. строки исходной матрицы в

транспонированной занимают положение  столбцов.

Дифференцированием Q по а получается

= -2ХТу + 2(ХТХ)а                                       (2.5)

Приравниванием производной к  нулю получается выражение для определения

вектора оценки а:

                                               ХТу = ХТХа,

а = (ХТХ)-1Ту).                                           (2.6)

Оценку а, определенную изложенным способом, называют оценкой метода

наименьших квадратов. Применительно  к уравнению регрессии (2.1) матрицы

коэффициентов имеют вид:

I  x11  x12  .  x1m

I  x21  x22  .  x2m

X =    .  .  .  .  .    ,

.  .  .  .  .

Информация о работе Статистический метод группировки