Корреляционый анализ

Автор: Пользователь скрыл имя, 14 Мая 2012 в 22:15, курсовая работа

Краткое описание

Решение задач по математическому анализу.

Оглавление

Корреляционный анализ
1.1. Построение рядов распределения по факторному и результативному признакам...............................................................................3-5
1.2. Построение корреляционной таблицы..............................6
1.3. Расчет и построение эмпирической линии регрессии.......6-8
1.4. Расчет и построение теоретической линии регрессии.......8-11
1.5. Измерение тесноты связи..................................................12
1.6. Заключение по разделу Корреляционный анализ...............12-13……..
Определение показателей вариации…………………………....
2.1. Вычисление групповой дисперсии...................................14-16 ……
2.2. Вычисление средней из групповых..................................16-17 …
2.3. Вычисление межгрупповой дисперсии.............................17 … 2.4. Вычисление общей дисперсии ...……………………………………….
2.5. Вычисление среднеквадратического отклонения………… ……..
2.6. Вычисление показателя вариации…………………………………...
2.7. Вычисление эмпирического коэффициента детерминации...............................................................................18-19……….
2.8. Вычисление эмпирического корреляционного отношения ……..
2.9. Заключение по разделу «Определение показателей вариации»…..
Анализ динамических рядов……………………………………… …
3.1 Определение данных для 3-го динамического ряда по двум исходным данным……………………………………………………………………...
3.2. Установление вида ряда динамики………………………………… .
3.3. Определение среднего уровня ряда динамики……………………..
3.4. Определение показателей изменения уровня динамики: базисный и цепные абсолютные приросты, темпы роста и прироста, абсолютное значение прироста…………………………………………………………………...
3.5. Вычисление средний абсолютный прирост……………………… ...
3.6. Вычисление среднегодовых темпов роста и прироста……………..
3.7. Анализ полученных показателей динамических рядов… …….
Список использованной литературы.

Файлы: 1 файл

курсовик.docx

— 230.71 Кб (Скачать)

 

Вывод: Данные расчеты позволяют сделать выводы о том, что при переходе слева на право в сторону больших значений факторного признака , соответствующие ряды распределения функционального признака смещаются сверху вниз, т.е. в сторону меньших значений функции. Следовательно, выработка рабочего находится в корреляционной зависимости от среднего разряда.

 

 

      1. Расчет и построение эмпирической линии регрессии

 

После установления корреляционной связи, приступаем к  следующему этапу статистического  моделирования – к исследованию формы связи.

Под формулой корреляционной связи понимают тип  аналитической формулы, выражающей зависимость между изучаемыми величинами.

Необходимо  установить, какие изменяются средние  значения в связи с изменением .

Рассчитываются  средние величины для каждого  ряда распределения по формуле средней  взвешенной арифметической величины (3):

                                                                                                                  (3)

где: - средневзвешенное значение функции;

- центральное значение интервала  по функции;

m – абсолютные частоты вариантов .

Для сокращения вычислений при определении средней  арифметической можно использовать метод отсчета от условного нуля.

Расчетная формула  имеет вид

                                                         (4)

при этом

                                                              (5)

где: - фактические варианты ;

             - упрощенные варианты ;

            - новое начало отсчета по оси ;

            - интервал группировки по .

Новое начало отсчета выбирается таким образом, чтобы число наблюдений распределялось примерно поровну между положительными и отрицательными направлениями  оси ординат.

Так как в  нашем случае число наблюдений равно 11, т.е. нечетному числу, то значения будут входить в интервал от , при этом центральным значением интервала будет равно 0.

В нашем примере  условный нуль в шестом интервале  по оси  , тогда тыс. руб., а тыс. руб.

Результаты  расчетов представлены в таблице 1.6.

Упрощенные  варианты умножаются на частоты соответствующих клеток  корреляционной таблицы и записываются  в верхних углах каждой клетки.

    • Первая итоговая строка и итоговой столбец таблицы 1.6. выражают абсолютные частоты интервальных рядов распределения по функциональному и факторному признакам.
    • Вторая итоговая строка характеризует сумму произведений, записанных в верхних углах клеток.
    • Третья итоговая строка рассчитывается делением показателей второй строки на первую
    • В четвертой итоговой строке показаны искомые средние , полученные по формуле (4).

Таблица 1.6.

 

Расчет  эмпирической линии регрессии для  зависимости 

от

 

 

 

 

Выработка на 1 рабочего в  год

 

тыс.

руб.

 

X

 

Y

Средний разряд рабочих

 

Ито-

го

2,5

2,7

2,9

3,1

3,3

3,5

3,7

3,9

4,1

4,3

4,5

5

8508

15

                   

1

4

8328

 

14

                 

1

3

8148

                     

0

2

7968

         

22

         

2

1

7788

         

11

11

       

2

0

7608

           

10

       

1

-1

7428

           

1-1

       

1

-2

7248

             

1-2

     

1

-3

7068

                     

0

-4

6888

             

1-4

     

1

-5

6708

                 

1-5

 

1

 

 

ст-ро-ки

1

Итого

1

1

0

0

0

3

3

2

0

1

0

2

Σmy

5

4

0

0

0

5

0

-6

0

-5

0

Σy=3

3

5

4

0

0

0

1,6

0

-3

 

-5

0

-

4

8508

8328

7608

7608

7608

7896

7608

7608

7608

6708

7608

-


 

Показатели  четвертой итоговой строки являются основной для графического изображения выполненных расчетов на поле корреляции.

Соединив  между собой средние значения в каждом интервале отрезками  прямых линий, получаем эмпирическую линию  регрессии, по , которая показывает как в среднем изменяется  в связи с изменением .

 

Вывод: расчет эмпирической линии регрессии вновь подтвердил наличие корреляционной зависимости между средним разрядом и выработкой рабочего.

 

 

 

1.4. Расчет теоретической линии регрессии

 

Теоретическая линия регрессии представляет собой такую математически правильную кривую (либо прямую) линию, которая проходит наиболее близко к эмпирической линии регрессии, выражает общую закономерность средних изменений признака в связи со средними изменениями фактора.

В данном случае характер размещения точек на корреляционном поле делает весьма вероятной гипотезу о линейной связи  у от х  

Параметры искомой  прямой ( ) находим из системы уравнений по способу наименьших квадратов:

                                                                                       (6)

Исходная информация для решения  системы (6) получаем из таблицы 7, которая  будет основана на результатах таблицы 6.

Для получения упрощенных вариантов по факторному признаку также используем метод отсчета от условного нуля. В нашем примере примем                   ,

Таблица 1.7.

 

Расчет  теоретической линии регрессии  для зависимости 

от

Выработка на 1 рабочего в год

 

тыс.

руб.

 

 

 

Средний разряд рабочих

№ столбца

 

25

16

9

4

1

0

1

4

9

16

25

1

2

3

4

 

-5

-4

-3

-2

-1

0

1

2

3

4

5

 

 

 

 

X

 

Y

2,5

2,7

2,9

3,1

3,3

3,5

3,7

3,9

4,1

4,3

4,5

5

8508

1

                   

1

5

25

25

4

8328

 

1

                 

1

4

16

16

3

8148

                     

0

0

0

0

2

7968

         

2

         

2

4

16

32

1

7788

         

1

1

       

2

2

4

8

0

7608

           

1

       

1

0

0

0

-1

7428

           

1

       

1

-1

1

1

-2

7248

             

1

     

1

-2

4

4

-3

7068

                     

0

0

0

0

-4

6888

             

1

     

1

-4

16

16

-5

6708

                 

1

 

1

-5

25

25

 

 

строки

1

Итого

1

1

0

0

0

3

3

2

0

1

0

n=11

3

-

127

2

∑hi*x/

-5

-4

0

0

0

0

3

4

0

4

0

 

3

∑hi*x/2

25

16

0

0

0

0

3

8

0

16

0

 

4

∑mi*yi/

5

4

0

0

0

  5

0

-6

0

-5

0

 

5

∑m*y/*x/

-25

-16

0

0

0

0

0

-12

0

-20

0

 

 

В качестве проверки правильного составления  таблицы 1.7. должно соблюдаться равенство  итогов четвертой строки и второго  столбца. Если это условие не соблюдается, то в расчетах допущена ошибка, которая  может привести к существенным искажениям величины параметров теоретической  линии регрессии.

Если посмотреть в таблицу, то можно увидеть, суммы  четвертой итоговой строки и второго  итогового столбца одинаковы, и  эта величина равна 3.

 Далее в систему уравнений (6) подставим результаты, полученные в табл. 7.  

                                                                                            (7)                                                        

В качестве решения системы (7) примем метод Гаусса, который позволяет находить решения последовательно, исключая неизвестные. Для этого первое уравнение системы (7) делим на -2, а второе на -68 и получим:                                                                                                                                                                                                             

                                                                                            (8) 

После преобразований получаем ответ:

 

                                                       (9) 

Параметры в  системе (9) необходимо преобразовать  исходя из фактических значений и .

Формулы перевода из упрощенных в реальные координаты:

                                                                                                                 (10)

                                                                                                     (11)

где:    - интервал группировки по ;

     - интервал группировки по ;

            - новое начало отсчета по ;

             - новое начало отсчета по .

 

По формулам (10) и (11) находим:

 

 

Т. е. уравнение теоретической линии  регрессии в реальных коэффициентах  имеет вид:

                                        (12)                                                                            

В уравнении  регрессии первое слагаемое носит  название свободного члена, второе слагаемое  называется коэффициентом регрессии. Он показывает, на сколько натуральных  единиц изменяется в среднем результативный признак при изменении факторного признака на единицу.

Вывод: в данном случае из уравнения теоретической линии видно, что выработка рабочего понижается на 3,5% при увеличении среднего разряда работников на 1%, т.е. как было ранее замечено, оба признака имеют прямо пропорциональную связь.

Выработка на 1 рабочего, не зависящяя от рассматриваемых факторов, равна 14418,6 тыс. руб.

Для графического изображения теоретической линии  регрессии достаточно определить две  точки, через которые можно провести прямую. В данном случае возьмем  две крайние точки, т.е.:

                          Таблица 1.8.

х (чел)

2,5

4,3

у (тыс.руб.)

23171,1

29472,9


 

Вывод: если в пункте 1.7. посмотреть графическое изображение теоретической линии регрессии в виде уравнения прямой, то она еще раз подтверждает наличие корреляционной связи между изучаемыми признаками.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1.5. Измерение тесноты связи

 

Для выяснения  тесноты связи функционального  и фактического значений, нужно определить коэффициент корреляции . Для её расчета существует формула, представленная в упрощенных координатах признака и :

                                                                           (13)

Возьмем исходную информацию из табл. 7 и, подставив в  формулу (13), найдем значение коэффициента корреляции:

                                      (14)

Вывод: Выполненные расчеты показывают, что между выработкой рабочего и средним разрядом существует отрицательная корреляция, которая говорит о том, что с увеличением факторного признака x функциональный признак y уменьшается.

Знак при  корреляции совпадает со знаком регрессии  , что свидетельствует о правильности произведенных вычислений. Случайные факторы оказывают оказывают большое влияние на функцию ,так как r =-0.8,следовательно имеем тесную связь между изучаемыми явлениями.

 

 

 

 

1.6. Заключение по разделу «Корреляционный анализ»

 

По данным в таблице 1.1. рядам мы построили  интервальные и дискретные ряды, посредствам  вторых сделали вывод: ряд распределения по выработке на 1 рабочего, показывает, что для него наиболее характерными являются группа с центральным значением интервала 7800 тыс. руб., так как она составляет по 9,1% всех накладных расходов.

Информация о работе Корреляционый анализ