Изучение корреляционной зависимости между уровнями двух динамических рядов

Автор: Пользователь скрыл имя, 20 Августа 2011 в 17:23, курсовая работа

Краткое описание

Наиболее часто для формирования выборочной совокупности применяют бесповторную случайную выборку. Случайный отбор организуют с помощью жребия, таблицы случайных чисел или программы, генерирующей квазислучайную последовательность чисел. Для этого единицы генеральной совокупности нумеруют. Данные, соответствующие выпавшим, номерам попадают в выборку. При этом повторяющиеся номера пропускаем.

Оглавление

РАЗДЕЛ 1.Исследование модели распределения 2
1. Формирование выборочной совокупности 2
2. Построение интервального ряда распределения 3
3.Проверка соответствия эмпирического распределения нормальному закону распределения 4
РАЗДЕЛ 2.Исследование взаимосвязи двух количественных признаков 8
1. Оценка тесноты корреляционной связи 8
2. Определение формы связи двух признаков 9
РАЗДЕЛ 3. ИЗУЧЕНИЕ ДИНАМИЧЕСКИХ РЯДОВ 12
1.Изучение сезонных явлений 12
2.Определение основной тенденции развития 14
3. Изучение корреляционной зависимости между уровнями двух динамических рядов 15
3.1.Изучение корреляционной зависимости между уровнями двух динамических рядов методом коррелирования уровней 15
3.2.Изучение корреляционной зависимости между уровнями двух динамических рядов методом коррелирования разностей 16
3.3.Изучение корреляционной зависимости между уровнями двух динамических рядов методом коррелирования остатков (отклонений от трендов) 17
3.4. Изучение корреляционной зависимости между уровнями двух динамических рядов методом коррелирования с учётом фактора времени 19

Файлы: 1 файл

Курсовая работа (вариант №24).doc

— 1.30 Мб (Скачать)
 

      Определим   максимальное   значение   модуля   разности   между эмпирической функцией распределения F*(t) и теоретической функцией для нормального закона распределения F(t) (значения F(t) представлены в табл.3.2): 
 
 
 

        
 

и определяем величину:                                                           

  

       Для признака x: 

                                                               

       Для признака y:

                                                                             
 

        Затем по таблице определяем  в зависимости от l вероятность Р(l), того что за счёт чисто случайных причин расхождение между F*(t) и F(t) будет не больше, чем фактически наблюдаемое.

      При сравнительно больших Р(l) теоретический закон распределения можно считать совместимым с опытными данными.                                                                       

РАЗДЕЛ 2.Исследование взаимосвязи двух количественных признаков

1. Оценка тесноты корреляционной  связи

    Из  логических соображений выдвинем предположение, что признак (названный нами y) зависит от второго исследуемого признака x.

    Используя проведенное в первом разделе разбиение значений x на интервалы, построим аналитическую таблицу:  

Аналитическая таблица исследования зависимости признака y от признака x

    Группы предприятий по признаку x Число предприятий в j-ой группе mj Признак y
    Суммарное значение в группе Среднее значение признака yi в j-ой группе на одно предприятие
    31,4 – 34,02 8 250,8 31,3500
    34,02 – 36,64 9 298,6 33,1778
    36,64 – 39,26 6 207,8 34,6333
    39,26 – 41,88 4 143,8 35,9500
    41,88 – 44,5 3 113,3 37,7667
 
 
 

      Далее рассчитываем общую дисперсию:

        
 

где - среднее значение признака для всей выборки, и межгрупповую дисперсию: 
 
 
 

где - среднее значение признака в j-й группе; mj- численность j-й группы; k - число групп.

      

       Для оценки тесноты  связи между признаками y и x рассчитываем корреляционное отношение: 
 

      Оценку  тесноты связи признаков y и x проводим по шкале Чеддока:

    -если 0,3<0,5, то теснота связи заметная;

    -если 0,5<0,7, то теснота связи умеренная;

    -если 0,7<0,9, то теснота связи высокая;

    -если 0,9<0,9(9), то теснота связи весьма высокая.

2. Определение формы связи двух  признаков

      Примерное представление о виде зависимости  y от x даёт линия, проведённая через точки, соответствующие групповым средним и полученные на основе аналитической таблицы следующим образом: среднему значению признака в j-ой группе ставится в соответствие не середина интервала группирования по признаку x, а среднее значение , полученное из соответствующих интервалу значений признака x. Можно воспользоваться следующим приемом: построим все точки, соответствующие парам (хii), в декартовой системе координат и провести линию через середины скоплений точек (График № 1).

       Затем по справочнику плоских кривых и виду линии подбираем соответствующее уравнение регрессии. Однако не следует брать слишком сложное уравнение. В нашем случае берём линейную функцию:

                                                                                       
 

      Вычислив  частные производные и приравняв  их к нулю, получим систему линейных алгебраических уравнений относительно коэффициентов а и b. В нашем случае система уравнений имеет вид:

     
     
     

    Решая эту систему  уравнений относительно b, получим:

        
 

      Решая первое уравнение относительно а, получим:

                                                

                                                                           

                                    Т.о.:          

       Линейный коэффициент  корреляции равен:

где sx и sy - средние квадратические отклонения признаков x и y.

                                                                                    

       Рассчитаем общую  дисперсию: 

       и остаточную дисперсию: 

где yxi) - значение величины y, рассчитанное по уравнению регрессии при подстановке в него значения xi; yi- значение величины y в исходной таблице, соответствующее значению xi.

     

      Определим индекс корреляции:

        

      Индекс  корреляции принимает значения 0£ i £1.

                                                                                           

     Т.к. i близок к единице, то связь между признаками хорошо описана выбранным   уравнением   регрессии.   Для   линейной   зависимости дополнительным условием для такого заключения является близость значений r и i.                                                           

      Можно выбрать несколько  видов уравнения регрессии. Наилучшим  из них будет то уравнение, которому соответствует меньшая средняя  квадратическая ошибка уравнения регрессии:

где m - число коэффициентов в уравнении регрессии.

                                                                                            

     Принимая  во внимание то, что мы имеем дело с малой выборкой, необходимо оценить  значимость коэффициентов уравнения  регрессии, а также индекса корреляции i и линейного коэффициента корреляции r. Значимость линейного коэффициента корреляции r оцениваем с помощью критерия Стьюдента. Фактическое значение критерия Стьюдента равно:

     

           
 

                                  

                                                                            

     Критическое (предельное) значение критерия Стьюдента  tk, берем из табл.4 приложения, задаваясь уровнем значимости a=5,0 и имея число степеней свободы равное:

      k=n-2

     Если  tr>tk, то величину линейного коэффициента корреляции считаем значимой и можем использовать в расчетах.

      Значимость коэффициентов  уравнения регрессии а и b также оцениваем с помощью критерия Стьюдента. Расчетные значения критерия Стьюдента равны: 

       
 
 

     Учитывая, что число степеней свободы также равно k=n-2, сравнение фактических значений критерия Стьюдента ведем с уже найденным критическим значением tk.

     Если  ta>tk, tb>tk, то соответствующий коэффициент уравнения регрессии значим, и мы можем им пользоваться. Значимость индекса корреляции определяем с помощью критерия Фишера. Фактическое значение критерия Фишера равно: 

где m - число коэффициентов в уравнении регрессии.

      Табличное значение критерия Фишера Fk; определяется по табл.5 приложения, задаваясь уравнением значимости a и числом степеней свободы k1=m-l; k2=n-m.

        

      Если  Fi>Fk, то величину индекса корреляции считаем значимой и можем ее использовать в расчетах.

     Если  коэффициенты а и b, а также линейный коэффициент корреляции r и индекс корреляции i значимы, то все наши расчеты и выводы, опирающиеся на эти величины, правомерны и мы можем использовать полученное уравнение  регрессии для прогноза. Ошибка прогноза будет зависеть, в частности, от остаточной дисперсии s2e.

РАЗДЕЛ 3. ИЗУЧЕНИЕ ДИНАМИЧЕСКИХ РЯДОВ

1.Изучение сезонных явлений

      Исследуем сезонные процессы в наших двух динамических рядах. При изучении сезонных явлений из уровней динамического ряда целесообразно вычесть значения, получаемые по уравнению тренда, которые отражают основную тенденцию развития.

       При изучении периодических процессов в качестве аналитической модели используем ряд Фурье: 
 

где k=1; j=1.

      Для нахождения коэффициентов a0, aj, bj применяем метод наименьших квадратов.

       Получаем: 
 
 
 
 
 
 
 

      Для признака x:                                                        Для признака y:

        
 
 
 
 
 
 
 
 

      Обычно  для расчётов используют ежемесячные  данные за один год или несколько лет. В этом случае интервал между двумя соседними месяцами принимают равным: 

                                                                             

      Построив  модель сезонных колебаний, положим  для уточнённого изучения основной тенденции a0 =0. Исключим сезонные колебания из уровней динамического ряда (табл.3.1.1).

Таблица 3.1.1

xt yt
2661,669 3613,236
2875,587 3822,011
2963,355 3982,202
3123,42 4283,029
3220,836 4428,087
3326,98 4610,676
3286,852 4566,172
3263,324 4538,486
3116,237 4319,251
3036,962 4198,99
2900,234 3993,958
2894,491 3990,848
2874,626 3974,423
2997,766 4181,021
3084,173 4339,299
3262,659 4638,991
3338,698 4783,995
3444,038 4907,625
3403,894 4924,979
3381,141 4899,469
3315,414 4682,148
3157,719 4563,026
3022,368 4358,052
3017,432 4353,904
2997,586 4365,623

Информация о работе Изучение корреляционной зависимости между уровнями двух динамических рядов