Автоматизированный априорный анализ статистической совокупности в среде MS Excel

Автор: Пользователь скрыл имя, 12 Декабря 2011 в 18:53, лабораторная работа

Краткое описание

В статистическом исследовании эти предприятия выступают как единицы выборочной совокупности. Генеральную совокупность образуют все предприятия корпорации. Анализируемые признаки предприятий – Среднегодовая стоимость основных производственных фондов и Выпуск продукции – изучаемые признаки единиц совокупности.

Файлы: 1 файл

Отчет.doc

— 465.50 Кб (Скачать)

     Примечание. В случае, если признается случайным свободный член а0, то уравнение регрессии целесообразно построить заново без свободного члена а0. В этом случае в диалоговом окне Регрессия необходимо задать те же самые параметры за исключением лишь того, что следует активизировать флажок Константа-ноль (это означает, что модель будет строиться при условии а0=0). В лабораторной работе такой шаг не предусмотрен.

     Если  незначимым (случайным) является коэффициент  регрессии а1, то взаимосвязь  между признаками X и Y в принципе не может аппроксимироваться  линейной моделью.

     Вывод:

     Для свободного члена а0 уравнения регрессии рассчитанный уровень значимости есть αр =…..………… Так как он меньше (больше) заданного уровня значимости α=0,05, то коэффициент а0 признается типичным (случайным).

     Для коэффициента регрессии  а1  рассчитанный  уровень  значимости есть αр =………..…… Так как он меньше (больше) заданного уровня значимости α=0,05, то коэффициент а1 признается типичным (случайным).

5.1.2. Зависимость доверительных  интервалов коэффициентов уравнения от заданного уровня надежности

     Доверительные интервалы коэффициентов а0, а1 построенного уравнения регрессии при уровнях надежности Р=0,95 и Р=0,683 представлены в табл.2.7, на основе которой формируется табл.2.9.

 

     Таблица 2.9

     Границы доверительных интервалов коэффициентов уравнения

Коэффициенты Границы доверительных интервалов
Для уровня надежности Р=0,95 Для уровня надежности Р=0,683
нижняя верхняя нижняя верхняя
а0        
а1        

     Вывод:

     В  генеральной  совокупности  предприятий  значение коэффициента  а0 следует ожидать с надежностью Р=0,95 в пределах ……………. а0 ….……….., значение коэффициента а1 в пределах …………… а1 ….………… Уменьшение уровня надежности ведет к расширению (сужению) доверительных интервалов коэффициентов уравнения.

        • Определение практической пригодности  построенной регрессионной  модели.

           Практическую  пригодность построенной модели можно охарактеризовать по величине линейного коэффициента корреляции r:

        • близость к единице свидетельствует о хорошей аппроксимации исходных (фактических) данных с помощью построенной линейной функции связи ;
        • близость к нулю означает, что связь между фактическими данными Х и Y нельзя аппроксимировать как построенной, так и любой другой линейной моделью, и, следовательно, для моделирования связи следует использовать какую-либо подходящую нелинейную модель.
        • Пригодность построенной регрессионной модели для практического использования можно оценить и по величине индекса детерминации R2, показывающего, какая часть общей вариации признака Y объясняется в построенной модели вариацией фактора X.
        • В основе такой оценки лежит равенство R = r (имеющее место для линейных моделей связи), а также шкала Чэддока, устанавливающая качественную характеристику тесноты связи в зависимости от величины r.
        • Согласно шкале Чэддока высокая степень тесноты связи признаков достигается лишь при >0,7, т.е. при >0,7. Для индекса детерминации R2 это означает выполнение неравенства R2 >0,5.
        • При недостаточно тесной связи признаков X, Y (слабой, умеренной, заметной) имеет место неравенство 0,7, а следовательно, и неравенство .
        • С учетом вышесказанного, практическая пригодность построенной модели связи оценивается по величине R2 следующим образом:
        • неравенство R2 >0,5 позволяет считать, что построенная модель пригодна для практического применения, т.к. в ней достигается высокая степень тесноты связи признаков X и Y, при которой более 50% вариации признака Y объясняется влиянием фактора Х;
        • неравенство означает, что построенная модель связи практического значения не имеет ввиду недостаточной тесноты связи между признаками X и Y, при которой менее 50% вариации признака Y объясняется влиянием фактора Х, и, следовательно, фактор Х влияет на вариацию Y в значительно меньшей степени, чем другие (неучтенные в модели) факторы.

           Значение  индекса детерминации R2 приводится в табл.2.5 в ячейке В79 (термин "R - квадрат").

           Вывод:

           Значение линейного коэффициента корреляции r и значение индекса детерминации R2 согласно табл. 2.5 равны: r =…….…….., R2 =……..………. Поскольку и , то построенная линейная регрессионная модель связи  пригодна (не пригодна) для практического использования.

        •   Общая оценка адекватности  регрессионной модели по F-критерию Фишера

             Адекватность  построенной регрессионной модели фактическим данным (xi, yi) устанавливается по критерию Р.Фишера, оценивающему статистическую значимость (неслучайность) индекса детерминации R2.

             Рассчитанная  для уравнения регрессии оценка значимости R2 приведена в табл.2.6 в ячейке F86 (термин "Значимость F"). Если она меньше заданного уровня значимости α=0,05, то величина R2 признается неслучайной и, следовательно, построенное уравнение регрессии может быть использовано как модель связи между признаками Х и Y для генеральной совокупности предприятий отрасли.

             Вывод:

             Рассчитанный  уровень значимости αр индекса детерминации R2 есть αр=……………… Так как он меньше(больше) заданного уровня значимости α=0,05, то значение R2 признается типичным (случайным) и модель связи между признаками Х и Y ……………………применима (неприменима) для генеральной совокупности предприятий отрасли в целом.

          •   Оценка погрешности  регрессионной модели

               Погрешность регрессионной модели можно оценить по величине стандартной ошибки построенного линейного уравнения регрессии . Величина ошибки оценивается как среднее квадратическое отклонение по совокупности отклонений исходных (фактических) значений yi признака Y от его теоретических значений , рассчитанных по построенной модели.

               Погрешность регрессионной модели выражается в  процентах и рассчитывается как  величина .100.

               В адекватных моделях погрешность  не должна превышать 12%-15%.

               Значение  приводится в выходной таблице "Регрессионная статистика" (табл.2.5) в ячейке В81 (термин "Стандартная ошибка"), значение    в таблице описательных  статистик (ЛР-1, Лист 1, табл.3, столбец 2).

               Вывод:

               Погрешность линейной регрессионной модели составляет .100=___________.100=…..……..%, что подтверждает (не подтверждает) адекватность построенной модели ……………………………

            Задача 6. Дать экономическую интерпретацию:

                1) коэффициента регрессии а1;

                3) остаточных величин  i.

                2) коэффициента эластичности КЭ;

          6.1. Экономическая интерпретация коэффициента регрессии а1

               В случае линейного уравнения регрессии  =a0+a1x величина коэффициента регрессии a1 показывает, на сколько в среднем (в абсолютном выражении) изменяется значение результативного признака Y при изменении фактора Х на единицу его измерения. Знак при a1 показывает направление этого изменения.

               Вывод:

          Коэффициент регрессии а1 =……………….. показывает, что при увеличении факторного признака Среднегодовая стоимость основных производственных фондов на 1 млн руб. значение результативного признака Выпуск продукции увеличивается (уменьшается) в среднем на ……………..млн руб.

           
           

          6.2. Экономическая интерпретация  коэффициента эластичности.

               С целью расширения возможностей экономического анализа явления используется коэффициент эластичности , который измеряется в процентах и показывает, на сколько процентов изменяется в среднем результативный признак при изменении факторного признака на 1%.

               Средние значения и приведены в таблице описательных статистик (ЛР-1, Лист 1, табл.3).

               Расчет  коэффициента эластичности:

                =………._________ =………..%

               Вывод:

               Значение  коэффициента эластичности Кэ=…………. показывает, что при увеличении факторного признака Среднегодовая стоимость основных производственных фондов на 1% значение результативного признака Выпуск продукции увеличивается (уменьшается) в среднем на ……….%.

          6.3. Экономическая интерпретация  остаточных величин  εi

               Каждый  их остатков характеризует отклонение фактического значения yi от теоретического значения , рассчитанного по построенной регрессионной модели и определяющего, какого среднего значения    следует ожидать, когда фактор Х принимает значение xi.

               Анализируя остатки, можно сделать ряд практических выводов, касающихся выпуска продукции на рассматриваемых предприятиях отрасли.

               Значения  остатков i (таблица остатков из диапазона А98:С128) имеют как положительные, так и отрицательные отклонения от ожидаемого в среднем объема выпуска продукции (которые в итоге уравновешиваются, т.е. ).

               Экономический интерес представляют наибольшие расхождения между фактическим объемом выпускаемой продукции yi и ожидаемым усредненным объемом .

               Вывод:

               Согласно  таблице остатков максимальное превышение ожидаемого среднего объема выпускаемой  продукции  имеют три предприятия - с номерами……, ……, ……..,  а максимальные отрицательные отклонения - три предприятия с номерами……, ……, …….. .Именно эти шесть предприятий подлежат дальнейшему экономическому анализу для выяснения причин наибольших отклонений объема выпускаемой ими продукции от ожидаемого среднего объема и выявления резервов роста производства.

               Задача 7. Нахождение наиболее адекватного нелинейного уравнения регрессии с помощью средств инструмента Мастер диаграмм.

                Уравнения регрессии и их графики построены  для 3-х видов нелинейной зависимости  между признаками и представлены на диаграмме 2.1 Рабочего файла.

                Уравнения регрессии и соответствующие  им индексы детерминации R2 приведены в табл.2.10 (при заполнении данной таблицы коэффициенты уравнений необходимо указывать не в компьютерном формате, а в общепринятой десятичной форме чисел).

               Таблица 2.10

               Регрессионные модели связи

               Вид уравнения      Уравнение регрессии Индекс

          детерминации  R2

          Полином 2-го порядка  
          Полином 3-го порядка  
          Степенная функция  

                Выбор наиболее адекватного уравнения регрессии определяется максимальным значением индекса детерминации R2: чем ближе значение R2 к единице, тем более точно регрессионная модель соответствует фактическим данным.

                Вывод:

                Максимальное  значение индекса детерминации R2 =…………............ Следовательно, наиболее адекватное исходным данным нелинейное уравнение регрессии имеет вид …………………………

           
           

                 ПРИЛОЖЕНИЕ 

          Результативные таблицы и графики

          Распечатка  Листа 2 Рабочего файла
           
           

             ВСЕРОССИЙСКИЙ ЗАОЧНЫЙ ФИНАНСОВО-ЭКОНОМИЧЕСКИЙ ИНСТИТУТ

           

             КАФЕДРА СТАТИСТИКИ

           
           
           
           
           
           
           

             О Т Ч Е Т 

             о результатах выполнения

             компьютерной  лабораторной работы

           

          Автоматизированный  анализ динамики социально-экономических  явлений в среде  MS Excel

           
           

             Вариант № ____

           
           
           
           
           
           
           
           
           
           

                          Выполнил: ст. III курса гр._______________

                              ____________________

                              ФИО

                            Проверил:_______________________

                              ФИО

           
           
           
           
           

          Москва  ………..г.

           

          1. Постановка задачи  статистического  исследования 

                В процессе статистического изучения деятельности одного из предприятий получены данные о годовом выпуске продукции (в стоимостном выражении) за шестилетний период, а также данные о выпуске продукции по месяцам за 6-ой год.

                Полученные  два ряда динамики представлены на Листе 3 Рабочего файла в формате электронных таблиц процессора Excel, годовые данные – в диапазоне ячеек A6:B12, а данные за 6-ой год по месяцам - в диапазоне D6:E19.

                Таблица 3.1

          Исходные данные

           

                ВНИМАНИЕ!!! В данной лабораторной работе, в отличие от двух предшествующих лабораторных работ, все Excel-таблицы размещаются не только в ПРИЛОЖЕНИИ, но и по тексту отчета в соответствующих местах.

                В процессе автоматизированного анализа динамики выпуска продукции за шестилетний период необходимо решить следующие статистические задачи.

          Задание 1. Расчёт и анализ показателей ряда динамики выпуска продукции за шестилетний период.

          Задание 2. Прогноз показателя выпуска продукции на 7-ой год методом экстраполяции.

          Задание 3. Выявление тенденции развития изучаемого явления (тренда) по данным о выпуске продукции по месяцам за 6-ой год методами скользящей средней и аналитического выравнивания.

           
           

          2. Выводы по результатам  выполнения лабораторной  работы4

          Задание 1.

            Расчёт  и анализ показателей  ряда динамики выпуска продукции за шестилетний период.

          Выполнение  Задания 1 заключается в решении двух задач:

          Задача 1.1. Расчет цепных и базисных показателей динамики: абсолютный прирост; темп роста; темп прироста и абсолютное значение 1 % прироста.

          Задача  1.2. Расчет средних показателей ряда динамики: средний уровень ряда динамики; средний абсолютный прирост; средний темп роста и средний темп прироста.

                Задача 1.1.

              Аналитические показатели рядов динамики строятся на основе сравнения двух уровней ряда. Используют два способа сравнения уровней:

              1) базисный способ, при котором каждый последующий уровень сравнивается с одним и тем же уровнем, принятым за базу сравнения (то есть база сравнения – постоянная);

              2) цепной способ, при котором каждый последующий уровень сравнивается с предыдущим уровнем (то есть база сравнения – переменная).

              Соответственно  различают:

                  - базисные показатели, обозначаемые надстрочным индексом б;

                  - цепные показатели, обозначаемые надстрочным индексом ц.

                Общеупотребительные обозначения уровней  ряда динамики:

                   yi – данный (текущий) уровень;

                   yi-1– предыдущий уровень;

                   y0 – базисный уровень;

                   yn – конечный уровень;

                К числу основных аналитических показателей рядов динамики, характеризующих изменения уровней ряда за отдельные промежутки времени, относятся: абсолютный прирост, темп роста, темп прироста, абсолютное значение одного процента прироста, которые рассчитываются по следующим формулам:

                уiб = уi – уо,                                              уiц = уi – уi-1

                ,                              

                Тпрiрi-100 (%)                             

              Аналитические показатели годовых изменений уровней ряда приведены в табл.3.2.

           
           

          Таблица 3.2

           

                Вывод:

                Как показывают данные табл. 3.2, объем реализации произведенной продукции постоянно (непостоянно) повышался (снижался). В целом за исследуемый период объем реализации произведенной продукции повысился (снизился) на ………………млн. руб. (гр.4)  или на……..% (гр.8). Рост (снижение) объема реализации продукции носит стабильный (скачкообразный) характер, что подтверждается постоянно увеличивающимися (разнонаправленными) значениями цепных абсолютных приростов (гр.3) и цепных темпов прироста (гр.7). Характер изменения объемов реализации продукции подтверждается также систематическим (несистематическим) изменением величины абсолютного значения 1% прироста (гр.9).

           
           

                Задача 1.2.

                В табл.3.2 приведены данные, характеризующие динамику изменения уровней ряда за отдельные периоды времени. Для обобщающей оценки изменений уровней ряда за весь рассматриваемый период времени необходимо рассчитать средние показатели динамики.

                В анализе динамики явления в зависимости  от вида исходного ряда динамики используются различные средние показатели динамики, характеризующие изменения ряда динамики в целом.

                Средний уровень ряда динамики ( ) характеризует типичную величину уровней ряда.

              Для интервального ряда динамики с равноотстоящими  уровнями средний уровень ряда определяется как простая арифметическая средняя из уровней ряда:

          ,

          где n- число уровней ряда.

                Средний абсолютный прирост  ( ) является обобщающей характеристикой индивидуальных абсолютных приростов и определяется как простая арифметическая средняя из цепных абсолютных приростов:

                         

          где n- число уровней ряда.

                Средний темп роста ( ) – это обощающая характеристика интенсивности изменения уровней ряда, показывающая во сколько раз изменялись уровни ряда в среднем за единицу времени. Показатель может быть рассчитан по формуле

             

              

          где  n – число уровней ряда.

                Средний темп прироста ( ) рассчитывают с использованием среднего темпа роста по формуле:

                           

                Средние показатели ряда динамики выпуска продукции представлены в табл.3.3.

          Таблица 3.3

           
           
           
           

                Вывод.

                За  исследуемый период средний объем  реализации произведенной продукции  составил ………….. млн. руб. Выявлена положительная (отрицательная) динамика реализации продукции: ежегодное увеличение (снижение) объема реализации составляло в среднем ……….. млн. руб. или …….%.

                При среднем абсолютном приросте …………млн. руб. отклонения по отдельным годам  незначительны (значительны).

           

                Задание 2.

          Прогноз показателя выпуска продукции на 7-ой год методом экстраполяции

                Применение метода экстраполяции основано на инерционности развития социально-экономических явлений и заключается в предположении о том, что тенденция развития данного явления в будущем не будет претерпевать каких-либо существенных изменений. При этом с целью получения окончательного прогноза всегда следует учитывать все имеющиеся предпосылки и гипотезы дальнейшего развития рассматриваемого социально-экономического явления. Прогноз, сделанный на период экстраполяции (период упреждения), больший 1/3 рассмотренного периода развития явления, не может считаться научно обоснованным (например, по данным за 6 лет научно обоснованным будет прогноз лишь на 2 года вперед).

                Выполнение  Задания 2 заключается в решении двух задач:

          Задача  2.1. Прогнозирование выпуска продукции предприятием на год вперёд с использованием среднего абсолютного прироста и среднего темпа роста.

          Задача  2.2. Прогнозирование выпуска продукции предприятием на год вперёд с использованием аналитического выравнивания ряда динамики по прямой, параболе и степенной функции.

                Задача 2.1.

                Прогнозирование уровня ряда динамики с использованием среднего абсолютного прироста и среднего темпа роста осуществляется соответственно по формулам:

          ,                                     (1),

                                                   (2),

           

          где: – прогнозируемый уровень;

                  t – период упреждения (число лет, кварталов и т.п.);

                  yi – базовый для прогноза уровень;

                  – средний за исследуемый период абсолютный прирост (среднегодовой, среднеквартальный и т.п.);

                 – средний за исследуемый период темп роста (среднегодовой, среднеквартальный и т.п.).

                Формула (1) применяется при относительно стабильных абсолютных приростах Δyц, что с некоторой степенью приближения соответствует линейной форме зависимости . Формула (2) используется при достаточно стабильных темпах ростах  ( ), что с некоторой степенью приближения соответствует показательной  форме зависимости .

                Прогнозные  оценки объема реализации продукции  на 7-ой год (по данным шестилетнего периода), рассмотренные с использованием среднего абсолютного прироста и среднего темпа роста (рассчитанные в задании 1), приведены в табл.3.4.

          Таблица 3.4

                Вывод.

                Как показывают полученные прогнозные оценки, прогнозируемые объемы выпуска продукции на 7-ой год (по данным шестилетнего периода) достаточно близки (значительно отличаются) между собой: ………… и ……………млн.руб. Расхождение полученных данных объясняется тем, что в основу прогнозирования положены разные методики экстраполяции рядов динамики.

                Задача 2.2.

                Прогнозирование выпуска продукции предприятием на год вперёд методом аналитического  выравнивания  ряда динамики по прямой, параболе и степенной функции выполнено с использованием средств инструмента МАСТЕР ДИАГРАММ. Результаты представлены на рис. 3.1 в виде уравнений регрессии и их графиков.

          Рис. 3.1

                ВНИМАНИЕ!!! Инструмент МАСТЕР ДИАГРАММ строит уравнения, обозначая независимую переменную через Х, зависимую – через Y. В анализе временных рядов рассматриваются зависимости вида y=f(t), где t время. Следовательно, во всех выводах по результатам анализа рядов динамики для обозначения аргумента в уравнении регрессии используется переменная t,  а не x..

                Выбор наиболее адекватной трендовой модели определяется максимальным значением  индекса детерминации R2: чем ближе значение R2 к единице, тем более точно регрессионная модель соответствует фактическим данным.

                Вывод:

                Максимальное  значение индекса детерминации R2 =…………............ Следовательно, уравнение регрессии, наиболее адекватное данным о выпуске продукции за 6-летний период, имеет вид  …………………………

                Рассчитанный  по данному уравнению прогноз выпуска продукции на 7-ой год составляет ………………млн. руб., что незначительно (существенно) расходится с прогнозами, полученными в задаче 2.1.

          Задание 3.

          Выявление тенденции развития изучаемого явления (тренда) методами скользящей средней и аналитического выравнивания по данным о выпуске продукции по месяцам за 6-ой год.

                Выполнение  Задания 3 заключается в решении двух задач:

          Задача  3.1. Расчет скользящей средней ряда, полученной на основе трёхзвенной скользящей суммы.

          Задача  3.2. Аналитическое выравнивание ряда динамики по прямой и параболе.

                Задача  3.1.

                Значения  скользящей средней, полученные на основе трёхзвенной скользящей суммы, представлены в табл.3.5.

          Таблица 3.5

                Вывод:

                Анализ  данных табл.3.5 показывает, что значения скользящей средней изменяются закономерно (незакономерно). Следовательно, можно (нельзя) установить основную тенденцию ряда – возрастание (убывание) объемов выпуска продукции по месяцам за 6-ой год.

                График  сглаживания ряда динамики выпуска продукции методом скользящей средней представлен на рис. 3.2.

          Рис. 3.2

          Задача  3.2.

                Метод аналитического выравнивания позволяет  представить основную тенденцию (тренд) развития явления в виде функции  времени y=f(t).

                Для отображения трендов применяются  различные функции: линейные и нелинейные.

                Построение графика выпуска продукции предприятием методом аналитического выравнивания ряда динамики по прямой и полиному 2-го порядка (параболе) выполнено с использованием средств инструмента МАСТЕР ДИАГРАММ и представлено на рис. 3.3.

          Рис. 3.3

                Выбор наиболее адекватной трендовой модели определяется максимальным значением индекса детерминации R2: чем ближе значение R2 к единице, тем более точно регрессионная модель соответствует фактическим данным.

           

                Вывод:

                Максимальное  значение индекса детерминации R2 =…………............ Следовательно, уравнение регрессии, наиболее адекватное данным о выпуске продукции за 6-ой год, имеет вид …………………………

Информация о работе Автоматизированный априорный анализ статистической совокупности в среде MS Excel