Автор: Пользователь скрыл имя, 18 Ноября 2011 в 18:03, задача
По семи территориям Уральского района За 199Х г. известны значения двух признаков.
Требуется:
1. Для характеристики зависимости у от х рассчитать параметры следующих функций:
а) линейной;
б) степенной;
в) показательной;
г) равносторонней гиперболы.
2. Оценить каждую модель через среднюю ошибку аппроксимации и F-критерий Фишера.
Требуется:
1. Построить
линейное уравнение парной
2. Рассчитать
линейный коэффициент парной
корреляции и среднюю ошибку аппроксимации.
3. Оценить
статистическую значимость
4. Выполнить прогноз заработной платы у при прогнозном значении среднедушевого прожиточного минимума х, составляющем 107% от среднего уровня.
5. Оценить
точность прогноза, рассчитав ошибку прогноза
и его доверительный интервал.
Решение:
Таблица 6
х | у | yx | x2 | y2 | Ai | ||||
l | 81 | 136 | 11016 | 6561 | 18496 |
|
-14,80 | 10,9 | |
2 | 79 | 151 | 11929 | 6241 | 22801 | 148,8 | 2,20 | 1,5 | |
3 | 90 | 129 | 11610 | 8100 | 16641 | 159,6 | -30,60 | 23,7 | |
4 | 76 | 151 | 11476 | 5776 | 22801 | 145,9 | 5,10 | 3,4 | |
5 | 94 | 165 | 15510 | 8836 | 27225 | 163,5 | 1,50 | 0,9 | |
6 | 101 | 198 | 19998 | 10201 | 39204 | 170,4 | 27,60 | 13,9 | |
7 | 70 | 134 | 9380 | 4900 | 17956 | 140 | -6,00 | 4,5 | |
8 | 85 | 153 | 13005 | 7225 | 23409 | 154,7 | -1,70 | 1,1 | |
9 | 76 | 155 | 11780 | 5776 | 24025 | 145,9 | 9,10 | 5,9 | |
10 | 84 | 165 | 13860 | 7056 | 27225 | 153,7 | 11,30 | 6,8 | |
11 | 81 | 156 | 12636 | 6561 | 24336 | 150,8 | 5,20 | 3,3 | |
12 | 110 | 170 | 18700 | 12100 | 28900 | 179,2 | -9,20 | 5,4 | |
Итого | 1027 | 1863 | 160900 | 89333 | 293019 | 1863,3 | -0,30 | 81,30 | |
Ср. знач. | 85,6 | 155,3 | 13408,3 | 7444,4 | 24418,3 | 155,3 | 0 | 6,8 | |
s | 10,8 | 17,3 | |||||||
s2 | 117,04 | 300,21 |
Находим параметры регрессии
Уравнение регрессии: у = 71,472+0,9793х.
Параметр регрессии позволяет сделать вывод, что с увеличением среднедушевого прожиточного минимума на 1 руб. среднедневная заработная плата возрастает в среднем на 0,98 руб. (или 98 коп.).
2. Тесноту линейной связи оценит коэффициент корреляции:
Значение коэффициента корреляции 0,61, говорит о наличии заметной линейной связи между признаками.
Коэффициент детерминации:
Это означает, что 37,2% вариации заработной платы (y) объясняется вариацией фактора x – среднедушевого прожиточного минимума.
Качество модели определяет средняя ошибка аппроксимации:
Качество построенной модели оценивается как хорошее, так как A не превышает 10%.
3. Оценку статистической значимости уравнения регрессии в целом проведем с помощью F -критерия Фишера. Фактическое значение F -критерия составит:
.
Табличное значение критерия при пятипроцентном уровне значимости и степенях свободы k1 =1 и k2 =12 - 2 =10 составляет Fтабл = 4,96. Так как Fфакт=5,92> Fтабл = 4,96, то уравнение регрессии признается статистически значимым.
Оценку статистической значимости параметров регрессии и корреляции проведем с помощью t -статистики Стьюдента и путем расчета доверительного интервала каждого из параметров.
Табличное значение t -критерия для числа степеней свободы df =n-2=12-2=10 и уровня значимости a=0,05 составит tтабл = 2,23.
Определим стандартные ошибки (остаточная дисперсия на одну степень свободы ):
Тогда
Фактические значения t –статистики и
превосходят табличные значение поэтому статистически значимы. Фактическое значение t –статистики меньше табличного поэтому статистически незначимо.
Рассчитаем доверительные
интервалы для параметров регрессии
a и b. Для этого определим предельную
ошибку для каждого показателя:
Доверительные
интервалы
Анализ верхней
и нижней границ доверительных интервалов
приводит к выводу о том, что с вероятностью
p =1-a = 0,95 параметр b, находясь в указанных
границах, не принимают нулевых значений,
т.е. являются статистически значимыми
и существенно отличны от нуля.
4. Полученные оценки уравнения регрессии позволяют использовать его для прогноза. Если прогнозное значение прожиточного минимума составит:
тогда индивидуальное прогнозное значение заработной платы составит:
= 71,472+0,9793*91,6=161,1 руб.
5. Ошибка прогноза составит:
Предельная ошибка прогноза, которая в 95% случаев не будет превышена, составит:
Доверительный интервал прогноза:
Выполненный прогноз
среднемесячной заработной платы является
надежным ( p =1-a =1- 0,05 = 0,95) и находится
в пределах от 125,42 руб до 196,78 руб.
Задача
№3
По 30 территориям России имеются данные, представленные в табл. 3.
Таблица 3
Признак | Среднее значение | Среднее квадратическое отклонение | Линейный коэффициент парной корреляции |
Среднедневной душевой доход, руб., z | 91,8 | 8,44 | |
Среднедневная заработная плата одного работающего, руб., x | 51,9 | 10,86 | |
Средний возраст безработного, лет, y | 36,5 | -2,42 |
Требуется:
1.
Построить уравнение
2.
Рассчитать линейные
3.
Рассчитать общий и частные
F-критерии Фишера.
Решение:
1.
Линейное уравнение множественной регрессии
z от x и y имеет вид:
Для
расчета его параметров применим
метод стандартизации переменных и
построим искомое уравнение в стандартизованном
масштабе:
Расчет
β - коэффициентов выполним по формулам:
Получим
уравнение множественной
или
Для построения уравнения естественной форме рассчитаем и , используя формулы для перехода от к :
Значение
а определим из соотношения:
Следовательно,
уравнение множественной
Для
характеристики относительной силы
влияния x и y
на z рассчитаем средние коэффициенты
эластичности:
С
увеличением средней заработной
платы x на 1% от ее среднего уровня
средний душевой доход z возрастает
на 0,385% от своего среднего уровня; при
повышении среднего возраста безработного
y на 1% среднедушевой доход z увеличивается
на 0,229% от своего среднего уровня. Очевидно,
что сила влияния средней заработной платы
x на средний душевой доход z оказалась
большей, чем сила влияния среднего возраста
безработного y. К аналогичным выводам
о силе связи приходим при сравнении модулей
значений
и
:
Различия
в силе влияния фактора на результат,
полученные при сравнении
,
и
, объясняются тем, что коэффициент
эластичности исходит из соотношения
средних, а β – коэффициент - из соотношения
средних квадратических отклонений.
2.
Линейные коэффициенты частной корреляции
рассчитаем по рекуррентной формуле:
Если
сравнить значения коэффициентов парной
и частной корреляции, то приходим к
выводу, что из-за слабой межфакторной
связи (
) коэффициенты парной и частной корреляции
отличаются незначительно: выводы о тесноте
и направлении связи на основе коэффициентов
парной и частной корреляции совпадают:
Расчет
линейного коэффициента множественной
корреляции выполним по формуле:
Зависимость
z от x и y характеризуется как
умеренная, в которой 46,8% (
) вариации среднего душевого дохода
определяются вариацией учтенных в модели
факторов: средней заработной платы и
среднего возраста безработного. Прочие
факторы, не включенные в модель, составляют
соответственно 53,2% (т.к. 100%-72%) от общей
вариации z.
3.
Общий F-критерий Фишера проверяет
гипотезу
о статистической значимости уравнения
регрессии и показателя тесноты статистической
связи (
):
По таблице значений F-критерий Фишера при уровне значимости , и степенях свободы .
Сравнивая
и
, приходим к выводу о необходимости
отклонить гипотезу
, так как
<
. Делаем заключение с вероятностью
о статистической значимости уравнения
регрессии в целом и показателя тесноты
связи
, которые сформировались под неслучайным
воздействием факторов x.