Автор: Пользователь скрыл имя, 12 Апреля 2012 в 11:25, лекция
1. Что означает термин «статистика»
Статистика - (от итал. stato - государство ) - англ. statistics; нем. Statistik. 1. Наука , изучающая количественную сторону массовых явлений. 2. Совокупность упорядоченных, классифицированных данных о к.-л. массовом явлении или процессе .
2. Кто ввел в науку термин «статистика»
В науку термин «статистика» ввел немецкий ученый Готфрид Ахенваль в 1746 году
2.Какие основные задачи решают с помощью корреляционного и регрессионного анализа?
1. Обнаружение корреляционной зависимости и выявление формы связи.
2. Установление количественных оценок тесноты связи, характеризующих силу
влияния факторных признаков на результативные.
3.В чем состоит значение уравнения регрессии
Корреляционно-регрессионный анализ (КРА) заключается в построении и
анализе статистической модели в виде уравнения регрессии (уравнение
корреляционной связи), приближенно выражающей зависимость результативного
признака от одного или нескольких факторных признаков и в оценке степени
тесноты связи.
4.Что характеризуют коэффициентной регрессии
Изучение связи
между тремя и более связанными между собой признаками наз-ся множественной
(многофакторной) регрессии.
После построения регрессионной модели с помощью корреляционного анализа
осуществляют проверку адекватности полученной модели. Адекватную модель
экономически интерпретируют. Проверка адекватности моделей начинается с
проверки значимости каждого коэффициента регрессии с помощью t-критерия
Стьюдента. Проверка адекватности всей модели осуществляется с помощью
расчета F-критерия и величины средней ошибки аппроксимации.
Средняя ошибка аппроксимации определяется по формуле:
где - это линейные
отклонения абсолютных величин эмпирических и выровненных данных.
Значение средней ошибки не должно превышать 12-15%.
После проверки адекватности, установления точности и надежности построенной
модели её необходимо проанализировать. Для этого используют след показатели:
1. Частные коэффициенты эластичности
, где
а1 – коэффициент регрессии при соответствующем факторном признаке;
- среднее значение соответствующего факторного признака;
- среднее значение результативного признака.
Коэффициент эластичности показывает на сколько процентов в среднем изменится
значение результативного признака при изменении факторного признака на 1%.
2. Для определения тесноты связи между признаками при линейной форме связи
используется показатель линейный коэффициент корреляции.
Линейный коэффициент корреляции изменяется в пределах от -1 до 1. По этому
показателю можно сделать след выводы:
а) о направлении связи (если -1 < r < 0, то связь обратная, если 0 < r
< 1, то связь прямая);
б) определить тесноту связи.
Квадрат линейного коэффициента корреляции (линейный коэффициент детерминации)
показывает на сколько процентов вариация результативного признака объясняется
вариацией факторного признака.
Для измерения тесноты связи при множественной корреляционной зависимости
рассчитываются множественный коэффициент корреляции и частные коэффициенты
корреляции.
Корреляционно-регрессионный анализ (КРА) заключается в построении и
анализе статистической модели в виде уравнения регрессии (уравнение
корреляционной связи), приближенно выражающей зависимость результативного
признака от одного или нескольких факторных признаков и в оценке степени
тесноты связи.
5.Определите понятие множественной регрессии
Общее назначение множественной регрессии (этот термин был впервые использован в работе Пирсона - Pearson, 1908) состоит в анализе связи между несколькими независимыми переменными (называемыми также регрессорами или предикторами) и зависимой переменной.
6.Произвести расчет коэффициентов корреляции
Коэффициент корреляции (КК) - важный показатель показывающий взаимосвязь между двумя наборами данных. ККК может принимать значения от -1 до 1. Отрицательный КК показывает что данные взаимосвязанно расходятся, при возрастании значений одних из них значения другой убывают, положительный - что данные взаимосвязанно растут, 0 и близкие значения говорят о том, что данные не связаны друг с другом. Следует помнить, что КК неисключительный математический показатель, который может не иметь никаких связей с реальной ситуацией, так же возможна ситуация, когда 2 набора данных не связаны между собой, но сильно коррелируют через третий набор (т.н. условная корреляция) и т.д.
Формула, по которой вычисляется коэффициент линейной корреляции:
Задача 1. В приведенном ниже балансе движения товаров за год (тыс. тенге) исчислите недостающие показатели:
Решение:
Товар А:
Остаток на конец года:
80+250-50-180=100
Товар Б:
Поступление:
50+300+600-100 = 850
Товар В:
Продано в розницу:
70+400-100-100 = 270
Задача 2. Исчислите коэффициент взаимной сопряженности на основе следующего распределения 300 студентов по оценкам на экзаменах по политической экономии и экономической статистике.
Решение:
Коэффициент взаимной сопряженности Пирсона определяется по формуле
где φ - показатель средней квадратической сопряженности:
φ2 =
1,011
Кп=0,71
Связь между признаками достаточно сильная.
Задача 3. Имеются следующие данные по 27 заводам о стоимости основных фондов (x) и выпуске продукции (y), млрд. тенге.
Исчислите коэффициент корреляции рангов. Полагая, что связь линейная, определите уравнение связи и линейный коэффициент корреляции. Сделайте выводы о связи и объясните смысл коэффициента регрессии.
Решение:
Расчет ведется по формуле Спирмена
Проставим ранги у исходных данных
Ранг по Х | Ранг по У | d=px-pу | d2 |
1 | 1 | 0 | 0 |
2 | 3 | -1 | 1 |
3 | 4 | -1 | 1 |
4 | 2 | 2 | 4 |
5 | 5 | 0 | 0 |
6 | 7 | -1 | 1 |
7 | 6 | 1 | 1 |
8 | 8 | 0 | 0 |
9 | 11 | -2 | 4 |
10 | 9 | 1 | 1 |
11 | 10 | 1 | 1 |
12 | 15 | -3 | 9 |
13 | 12 | 1 | 1 |
14 | 14 | 0 | 0 |
15 | 13 | 2 | 4 |
16 | 16 | 0 | 0 |
17 | 17 | 0 | 0 |
18 | 18 | 0 | 0 |
19 | 20 | -1 | 1 |
20 | 19 | 1 | 1 |
21 | 21 | 0 | 0 |
22 | 23 | -1 | 1 |
23 | 24 | -1 | 1 |
24 | 22 | 2 | 4 |
25 | 25 | 0 | 0 |
26 | 26 | 0 | 0 |
27 | 27 | 0 | 0 |
|
|
| 36 |
= 0,98
Для определения по данным парной корреляции параметров прямолинейной регрессии вида Y=a0+a1*x решается система нормальных уравнений:
a0*n+a1*∑x=∑y
a0*∑x+a1*∑x2=∑x*y
Тогда параметры уравнения можно найти по формулам:
a0= | ∑y*∑x2 - ∑x*y*∑x |
|
|
|
n*∑x2 - (∑x)2 |
|
|
| |
a1= | n*∑x*y - ∑x*∑y |
|
|
|
n*∑x2 - (∑x)2 |
|
|
|
Расчеты представим в таблице:
n | х | у | х2 | у2 | х*у |
1 | 6 | 3 | 36 | 9 | 18 |
2 | 8 | 4 | 64 | 16 | 32 |
3 | 9 | 4 | 81 | 16 | 36 |
4 | 9 | 3 | 81 | 9 | 27 |
5 | 10 | 5 | 100 | 25 | 50 |
6 | 10 | 7 | 100 | 49 | 70 |
7 | 11 | 6 | 121 | 36 | 66 |
8 | 11 | 8 | 121 | 64 | 88 |
9 | 11 | 10 | 121 | 100 | 110 |
10 | 12 | 9 | 144 | 81 | 108 |
11 | 13 | 9 | 169 | 81 | 117 |
12 | 14 | 12 | 196 | 144 | 168 |
13 | 14 | 10 | 196 | 100 | 140 |
14 | 14 | 11 | 196 | 121 | 154 |
15 | 15 | 10 | 225 | 100 | 150 |
16 | 15 | 12 | 225 | 144 | 180 |
17 | 17 | 13 | 289 | 169 | 221 |
18 | 18 | 15 | 324 | 225 | 270 |
19 | 18 | 16 | 324 | 256 | 288 |
20 | 20 | 15 | 400 | 225 | 300 |
21 | 21 | 17 | 441 | 289 | 357 |
22 | 22 | 18 | 484 | 324 | 396 |
23 | 23 | 19 | 529 | 361 | 437 |
24 | 23 | 17 | 529 | 289 | 391 |
25 | 24 | 20 | 576 | 400 | 480 |
26 | 25 | 22 | 625 | 484 | 550 |
27 | 25 | 21 | 625 | 441 | 525 |
∑ | 418 | 316 | 7322 | 4558 | 5729 |
Тогда а0= -3,53; а1= 0,98
Уравнение корреляционной связи имеет вид:
Y=0,98*х-3,53
Для изучения тесноты связи используем линейный коэффициент корреляции:
=0,978
Таким образом, степень тесноты связи исчисленная обоими методами достаточно высокая, так как r>0,9.
Задача 4. Имеются следующие данные о стаже работы (лет, x) рабочих одного из заводов и выработке одного рабочего за смену (шт., y):
Считая, что связь линейная, исчислите уравнение корреляционной связи между стажем работы и выработкой, а также линейный коэффициент корреляции.
Решение:
Для определения по данным парной корреляции параметров прямолинейной регрессии вида Y=a0+a1*x решается система нормальных уравнений:
a0*n+a1*∑x=∑y
a0*∑x+a1*∑x2=∑x*y
Тогда параметры уравнения можно найти по формулам:
a0= | ∑y*∑x2 - ∑x*y*∑x |
|
|
|
n*∑x2 - (∑x)2 |
|
|
| |
a1= | n*∑x*y - ∑x*∑y |
|
|
|
n*∑x2 - (∑x)2 |
|
|
|
Расчеты представим в таблице:
n | х | у | х2 | у2 | х*у |
1 | 1 | 50 | 1 | 2500 | 50 |
2 | 2 | 55 | 4 | 3025 | 110 |
3 | 3 | 54 | 9 | 2916 | 162 |
4 | 4 | 58 | 16 | 3364 | 232 |
5 | 5 | 62 | 25 | 3844 | 310 |
6 | 6 | 63 | 36 | 3969 | 378 |
7 | 7 | 65 | 49 | 4225 | 455 |
8 | 8 | 68 | 64 | 4624 | 544 |
9 | 10 | 68 | 100 | 4624 | 680 |
10 | 12 | 70 | 144 | 4900 | 840 |
11 | 15 | 72 | 225 | 5184 | 1080 |
∑ | 73 | 685 | 673 | 43175 | 4841 |