Предмет и методы статистики

Автор: Пользователь скрыл имя, 12 Апреля 2012 в 11:25, лекция

Краткое описание

1. Что означает термин «статистика»
Статистика - (от итал. stato - государство ) - англ. statistics; нем. Statistik. 1. Наука , изучающая количественную сторону массовых явлений. 2. Совокупность упорядоченных, классифицированных данных о к.-л. массовом явлении или процессе .
2. Кто ввел в науку термин «статистика»
В науку термин «статистика» ввел немецкий ученый Готфрид Ахенваль в 1746 году

Файлы: 1 файл

Предмет и методы статистики.doc

— 1,005.50 Кб (Скачать)

 

2.Какие основные задачи решают с помощью корреляционного и регрессионного анализа?

1. Обнаружение корреляционной зависимости и выявление формы связи.

2. Установление количественных оценок тесноты связи, характеризующих силу

влияния факторных признаков на результативные.

 

3.В чем состоит значение уравнения регрессии

Корреляционно-регрессионный анализ (КРА) заключается в построении и

анализе статистической модели в виде уравнения регрессии (уравнение

корреляционной связи), приближенно выражающей зависимость результативного

признака от одного или нескольких факторных признаков и в оценке степени

тесноты связи.

4.Что характеризуют коэффициентной регрессии

Изучение связи

между тремя и более связанными между собой признаками наз-ся множественной

(многофакторной) регрессии.

После построения регрессионной модели с помощью корреляционного анализа

осуществляют проверку адекватности полученной модели. Адекватную модель

экономически интерпретируют. Проверка адекватности моделей начинается с

проверки значимости каждого коэффициента регрессии с помощью t-критерия

Стьюдента. Проверка адекватности всей модели осуществляется с помощью

расчета F-критерия и величины средней ошибки аппроксимации.

Средняя ошибка аппроксимации определяется по формуле:

    

где - это линейные

отклонения абсолютных величин эмпирических и выровненных данных.

Значение средней ошибки не должно превышать 12-15%.

После проверки адекватности, установления точности и надежности построенной

модели её необходимо проанализировать. Для этого используют след показатели:

1. Частные коэффициенты эластичности

     , где

     а1 – коэффициент регрессии при соответствующем факторном признаке;

     - среднее значение соответствующего факторного признака;

     - среднее значение результативного признака.

Коэффициент эластичности показывает на сколько процентов в среднем изменится

значение результативного признака при изменении факторного признака на 1%.

2. Для определения тесноты связи между признаками при линейной форме связи

используется показатель линейный коэффициент корреляции.

    

Линейный коэффициент корреляции изменяется в пределах от -1 до 1. По этому

показателю можно сделать след выводы:

а) о направлении связи (если -1 < r < 0, то связь обратная,  если 0 < r

< 1, то связь прямая);

б) определить тесноту связи.

     Квадрат линейного коэффициента корреляции (линейный коэффициент детерминации)

показывает на сколько процентов вариация результативного признака объясняется

вариацией факторного признака.

Для измерения тесноты связи при множественной корреляционной зависимости

рассчитываются множественный коэффициент корреляции и частные коэффициенты

корреляции.

     Корреляционно-регрессионный анализ (КРА) заключается в построении и

анализе статистической модели в виде уравнения регрессии (уравнение

корреляционной связи), приближенно выражающей зависимость результативного

признака от одного или нескольких факторных признаков и в оценке степени

тесноты связи.

 

5.Определите понятие множественной регрессии

Общее назначение множественной регрессии (этот термин был впервые использован в работе Пирсона - Pearson, 1908) состоит в анализе связи между несколькими независимыми переменными (называемыми также регрессорами или предикторами) и зависимой переменной. 

 

6.Произвести расчет коэффициентов корреляции

Коэффициент корреляции (КК) - важный показатель показывающий взаимосвязь между двумя наборами данных. ККК может принимать значения от -1 до 1. Отрицательный КК показывает что данные взаимосвязанно расходятся, при возрастании значений одних из них значения другой убывают, положительный - что данные взаимосвязанно растут, 0 и близкие значения говорят о том, что данные не связаны друг с другом. Следует помнить, что КК неисключительный математический показатель, который может не иметь никаких связей с реальной ситуацией, так же возможна ситуация, когда 2 набора данных не связаны между собой, но сильно коррелируют через третий набор (т.н. условная корреляция) и т.д.

Формула, по которой вычисляется коэффициент линейной корреляции:

 

 

Задача 1. В приведенном ниже балансе движения товаров за год (тыс. тенге) исчислите недостающие показатели:

Решение:

Товар А:

Остаток на конец года:

80+250-50-180=100

Товар Б:

Поступление:

50+300+600-100 = 850

Товар В:

Продано в розницу:

70+400-100-100 = 270

 

Задача 2. Исчислите коэффициент взаимной сопряженности на основе следующего распределения 300 студентов по оценкам на экзаменах по политической экономии и экономической статистике.

Решение:

Коэффициент взаимной сопряженности Пирсона определяется по формуле

где φ - показатель средней квадратической сопряженности:

φ2 =

1,011

Кп=0,71

Связь между признаками достаточно сильная.

 

Задача 3. Имеются следующие данные по 27 заводам о стоимости основных фондов (x) и выпуске продукции (y), млрд. тенге.

Исчислите коэффициент корреляции рангов. Полагая, что связь линейная, определите уравнение связи и линейный коэффициент корреляции. Сделайте выводы о связи и объясните смысл коэффициента регрессии.

Решение:

Расчет ведется по формуле Спирмена

Проставим ранги у исходных данных

Ранг по Х

Ранг по У

d=px-pу

d2

1

1

0

0

2

3

-1

1

3

4

-1

1

4

2

2

4

5

5

0

0

6

7

-1

1

7

6

1

1

8

8

0

0

9

11

-2

4

10

9

1

1

11

10

1

1

12

15

-3

9

13

12

1

1

14

14

0

0

15

13

2

4

16

16

0

0

17

17

0

0

18

18

0

0

19

20

-1

1

20

19

1

1

21

21

0

0

22

23

-1

1

23

24

-1

1

24

22

2

4

25

25

0

0

26

26

0

0

27

27

0

0

 

 

 

36

 

= 0,98

Для определения по данным парной корреляции параметров прямолинейной регрессии вида Y=a0+a1*x решается система нормальных уравнений:

a0*n+a1*∑x=∑y

a0*∑x+a1*∑x2=∑x*y

Тогда параметры уравнения можно найти по формулам:

a0=

∑y*∑x2 - ∑x*y*∑x

 

 

 

n*∑x2 - (∑x)2

 

 

 

a1=

n*∑x*y - ∑x*∑y

 

 

 

n*∑x2 - (∑x)2

 

 

 

Расчеты представим в таблице:

n

х

у

х2

у2

х*у

1

6

3

36

9

18

2

8

4

64

16

32

3

9

4

81

16

36

4

9

3

81

9

27

5

10

5

100

25

50

6

10

7

100

49

70

7

11

6

121

36

66

8

11

8

121

64

88

9

11

10

121

100

110

10

12

9

144

81

108

11

13

9

169

81

117

12

14

12

196

144

168

13

14

10

196

100

140

14

14

11

196

121

154

15

15

10

225

100

150

16

15

12

225

144

180

17

17

13

289

169

221

18

18

15

324

225

270

19

18

16

324

256

288

20

20

15

400

225

300

21

21

17

441

289

357

22

22

18

484

324

396

23

23

19

529

361

437

24

23

17

529

289

391

25

24

20

576

400

480

26

25

22

625

484

550

27

25

21

625

441

525

418

316

7322

4558

5729

 

Тогда а0= -3,53; а1= 0,98

Уравнение корреляционной связи имеет  вид:

Y=0,98*х-3,53

Для изучения тесноты связи используем линейный коэффициент корреляции:

=0,978

Таким образом, степень тесноты связи исчисленная обоими методами достаточно высокая, так как r>0,9.

 

Задача 4. Имеются следующие данные о стаже работы (лет, x) рабочих одного из заводов и выработке одного рабочего за смену (шт., y):

Считая, что связь линейная, исчислите уравнение корреляционной связи между стажем работы и выработкой, а также линейный коэффициент корреляции.

Решение:

Для определения по данным парной корреляции параметров прямолинейной регрессии вида Y=a0+a1*x решается система нормальных уравнений:

a0*n+a1*∑x=∑y

a0*∑x+a1*∑x2=∑x*y

Тогда параметры уравнения можно найти по формулам:

a0=

∑y*∑x2 - ∑x*y*∑x

 

 

 

n*∑x2 - (∑x)2

 

 

 

a1=

n*∑x*y - ∑x*∑y

 

 

 

n*∑x2 - (∑x)2

 

 

 

Расчеты представим в таблице:

n

х

у

х2

у2

х*у

1

1

50

1

2500

50

2

2

55

4

3025

110

3

3

54

9

2916

162

4

4

58

16

3364

232

5

5

62

25

3844

310

6

6

63

36

3969

378

7

7

65

49

4225

455

8

8

68

64

4624

544

9

10

68

100

4624

680

10

12

70

144

4900

840

11

15

72

225

5184

1080

73

685

673

43175

4841

Информация о работе Предмет и методы статистики