Модель множественной линейной регрессии

Автор: Пользователь скрыл имя, 03 Апреля 2014 в 10:48, контрольная работа

Краткое описание

Необходимо провести анализ исходных данных, предоставленных агентством недвижимости «Дом-Юг» и установить влияет ли площадь квартир на их стоимость. Для проведения исследований воспользуемся пакетом прикладных программ Microsoft Office, а именно пакетом Microsoft Excel и Statistica 10.

Файлы: 1 файл

Множественная регрессия.docx

— 182.88 Кб (Скачать)

 

 

МИНОБРНАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ

 
 
 

Федеральное государственное автономное образовательное

учреждение высшего профессионального образования

«Южный федеральный университет»

 
 
 

Экономический факультет

Кафедра экономической кибернетики

 
 
 

Петринич Андрея Андреевича

 
 
 

МОДЕЛЬ МНОЖЕСТВЕННОЙ ЛИНЕЙНОЙ РЕГРЕССИИ

 
     
 

Научный руководитель-

д.э.н. Шаль Анна Викторовна

 
     
 

 

Ростов-на-Дону

2014

 



 

 

 

 

 

 

 

Имеются данные по 20 объектам недвижимости г. Ростова-на-Дону, а так же факторы влияющие на стоимость квартир:

Необходимо провести анализ исходных данных, предоставленных агентством недвижимости «Дом-Юг» и установить влияет ли площадь квартир на их стоимость. Для проведения исследований воспользуемся пакетом прикладных программ Microsoft Office, а именно пакетом Microsoft Excel и Statistica 10.

Таблица 1-Исходные данные

N

Общая площадь

Жилая площадь

Расстояние до остановки минуты

Этаж

Число комнат

Тип дома

Стоимость

X1

X2

X3

X4

X5

X6

Y

1

26

14

3

5

1

1

1680

2

64

47

8

1

5

1

3350

3

44

23

18

9

1

0

2100

4

60

42

28

4

3

1

3200

5

43

29

8

2

2

1

2600

6

100

65

8

4

3

1

3800

7

39

20

7

7

1

0

2300

8

40

30

5

5

2

1

2800

9

60

31

7

1

2

0

4100

10

39

19

10

3

1

0

2300

11

76

45

5

3

3

1

6500

12

65

35

8

1

2

1

5000

13

65

43

5

4

3

1

4700

14

61

52

5

1

3

1

4800

15

47

27

15

1

2

1

2350

16

71

50

20

4

3

1

3000

17

34

14

12

4

1

1

1950

18

39

19

6

5

1

0

2550

19

37

16

13

3

1

1

2700

20

27

14

9

10

1

0

2200

21

50

34

7

4

2

1

2700

22

39

17

11

11

1

1

2300

23

82

60

15

3

3

0

4700

24

32

17

9

3

1

1

2750

25

92

54

10

4

4

0

4500

26

64

40

17

6

3

0

3600

27

78

49

12

5

4

1

3800

28

43

29

14

4

2

1

3000

29

46

34

25

1

2

1

2200

30

23

17

4

2

1

1

1550

31

63

48

8

1

3

0

3100

32

65

41

12

6

3

0

5000

33

55

31

9

8

2

0

4100

34

25

19

20

1

1

1

1900

35

100

60

11

5

3

1

5700

36

53

30

5

5

2

1

2000


 

1.Предварительный анализ

Теперь на основании исходных данных найдем статистические показатели.

Y- стоимость квартиры

X1- общая площадь квартиры

X2- жилая площадь квартиры

X3- время до ближайшей остановки

X4- этаж, на котором расположена квартира

X5- число комнат в квартире

X6- тип дома, в котором находится квартира (1-кирпичный, 0-другой)

 

Таблица 2-Статистические показатели

Показатель

X1

X2

X3

X4

X5

X6

Y

Максимум

100

65

28

11

5

1

6500

Среднее значение

54,08

33,75

10,81

4,06

2,17

0,67

3246,67

Минимум

23

14

3

1

1

0

1550

Медиана

51,5

31

9

4

2

1

2900

Мода

39

14

8

1

1

1

2300

Дисперсия

418,02

221,85

34,39

6,68

1,11

0,23

1503914,29

Дисперсия для ген. совокупности

406,41

215,69

33,43

6,50

1,08

0,22

1462138,89

Квадратичное отклонение

14630,75

7764,75

1203,64

233,89

39

8

52637000

Среднеквадратичное отклонение

16,75

12,51

4,50

1,9

0,87

0,44

1010,93


 

1)X1- общая площадь квартиры

Максимальное значение площади квартиры из предоставленной выборки равна 100 м2.

Среднее значение площади квартиры из предоставленной выборки равна 54,08 м2.

Минимальное значение площади квартиры из предоставленной выборки равна 23 м2.

Наиболее частым встречающимся значением по этому фактору равно 39 м2, это говорит о том, что встречаются квартиры со сходными площадями. Что касается медианы, то половина площадей квартир не превышают 51,5 м2, а другая половина превышает.

 

2)X2- жилая площадь квартиры

Максимальное значение жилой площади квартиры из предоставленной выборки равна 65 м2.

Среднее значение жилой площади квартиры из предоставленной выборки равна 33,75 м2.

Минимальное значение жилой площади квартиры из предоставленной выборки равна 14  м2.

Наиболее частым встречающимся значением по этому фактору равно 14м2, это говорит о том, что встречаются квартиры со сходными площадями. Что касается медианы, то половина площадей квартир не превышают 31 м2, а другая половина превышает.

 

3)X3- время до ближайшей остановки

Максимальное время, затраченное на путь до остановки равно 28 минут.

Средне время, затраченное на путь до остановки равно 11 минут.

Минимальное время, затраченное на путь до остановки равно 3 минуты.

Наиболее частым встречающимся значением по этому фактору равно 8 минут, это говорит о том, что встречаются квартиры, которые находятся на одинаковом расстоянии от остановки. Что касается медианы, то половина квартир находится на расстоянии, преодоление которого не превышает 9 минут, а другая половина превышает.

 

4)X4- этаж, на котором расположена квартира

Квартира расположенная на 11 этаже имеет наибольшее значение по этому фактору из представленной выборки.

Квартира расположенная на 4 этаже имеет среднее значение по этому фактору из представленной выборки.

Квартира расположенная на 1 этаже имеет наименьшее значение по этому фактору из представленной выборки.

Чаше всего квартиры расположены на 1 этаже. Что касается медианы, то половина квартир находится в пределах от 1-4 этажа, а другая половина превышает.

 

5)X5- число комнат в квартире

Наибольшее количество комнат в квартире 5.

Среднее количество комнат в квартире 2.

Наименьшее количество комнат в квартире 1.

Чаще всего встречаются однокомнатные квартиры. Что касается медианы, то половина квартир не превышают порог 2 комнат по количеству, остальные имеют большее количество.

 

6)X6- тип дома, в котором находится квартира (1-кирпичный, 0-другой)

Чаще всего встречаются кирпичные дома. Что касается медианы, то половина квартир находится в кирпичном доме, а другие квартиры находятся в домах другого типа.

 

На основе исходных данных построим гистограмму, которая показывает отношение факторов.

Рисунок 1-Отношение факторов.

Рисунок 2-Отношение стоимостей квартир

Теперь построим поле корреляции на основе исходных данных.

Рисунок 3-Поле корреляции

 

Для нахождения частных коэффициентов корреляции воспользуемся надстройкой «Анализ данных» в прикладном пакете программ Microsoft Office 2010, а именно Microsoft Excel 2010.

Таблица 3-Матрица частных и парных коэффициентов корреляции

 

Y

X1

X2

X3

X4

X5

X6

Y

1

0.79

0.73

-0.14

-0.14

0.64

-0.0775

X1

0.79

1

0.94

0.0478

-0.12

0.81

-0.0585

X2

0.73

0.94

1

0.093

-0.24

0.87

0.0201

X3

-0.14

0.0478

0.093

1

-0.0143

0.07

0.017

X4

-0.14

-0.12

-0.24

-0.0143

1

-0.27

-0.33

X5

0.64

0.81

0.87

0.07

-0.27

1

0.0566

X6

-0.0775

-0.0585

0.0201

0.017

-0.33

0.0566

1


Исходя из полученных данных, можно сделать следующие выводы:

  1. X1- общая площадь квартиры/ Y- стоимость квартиры

,79 – это говорит о  том, характер связи между переменной X1 и Y сильный, следовательно, общая площадь квартиры влияет на ее стоимость.

  1. X2- жилая площадь квартиры/ Y- стоимость квартиры

,73 – это говорит о том, характер связи между переменной X2 и Y сильный, следовательно, жилая площадь квартиры влияет на ее стоимость.

  1. X3- время до ближайшей остановки/ Y- стоимость квартиры

,14 – это говорит о том, характер связи между переменной X3 и Y слабый, следовательно, расстояние до остановки не влияет на ее стоимость.

  1. X4- этаж, на котором расположена квартира/ Y- стоимость квартиры

,14 – это говорит о том, характер связи между переменной X4 и Y слабый, следовательно, этаж, на котором находится квартира, не влияет на стоимость.

  1. X5- число комнат в квартире/ Y- стоимость квартиры

,64 – это говорит о том, характер связи между переменной X5 и Y сильный, следовательно, число квартиры влияет на ее стоимость.

  1. X6- тип дома, в котором находится квартира / Y- стоимость квартиры

,0775 – это говорит о том, характер связи между переменной X6 и Y, следовательно, тип дома не влияет на стоимость квартиры.

 

Для отбора наиболее значимых факторов xi учитываются следующие условия:

- связь между результативным признаком  и факторным должна быть выше  межфакторной связи;

- связь между факторами должна  быть не более 0.7. Если в матрице  есть межфакторный коэффициент корреляции rxjxi > 0.7, то в данной модели множественной регрессии существует мультиколлинеарность.;

- при высокой межфакторной связи признака отбираются факторы с меньшим коэффициентом корреляции между ними.

В нашем случае rx1 x2 , rx1 x5 , rx2 x5 имеют |r|>0.7, что говорит о мультиколлинеарности факторов и о необходимости исключения одного из них из дальнейшего анализа.

Анализ первой строки этой матрицы позволяет произвести отбор факторных признаков, которые могут быть включены в модель множественной корреляционной зависимости. Факторные признаки, у которых |ryxi| < 0.5 исключают из модели. Можно дать следующую качественную интерпретацию возможных значений коэффициента корреляции если |r|>0.3 – связь практически отсутствует; 0.3 ≤ |r| ≤ 0.7 - связь средняя; 0.7 ≤ |r| ≤ 0.9 – связь сильная; |r| > 0.9  – связь весьма сильная.

Информация о работе Модель множественной линейной регрессии