Автор: Пользователь скрыл имя, 03 Апреля 2014 в 10:48, контрольная работа
Необходимо провести анализ исходных данных, предоставленных агентством недвижимости «Дом-Юг» и установить влияет ли площадь квартир на их стоимость. Для проведения исследований воспользуемся пакетом прикладных программ Microsoft Office, а именно пакетом Microsoft Excel и Statistica 10.
МИНОБРНАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ |
||||
Федеральное государственное автономное образовательное учреждение высшего профессионального образования «Южный федеральный университет» |
||||
Экономический факультет Кафедра экономической кибернетики |
||||
Петринич Андрея Андреевича |
||||
МОДЕЛЬ МНОЖЕСТВЕННОЙ ЛИНЕЙНОЙ РЕГРЕССИИ |
||||
Научный руководитель- д.э.н. Шаль Анна Викторовна |
||||
Ростов-на-Дону 2014 |
Имеются данные по 20 объектам недвижимости г. Ростова-на-Дону, а так же факторы влияющие на стоимость квартир:
Необходимо провести анализ исходных данных, предоставленных агентством недвижимости «Дом-Юг» и установить влияет ли площадь квартир на их стоимость. Для проведения исследований воспользуемся пакетом прикладных программ Microsoft Office, а именно пакетом Microsoft Excel и Statistica 10.
Таблица 1-Исходные данные
N |
Общая площадь |
Жилая площадь |
Расстояние до остановки минуты |
Этаж |
Число комнат |
Тип дома |
Стоимость |
X1 |
X2 |
X3 |
X4 |
X5 |
X6 |
Y | |
1 |
26 |
14 |
3 |
5 |
1 |
1 |
1680 |
2 |
64 |
47 |
8 |
1 |
5 |
1 |
3350 |
3 |
44 |
23 |
18 |
9 |
1 |
0 |
2100 |
4 |
60 |
42 |
28 |
4 |
3 |
1 |
3200 |
5 |
43 |
29 |
8 |
2 |
2 |
1 |
2600 |
6 |
100 |
65 |
8 |
4 |
3 |
1 |
3800 |
7 |
39 |
20 |
7 |
7 |
1 |
0 |
2300 |
8 |
40 |
30 |
5 |
5 |
2 |
1 |
2800 |
9 |
60 |
31 |
7 |
1 |
2 |
0 |
4100 |
10 |
39 |
19 |
10 |
3 |
1 |
0 |
2300 |
11 |
76 |
45 |
5 |
3 |
3 |
1 |
6500 |
12 |
65 |
35 |
8 |
1 |
2 |
1 |
5000 |
13 |
65 |
43 |
5 |
4 |
3 |
1 |
4700 |
14 |
61 |
52 |
5 |
1 |
3 |
1 |
4800 |
15 |
47 |
27 |
15 |
1 |
2 |
1 |
2350 |
16 |
71 |
50 |
20 |
4 |
3 |
1 |
3000 |
17 |
34 |
14 |
12 |
4 |
1 |
1 |
1950 |
18 |
39 |
19 |
6 |
5 |
1 |
0 |
2550 |
19 |
37 |
16 |
13 |
3 |
1 |
1 |
2700 |
20 |
27 |
14 |
9 |
10 |
1 |
0 |
2200 |
21 |
50 |
34 |
7 |
4 |
2 |
1 |
2700 |
22 |
39 |
17 |
11 |
11 |
1 |
1 |
2300 |
23 |
82 |
60 |
15 |
3 |
3 |
0 |
4700 |
24 |
32 |
17 |
9 |
3 |
1 |
1 |
2750 |
25 |
92 |
54 |
10 |
4 |
4 |
0 |
4500 |
26 |
64 |
40 |
17 |
6 |
3 |
0 |
3600 |
27 |
78 |
49 |
12 |
5 |
4 |
1 |
3800 |
28 |
43 |
29 |
14 |
4 |
2 |
1 |
3000 |
29 |
46 |
34 |
25 |
1 |
2 |
1 |
2200 |
30 |
23 |
17 |
4 |
2 |
1 |
1 |
1550 |
31 |
63 |
48 |
8 |
1 |
3 |
0 |
3100 |
32 |
65 |
41 |
12 |
6 |
3 |
0 |
5000 |
33 |
55 |
31 |
9 |
8 |
2 |
0 |
4100 |
34 |
25 |
19 |
20 |
1 |
1 |
1 |
1900 |
35 |
100 |
60 |
11 |
5 |
3 |
1 |
5700 |
36 |
53 |
30 |
5 |
5 |
2 |
1 |
2000 |
1.Предварительный анализ
Теперь на основании исходных данных найдем статистические показатели.
Y- стоимость квартиры
X1- общая площадь квартиры
X2- жилая площадь квартиры
X3- время до ближайшей остановки
X4- этаж, на котором расположена квартира
X5- число комнат в квартире
X6- тип дома, в котором находится квартира (1-кирпичный, 0-другой)
Таблица 2-Статистические показатели
Показатель |
X1 |
X2 |
X3 |
X4 |
X5 |
X6 |
Y |
Максимум |
100 |
65 |
28 |
11 |
5 |
1 |
6500 |
Среднее значение |
54,08 |
33,75 |
10,81 |
4,06 |
2,17 |
0,67 |
3246,67 |
Минимум |
23 |
14 |
3 |
1 |
1 |
0 |
1550 |
Медиана |
51,5 |
31 |
9 |
4 |
2 |
1 |
2900 |
Мода |
39 |
14 |
8 |
1 |
1 |
1 |
2300 |
Дисперсия |
418,02 |
221,85 |
34,39 |
6,68 |
1,11 |
0,23 |
1503914,29 |
Дисперсия для ген. совокупности |
406,41 |
215,69 |
33,43 |
6,50 |
1,08 |
0,22 |
1462138,89 |
Квадратичное отклонение |
14630,75 |
7764,75 |
1203,64 |
233,89 |
39 |
8 |
52637000 |
Среднеквадратичное отклонение |
16,75 |
12,51 |
4,50 |
1,9 |
0,87 |
0,44 |
1010,93 |
1)X1- общая площадь квартиры
Максимальное значение площади квартиры из предоставленной выборки равна 100 м2.
Среднее значение площади квартиры из предоставленной выборки равна 54,08 м2.
Минимальное значение площади квартиры из предоставленной выборки равна 23 м2.
Наиболее частым встречающимся значением по этому фактору равно 39 м2, это говорит о том, что встречаются квартиры со сходными площадями. Что касается медианы, то половина площадей квартир не превышают 51,5 м2, а другая половина превышает.
2)X2- жилая площадь квартиры
Максимальное значение жилой площади квартиры из предоставленной выборки равна 65 м2.
Среднее значение жилой площади квартиры из предоставленной выборки равна 33,75 м2.
Минимальное значение жилой площади квартиры из предоставленной выборки равна 14 м2.
Наиболее частым встречающимся значением по этому фактору равно 14м2, это говорит о том, что встречаются квартиры со сходными площадями. Что касается медианы, то половина площадей квартир не превышают 31 м2, а другая половина превышает.
3)X3- время до ближайшей остановки
Максимальное время, затраченное на путь до остановки равно 28 минут.
Средне время, затраченное на путь до остановки равно 11 минут.
Минимальное время, затраченное на путь до остановки равно 3 минуты.
Наиболее частым встречающимся значением по этому фактору равно 8 минут, это говорит о том, что встречаются квартиры, которые находятся на одинаковом расстоянии от остановки. Что касается медианы, то половина квартир находится на расстоянии, преодоление которого не превышает 9 минут, а другая половина превышает.
4)X4- этаж, на котором расположена квартира
Квартира расположенная на 11 этаже имеет наибольшее значение по этому фактору из представленной выборки.
Квартира расположенная на 4 этаже имеет среднее значение по этому фактору из представленной выборки.
Квартира расположенная на 1 этаже имеет наименьшее значение по этому фактору из представленной выборки.
Чаше всего квартиры расположены на 1 этаже. Что касается медианы, то половина квартир находится в пределах от 1-4 этажа, а другая половина превышает.
5)X5- число комнат в квартире
Наибольшее количество комнат в квартире 5.
Среднее количество комнат в квартире 2.
Наименьшее количество комнат в квартире 1.
Чаще всего встречаются однокомнатные квартиры. Что касается медианы, то половина квартир не превышают порог 2 комнат по количеству, остальные имеют большее количество.
6)X6- тип дома, в котором находится квартира (1-кирпичный, 0-другой)
Чаще всего встречаются кирпичные дома. Что касается медианы, то половина квартир находится в кирпичном доме, а другие квартиры находятся в домах другого типа.
На основе исходных данных построим гистограмму, которая показывает отношение факторов.
Рисунок 1-Отношение факторов.
Рисунок 2-Отношение стоимостей квартир
Теперь построим поле корреляции на основе исходных данных.
Рисунок 3-Поле корреляции
Для нахождения частных коэффициентов корреляции воспользуемся надстройкой «Анализ данных» в прикладном пакете программ Microsoft Office 2010, а именно Microsoft Excel 2010.
Таблица 3-Матрица частных и парных коэффициентов корреляции
Y |
X1 |
X2 |
X3 |
X4 |
X5 |
X6 | |
Y |
1 |
0.79 |
0.73 |
-0.14 |
-0.14 |
0.64 |
-0.0775 |
X1 |
0.79 |
1 |
0.94 |
0.0478 |
-0.12 |
0.81 |
-0.0585 |
X2 |
0.73 |
0.94 |
1 |
0.093 |
-0.24 |
0.87 |
0.0201 |
X3 |
-0.14 |
0.0478 |
0.093 |
1 |
-0.0143 |
0.07 |
0.017 |
X4 |
-0.14 |
-0.12 |
-0.24 |
-0.0143 |
1 |
-0.27 |
-0.33 |
X5 |
0.64 |
0.81 |
0.87 |
0.07 |
-0.27 |
1 |
0.0566 |
X6 |
-0.0775 |
-0.0585 |
0.0201 |
0.017 |
-0.33 |
0.0566 |
1 |
Исходя из полученных данных, можно сделать следующие выводы:
,79 – это говорит о том, характер связи между переменной X1 и Y сильный, следовательно, общая площадь квартиры влияет на ее стоимость.
,73 – это говорит о том, характер связи между переменной X2 и Y сильный, следовательно, жилая площадь квартиры влияет на ее стоимость.
,14 – это говорит о том, характер связи между переменной X3 и Y слабый, следовательно, расстояние до остановки не влияет на ее стоимость.
,14 – это говорит о том, характер связи между переменной X4 и Y слабый, следовательно, этаж, на котором находится квартира, не влияет на стоимость.
,64 – это говорит о том, характер связи между переменной X5 и Y сильный, следовательно, число квартиры влияет на ее стоимость.
,0775 – это говорит о том, характер связи между переменной X6 и Y, следовательно, тип дома не влияет на стоимость квартиры.
Для отбора наиболее значимых факторов xi учитываются следующие условия:
-
связь между результативным
- связь между факторами должна быть не более 0.7. Если в матрице есть межфакторный коэффициент корреляции rxjxi > 0.7, то в данной модели множественной регрессии существует мультиколлинеарность.;
- при высокой межфакторной связи признака отбираются факторы с меньшим коэффициентом корреляции между ними.
В нашем случае rx1 x2 , rx1 x5 , rx2 x5 имеют |r|>0.7, что говорит о мультиколлинеарности факторов и о необходимости исключения одного из них из дальнейшего анализа.
Анализ первой строки этой матрицы позволяет произвести отбор факторных признаков, которые могут быть включены в модель множественной корреляционной зависимости. Факторные признаки, у которых |ryxi| < 0.5 исключают из модели. Можно дать следующую качественную интерпретацию возможных значений коэффициента корреляции если |r|>0.3 – связь практически отсутствует; 0.3 ≤ |r| ≤ 0.7 - связь средняя; 0.7 ≤ |r| ≤ 0.9 – связь сильная; |r| > 0.9 – связь весьма сильная.