Автор: Пользователь скрыл имя, 04 Октября 2011 в 14:25, задача
В ряде задач будет предложено использовать данные таблицы 1, в которой приведены результаты выборочного социологического обследования 100 городских семей на предмет изучения уровня жизни населения. Известно, что всего в данном городе проживает около 500 тыс. семей. Выборка 100 семей произведена по принципу случайного отбора.
Задачи
по
математической статистике
В
ряде задач будет предложено использовать
данные таблицы 1, в которой приведены
результаты выборочного социологического
обследования 100 городских семей на предмет
изучения уровня жизни населения. Известно,
что всего в данном городе проживает около
500 тыс. семей. Выборка 100 семей произведена
по принципу случайного отбора.
Таблица 1
Данные
обследования 100 городских семей
№ п.п. | Количество членов в семье | Жилищные условия | Совокупный доход семьи в месяц, руб. | Наличие загородного земельного участка | Личный автомобиль | Гараж | |||||
всего | в т. ч. | отдельная квартира | общая площадь, кв. м. | жилая площадь, кв. м. | количество жилых комнат | ||||||
муж. пола | жен. пола | ||||||||||
А | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 |
1
2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 |
2
5 3 4 1 3 6 2 4 3 4 1 3 5 2 3 4 4 3 3 2 5 3 4 1 3 3 4 4 3 2 5 3 1 4 3 4 2 6 4 6 3 1 6 4 4 3 2 4 3 3 4 2 3 4 4 7 1 3 2 3 8 2 4 3 4 1 6 3 2 4 5 4 3 3 1 4 3 5 2 3 5 4 4 3 2 5 3 1 4 3 4 2 6 3 1 4 3 5 2 |
1
2 1 1 1 2 3 1 2 1 1 – – 3 1 2 3 2 – 1 – 4 1 2 – 1 2 1 2 1 – 1 2 1 3 1 3 1 4 1 3 – – 2 3 3 2 – 1 2 1 1 1 2 2 2 1 – 2 1 1 5 2 1 2 3 – – 3 – 2 3 3 – 1 – 2 2 2 – – 4 3 2 1 – 2 1 1 3 1 2 1 3 2 – 3 1 2 – |
1
3 2 3 – 1 3 1 2 2 3 1 3 2 1 1 1 2 3 2 2 1 2 2 1 2 1 3 2 2 2 4 1 – 1 2 1 1 2 2 3 3 1 4 1 1 1 2 3 1 2 3 1 1 2 2 6 1 1 1 2 3 – 3 1 1 1 6 – 2 2 2 1 3 3 1 2 1 3 2 3 1 1 2 2 2 3 2 – 1 2 2 1 3 1 1 1 2 3 2 |
да
да да нет да нет да нет да да да нет да да да нет да да нет да да нет да да нет да да да да да нет да да да да да да да да да нет нет да да нет да да да да да нет да да да да да да нет да да да да да да да да нет да нет да да да да нет да да да да да да да да нет да да нет да да да да нет да да да да да да да да нет |
50
63 48 22 29 21 58 21 39 34 65 18 81 65 37 40 29 55 25 65 31 39 38 45 19 35 58 39 69 104 31 65 52 54 54 74 31 67 51 39 45 17 35 88 35 91 96 34 55 58 42 70 80 47 69 57 64 30 64 31 42 71 40 70 61 118 17 62 26 32 37 69 41 50 104 28 77 41 61 47 57 101 80 40 34 43 39 79 48 78 33 63 31 62 37 31 66 31 53 36 |
28
36 26 14 14 15 35 13 22 20 43 12 45 37 20 22 16 36 17 38 16 28 19 29 10 24 32 19 42 55 19 43 29 32 32 47 17 43 28 26 31 12 19 51 23 50 62 18 30 33 29 45 51 31 39 41 48 20 36 19 29 34 29 49 41 75 11 43 14 15 16 49 20 35 61 14 49 28 34 30 33 62 52 26 18 29 20 45 28 48 22 38 17 41 27 17 36 17 28 25 |
2
3 2 1 1 1 3 1 2 1 3 1 2 3 1 2 1 3 1 3 1 2 1 2 1 2 2 1 3 3 1 3 2 2 2 4 1 3 2 2 2 1 1 3 2 3 5 1 2 2 2 3 4 2 2 3 3 1 3 1 2 2 2 3 2 5 1 3 1 1 1 4 1 2 4 1 4 2 2 2 2 3 3 2 1 2 1 3 2 3 1 3 1 3 2 1 2 1 2 1 |
450
410 145 287 82 140 487 197 185 262 281 116 294 415 415 659 214 655 214 452 118 243 396 500 192 216 957 312 1080 855 212 881 404 95 277 605 522 612 625 140 992 361 75 190 390 472 375 183 810 315 125 218 713 611 290 493 515 253 670 244 317 458 319 714 125 382 164 290 288 106 602 215 145 871 220 132 810 212 360 131 802 691 184 162 211 304 262 355 187 516 160 410 215 818 195 88 425 415 620 78 |
да
нет нет нет да нет да да нет нет нет нет да да да да нет нет нет нет нет нет да нет нет нет нет нет да нет нет да нет нет да нет нет нет нет нет да нет нет да нет нет нет нет да да нет да нет нет нет да да да нет нет да да нет нет да нет нет да нет нет да нет да нет нет нет да нет нет нет да да нет нет да да нет да нет да нет нет да да нет нет да нет нет да |
да
нет да нет нет нет нет да нет нет нет нет нет да нет да нет да нет да нет нет нет да нет нет да нет нет нет нет да нет нет нет нет да нет нет нет нет нет нет нет нет да нет нет нет нет нет нет да да нет нет нет нет нет нет нет да нет нет нет нет нет нет да нет да нет нет нет нет нет да нет нет нет нет да нет нет нет нет нет да нет да нет да нет да нет нет да нет да нет |
да
нет нет нет нет нет нет нет нет нет нет нет нет нет нет да нет нет нет нет нет нет нет да нет нет да нет нет нет нет да нет нет нет нет да нет нет нет нет нет нет нет нет да нет нет нет нет нет нет да да нет нет нет нет нет нет нет да нет нет нет нет нет нет да нет нет нет нет нет нет нет да нет нет нет нет да нет нет нет нет нет нет нет нет нет нет нет да нет нет да нет да нет |
Задача 1
По
данным таблицы 1 постройте ряд распределения
тех жилищ, которые являются отдельными
квартирами, по числу жилых комнат. Наряду
с локальными частотами подсчитайте накопленные
частоты. Постройте полигон распределения,
а также кумуляту. Определите моду, медиану,
среднюю, дисперсию, среднее квадратическое
отклонение, коэффициент вариации.
Методические советы по выполнению задания
по теме
«Статистические ряды распределения и
их характеристики».
Ряд распределения – это ряд чисел, в котором значение изучаемого признака (варианты), расположены в определенном порядке: либо в порядке возрастания, либо убывания. Наряду с вариантами ряд распределения включает и частоты – величины, показывающие сколько раз каждая варианта встречается в данной совокупности. Сумма частот равна объему совокупности. Таким образом, ряд распределения состоит из вариант (х) и частот (т).
В
зависимости от прерывности или непрерывности
варьирующего признака ряды распределения
удобно представлять в виде двух разновидностей:
дискретного и вариационного (интервального).
Дискретный ряд представляет собой ряд
прерывных чисел. Например, распределение
семей по числу членов (табл. I). При непрерывной
вариации распределение признака называется
интервальным. Частоты относятся ко всему
интервалу. Примером интервального ряда
может служить распределение совхозов
области по проценту выполнения плана
(табл. II).
Распределение
семей по числу
членов |
Распределение
365 совхозов
по проценту выполнения плана | |||||
Число членов | Число
семей (частоты) |
Накопленные частоты | Процент выполнения плана | Число совхозов (частоты) | Накопленные частоты | |
1
2 3 4 5 6 7 8 |
7
16 34 22 13 10 8 5 |
7
23 57 79 92 102 110 115 |
95–100
100–105 105–110 110–115 115–120 120–125 125–130 130 и выше |
3
17 28 64 127 71 40 15 |
3
20 48 112 239 310 350 365 | |
Итого | 115 | Итого | 365 |
В зависимости от вида ряда распределения по разному можно изобразить их графически. Если ряд дискретный – строится полигон распределения. Величина признака откладывается на оси абсцисс, частоты – на оси ординат. Вершины ординат соединяются прямыми линиями. Гистограмма распределения отличается о полигона тем, что на оси абсцисс берутся не точки, а отрезки, изображающие интервал, т.е. гистограмма строится на основе вариационного ( интервального) ряда. По накопленным частотам строится кумулятивная кривая (кумулята).
Для
определения средней
Простая средняя арифметическая .
Средняя арифметическая взвешенная .
В наших примерах средняя
Для табл. II %.
При расчете средней арифметической для интервального ряда нужно сначала определить середины интервалов как полусуммы значений верхней и нижней границ интервала. При наличии интервалов, где «открыты» верхняя или нижняя граница, величину интервала определяют по последующему ил предыдущему интервалу.
Для характеристики рядов распределения кроме средней степенной применяются структурные средние: мода и медиана.
Мода – варианта, которая наиболее часто встречается в данной совокупности, т.е. варианта с наибольшей частотой.
Медиана – варианта, находящаяся в середине ряда распределения.
Мода для дискретного ряда определяется просто и соответствует варианте с наибольшей частотой. По данным табл. I мода равна 3, т.к. эта варианта встречается наибольшее число раз – 34. Значит, более всего в данной совокупности из 115 семей встречаются семьи с числом членов 3 человека. Для интервального ряда (с равными интервалами) мода определяется по следующей формуле:
.
где i – длина интервала; – частота модального, – домодального, – замодального интервалов; – начало модального интервала.
.
Медиану дискретного ряда определяют по накопленным частотам делением объема совокупности пополам: по табл. I – 115:2=57,5. Это соответствует медиане, равной 3.
Для интервального ряда медиану определяют по формуле:
,
где – накопленная частота интервала, предшествующего медианному; – локальная частота медианного интервала; – начало медианного интервала.
В нашем примере по данным табл. II получим:
.
Размах вариации – разность между наибольшей и наименьшей вариантой: . По данным дискретного ряда размах вариации равен 7=(8–1), по интервальному ряду 40=(135–95).
Среднее квадратическое отклонение – показатель вариации, измеряющий величину, на которую все варианты в среднем отклоняются от средней арифметической. Среднее квадратическое отклонение бывает простое и взвешенное и рассчитывается по формулам:
простое (невзвешенное) взвешенное
Квадрат среднего квадратического отклонения называется дисперсией, или средним квадратом отклонений. По данным табл. I, используя формулу взвешенного среднего квадратического отклонения, рассчитаем его величину:
(чел.)
Наряду с абсолютным показателем колеблемости признака – средним квадратическим отклонением, широко применяется и относительный показатель – коэффициент вариации, который показывает меру колеблемости признака относительно его среднего значения и измеряется в процентах. Расчет коэффициента вариации можно проследить по данным табл. I:
.