Автор: Пользователь скрыл имя, 15 Января 2014 в 00:39, курсовая работа
Задание №1.
На основе данных, приведенных в таблице 2 приложения и соответствующих варианту, выполнить:
1. Структурную равноинтервальную группировку по обоим признакам. Определить число групп по формуле Стерджесса. Результаты группировки представить в таблице и сделать выводы.
2. Аналитическую группировку, для этого определить признак - фактор и признак - результат, обосновав их выбор. Результаты представить в таблице. Сделать выводы о наличии и направлении взаимосвязи между признаками.
3. Комбинационную группировку по признаку - фактору и признаку - результату. Сделать выводы.
Задание №1. 3
Задание № 2. 7
Задание № 3. 12
Задание № 4. 15
Список использованной литературы 23
Рис. 2.1. Гистограмма распределения показателей постоянной численности населения
на конец года, тыс. чел.
Рис. 2.2. Кумулята распределения показателей постоянной численности населения
на конец года, тыс. чел.
Определим среднюю величину, по исходным данным, используя формулу средней арифметической взвешенной:
Где, xi – варианта,
fi – частоты,
Мода вычисляется по формуле:
Мо =
х0 – нижняя граница модального интервала,
iMo- значение модального интервала,
fMo – модальная частота,
fMo-1- частота предшествующая модальной,
fMo+1 – частота следующая за модальной.
Meдиана: Me =
хМе - нижняя граница медианного интервала,
iMe - медианный интервал,
fi – сумма частот,
SMe-1 – накопленная частота,
fМе – медианная частота.
Дисперсия представляет
собой средний квадрат
Среднее квадратическое отклонение:
σ =
Коэффициент вариации: КВ = V = > 33%
Квартили – значение признака, делящие упорядоченную по значению признака совокупность на 4 равные части.
;
где х0 – нижняя граница интервала, содержащего нижний квартиль;
h – величина интервала, где находится нижний квартиль;
- накопленная частота интервала
предшествующая нижнему
где х0 – нижняя граница интервала, содержащего верхний квартиль;
h – величина интервала, где находится верхний квартиль;
- накопленная частота интервала
предшествующая верхнему
- частоты интервалов содержащих нижний и верхний квартиль.
Вывод: Наиболее частый вариант постоянной численности населения, на конец года, в регионах составляет 1218,93 тыс.чел. Половина регионов имеет численность населения в размере менее 1330,33 тыс.чел., а другая половина областей в размере более 1330,33 тыс.чел. Среднее арифметическое значение численности населения составило 1724,02 тыс.чел. Дисперсия равна 1424347,31. Каждое индивидуальное значение численность населения отклоняется от их средней величины на 1193,46 тыс. чел. Коэффициент вариации составил 69,2%, что больше 33%, следовательно, совокупность не однородна. 1-ая квартиль (Q1) определяет такое значение признака, что ¼ регионов имеет численность населения меньше, чем 1030,4 тыс.чел., а ¾ - больше чем 1030,4 тыс.чел. 3-я квартиль (Q3) определяет такое значение признака, что ¾ регионов имеют численность населения меньше, чем 1640,05 тыс.чел., а ¼ - больше, чем 1640,05 тыс.чел.
Таблица 2.2
Вариационное распределение потребления овощей
на душу населения в год, кг
Потребление овощей на душу населения, кг в год |
Регионы fi |
Накопительная частота S |
Середина интервала xi |
xi - |
(xi – |
(x – |
51 - 66,67 |
2 |
2 |
58,83 |
-40,21 |
1616,93 |
3233,87 |
66,67 - 82,33 |
4 |
6 |
74,50 |
-24,54 |
602,43 |
2409,72 |
82,33 - 98 |
8 |
14 |
90,17 |
-8,88 |
78,81 |
630,52 |
98 - 113,67 |
9 |
23 |
105,83 |
6,79 |
46,09 |
414,80 |
113,67 - 129,33 |
5 |
28 |
121,50 |
22,46 |
504,25 |
2521,26 |
129,33 - 145 |
2 |
30 |
137,17 |
38,12 |
1453,30 |
2906,61 |
Итого |
30 |
12116,77 |
Рис.3. Гистограмма потребления овощей на душу населения в год, кг
Рис.4. Куммулята потребления овощей на душу населения в год, кг
Средняя величина:
=
Мода: Мо =
Meдиана вычисляется по формуле:
Me =
Дисперсия: σ2 =
Среднее квадратическое отклонение:
σ =
Коэффициент вариации: КВ = V = < 33%.
;
Наиболее частый вариант потребления овощей на душу населения составляет 101,13 кг в год. Потребление овощей на душу населения в половине регионов, от их общей совокупности, составляет менее 99,74 кг в год, а в другой половине более 99,74 кг в год. Среднее арифметическое значение потребления овощей на душу населения составляет 99,04 кг в год. Дисперсия равна 403,89. Каждое значение показателя потребления овощей на душу населения отклоняется от их средней величины на 20,09 кг в год. Коэффициент вариации равен 20,29%, что меньше 33% и, следовательно, совокупность однородна. Q1 определяет значение признака, при котором четверть регионов потребляет овощей на душу населения, меньшую, чем 85,27 кг в год., а три четверти – большую, чем 85,27 кг в год. Q3 определяет значение признака, при котором три четверти регионов потребляет овощей на душу населения меньшую, чем 112,79 кг в год, а четверть - большую, чем 112,79 кг в год.
Задание № 3.
2. Используя результаты расчетов, выполненных в задании №2 курсовой работы по признаку 2 и полагая, что эти данные получены при помощи повторного отбора, определить:
1.а). Определим пределы, за которые с доверительной вероятностью 0,954 не выйдет среднее значение признака, рассчитанное по генеральной совокупности;
Нам известно: = 1724,02 тыс.чел. р = 0,954
σ2 = 1424347,31 t = 2 (по таблице)
Так как мы имеем собственно – случайный 38% бесповторный отбор, то N = 79 регионов, а n = 30 регионов.
Необходимо определить
μ(х) = тыс. чел.
где σ2(х) – дисперсия выборочной совокупности,
n – объем выборочной совокупности,
N - объем генеральной совокупности.
Предельная ошибка выборки определяется по формуле:
∆ = tμ = 2 · 171,6 = 343,2 тыс. чел.
Зная выборочную среднюю величину признака и предельную ошибку выборки, можно определить границы, в которых заключена генеральная средняя:
– Δ ≤ ≤ +Δ
1380,82 ≤ ≤ 2067,22
Вывод: На основании проведенного выборочного обследования с вероятностью 0,954 можно заключить, что средние значения численности постоянного населения регионов лежат в пределах от 1380,82 до 2067,22 тыс. чел.
б). Для того чтобы снизить предельную ошибку средней величины на 50% нужно изменить объем выборки.
Нам известно: Δ =343,2 · 50% = 171,6 N = 79
σ2 = 1424347,31 t = 2
Для определения необходимого объема выборки при бесповторном отборе используется формула:
Вывод: для того чтобы снизить предельную ошибку средней величины на 50%, необходимый объем выборки должен примерно составлять 56 регионов.
2. а). При помощи повторного отбора, определим пределы, за которые в генеральной совокупности не выйдет значение доли потребления овощей на душу населения, у которых индивидуальные значения признака превышают моду.
Нам известно: Мо = 101,13 кг в год. В 14 регионах потребление овощей на душу населения больше 101,13 кг в год. t = 1, p = 0.683 (по таблице)
Доля признака в выборочной совокупности определим по формуле:
Тогда средняя ошибка выборки будет вычисляться по формуле:
Где w(1-w) – дисперсия доли альтернативного признака:
σ2 = W(1-W) = 0,47(1 - 0,47) = 0,2491
Предельная ошибка выборки:
∆ = tμ = 1 · 0,091 = 0,091
Зная выборочную долю признака и предельную ошибку выборки, можно определить границы, в которых заключена генеральная доля:
- ∆р ≤ p ≤ + ∆р
0,379 ≤ р ≤ 0,561
37,9% и 56,1%
С вероятностью 0,683 доля производства овощей в регионах России находится в пределах от 37,9% до 56,1%.
б). Для того чтобы снизить предельную ошибку доли на 20% необходимо изменить объем выборки.
Нам известно: Δ = 0,091 · 80% = 0,0728 σ2 = 0,2491
t = 1 p = 0.683
Для определения необходимого объема выборки при повторном отборе используется формула:
Вывод: для снижения предельной ошибки доли на 20% необходимо изменить объем выборки или число регионов до 47.
Задание № 4.
б) цепные и базисные показатели динамики: абсолютный прирост, темп роста, темп прироста;
в) средний абсолютный прирост, средний темп роста, средний темп прироста.
Таблица 4.1
Численность населения Псковского района на конец года, тыс.чел.
Года |
Население, тыс.чел. |
С постоянной базой сравнения |
С переменной базой сравнения | ||||||
К роста |
Тр |
Тпр |
Δ |
К роста |
Тр |
Тпр |
Δ | ||
2002 |
38,05 |
- |
- |
- |
- |
- |
- |
- |
- |
2003 |
39,10 |
1,03 |
102,8% |
2,8% |
1,06 |
1,03 |
102,8% |
2,8% |
1,06 |
2004 |
36,70 |
0,96 |
96,5% |
-3,5% |
-1,35 |
0,94 |
93,9% |
-6,1% |
-2,40 |
2005 |
36,50 |
0,96 |
95,9% |
-4,1% |
-1,55 |
0,99 |
99,5% |
-0,5% |
-0,20 |
2006 |
35,35 |
0,93 |
92,9% |
-7,1% |
-2,70 |
0,97 |
96,8% |
-3,2% |
-1,15 |
2007 |
34,83 |
0,92 |
91,5% |
-8,5% |
-3,22 |
0,99 |
98,5% |
-1,5% |
-0,52 |
2008 |
34,49 |
0,91 |
90,7% |
-9,3% |
-3,56 |
0,99 |
99,0% |
-1,0% |
-0,34 |
2009 |
34,08 |
0,90 |
89,6% |
-10,4% |
-3,97 |
0,99 |
98,8% |
-1,2% |
-0,41 |