Статистическое изучение регионов РФ

Автор: Пользователь скрыл имя, 15 Января 2014 в 00:39, курсовая работа

Краткое описание

Задание №1.
На основе данных, приведенных в таблице 2 приложения и соответствующих варианту, выполнить:
1. Структурную равноинтервальную группировку по обоим признакам. Определить число групп по формуле Стерджесса. Результаты группировки представить в таблице и сделать выводы.
2. Аналитическую группировку, для этого определить признак - фактор и признак - результат, обосновав их выбор. Результаты представить в таблице. Сделать выводы о наличии и направлении взаимосвязи между признаками.
3. Комбинационную группировку по признаку - фактору и признаку - результату. Сделать выводы.

Оглавление

Задание №1. 3
Задание № 2. 7
Задание № 3. 12
Задание № 4. 15
Список использованной литературы 23

Файлы: 1 файл

сделан.статистика.doc

— 533.50 Кб (Скачать)

 

Рис.  2.1. Гистограмма распределения  показателей постоянной численности населения

на конец года, тыс. чел.

 

Рис.  2.2. Кумулята распределения  показателей постоянной численности населения

на конец года, тыс. чел.

 

Определим среднюю величину, по исходным данным, используя формулу средней арифметической взвешенной:

 

Где, xi – варианта,

fi – частоты,

 Мода вычисляется по формуле:    

Мо =

х0 – нижняя граница модального интервала,

iMo- значение модального интервала,

fMo – модальная частота,

fMo-1- частота предшествующая модальной,

fMo+1 – частота следующая за модальной.

Meдиана:  Me =

хМе - нижняя граница медианного интервала,

iMe - медианный интервал,

fi – сумма частот,

SMe-1 – накопленная частота,

fМе – медианная частота.

Дисперсия представляет собой средний квадрат отклонений индивидуальных значений признака от их средней величины и вычисляется  по формуле:          σ2 =

         Среднее квадратическое отклонение:

σ =

Коэффициент вариации:      КВ = V = > 33%

Квартили – значение признака, делящие упорядоченную по значению признака совокупность на 4 равные части.

;

где х0 – нижняя граница интервала, содержащего нижний квартиль;

h – величина интервала, где находится нижний квартиль;

- накопленная частота интервала  предшествующая нижнему квартилю.

где х0 – нижняя граница интервала, содержащего верхний квартиль;

h – величина интервала, где находится верхний квартиль;

- накопленная частота интервала  предшествующая верхнему квартилю.

- частоты интервалов содержащих нижний и верхний квартиль.

 

Вывод: Наиболее частый вариант постоянной численности населения, на конец года, в регионах составляет 1218,93 тыс.чел. Половина регионов имеет численность населения в размере менее 1330,33 тыс.чел., а другая половина областей в размере более 1330,33 тыс.чел. Среднее арифметическое значение численности населения составило 1724,02 тыс.чел. Дисперсия равна 1424347,31. Каждое индивидуальное значение численность населения отклоняется от их  средней величины на 1193,46 тыс. чел.  Коэффициент вариации составил 69,2%, что больше 33%, следовательно, совокупность не однородна. 1-ая квартиль (Q1) определяет такое значение признака, что ¼ регионов имеет численность населения меньше, чем 1030,4 тыс.чел., а ¾ - больше чем 1030,4 тыс.чел. 3-я квартиль (Q3) определяет такое значение признака, что ¾ регионов имеют численность населения меньше, чем 1640,05 тыс.чел., а ¼ - больше, чем 1640,05 тыс.чел.

Таблица 2.2

Вариационное распределение потребления овощей

на душу населения в год, кг

Потребление

овощей на душу населения, кг в год

Регионы

fi

Накопительная частота S

Середина интервала

xi

xi -

(xi

)2

(x

)2·fi

51 - 66,67

2

2

58,83

-40,21

1616,93

3233,87

66,67 - 82,33

4

6

74,50

-24,54

602,43

2409,72

82,33 - 98

8

14

90,17

-8,88

78,81

630,52

98 - 113,67

9

23

105,83

6,79

46,09

414,80

113,67 - 129,33

5

28

121,50

22,46

504,25

2521,26

129,33 - 145

2

30

137,17

38,12

1453,30

2906,61

Итого

30

       

12116,77


 

Рис.3. Гистограмма потребления овощей на душу населения в год, кг

 

 

 

Рис.4. Куммулята  потребления овощей на душу населения в год, кг

 

Средняя величина:

=

Мода: Мо =

Meдиана вычисляется по формуле:

Me =

          Дисперсия:          σ2 =

Среднее квадратическое отклонение:

σ =

Коэффициент вариации: КВ = V = < 33%.

;

Наиболее частый вариант потребления овощей на душу населения составляет 101,13 кг в год. Потребление овощей на душу населения в половине регионов, от их общей совокупности,  составляет менее 99,74 кг в год, а в другой половине более 99,74 кг в год. Среднее арифметическое значение потребления овощей на душу населения составляет 99,04 кг в год. Дисперсия равна 403,89. Каждое значение показателя потребления овощей на душу населения отклоняется от их  средней величины на 20,09 кг в год.  Коэффициент вариации равен 20,29%, что меньше 33%  и, следовательно, совокупность однородна. Q1 определяет значение признака, при котором четверть регионов потребляет овощей на душу населения, меньшую, чем 85,27 кг в год., а три четверти – большую, чем 85,27 кг в год. Q3 определяет значение признака, при котором три четверти регионов потребляет овощей на душу населения меньшую, чем 112,79 кг в год, а четверть - большую, чем 112,79 кг в год.

                                                     

 Задание № 3.

    1. Используя результаты расчетов, выполненных в задании 2 курсовой работы по признаку 1, и полагая, что эти данные получены при помощи собственно-случайного 38% бесповторного отбора, определить:
    1. Пределы, за которые с доверительной вероятностью 0,954 не выйдет среднее значение признака, рассчитанное по генеральной совокупности.
    2. Как нужно изменить объем выборки, чтобы снизить предельную ошибку средней величины на 50%.

2. Используя результаты расчетов, выполненных в задании №2 курсовой работы по признаку 2 и полагая, что эти данные получены при помощи повторного отбора, определить:

    1. Пределы, за которые в генеральной совокупности не выйдет значение доли регионов, у которых индивидуальные значения признака превышают моду (уровень доверительной вероятности установите по своему усмотрению).
    2. Как изменить объем выборки, чтобы снизить предельную ошибку доли на 20%.

1.а). Определим пределы, за которые с доверительной вероятностью 0,954 не выйдет среднее значение признака, рассчитанное по генеральной совокупности;   

Нам известно: = 1724,02 тыс.чел.               р = 0,954

                       σ2 = 1424347,31                      t = 2 (по таблице)

Так как мы имеем собственно – случайный 38% бесповторный отбор, то N = 79 регионов, а n = 30 регионов.

 Необходимо определить среднюю  ошибку выборки:                           

μ(х) = тыс. чел.

где σ2(х) – дисперсия выборочной совокупности,

n – объем выборочной совокупности,

N - объем генеральной совокупности.

Предельная ошибка выборки  определяется по формуле:

∆ = tμ = 2 · 171,6 = 343,2 тыс. чел.

Зная выборочную среднюю величину признака и предельную ошибку выборки, можно определить границы, в которых  заключена генеральная средняя:

       – Δ ≤

   1380,82  ≤ ≤ 2067,22

Вывод: На основании проведенного выборочного обследования с вероятностью 0,954 можно заключить, что средние значения численности постоянного населения регионов лежат в пределах от 1380,82  до 2067,22 тыс. чел.

б).  Для того чтобы снизить предельную ошибку средней величины на 50% нужно изменить объем выборки.

 Нам известно: Δ  =343,2 · 50% = 171,6         N = 79         

                     σ2 = 1424347,31                     t = 2

Для определения необходимого объема выборки при бесповторном отборе используется формула:

Вывод: для того чтобы  снизить предельную ошибку средней  величины на 50%, необходимый объем выборки должен примерно составлять 56 регионов.

2. а). При помощи  повторного отбора, определим пределы, за которые в генеральной совокупности не выйдет значение доли потребления овощей на душу населения, у которых индивидуальные значения признака превышают моду.

Нам известно: Мо = 101,13 кг в год. В 14 регионах потребление овощей на душу населения больше 101,13 кг в год. t = 1, p = 0.683 (по таблице)

Доля признака в выборочной совокупности определим по формуле:

              

 Тогда средняя ошибка выборки будет вычисляться по формуле:

Где w(1-w) – дисперсия доли альтернативного признака:

σ2 = W(1-W) = 0,47(1 - 0,47) = 0,2491

Предельная ошибка выборки:

∆ = tμ = 1 · 0,091 = 0,091

Зная выборочную долю признака  и предельную ошибку выборки, можно определить границы, в которых заключена генеральная доля:

- ∆р ≤ p ≤ + ∆р

0,379 ≤ р ≤ 0,561

        37,9% и 56,1%

С вероятностью 0,683 доля производства овощей в регионах России находится в пределах от 37,9% до 56,1%.

б). Для того чтобы снизить предельную ошибку доли на 20% необходимо изменить объем выборки.

Нам известно: Δ = 0,091 · 80% = 0,0728           σ2 = 0,2491

                            t = 1                                             p = 0.683

Для определения необходимого объема выборки при повторном  отборе используется формула:

Вывод: для снижения предельной ошибки доли на 20% необходимо изменить объем выборки или число регионов до 47.

 

Задание № 4.

  1. Пользуясь данными из статистических ежегодников, составить 2 динамических ряда для характеристики изменения социально – экономических показателей по районам Псковской области.
  2. Рассчитать: а) среднегодовой уровень динамики;

б) цепные и базисные показатели динамики: абсолютный прирост, темп роста, темп прироста;

в) средний абсолютный прирост, средний  темп роста, средний темп прироста.

  1. Произвести сглаживание ряда динамики трехлетней скользящей средней.
  2. Произвести аналитическое выравнивание ряда динамики.
  3. Изобразить фактический и выровненный ряды графически.
  4. Сделать сравнительные выводы и прогнозы по районам. Дать общую характеристику развития районов по данным направлениям.

Таблица 4.1

Численность населения  Псковского района на конец года, тыс.чел.

Года

Население, тыс.чел.

С постоянной базой сравнения

С переменной базой сравнения

К роста

Тр

Тпр

Δ

К роста

Тр

Тпр

Δ

2002

38,05

-

-

-

-

-

-

-

-

2003

39,10

1,03

102,8%

2,8%

1,06

1,03

102,8%

2,8%

1,06

2004

36,70

0,96

96,5%

-3,5%

-1,35

0,94

93,9%

-6,1%

-2,40

2005

36,50

0,96

95,9%

-4,1%

-1,55

0,99

99,5%

-0,5%

-0,20

2006

35,35

0,93

92,9%

-7,1%

-2,70

0,97

96,8%

-3,2%

-1,15

2007

34,83

0,92

91,5%

-8,5%

-3,22

0,99

98,5%

-1,5%

-0,52

2008

34,49

0,91

90,7%

-9,3%

-3,56

0,99

99,0%

-1,0%

-0,34

2009

34,08

0,90

89,6%

-10,4%

-3,97

0,99

98,8%

-1,2%

-0,41

Информация о работе Статистическое изучение регионов РФ