Автор: Пользователь скрыл имя, 25 Января 2013 в 20:18, курсовая работа
Целью выполнения данной работы является овладение статистическими методами при изучении социальных и экономических явлений и процессов и приобретение навыков использования статистической информации при принятии управленческих решений.
Статистический анализ явлений и процессов, происходящих в социальной жизни общества, осуществляется с помощью специфических для статистики методов – методов обобщающих показателей, дающих числовое измерение количественных и качественных характеристик объекта, связей между ними, тенденций их изменения. Эти показатели отражают социальную жизнь общества, выступающую как предмет исследования социальной статистики.
Введение………………………………………………………………….2
1.Проведение статистического наблюдения…………………………...3
2.Групптровка статистических данных…………………………………8
3.Расчёт характеристик вариационного ряда…………………………..10
4.Анализ связи между признаками по аналитической группировке…19
5.Выборочное обследование…………………………………………….24
6.Корреляционно-регрессионный анализ……………………………….29
7.Анализ рядов динамики………………………………………………..33
8.Индексы…………………………………………………………………38
Заключение………………………………………………………………..48
Библиографический список источников информации…………………49
Дисперсия (σ2) – квадрат среднего квадратического отклонения.
Простая дисперсия:
Взвешенная дисперсия:
Рассчитаем взвешенную дисперсию:
Коэффициент вариации (Кν) – это показатель типичности средней величины:
где σ – среднее квадратическое отклонение; x̅ – средняя арифметическая.
Рассчитаем коэффициент вариации за 1 квартал 2011 года:
Считается, что если Кν ≥ 40%, то средняя нетипична, а исследуемая совокупность неоднородна.
Таким образом, так как коэффициент вариации больше 40 %, то можно сделать вывод, что средняя нетипична, а исследуемая совокупность неоднородна.
Отдельные значения в совокупности в среднем отличаются на 4115 тыс.руб. от средней арифметической.
Наиболее характерным значением исследуемого признака для данной совокупности является 8230 тыс. руб.
Среднее квадратическое отклонение показывает, что на 6823,96 тыс. руб. отличаются отдельные значения в совокупности от средней арифметической.
4.Анализ связи
между признаками по
Аналитическая группировка строится для анализа связей между признаками. Процедура построения:
1.По имеющимся данным
выбирается признак-фактор (влияющий)
и признак-результат (
2.Строится группировка по признаку-фактору.
3.В каждой группе
рассчитывается среднее
4.Строится аналитическая группировочная таблица.
Макет аналитической группировки
Интервалы группировки по признаку-фактору |
Количество единиц в группе |
Среднее значение признака-результата |
(xj ) |
(fj ) |
(y̅j.) |
Итого: |
N объём стат. совокупности |
y̅ общ. |
y̅ общ. = Σ y̅j ∙ fj [13]
Σfj
Построим аналитическую группировку.
Имеются данные о количестве выручки от реализации сельскохозяйственной продукции за 1 квартал 2011 г.
В этом распределении группы хозяйств – это признак-фактор. Количество выручки – признак-результат.
Аналитическая группировка зависимости количества выручки от нахождения в определённой группе хозяйств.
Таблица № 10.
Группы хозяйств по количеству выручки от реализации сельскохозяйственной продукции за 1 квартал 2011 г. , тыс.руб. |
Количество хозяйств, шт. |
Среднее значение выручки по группе |
1. 0 - 4115 |
7 |
1875,6 |
2. 4115 - 8230 |
3 |
6508 |
3. 8230 - 12345 |
1 |
11467 |
4. 12345 - 16460 |
1 |
15463 |
5. 16460 - 20575 |
4 |
19285 |
Итого: |
16 |
54598,6 |
Количественные характеристики связи можно определить с помощью дисперсионного анализа и расчета показателя силы связи.
Межгрупповая дисперсия
где - групповые средние результативного признака;
- групповые частоты;
- общая средняя результативного признака в совокупности.
Рассчитаем межгрупповую дисперсию:
Средняя внутригрупповая
дисперсия характеризует
Сначала рассчитываются внутригрупповые дисперсии по каждой группе аналитической группировки:
где - отдельные значения результативного признака в j – й группе;
- среднее значение результативного признака в j-й группе;
- частота в j-й группе.
Рассчитаем внутригрупповую дисперсию:
Затем рассчитывается средняя внутригрупповая дисперсия:
Рассчитаем среднюю внутригрупповую дисперсию:
Общая дисперсия рассчитывается по формуле:
Рассчитаем общую дисперсию:
Мерой тесноты связи между результативным и факторным признаками является коэффициент детерминации:
Рассчитаем коэффициент детерминации:
Корень квадратный из коэффициента детерминации называется эмпирическим корреляционным отношением:
Рассчитаем эмпирическое корреляционное отношение:
Показатель силы связи определяет, насколько изменится признак- результат при изменении признака-фактора на одну его единицу:
где - средние значения результативного признака в первой и последней группах аналитической группировки;
- середины интервала факторного признака в первой и последней группах аналитической группировки.
Таким образом, связь прямая, так как показатель силы связи больше нуля (1,06).
Коэффициент детерминации 0,87 показывает, что на 87% изменения признака-результата (количества выручки) зависит от признака-фактора (группы хозяйств).
Вариация изучаемого признака под влиянием признака-фактора равна 2173512515,9375 тыс.руб.в квартал. Случайная вариация внутри каждой группы равна 313228137,25 тыс. руб.
Эмпирическое корреляционное отношение равно 0,93 (ближе к 1), поэтому можно сказать, что связь тесная.
5.Выборочное обследование
В статистике различают два способа наблюдения в зависимости от полноты охвата объекта: сплошное и несплошное. Разновидностью несплошного наблюдения является выборочное.
Под выборкой понимается
метод статистического
Основным принципом выборочного наблюдения является обеспечение равной возможности попадания в отобранную часть любой из единиц изучаемой совокупности.
Характеристики, полученные по выборке, распространяются на всю совокупность.
Совокупность, из которой производится отбор, называется генеральной совокупностью. Отобранная для обследования часть называется выборочной совокупностью или выборкой.
Выборка должна достаточно точно представлять генеральную совокупность. Различия между показателями выборочной и генеральной совокупности объясняются ошибками выборки.
Ошибка выборки представляет собой среднее квадратическое отклонение выборочной средней и выборочной доли от средней и доли генеральной совокупности. Выборочная доля – доля единиц выборки, обладающих изучаемым признаком. Генеральная доля – доля единиц генеральной совокупности, обладающих изучаемым признаком.
Средняя ошибка выборки по выборочной средней определяется по формуле:
где μx̅ - средняя ошибка по выборочной средней;
σ2 – генеральная дисперсия;
n – численность выборочной совокупности
На практике значение генеральной дисперсии может быть не известно. Его можно заменить выборочной дисперсией (S2) при следующих условиях:
- если объём выборки больше либо равен 100, σ2 = S2;
- если объём выборки меньше 100, σ2 = S2 .
Средняя ошибка выборки тем больше, чем больше вариация признака в генеральной совокупности и чем меньше объём выборки.
Средняя ошибка выборки по выборочной доле определяется по формуле:
где р – доля признака в генеральной и выборочной совокупности;
(1- p) – доля единиц генеральной и выборочной совокупности, не обладающих изучаемым признаком.
Теорией вероятности доказано, что генеральная средняя (x̅) не выйдет за пределы, равные величине средней ошибки (μx̅) не во всех возможных выборках, а только в 6 827 и 10 000, т.е. ожидаемую ошибку можно утверждать с вероятностью P = 0, 6827. Данная вероятность представляет собой величину интервала вероятности Лапласа при t = 1. Величину t называют коэффициентом доверия или нормированным отклонением, а вероятность P – доверительной вероятностью. С целью повышения вероятности приходится расширять пределы возможных ошибок, увеличивая коэффициент доверия. Например, при t = 2 утверждать, что генеральная средняя не выйдет за пределы рассчитанных ошибок, можно с вероятностью P = 0,954; при t = 3 с вероятностью P = 0,997. Найти значение нормированного отклонения при заданной вероятности можно по «Таблице значений интервала вероятностей» в статистических справочниках и учебниках.
Средняя ошибка, умноженная на коэффициент t называется предельной ошибкой выборки или допустимой погрешностью:
- допустимая погрешность по средней величине: ∆x = t μx̅ ;
- допустимая погрешность по доле: ∆p = t μp ;
Приведённые выше формулы справедливы при повторном отборе. При бесповторном отборе в подкоренное выражение вводится множитель:
где n – объём выборки ; N – объём генеральной совокупности.
Таким образом, формулы для расчёта ошибок выборки выглядят так:
При применении выборочного
обследования важно правильно рассчитать
объём выборки. Для расчёта необходимой
численности выборки
где t – находится по таблице по заданной доверительной вероятности;
∆ - задаётся исследователем, исходя из тебуемой точности расчётов;
σ2 – принимается по предыдущему обследованию, либо рассчитывается:
- если известно наибольшее
и наименьшее значения
- если известно среднее
значение признака в
Если рассчитанный объём выборки превышает 5% от объёма генеральной совокупности, делается пересчёт на бесповторный отбор:
Для выборочного обследования выбрана таблица № 3.
Из общего количества хозяйств Глазовского района была проведена 20%-ная случайная бесповторная выборка с целью определения среднего количества выручки в квартал. Определить с вероятностью 0,95 доверительные пределы, в которых лежит средний объём выручки для всех хозяйств Глазовского района.
Результаты выборки следующие:
Группы хозяйств по количеству выручки от реализации с/х продукции за 1 квартал 2011 г. , тыс.руб. x |
Количество хозяйств, шт.
f |
Среднее значение выручки по группе
x' |
1. 0 - 4115 |
7 |
1875,6 |
2. 4115 - 8230 |
3 |
6508 |
3. 8230 - 12345 |
1 |
11467 |
4. 12345 - 16460 |
1 |
15463 |
5. 16460 - 20575 |
4 |
19285 |
Итого: |
16 |
54598,6 |
Информация о работе Статистические методы социальных и экономических явлений и процессов