Автор: Пользователь скрыл имя, 06 Ноября 2011 в 18:31, курс лекций
Курс «Теория статистики» имеет целью дать студентам представление о содержании статистики как научной дисциплины, познакомить с ее основными понятиями, методологией и методикой расчета важнейших статистических аналитических показателей. В соответствии с этим данный конспект лекций охватывает самые общие начальные элементы статистической науки. В дальнейшем на базе курса «Теория статистики» изучаются конкретные статистические дисциплины: теория статистического наблюдения, анализ и прогнозирование временных рядов, классификации и группировки, многомерные статистические методы, отраслевые статистики и другие.
где – значение осредняемого признака или серединное значение интервала, в котором измеряется варианта;
– количество значений признака или количество интервалов группирования;
– показатель степени средней;
– частота, показывающая, сколько раз встречаются -е значения осредняемого признака.
Общие формулы расчёта
степенных средних имеют
Виды
степенных средних
Вид степенной средней | Показа-тель
степени ( |
Формула расчёта | |
Простая | Взвешенная | ||
Гармоническая | -1 | ||
Геометрическая | |||
Арифметическая | 1 | ||
Квадратическая | 2 | ||
Кубическая | 3 |
Если рассчитать все виды средних для одних и тех же исходных данных, то значения их окажутся неодинаковыми. Здесь действует правило мажорантности средних: с увеличением показателя степени увеличивается и соответствующая средняя величина:
В
статистической практике чаще, чем
остальные виды средних взвешенных,
используются средние арифметические
и средние гармонические взвешенные.
Расчет
средних по результатам
группировки
Очень часто исходные данные для анализа бывают представлены в сгруппированном виде, когда для каждого значения усредняемого признака Х сообщается частота его повторения. В этих случаях средняя величина рассчитывается по обычным формулам средних взвешенных (арифметических или гармонических). Сложности возникают, когда в сгруппированных данных указывается не конкретное значение признака Х по каждой группе, а лишь интервал его изменения. В данном случае правильный расчет общей средней величины возможен, если удается получить среднее значение признака по каждой группе. Если же это сделать невозможно, то их заменяют серединами интервалов. Таким образом, расчет средней арифметической делают по формуле
Отметим, что расчет среднего значения по данным группировки требует особого внимания при выборе взвешивающего показателя.
Средняя арифметическая величина обладает рядом свойств, позволяющих ускорить расчет:
Структурные
средние
Структурные
средние применяются для
В качестве структурных средних чаще всего используют показатели моды – наиболее часто повторяющегося значения признака, и медианы – величины признака, которая делит упорядоченную последовательность его значений на две равные по численности части. Если изучаемый признак имеет дискретные значения, то особых сложностей при расчете моды и медианы не бывает. Рассмотрим случай, когда значения признака Х представлены в виде интервальных рядов. Поскольку медианное значение делит всю совокупность на две равные части, оно оказывается в одном из интервалов признака Х. С помощью интерполяции в этом медианном интервале, находят значение медианы:
,
где ХMe – верхняя граница предмедианного интервала (начало медианного);
hMe – величина медианного интервала;
- половина от общего числа наблюдений.
- сумма наблюдений, накопленная
до начала медианного
- число наблюдений в медианном
интервале.
Тема
5. Показатели вариации
В статистической практике для изучения и измерения вариации используются различные показатели (меры) вариации в зависимости от поставленных перед исследователем задач. К ним относятся размах вариации, среднее линейное отклонение, средний квадрат отклонений (дисперсия), среднее квадратическое отклонение и коэффициент вариации.
Способы вычисления показателей вариации. Размах вариации (R) является наиболее простым измерителем вариации признака
,
где – наибольшее значение варьирующего признака;
– наименьшее значение признака.
Среднее линейное отклонение ( ) представляет собой среднюю величину из отклонений вариантов признака от их средней.
– невзвешенное среднее линейное отклонение.
Показатели дисперсии и среднего квадратического отклонения являются общепринятыми мерами вариации и широко используются в статистических исследованиях.
Дисперсия представляет собой средний квадрат отклонений индивидуальных значений признака от их средней величины.
– невзвешенная;
– взвешенная.
Среднее квадратическое отклонение представляет собой корень второй степени из среднего квадрата отклонений отдельных значений признака от их средней.
Для целей сравнения колеблемости различных признаков в одной и той же совокупности или же при сравнении колеблемости одного и того же признака в нескольких совокупностях вычисляются относительные показатели вариации. Базой для сравнения служит средняя арифметическая.
Различают
следующие относительные
Коэффициент осцилляции: .
Линейный коэффициент вариации: .
Коэффициент вариации: .
Правило сложения дисперсий. Если данные представлены в виде аналитической группировки, то можно вычислить дисперсию общую, межгрупповую и внутригрупповую.
Общая дисперсия измеряет вариацию признака во всей совокупности под влиянием всех факторов, обусловливающих эту вариацию:
Межгрупповая дисперсия характеризует различия в величине изучаемого признака, возникающие под влиянием признака-фактора, положенного в основание группировки. Она рассчитывается по формуле:
где и – соответственно средние и численности по отдельным группам.
Внутригрупповая дисперсия отражает часть вариации, происходящую под влиянием неучтенных факторов и не зависящую от признака-фактора, положенного в основание группировки. Она исчисляется следующим образом:
Существует закон, связывающий три вида дисперсий. Общая дисперсия равна сумме средней из внутригрупповых и межгрупповых дисперсий:
где
Данное
соотношение называют правилом
сложения дисперсий. Согласно этому
правилу общая дисперсия, возникающая
под влиянием всех факторов, равна сумме
дисперсий, возникающих под влиянием прочих
факторов, и дисперсии, возникающей за
счёт группировочного признака.
Тема 6. Выборочное наблюдение
Тема
«Выборочное наблюдение»
Часть единиц отобранных для наблюдений принято называть выборкой, а всю совокупность единиц из которых производится отбор – генеральной совокупностью. Качество результатов выборочного наблюдения зависит от того, на сколько состав выборки представляет генеральную совокупность, иначе говоря, от того, насколько выборка репрезентативна. Чтобы обеспечить репрезентативность выборки, необходимо соблюдать принцип случайности отбора единиц.
Особенности обследуемых объектов определяют 2 метода отбора единиц в выборочную совокупность – повторный и бесповторный. При повторном отборе каждая попавшая в выборку единица возвращается в генеральную совокупность и имеет шанс вторично попасть в выборку. Бесповторный отбор означает, что каждая отобранная единица не возвращается в генеральную совокупность и не может подвергнуться вторичной регистрации, а потому для остальных единиц вероятность попасть в выборку увеличивается. Понятно, что бесповторный отбор дает более точные результаты.
Разность между показателями выборочной и генеральной совокупности называется ошибкой выборки. Расчёт ошибок позволяет решить одну из главных проблем организации выборочного наблюдения – оценить репрезентативность (представительность) выборочной совокупности.
Рассмотрим
на примере, насколько отличаются выборочные
и генеральные показатели по данным
об успеваемости студентов.
Оценка | Число студентов, чел. | ||
Генеральная совокупность | Первая выборка | Вторая выборка | |
2 | 100 | 9 | 12 |
3 | 300 | 27 | 29 |
4 | 520 | 54 | 52 |
5 | 80 | 10 | 7 |
Итого | 1000 | 100 | 100 |
Средний балл по генеральной совокупности
по первой
по второй
Доля студентов, получивших «4» и «5»:
по
по первой