Лекции по "Теория статистики"

Автор: Пользователь скрыл имя, 06 Ноября 2011 в 18:31, курс лекций

Краткое описание

Курс «Теория статистики» имеет целью дать студентам представление о содержании статистики как научной дисциплины, познакомить с ее основными понятиями, методологией и методикой расчета важнейших статистических аналитических показателей. В соответствии с этим данный конспект лекций охватывает самые общие начальные элементы статистической науки. В дальнейшем на базе курса «Теория статистики» изучаются конкретные статистические дисциплины: теория статистического наблюдения, анализ и прогнозирование временных рядов, классификации и группировки, многомерные статистические методы, отраслевые статистики и другие.

Файлы: 1 файл

Чимитова Е_В_ Теория статистики (конспект лекций).doc

— 419.00 Кб (Скачать)
="center">    

где – значение осредняемого признака или серединное значение интервала, в котором измеряется варианта;

        – количество значений  признака или количество интервалов группирования;

            – показатель степени средней;

            – частота, показывающая, сколько раз встречаются -е значения осредняемого признака.

          Общие формулы расчёта  степенных средних имеют показатель степени ( ). В зависимости от того, какое значение он принимает, различают следующие виды степенных средних, представленных в таблице. 
 

    Виды  степенных средних 

Вид степенной  средней Показа-тель степени (
)
Формула расчёта
Простая Взвешенная
Гармоническая -1
Геометрическая
0
Арифметическая 1
Квадратическая 2
Кубическая 3
 

     Если  рассчитать все виды средних для одних и тех же исходных данных, то значения их окажутся неодинаковыми. Здесь действует правило мажорантности средних: с увеличением показателя степени увеличивается и соответствующая средняя величина:

     

     В статистической практике чаще, чем  остальные виды средних взвешенных, используются средние арифметические и средние гармонические взвешенные. 

Расчет  средних по результатам  группировки  

      Очень часто исходные данные для анализа  бывают представлены в сгруппированном  виде, когда для каждого значения усредняемого признака Х сообщается частота его повторения. В этих случаях средняя величина рассчитывается по обычным формулам средних взвешенных (арифметических или гармонических). Сложности возникают, когда в сгруппированных данных указывается не конкретное значение признака Х по каждой группе, а лишь интервал его изменения. В данном случае правильный расчет общей средней величины возможен, если удается получить среднее значение признака по каждой группе. Если же это сделать невозможно, то их заменяют серединами интервалов. Таким образом, расчет средней арифметической делают по формуле

      

, где 
.

      Отметим, что расчет среднего значения по данным группировки требует особого  внимания при выборе взвешивающего  показателя.

      Средняя арифметическая величина обладает рядом  свойств, позволяющих ускорить расчет:

    1. Величина средней арифметической не изменится, если веса всех вариантов умножить или разлить на одно и то же число.
    2. Если все индивидуальные значения признака (все варианты) увеличить или уменьшить в одно и то же число раз, то среднее значение получившегося нового признака будет во столько же раз отличаться от среднего значения исходного показателя.
 

Структурные средние 

      Структурные средние применяются для изучения внутреннего строения рядов распределения  значений признака, а также для  оценки средней величины (степенного типа), если по имеющимся данным ее расчет не может быть выполнен.

      В качестве структурных средних чаще всего используют показатели моды –  наиболее часто повторяющегося значения признака, и медианы – величины признака, которая делит упорядоченную последовательность его значений на две равные по численности части. Если изучаемый признак имеет дискретные значения, то особых сложностей при расчете моды и медианы не бывает. Рассмотрим случай, когда значения признака Х представлены в виде интервальных рядов. Поскольку медианное значение делит всю совокупность на две равные части, оно оказывается в одном из интервалов признака Х. С помощью интерполяции в этом медианном интервале, находят значение медианы:

       ,

      где ХMe – верхняя граница предмедианного интервала (начало медианного);

      hMe – величина медианного интервала;

       - половина от общего числа  наблюдений.

       - сумма наблюдений, накопленная  до начала медианного интервала;

       - число наблюдений в медианном  интервале. 
 

     Тема 5. Показатели вариации 

     В статистической практике для изучения и измерения вариации используются различные показатели (меры) вариации в зависимости от поставленных перед  исследователем задач. К ним относятся размах вариации, среднее линейное отклонение, средний квадрат отклонений (дисперсия), среднее квадратическое отклонение и коэффициент вариации.

      Способы вычисления показателей  вариации. Размах вариации (R) является наиболее простым измерителем вариации признака

,

где – наибольшее значение варьирующего признака;

       – наименьшее значение признака.

      Среднее линейное отклонение ( ) представляет собой среднюю величину из отклонений вариантов признака от их средней.

  – невзвешенное среднее  линейное отклонение.

     Показатели  дисперсии и среднего квадратического  отклонения являются общепринятыми мерами вариации и широко используются в статистических исследованиях.

     Дисперсия представляет собой средний квадрат отклонений индивидуальных значений признака от их средней величины.

         – невзвешенная;

      –  взвешенная.

     Среднее квадратическое отклонение представляет собой корень второй степени из среднего квадрата отклонений отдельных значений признака от их средней.

     Для целей сравнения колеблемости различных  признаков в одной и той  же совокупности или же при сравнении колеблемости одного и того же признака в нескольких совокупностях вычисляются относительные показатели вариации. Базой для сравнения служит средняя арифметическая.

     Различают следующие относительные показатели вариации ( ):

     Коэффициент осцилляции: .

     Линейный  коэффициент вариации: .

     Коэффициент вариации: .

     Правило сложения дисперсий. Если данные представлены в виде аналитической группировки, то можно вычислить дисперсию общую, межгрупповую и внутригрупповую.

     Общая дисперсия измеряет вариацию признака во всей совокупности под влиянием всех факторов, обусловливающих эту вариацию:

     

.

     Межгрупповая  дисперсия характеризует различия в величине изучаемого признака, возникающие под влиянием признака-фактора, положенного в основание группировки. Она рассчитывается по формуле:

     

,

где и – соответственно средние и численности по отдельным группам.

     Внутригрупповая дисперсия отражает часть вариации, происходящую под влиянием неучтенных факторов и не зависящую от признака-фактора, положенного в основание группировки. Она исчисляется следующим образом:

     

.

     Существует  закон, связывающий три вида дисперсий. Общая дисперсия равна сумме  средней из внутригрупповых и  межгрупповых дисперсий:

     

,

     где

.

     Данное  соотношение называют правилом сложения дисперсий. Согласно этому правилу общая дисперсия, возникающая под влиянием всех факторов, равна сумме дисперсий, возникающих под влиянием прочих факторов, и дисперсии, возникающей за счёт группировочного признака. 

 

      Тема 6. Выборочное наблюдение 

     Тема  «Выборочное наблюдение» является одной из центральных в курсе  теории статистики. Выборочное наблюдение тесно связано с курсами математической статистики и теории вероятностей.

     Часть единиц отобранных для наблюдений принято  называть выборкой, а всю совокупность единиц из которых производится отбор – генеральной совокупностью. Качество результатов выборочного наблюдения зависит от того, на сколько состав выборки представляет генеральную совокупность, иначе говоря, от того, насколько выборка репрезентативна. Чтобы обеспечить репрезентативность выборки, необходимо соблюдать принцип случайности отбора единиц.

     Особенности обследуемых объектов определяют 2 метода отбора единиц в выборочную совокупность  – повторный и  бесповторный. При повторном отборе каждая попавшая в выборку единица возвращается в генеральную совокупность и имеет шанс вторично попасть в выборку. Бесповторный отбор означает, что каждая отобранная единица не возвращается в генеральную совокупность и не может подвергнуться вторичной регистрации, а потому для остальных единиц вероятность попасть в выборку увеличивается. Понятно, что бесповторный отбор дает более точные результаты.

     Разность  между показателями выборочной и  генеральной совокупности называется ошибкой выборки. Расчёт ошибок позволяет решить одну из главных проблем организации выборочного наблюдения – оценить репрезентативность (представительность) выборочной совокупности.

     Рассмотрим  на примере, насколько отличаются выборочные и генеральные показатели по данным об успеваемости студентов. 

Оценка Число студентов, чел.
Генеральная совокупность Первая выборка Вторая выборка
2 100 9 12
3 300 27 29
4 520 54 52
5 80 10 7
Итого 1000 100 100
 

     Средний балл по генеральной совокупности

                  по первой выборке 

                  по второй выборке  .

     Доля  студентов, получивших «4» и «5»:

                  по генеральной  совокупности 

                  по первой выборке 

<

Информация о работе Лекции по "Теория статистики"