Предмет и методы статистики

Автор: Пользователь скрыл имя, 12 Апреля 2012 в 11:25, лекция

Краткое описание

1. Что означает термин «статистика»
Статистика - (от итал. stato - государство ) - англ. statistics; нем. Statistik. 1. Наука , изучающая количественную сторону массовых явлений. 2. Совокупность упорядоченных, классифицированных данных о к.-л. массовом явлении или процессе .
2. Кто ввел в науку термин «статистика»
В науку термин «статистика» ввел немецкий ученый Готфрид Ахенваль в 1746 году

Файлы: 1 файл

Предмет и методы статистики.doc

— 1,005.50 Кб (Скачать)

 

Под выборочным понимается метод статистического исследования, при котором обобщающие показатели изучаемой совокупности устанавливаются по некоторой ее части, организованной по принципу случайного отбора.

 

1. Генеральная и выборочная совокупности

Выборочная совокупность – это совокупность единиц, попавших в выборку.

При сплошном наблюдении – множество всех единиц данной совокупности носит

название генеральной совокупности.

 

2. Понятие и классификации ошибок выборочного наблюдения

 

 

 

Ошибки репрезентативности возникают только при выборочном наблюдении.

Возникают в силу того, что  выборочная совокупность не может в точности

воспроизвести  генеральную совокупность. Избежать их нельзя, но они легко

поддаются прогнозированию и при необходимости их можно свести к минимуму.

Ошибка выборочного наблюдения – это разности между величиной  параметра в

генеральной совокупности и его величиной вычисленной по результатам выборочного

наблюдения.

ошибкой регистрации (несовершенство технических условий)

 

 

4.Закон больших чисел в выборочном методе

 

Закон больших чисел – общий принцип, в силу которого совместное действие случайных факторов приводит при некоторых весьма общих условиях к результату, почти не зависящему от случая. Первым примером действия этого принципа может служить сближение частоты наступления случайного события с его вероятностью при возрастании числа испытаний

 

5.Способы отбора единиц в выборочную совокупность

1. индивидуальный отбор –в выборку отбираются отдельные единицы;

2.  групповой отбор – в выборку попадаются качественно однородные группы или серии изучаемых явлений;

3. комбинированный отбор – как комбинация индивидуального и группового отбора.

 

6.Виды выборочного наблюдения.

    Простая случайная выборка (собственно-случайная) есть отбор единиц из генеральной совокупности путем случайного отбора, но при условии вероятности выбора любой единицы из генеральной совокупности. Отбор проводится методом жеребьевки или по таблице случайных чисел.

    Типическая (стратифицированная) выборка предполагает разделение неоднородной генеральной совокупности на типологические или районированные группы по какому-либо существенному признаку, после чего из каждой группы производится случайный отбор единиц

     Для серийной (гнездовой) выборки характерно то, что генеральная совокупность первоначально разбивается на определенные равновеликие или неравновеликие серии (единицы внутри серий связаны по определенному признаку), из которых путем случайного отбора отбираются серии и затем внутри отобранных серий проводится сплошное наблюдение.

     Механическая выборка представляет собой отбор единиц через равные промежутки (по алфавиту, через временные промежутки, по пространственному способу и т.д.). При проведении механического отбора генеральная совокупность разбивается на равные по численности группы, из которых затем отбирается по одной единице.

      Комбинированная выборка основана на сочетании нескольких способов выборки.

       Ступенчатая выборка есть образование внутри генеральной совокупности вначале крупных групп единиц, из которых образуются группы, меньшие по объему, и так до тех пор, пока не будут отобраны те группы или отдельные единицы, которые необходимо исследовать.

 

7.Расчет ошибок выборочного наблюдения  при различных видах выборки

 

Основной задачей при выборочном исследовании является определение ошибок выборки. Принято различать среднюю и предельную ошибки выборки. Для иллюстрации можно предложить расчет ошибки выборки на примере простого случайного отбора.

Расчет средней ошибки повторной простой случайной выборки производится следующим образом:

cредняя ошибка для средней

 

cредняя ошибка для доли

 

Расчет средней ошибки бесповторной случайной выборки:

средняя ошибка для средней

 

средняя ошибка для доли

 

Расчет предельной ошибки  повторной случайной выборки:

предельная ошибка для средней

предельная ошибка для доли

 

где t - коэффициент кратности;

Расчет предельной ошибки бесповторной случайной выборки:

предельная ошибка для средней

 

предельная ошибка для доли

 

Следует обратить внимание на то, что под знаком радикала в формулах при бесповторном отборе появляется множитель, где N - численность генеральной совокупности.

Что касается расчета ошибки выборки в других видах выборочного отбора (например, типической и серийной), то необходимо отметить следующее.

Для типической выборки величина стандартной ошибки зависит от точности определения групповых средних. Так, в формуле предельной ошибки типической выборки учитывается средняя из групповых дисперсий, т.е.

 

При серийной выборке величина ошибки выборки зависит не от числа исследуемых единиц, а от числа обследованных серий (s) и от величины межгрупповой дисперсии:

 

Серийная выборка, как правило, проводится как бесповторная, и формула ошибки выборки в этом случае имеет вид

 

где  - межсерийная дисперсия; s - число отобранных серий; S - число серий в генеральной совокупности.

Все вышеприведенные формулы применимы для большой выборки. Кроме большой выборки используются так называемые малые выборки (n < 30), которые могут иметь место в случаях нецелесообразности использования больших выборок.

При расчете ошибок малой выборки необходимо учесть два момента:

1) формула средней ошибки имеет вид

 

Задача 1. При выборочном изучении квалификации рабочих на одном заводе, где работает 2000 человек, получено следующее распределение 100 рабочих по тарифным разрядам (рабочие отбирались по схеме бесповторного отбора):

Определите: 1) в каких пределах находятся в генеральной совокупности средний тарифный разряд (с вероятностью 0,954) и доля рабочих, имеющих 5-й и 6-й разряды (с вероятностью 0,683); 2) какова должна быть численность выборки, чтобы ошибка доли не превышала 0,02.

 

1) Определим с вероятностью 0,954 предельную ошибку выборки и границы, в которых можно ожидать средний разряд в расчете на одного человека в генеральной совокупности.

При случайном бесповторном отборе средняя ошибка определяется по формуле  ,

где   - выборочная  (или генеральная) дисперсия;

        n – объем выборочной совокупности;

        N- объем генеральной совокупности.

Определим средний разряд по формуле:

 

 

и дисперсию  по формуле:

, = 2,23

n=100,              N=2000

0,146.

Определим предельную ошибку выборки по формуле: .

Так как по условию p=0,954, то по таблице значений функции Лапласа при данной в условии доверительной вероятности из соотношения найдем t=2. Подставим полученные значения в формулу и получим .

Определим пределы, в которых будут находиться характеристики генеральной совокупности по формуле:

Вывод: средний разряд рабочего (с вероятностью 0,954)  находится в пределах: .

Определим долю рабочих, имеющих 5 и 6 разряд в генеральной совокупности.

Таких людей 16+13=29 чел.

Выборочная доля таких людей составляет

,  Так как по условию p=0,683, то по таблице значений функции Лапласа при данной в условии доверительной вероятности из соотношения найдем t=1. n=100 чел., генеральная совокупность составляет N=2000 чел.

По формуле   найдем среднюю квадратическую ошибку бесповторной выборки для доли:

0,044

Найдем предельную ошибку выборки для доли по формуле:

=1*0,044=0,044.

Теперь искомый доверительный интервал определяем по формуле:

,

,

  .  

Итак, с надежностью 0,683 доля  рабочих 5 и 6 разряда в генеральной совокупности, заключена  в пределах от 0,246 до 0,334.

Предельная ошибка выборки . Требуемая ошибка не более . Для определения объема бесповторной выборки воспользуемся формулой:

=201 чел.

Объем выборки должен составлять 201чел.

 

Задача 2. Произведено выборочное наблюдение для установления процента изделий высшего сорта в партии однородной продукции. При механическом отборе из партии в 10 000 единиц готовых изделий было обследовано 400 единиц, из которых 320 изделий отнесено к высшему сорту. Определите с вероятностью 0,997 возможный процент изделий высшего сорта во всей партии.

Решение:

Выборочная доля изделий высшего сорта составляет

,  Так как по условию p=0,997, то по таблице значений функции Лапласа при данной в условии доверительной вероятности из соотношения найдем t=3.

n=400 ед., генеральная совокупность составляет N=10000 ед.

По формуле   найдем среднюю квадратическую ошибку бесповторной выборки для доли:

0,019

Найдем предельную ошибку выборки для доли по формуле:

=3*0,019=0,057.

Теперь искомый доверительный интервал определяем по формуле:

,

,

  .  

Итак, с надежностью 0,997 доля  изделий высшего сорта во всей партии, заключена  в пределах от 74,3% до 85,7%.

 

Задача 3. Определите численность выборки при обследовании остатков на расчетных счетах у клиентов Народного банка, чтобы с вероятностью 0,683 ошибка выборки не превышала 50 тенге. Известна величина дисперсии – 12 000 тенге, при выборке применялся механический отбор.

 

Решение:

Предельная ошибка выборки . Для определения объема механической выборки воспользуемся формулой:

,

Тогда численность выборки

=5.

 

Задача 4. При выборочном обследовании 100 партий изделий установлено, что средний вес партии составляет 63, а среднее квадратичное отклонение – 4,5 кг. Определите с вероятностью 0,683 ошибку выборки.

Решение:

При средняя ошибка определяется по формуле 

,

Дисперсия

=4,52 =20,25

0,45.

 

Задача 5. Используя условие предыдущей задачи, определите необходимую численность выборки, чтобы ошибка выборки не превышала 0,3 кг (с вероятностью 0,683).

Решение:

Численность выборки при ошибке 0,3 кг

=281 партия

 


 

ТЕМА  8. РЯДЫ ДИНАМИКИ

 

1.      Дайте понятие Интерполяция — (interpolation) Оценка значения неизвестной величины, находящейся между двумя точками ряда известных величин

Экстраполяция — [< лат. extra сверх, вне + polire делать гладким] метод научного исследования, заключающийся в распространении выводов, полученных из наблюдения над одной частью явления, на другую его часть

 

2. Рядами динамики в статистике называются ряды последовательно расположенных в хронологическом порядке показателей, которые характеризуют развитие явления.

В ряду динамики для каждого отрезка времени приводятся два показателя: показателя времени t и уровень ряда y. 

В зависимости от вида приводимых в рядах динамики обобщающих показателей их можно разделить на ряды динамики абсолютных, относительных и средних величин.

В зависимости от того, характеризуются ли уровни развития общественных явлений на определенные моменты времени или за определенные периоды времени ряды динамики принимают вид либо моментных либо интервальных рядов динамики.

На основе рядов динамики абсолютных величин могут быть получены ряды динамики относительных и средних величин.

Важнейшими разновидностями рядов динамики относительных величин являются ряды темпов роста (например, производства продукции), изменения структуры (например, доходов и расходов республиканского бюджета) и изменения показателей интенсивности (например, выработки продукции на душу населения, численности скота на 100 га земельных угодий).  и на конец периода.

Показатели динамики.  Для анализа динамики исчисляют следующие показатели в статистических рядах динамики: темпы роста Ty, абсолютные приросты Δy, относительные прироста TΔy (которые иначе называются темпами прироста) и абсолютная величина одного процента прироста.

Темпами роста Ty называются отношения уровней ряда одного периода к другому. Они могут быть исчислены как базисные, когда все уровни ряда относятся к уровню одного какого-либо периода, принятого за базу. Они могут быть исчислены как цепные темпы, когда уровни каждого периода соотносятся с уровнями предыдущего периода.

Базисные и цепные темпы роста могут быть исчислены как коэффициенты, если основания отношения принимаются за единицу, и как проценты, если основания отношения принимаются за 100. При этом обычно принято рассчитывать коэффициенты с точностью до трех знаков после запятой, а проценты – до одного знака.

Если темпы выражены в коэффициентах, то легко перейти от цепных темпов к базисным и обратно, пользуясь следующими правилами:

1)          произведение цепных темпов равно базисному;

2)          частное от деления двух базисных темпов равно цепному.

 

4.Абсолютный прирост, темп роста и прироста

Информация о работе Предмет и методы статистики