Автор: Пользователь скрыл имя, 16 Февраля 2013 в 00:56, контрольная работа
Изучение статистических совокупностей, состоящих из множеств единиц, связано с большими трудовыми и материальными затратами.
С давних пор представлялось заманчивым не изучать все единицы совокупности, а отобрать лишь некоторую часть, по которой можно было бы судить о свойствах всей совокупности в целом. Попытки такого рода делались еще в XVII в.
Введение…………………………………………………………………………...3
1. Сущность и этапы выборочного исследования………………………………5
2. Виды отбора единиц из генеральной совокупности…………………………8
3. Определение необходимого объёма выборки……………………………….16
4. Малая выборка………………………………………………………………...20
5. Использование выборочного метода при изучении социально экономических явлений…………………………………………………………24
Список литературы……………………………………………………………
Распределение объема выборки между слоями исходной совокупности называют размещением выборки. Наиболее известны три способа размещения: пропорциональное, равномерное и оптимальное.
При пропорциональном размещении из каждой типической группы отбирается число единиц, пропорциональное доле этой группы в численности генеральной совокупности. Этот способ размещения весьма популярен среди исследователей из-за простоты организации и анализа данных.
При равномерном размещении из каждого слоя отбирается равное число единиц, что позволяет обеспечить достаточный объем выборки в тех слоях, которые оказываются слабо представленными при других способах размещения. К равномерному способу размещения приходится прибегать также в случаях, когда объемы слоев в исходной совокупности до исследования неизвестны.
Способ оптимального размещения выборки заключается в преимущественном распределении выборки в слоях с большей вариацией изучаемого (или косвенно с ним связанного) признака. Чем однороднее слой, тем меньшим объемом он может быть представлен в выборке. Если объемы слоев одинаковы, или примерно одинаковы, объем выборки в каждом пропорционален среднему квадратичному отклонению признака. При значительных различиях в объемах выборка распределяется пропорционально произведению среднего квадратичного признака на удельный вес слоя в совокупности. На практике использование оптимального размещения в чистом виде встречает определенные трудности. Как правило, из широкого набора признаков в многоцелевом исследовании бывает сложно выбрать единственный, в соответствии с которым следовало бы разместить выборку.
Равномерный и оптимальный способы относятся к непропорциональному размещению, поэтому оценка по совокупности строится с помощью процедуры взвешивания: оценка по каждому слою включается в общую в соответствии с его удельным весом.
Для типической выборки средняя ошибка рассчитывается по формуле:
− при пропорциональном размещении:
(повторный отбор)
(бесповторный отбор),
где - средняя из групповых дисперсий.
− при непропорциональном размещении:
(повторный отбор)
(бесповторный отбор),
где Ni и ni - объёмы типической группы и выборки из неё соответственно;
- групповые дисперсии.
Серийный отбор также иногда применяется в социально-экономических исследованиях. Его отличительной особенностью является следующее: случайно или механически отбирают не отдельные единицы генеральной совокупности, а серии, или группы. Внутри каждой отобранной серии обследуются все единицы. Отбор серий может осуществляться как случайным, тогда принципиальных различий между серийным и случайным отбором отдельных единиц нет, так и механическим путем, тогда он уже носит черты направленного отбора.
Серийная выборка дает более значительную ошибку репрезентативности, чем другие способы отбора. Это объясняется тем, что единицы, составляющие отобранную серию, обычно похожи друг на друга. Эта похожесть обусловлена тем, что они формируются в схожих условиях.
Вычисление средней ошибки серийной выборки основано на дисперсии серийных средних и она рассчитывается следующим образом:
при повторном отборе - ,
при бесповторном отборе - ,
где r - количество серий в выборки; R - количество серий в генеральной совокупности. Отсюда можно сделать следующий вывод: чем более разнородными будут единицы, входящие в состав отбираемых серий, тем репрезентативней будет выборка.
В практике статистических обследований помимо рассмотренных выше способов применяются и их комбинация. Так, например, можно комбинировать типическую и серийную выборки, когда серии отбираются в установленном порядке из нескольких типических групп. Возможна также комбинация серийного и собственно-случайного отборов, при которой отдельные единицы отбираются внутри серии в собственно случайном порядке. Ошибка этой выборки определяется ступенчатостью отбора.
Требования более удобной и гибкой организации отбора, приводят к пожертвованию репрезентативностью, однако, имеются и другие методы организации выборочного наблюдения, лучше отвечающие характеру изучаемого материала. При этом иногда даже может улучшиться баланс между точностью наблюдения и затратами времени, труда и средств.
Одним из таких путей является многоступенчатый отбор, предполагающий подвыборку, которая заключается в отборе более мелких единиц из уже отобранных крупных, т.е. из генеральной совокупности сначала извлекаются укрупненные группы, потом - более мелкие и так до тех пор, пока не будут отобраны те единицы, которые подвергаются обследованию. Наиболее часто используется двухступенчатая форма многоступенчатой выборки.
В отличие от многоступенчатой выборки многофазная выборка предполагает сохранение одной и той же единицы отбора на всех этапах его проведения, при этом отобранные на каждой стадии единицы подвергаются обследованию (на каждой последующей стадии программа обследования расширяется).
3. Определение необходимого объёма выборки
При проектировании выборочного наблюдения встает вопрос о необходимой численности выборки.
Для определения необходимого объёма выборки задается уровень точности выборочной совокупности с определенной вероятностью. Например, необходимая численность случайной повторной выборки определяется по формуле
,
которая вытекает из формулы предельной ошибки:
.
Эта формула показывает, что при увеличении предполагаемой ошибки выборки значительно уменьшается необходимый объём выборки.
Необходимая численность выборки прямо пропорциональна дисперсии признака и величине t2. Формула необходимого объёма выборки выводится для разных способов отбора из формулы предельной ошибки выборки. В таблице 2 приведены формулы необходимого объёма выборки для некоторых способов формирования выборочной совокупности.
Таблица 2*1
Вид выборочного наблюдения |
Повторный отбор |
Бесповторный отбор |
Собственно-случайная выборка: a) при определении среднего размера признака
б) при определении доли признака
Механическая выборка
Типическая выборка:
а) при определении среднего размера выборки
б) при определении доли признака
Серийная выборка:
а) при определении среднего размера выборки
б) при определении доли признака |
|
|
Необходимая численность выборки вычисляется по-разному для выборочного наблюдения, в котором устанавливается средний размер признака в совокупности, и для наблюдения, в котором определяется доля единиц, обладающих данным признаком, из-за различных методов вычисления меры колеблемости для варьирующего и альтернативного признаков.
Практическое определение необходимого объёма выборки нередко становится серьёзной проблемой. Она связана, в частности, с недостаточной разработанностью таких вопросов, как оценка вариации изучаемых признаков, обоснование численности выборки при изучении нескольких признаков, зависимость объёма выборочной совокупности от программы разработки материалов наблюдения и др. Трудности появляются и из-за организационных факторов, которые должны быть обязательно учтены.
Одним из наиболее существенных и в то же время сложных вопросов определения необходимого объёма выборки в исследованиях являются расчет среднего квадратического отклонения изучаемого признака (s), так как часто отсутствуют данные необходимые для его вычисления. Обычно для этой цели берутся материалы предыдущих обследований. Но, если за прошедший до нового обследования период в генеральной совокупности произошли значительные изменения, то эти данные использовать нельзя.
Часто чтобы получить точные данные об изучаемой совокупности, в том числе и о вариации изучаемого признака, проводиться пробное обследование. По данным такого обследования можно рассчитать среднее квадратическое отклонение и дисперсию для последующего обоснования необходимого объёма выборки. Если же мера колеблемости признака не известна, то её можно найти приближенно по величине предлагаемого размаха или среднего линейного отклонения по следующим формулам:
и
где s - среднее квадратическое отклонение; R - размах вариации; - среднее линейное отклонение.
При применении этих формул важно чтобы фактическое распределение было близко к нормальному, так как не имеет смысла вычислять среднее квадратического отклонение для явно несимметричных распределений.
Очень часто при статистическом исследовании социально-экономических явлений расчет необходимого объёма выборки проводится по качественным признакам. Способ выражения качественных признаков не позволяет рассчитать по ним средние значения, поэтому оценка колеблемости обычно производится, исходя из долей единиц, обладающих значениями этих признаков, т.е. выборочных долей. Выборочная доля так же называется частностью.
Если расчет производится по качественному альтернативному признаку и не известна его доля в генеральной совокупности, рекомендуется принять её равной 0,5, так как дисперсия доли достигает максимума:
при w=0,5
Такой прием позволяет рассчитать численность выборки, если вы не располагаете результатами предыдущего обследования, и также позволяет избежать проведения пробных обследований, а значит, позволяет сэкономить время и ресурсы, что часто оказывается решающими факторами.
В условиях рыночной экономики в практике статистического исследования все чаще приходится сталкиваться с небольшими по объёму так называемыми малыми выборками.
Под малой выборкой понимается такое выборочное наблюдение, численность единиц которого не превышает 30. В настоящее время малая выборка используется более широко, чем раньше, прежде всего за счет статистического изучения малых и средних предприятий, коммерческих банков, фермерских хозяйств и т.д., количество которых в определенных случаях, особенно при региональных исследованиях, а также величина характеризующих их показателей (например, численность занятых) часто незначительны. Поэтому, хотя общий принцип выборочного обследования (с увеличением объёма выборки повышается точность выборочных данных) остается в силе, иногда приходиться ограничиваться малым числом наблюдений. Наряду со статистическим изучением рыночных структур эта необходимость возникает при выборочной проверки качества продукции, в научно-исследовательской работе и в ряде других случаев.
Разработка теории малой выборки была начата английским статистиком В.С. Госсетом (печатавшимся под псевдонимом Стьюдент) в 1908г. Он доказал, что оценка расхождения между средней малой выборки и генеральной средней имеет особый закон распределения, иногда называемое распределением Стьюдента.
При оценке результатов малой выборки величина генеральной дисперсии в расчетах не используется. Для определения возможных пределов ошибки пользуются так называемым критерием Стьюдента, определяемым по формуле
где - мера случайных колебаний выборочной средней в малой выборке.
Величина σ вычисляется на основе данных выборочного наблюдения. Она равна:
Данная величина используется лишь для исследуемой совокупности, а не в качестве приближенной оценки σ в генеральной совокупности. При небольшой численности выборки распределение Стьюдента отличается от нормального: большие величины критерия имеют здесь большую вероятность, чем при нормальном распределении.
Предельная ошибка малой выборки ( ) в зависимости от средней ошибки ( ) представлена как
Но в данном случае величина t иначе связана с вероятной оценкой, чем при большой выборке. Согласно распределению Стьюдента, вероятная оценка зависит как от величины t, так и от объема выборки в случае, если предельная ошибка не превысит t-кратную среднюю ошибку в малых выборках. При увеличении n это распределение стремиться к нормальному и при n=20 уже мало отличается от него.
Для каждого числа степеней свободы k = n-1 указана предельная величина tp (t0,95 или t0,99), которая с данной вероятностью р не будет превышать в силу случайных колебаний результатов выборки. На основе величины tp определяются доверительные интервалы
и
Эта область тех значений генеральной средней, выход за которые имеет весьма малую вероятность, равную:
В качестве доверительной вероятности при двусторонней проверки используются, как правило, р=0,95 или р=0,99, что не исключает, однако, выбора и других р.
Вероятность q случайного выхода оцениваемой средней величины за пределы доверительного интервала соответственно будут равны 0,05 и 0,01, т.е. весьма малы. Выбор между вероятностями 0,95 и 0,99 является до известной степени произвольным. Этот выбор во многом определяется содержанием тех задач, для решения которых применяется малая выборка.
В заключение отметим, что расчет ошибок в малой выборке мало отличается от аналогичных вычислений в большой выборке. Различие заключается в том, что при малой выборке вероятность нашего утверждения несколько меньше, чем при большой выборке. Однако все это не означает, что можно использовать малую выборку тогда, когда нужна большая выборка. Во многих случаях расхождения между найденными пределами могут достигнуть значительных размеров, что вряд ли удовлетворяет исследователей. Поэтому малую выборку следует применять в статистическом исследовании социально-экономических явлений с большой осторожностью, при соответствующем теоретическом и практическом обосновании.
Информация о работе Использование выборочного метода при изучении социально экономических явлений