Ошибка выборки

Автор: Пользователь скрыл имя, 11 Декабря 2012 в 13:54, реферат

Краткое описание

Использование выборки предполагает, что необходимо как-то оценивать соответствие результатов, полученных на выборке, реальному положению вещей. Эта оценка означает определение ошибки исследования. Всего при проведении исследований выделяются такие ошибки, как ошибка выборки, ошибка измерения и случайная (неконтролируемая) ошибка. Из перечисленных типов ошибок складывается ошибка всего исследования.

Файлы: 1 файл

зачет.docx

— 1,004.69 Кб (Скачать)

Ошибка выборки

Использование выборки предполагает, что необходимо как-то оценивать  соответствие результатов, полученных на выборке, реальному положению  вещей. Эта оценка означает определение  ошибки исследования. Всего при проведении исследований выделяются такие ошибки, как ошибка выборки, ошибка измерения  и случайная (неконтролируемая) ошибка. Из перечисленных типов ошибок складывается ошибка всего исследования.

Ошибку выборки также  часто именуют стандартной ошибкой. Определение ошибки выборки возможно только для случайных выборок, где  у каждого респондента равная вероятность попасть в выборку. Вычисление ошибки выборки означает определение расхождения между  результатами исследования и результатами, которые показала бы сплошная перепись генеральной совокупности, т. е. представляет собой вычисление значимости полученных результатов. Вычисление ошибки выборки  опирается на понятие нормального  распределения ответов, полученных случайным образом. Это распределение  описывается кривой Гаусса.

Вычисление стандартной  ошибки — это процесс определения  разницы между выборкой и генеральной  совокупностью с определенной степенью уверенности. Ошибка может возникнуть случайно или в силу недостатков  процедуры исследования. Когда используется случайная выборка, вероятность  ошибки может быть определена благодаря  связи между выборкой и нормальным распределением.

Ошибка выборки подразумевает  два понятия — уровень доверия  и доверительный интервал. Точность полученных результатов оценивается  исходя из попадания в доверительный  интервал при определенном уровне доверия. К примеру, исследователь может  с уверенностью в 95% (уровень доверия) сказать, что полученный им результат  — 30% людей, смотревших «Кто хочет стать  миллионером» — среди генеральной  совокупности будет, скажем, лежать в  трехпроцентном интервале (доверительный  интервал). То есть в действительности с вероятностью 95% можно утверждать, что передачу видело от 27 до 33% населения.

При нормальном распределении  стандартное отклонение определяет единицу стандартного расстояния от среднего распределения до границ распределения. Эта единица расстояния стандартного отклонения определяет доверительный  интервал исследования. Кроме того, единица указывает на величину стандартной  ошибки. Например, одна стандартная  ошибка (—1 и +1 расстояние стандартного отклонения от средней) означает, что  ответы 68% выборки (т. е. при доверительном  уровне 68%) попадут в задаваемое ею расстояние.

Оценка ошибки выборки  при доверительной вероятности 68% используется при проверке точности результатов исследования, которые  не будут использоваться при принятии значимых решений, т. к. оценка точности на этом доверительном уровне невелика. Поэтому чаще исследователями используется более высокий доверительный  уровень 95%, т. е. оценка вероятности что 95% ответов попадут в заданный интервал, который в этом случае составит две стандартные ошибки.

Важность использования  вероятностных или случайных  выборок при проведении исследований и измерений аудитории СМИ  заключается именно в возможности  оценить степень отклонения значений аудитории, полученных в ходе исследования, от значений, существующих в действительности. Эта возможность особенно важна  в силу того, что данные, используемые при медиапланировании, имеют одной из задач оптимизацию бюджета. Поскольку речь идет о деньгах и зачастую больших деньгах, то очень важно понимать — насколько будут точны значения, полученные при медиапланировании рекламной кампании, и насколько верно были израсходованы средства рекламодателя.

Ошибки в статистике

 

Ошибки в статистике (сплошных и выборочных) могут возникнуть ошибки двух видов: репрезентативности и регистрации.

Ошибки репрезентативности характерны только для выборочного  наблюдения и возникают в результате того, что выборочная совокупность не полностью воспроизводит генеральную. Они определяются как расхождение между значениями показателей, полученных по выборке, и значениями показателей этих же величин, которые были бы получены при проведенном сплошном наблюдении с одинаковой степенью точности.

Ошибки регистрации могут  иметь случайный, систематический  и непреднамеренный характер.

Случайные ошибки часто уравновешивают друг друга, так как они не имеют преимущественного направления в сторону преувеличения (преуменьшении) значения изучаемого показателя. Данные ошибки имеют объективный характер и возникают в следствии случайных различий между единицами, попавшими в выборку, и единицами генеральной совокупности. В результате и структуры этих совокупностей чаще всего не совпадают. Научным обоснованием случайных ошибок являются теория вероятностей и ее предельные теоремы.

Систематические ошибки направлены в одну сторону в результате предумышленного нарушения правил отбора. Их можно избежать при правильной организации и проведении наблюдения.

 

Ошибка выборки в статистике

 

Ошибка выборки или  ошибка репрезентативности определяется как разница между значением  показателя, который был получен  по выборке, и генеральным параметром. Она характерна только для выборочных наблюдений. Чем больше значение этой ошибки, тем в большей степени  выборочные показатели отличаются от соответствующих им генеральных  показателей.

Ошибку выборки часто  определяют по формулам:

1. Для среднего количественного  признака:

 где первое — среднее  значение признака в генеральной  совокупности или генеральная средняя;

 второе — выборочная средняя.

2. Для доли (альтернативного  признака):

где w — выборочная доля;

 р — генеральная доля, или доля единиц, обладающих данным значением признака в общем числе единиц генеральной совокупности.

Ошибки выборки возникают  вследствие двух причин из-за нарушения  принципа случайности как основного  принципа выборки (систематические  ошибки) и в результате случайного отбора (случайные ошибки). Выборки  являются случайными величинами и могут  принимать разные значения.

 

 

Определение ошибки выборки

 

При выборочном наблюдении регистрируется только часть единиц генеральной совокупности. Но эта  часть по объему должна быть такова, чтобы получаемые сведения оказались  репрезентативными, т. е. достаточно верно  отражали содержание и закономерности изучаемого явления в целом. Под  репрезентативностью понимается свойство выборочной совокупности воспроизводить характеристики генеральной совокупности.

Разность между данными  генеральной и выборочной совокупностей  называют ошибкой репрезентативности, или ошибкой выборки. Например, генеральная  совокупность правонарушителей составляет 500 человек. Удельный вес лиц, воспитанных  в неполной семье, среди них равен 30%. При выборочном наблюдении было изучено 50 человек, среди которых  удельный вес таких лиц оказался 25%. Ошибка выборки равна: 30% — 25% = 5% (0,5). Аналогичным образом выводится  ошибка репрезентативности и для  количественного признака. Предположим, что средняя арифметическая величина возраста преступников в генеральной  совокупности была равна 28,3 года. В  выборочной совокупности она составила 26,5 года. Ошибка равна: 28,3 — 26,5 = 1,8 года.

 Ошибки бывают тенденциозными, или систематическими, и случайными. Первые — результат неправильного  или преднамеренного отбора исследователем  тех или иных показателей, вторые  — результат случайностей неполного  отбора.

Тенденциозные ошибки возникают  тогда, когда исследователь неправильно  сформировал выборку, не знал научных  правил отбора единиц совокупности, сознательно  отобрал наиболее показательные  единицы. Например, исследуя правосознание  граждан, анкетер в целях экономии времени воспользовался аудиторией студентов-юристов и опросил их. Полученные данные, естественно, отражали правовые взгляды лишь этих респондентов и не соответствовали взглядам всех граждан. Выводы, сделанные на основе тенденциозных выборок, будут ошибочными. Они могут причинить вред делу.

Истории известны многие курьезы, связанные с пренебрежением правилами  выборочного наблюдения. Один из них  произошел в США в 1936 г. при  прогнозировании исхода президентских  выборов. Журнал «Литерари Дайджест», используя телефонные книги, опросил свыше 2 млн человек. По итогам опроса президентом должен быть избран Ландон. Социологи Геллап и другие опросили только 4 тыс. жителей и пришли к однозначному выводу: победит Рузвельт. Их прогноз оправдался. В чем причина таких расхождений? Первая выборка отражала мнение лишь состоятельных консервативных слоев населения, которые имели телефоны, вторая — всех слоев населения. Она оказалась более представительной, хотя была в 500 раз меньше первой. Роковую роль сыграли тенденциозные ошибки.

Научно-практическая задача выборочного наблюдения сводится не только к тому, чтобы при малых  затратах сил и средств максимально  приблизить данные выборки к данным всей генеральной совокупности, но и к тому, чтобы точно измерить, в каких пределах результаты выборки  отличаются от данных генеральной совокупности. Здесь и встает вопрос о характере  ошибок.

 

Тенденциозные (систематические) ошибки нельзя измерить. Они могут  быть самыми разными по величине и  содержанию. Тенденциозные ошибки тем  меньше, чем выше квалификация исследователя, чем лучше он знаком с объектом изучения и возможными источниками  систематических ошибок.

 

Ошибки статистического  наблюдения.

 

Собранные в процессе статистического  наблюдения данные по отдельным единицам изучаемой совокупности на последующих  стадиях статистического исследования должны быть сведены (обобщены) и обработаны, чтобы получить объективный и  точный ответ на все вопросы, поставленные целью исследования. Качество и правильность результатов любого статистического исследования, которые можно получить на основе обобщения, обработки и анализа статистических данных, зависят от качества и достоверности исходного материала – статистических данных.

 Всякое статистическое  наблюдение ставит задачу получения  таких данных, которые по возможности  более точно отображали бы  действительность, состояние изучаемых  единиц совокупности. Под точностью  статистической информации понимается  уровень (степень) соответствия  зафиксированной при статистическом  наблюдении величины изучаемого  признака действительному его  значению.

 Отклонения или разности  между зафиксированными при статистическом  наблюдении величинами изучаемого  признака и действительными (истинными)  величинами его называют ошибками  наблюдения.

В зависимости от источников и причины возникновения неточностей, допускаемых в процессе статистического  наблюдения, обычно выделяют ошибки регистрации  и ошибки репрезентативности (представительности).

 Ошибки регистрации возникают вследствие неправильного установления фактов в процессе наблюдения или неправильной их записи. Они имеют место как при сплошном, так и несплошном наблюдении. Ошибки регистрации подразделяются на случайные и систематические.

Случайные ошибки – это  ошибки, допущенные при заполнении бланков (цифра записана не в ту графу  или допущена описка в записи), оговорка в ответах, нечеткость в вопросе  и соответственно в ответе и т.д.

Систематические ошибки могут быть преднамеренными и непреднамеренными. Преднамеренные ошибки (сознательные) получаются в результате того, что при знании действительного состояния (величины) признака сознательно сообщаются неправильные данные. Непреднамеренными называются ошибки, вызываемые случайными причинами: например, неправильностью измерительных приборов, невнимательностью регистраторов и др.

Ошибки репрезентативности (представительности) свойственны не сплошному наблюдению. Они возникают в результате того, что состав отобранной для обследования части массового явления (части единиц совокупности, выборки) недостаточно полно отображает особенности, сущность всей изучаемой совокупности.

 Эти ошибки тоже  могут быть случайными из-за  того, что отобранные единицы  совокупности неполно воспроизводят  всю совокупность. Величина случайной  ошибки репрезентативности может  быть оценена с помощью соответствующих  математических методов (рассматриваются  в дисциплине “Математическая  статистика”).

Систематическая ошибки репрезентативности может возникнуть вследствие нарушения принципов случайного отбора единиц не сплошного наблюдения. Размеры систематической ошибки репрезентативности не поддаются оценке.

 

Ошибки статистического  наблюдения и меры борьбы с ними

 

При проведении статистического  наблюдения неизбежно наличие ошибок, которые подразделяются на преднамеренные и непреднамеренные и репрезентативности. Преднамеренные ошибки статистического  наблюдения - это такие ошибки, которые  получаются в результате преднамеренных действий. Они носят закономерный характер не систематический характер. Непреднамеренные - случайный характер и систематический связанный с особенностью статистического наблюдения, например округление количественных показателей. Данные ошибки можно определять следующими способами - логический контроль, например - 3 года и женат, логической взаимосвязью поставленных вопросов. Ошибки между сплошным и не сплошным наблюдением - ошибка репрезентативности.

Информация о работе Ошибка выборки