Автор: Пользователь скрыл имя, 07 Февраля 2013 в 16:55, курс лекций
Тема 1. Предмет, метод и задачи статистики (1.5 часа)
Понятие статистики и ее особенности
Термин «статистика» употребляется в различных значениях. Под статистикой понимается практическая деятельность по сбору, накоплению, обработке и анализу цифровых данных, характери¬зующих население, экономику, культуру, образование и другие явления в жизни общества.
Однако дисперсия выборочной совокупности не равна дисперсии генеральной совокупности, и следовательно, средние ошибки выборки, рассчитанные по этим формулам будут приближенными. В теории вероятностей доказано, что генеральная дисперсия выражается через выборную следующим соотношением:
Так как п / (п -1) при достаточно больших п — величина, близкая к единице, то можно принять, что σ2 ≈ S2 , и в практических расчетах средних ошибок выборки можно использовать данные формулы (6.5) и (6.6). И только в случаях малой выборки (когда объем выборки не превышает 30) необходимо учитывать коэффициент п/(п-1) и исчислять среднюю ошибку малой выборки по формуле:
При случайном бесповторном отборе в приведенные выше формулы расчета средних ошибок выборки необходимо подкоренное выражение умножить на 1 - (п / N], поскольку в процессе бесповторной выборки сокращается численность единиц генеральной совокупности. Следовательно, для бесповторной выборки расчетные формулы средней ошибки выборки примут такой вид:
• для средней количественного признака
• для доли (альтернативного признака)
Так как я всегда меньше N, то дополнительный множитель 1 - (n / N) всегда будет меньше единицы. Отсюда следует, что средняя ошибка при бесповторном отборе всегда будет меньше, чем при повторном. В то же время при сравнительно небольшом проценте выборки этот множитель близок к единице (например, при 5%-ной выборке он равен 0,95; при 2%-ной -- 0,98 и т.д.). Поэтому иногда на практике пользуются для определения средней ошибки выборки формулами и без указанного множителя, хотя выборку и организуют как бесповторную. Это имеет место в тех случаях, когда число единиц генеральной совокупности N неизвестно или безгранично, или когда n очень мало по сравнению с N, и по существу, введение дополнительного множителя, близкого по значению к единице, практически не повлияет на значение средней ошибки выборки.
Конечной целью выборочного наблюдения является характеристика генеральной совокупности на основе выборочных результатов.
Выборочные средние и относительные величины распространяют на генеральную совокупность с учетом предела их возможной ошибки.
В каждой конкретной выборке расхождение между выборочной средней и генеральной, т. е. может быть меньше средней ошибки выборки η , равно ей или больше ее.
Причем каждое из этих
расхождений имеет различную ве
Предельную ошибку выборки для средней ( ) при повторном отборе можно рассчитать по формуле:
, где t — нормированное отклонение — «коэффициент доверия», зависящий от вероятности, с которой гарантируется предельная ошибка выборки; — средняя ошибка выборки.
Аналогичным образом может быть записана формула предельной ошибки выборки для доли ∆w при повторном отборе:
При случайном бесповторном отборе в формулах расчета предельных ошибок выборки и необходимо умножить подкоренное выражение на 1 - (п / N) .
Предельная ошибка выборки позволяет определить предельные значения характеристик генеральной совокупности и их доверительные интервалы:
• для средней ;
• для доли ;
Это означает, что с заданной вероятностью можно утверждать, что значение генеральной средней следует ожидать в пределах от до .
Пример. Для определения скорости расчетов с кредиторами предприятий корпорации в коммерческом банке была проведена случайная выборка 100 платежных документов, по которым средний срок перечисления и получения денег оказался равным 22 дням ( = 22) со стандартным отклонением 6 дней (S = 6).
Необходимо с вероятностью Р = 0,954 определить предельную ошибку выборочной средней и доверительные пределы средней продолжительности расчетов предприятий данной корпорации.
Решение. Предельную ошибку ∆ = tμ определяем по формуле повторного отбора, так как численность генеральной совокупности N неизвестна. Из представленных значений Ф (t) для вероятности P= 0,954 находим t =2.
Таблица вероятности предельной ошибки.
t 1,000 1,960 2,000 3,000
Ф(t) 0,683 0,950 0,954 0,997
Следовательно, предельная ошибка выборки, дней:
Генеральная средняя будет равна , а доверительные интервалы (пределы) генеральной средней исчисляем, исходя из двойного неравенства:
; ;
Таким образом, с вероятностью 0,954 можно утверждать, что средняя продолжительность расчетов предприятий данной корпорации колеблется в пределах от 20,8 до 23,2 дней.
Определение необходимого объема выборки. При проектировании выборочного наблюдения с заранее заданным значением допустимой ошибки выборки очень важно правильно определить численность (объем) выборочной совокупности, которая определенной вероятностью обеспечит заданную точность результатов наблюдения. Формулы для определения необходимой численности выборки n легко получить непосредственно из формул ошибок выборки.
Так, из формул предельной ошибки выборки для повторного отбора нетрудно (предварительно возведя в квадрат обе части равенства) выразить необходимую численность выборки:
• для средней количественного признака
• для доли (альтернативного признака)
Аналогично из формул предельной ошибки выборки для бесповторного отбора находим, что
• для средней количественного признака
• для доли (альтернативного признака)
Эти формулы показывают,
что с увеличением
Для расчета объема выборки нужно знать дисперсию. Она может быть заимствована из проводимых ранее обследований данной или аналогичной совокупности, а если таковых нет, тогда для определения дисперсии надо провести специальное выборочное обследование небольшого объема.
Задача 4. Для определения среднего возраста 1200 студентов факультета необходимо провести выборочное обследование методом случайного бесповторного отбора. Предварительно установлено, что среднее квадратическое отклонение возраста студентов равно 10 годам.
Сколько студентов нужно обследовать, чтобы с вероятностью 0,954 средняя ошибка выборки не превышала 3 года?
Решение. Рассчитаем необходимую численность выборки, чел., по формуле бесповторного отбора (6.31), учитывая, что? = 2 при Р= 0,954:
Таким образом, выборки численностью 47 чел. обеспечивает заданную точность при бесповторном отборе.
Тема 6 Статистические методы изучения взаимосвязей социально-экономических явлений (1.5 часа)
Понятие и типы взаимосвязей, сущность их изучения
Изучение статистических закономерностей — важнейшая познавательная задача статистики, которую она решает с помощью особых методов, видоизменяющихся в зависимости от характера исходной информации и целей познания. Знание характера и силы связей позволяет управлять социально-экономическими процессами и предсказывать их развитие. Особую актуальность это приобретает в условиях развивающейся рыночной экономики. Изучение механизма рыночных связей, взаимодействия спроса и предложения, влияния объема и структуры товарооборота на объем и состав производства продукции, формирования товарных запасов, издержек производства, прибыли и других качественных показателей имеет первостепенное значение для прогнозирования конъюнктуры рынка, региональной организации производственных и торговых процессов, успешного ведения бизнеса.
Изучая социально-
Статистические показатели, отображающие объективную взаимообусловленность и взаимозависимость отдельных сторон экономической деятельности могут состоять между собой в следующих основных видах связи: балансовой, компонентной, факторной.
Балансовая связь показателей коммерческой деятельности характеризует зависимость между источниками формирования ресурсов (средств) и их использованием. Свое проявление она получает, например, в формуле товарного баланса:
Он +П = В+ОК
где Он — остаток товаров на начало изучаемого периода; П — поступление товаров за период; В — выбытие товаров в изучаемом периоде; Ок — остаток товаров на конец периода.
Компонентные связи показателей коммерческой деятельности характеризуются тем, что изменение статистического показателя определяется изменением компонентов, входящих в этот показатель, как множители:
a = b • c.
В статистике экономической деятельности компонентные связи используются в индексном методе выявления роли отдельных факторов в совокупном изменении сложного показателя.
Факторные связи в экономической деятельности характеризуются тем, что они проявляются в согласованной вариации изучаемых показателей. При этом одни показатели выступают как факторные, а другие — как результативные. По своему характеру этот вид связи является причинно-следственной (детерминированной) зависимостью.
В свою очередь, факторные связи могут рассматриваться как функциональные и корреляционные.
При функциональной связи изменение результативного признака у всецело обусловлено действием факторного признака х:
y=f(x)
Примером функциональной связи является зависимость длины окружности l от радиуса (r) :
l=2πr
Характерной особенностью функциональной связи является то, что она проявляется с одинаковой силой у каждой единицы изучаемой совокупности. Поэтому, установив при изучении любой единицы совокупности ту или иную закономерность, ее можно распространить как на каждую единицу, так и на всю изучаемую совокупность. Знание функциональных зависимостей позволяет абсолютно точно прогнозировать события, например наступление солнечных затмений с точностью до секунды.
При корреляционной связи изменение результативного признака у обусловлено влиянием факторного признака х не всецело, а лишь частично, так как возможно влияние прочих факторов ε:
у = φ (х) + ε.
По своему характеру корреляционные связи — это связи соотносительные. Примером корреляционной связи показателей коммерческой деятельности является зависимость сумм издержек обращения от объема товарооборота. В этой связи помимо факторного признака—объема товарооборота х на результативный признак (сумму издержек обращения у) влияют и другие факторы, в том числе и неучтенные ε. Поэтому корреляционные связи не являются полными (жесткими) зависимостями. При одном и том же значении учтенного факторного признака возможны различные значения результативного признака. Это обусловлено наличием других факторов, которые могут быть различными по составу, направлению и силе действия на отдельные (индивидуальные) единицы статистической совокупности. Поэтому для изучаемой статистической совокупности в целом здесь устанавливается такое соотношение, в котором определенному изменению факторного признака соответствует среднее изменение признака результативного.
Характерной особенностью корреляционных связей является то, что они проявляются не в единичных случаях, а в массе. Поэтому изучаются корреляционные связи по так называемым эмпирическим данным, полученным в статистическом наблюдении. В таких данных отображается совокупное действие всех причин и условий на изучаемый показатель.
При статистическом изучении корреляционной связи определяется влияние учтенных факторных признаков при отвлечении (абстрагировании) от прочих аргументов. Применяемый таким образом способ научной абстракции хотя и ведет к некоторому упрощению (аппроксимации) реального механизма связи, но делает возможным установление закономерностей взаимодействия изучаемых показателей, что позволяет, не прибегая к экспериментированию, получать количественные характеристики корреляционной связи.
При изучении корреляционной связи показателей коммерческой деятельности перед статистикой ставятся следующие основные задачи:
- проверка положений
экономической теории о
- установление количественных оценок тесноте связи, характеризующих силу влияния факторных признаков на результативные.
Для исследования стохастических связей широко используется метод сопоставления двух параллельных рядов, метод аналитических группировок, корреляционный анализ, регрессионный анализ и некоторые непараметрические методы.