Автор: Пользователь скрыл имя, 07 Февраля 2013 в 16:55, курс лекций
Тема 1. Предмет, метод и задачи статистики (1.5 часа)
Понятие статистики и ее особенности
Термин «статистика» употребляется в различных значениях. Под статистикой понимается практическая деятельность по сбору, накоплению, обработке и анализу цифровых данных, характери¬зующих население, экономику, культуру, образование и другие явления в жизни общества.
Там, где возникает потребность обобщения, расчет таких характеристик приводит к замене множества различных индивидуальных значений признака средним показателем, характеризующим всю совокупность явлений, что позволяет выявить закономерности, присущие массовым общественным явлениям, незаметные в единичных явлениях.
Средняя отражает характерный, типичный, реальный уровень изучаемых явлений, характеризует эти уровни и их изменения во времени и в пространстве.
Средняя это сводная характеристика закономерностей процесса в тех условиях, в которых он протекает.
Средние, полученные для неоднородных совокупностей, будут искажать характер изучаемого общественного явления, фальсифицировать его, или будут бессмысленными. Так, если рассчитать средний уровень доходов служащих какого-либо района, то получится фиктивный средний показатель, поскольку для его исчисления использована неоднородная совокупность, включающая в себя служащих предприятий различных типов (государственных, совместных, арендных, акционерных), а также органов государственного управления, сферы науки, культуры, образования и т.п. В таких случаях метод средних используется в сочетании с методом группировок, позволяющим выделить однородные группы, по которым и исчисляются типические групповые средние.
Средняя должна исчисляться для совокупности, состоящей из достаточно большого числа единиц, так как в этом случае согласно закону больших чисел взаимопогашаются случайные, индивидуальные различия между единицами, и они не оказывают существенного влияния на среднее значение, что способствует проявлению основного, существенного, присущего всей массе. Если основываться на средней из небольшой группы данных, то можно сделать неправильные выводы, поскольку такой средний показатель будет отражать значительное влияние индивидуальных особенностей, т.е. случайных моментов, не характерных для изучаемой совокупности в целом.
Каждая средняя характеризует изучаемую совокупность по какому-либо одному признаку, но для характеристики любой совокупности, описания ее типических черт и качественных особенностей нужна система средних показателей. Поэтому в практике отечественной статистики для изучения социально-экономических явлений, как правило, исчисляется система средних показателей. Так, например, показатели средней заработной платы оцениваются совместно с показателями средней выработки, фондовооруженности и энерговооруженности труда, степенью механизации и автоматизации работ и др.
Средняя должна вычисляться с учетом экономического содержания исследуемого показателя. Поэтому для конкретного показателя, используемого в социально-экономическом анализе, можно исчислить только одно истинное значение средней на базе научного способа расчета.
Виды средних величин
Выбор вида средней определяется экономическим содержанием определенного показателя и исходных данных. В каждом конкретном случае применяется одна из средних величин: арифметическая, гармоническая, геометрическая, квадратическая, кубическая и т.д.
Средняя арифметическая простая определяется суммированием показателей и делением на их число по формуле:
_ _
х = ∑х / n , где х – средняя арифметическая, n – число.
Средняя арифметическая взвешенная определяется с учетом веса, значения каждого показателя по формуле:
_
х = ∑х f / ∑f , где ∑х f – сумма произведений величины признаков на их вес или частоты, ∑f – общая численность единиц весов.
Средняя геометрическая используется для расчета среднегодовых темпов роста показателей в хозяйственной деятельности за ряд отчетных периодов по формуле:
; где – коэффициенты цепных темпов роста, n – число темпов роста, принятые для расчета средних показателей.
Пример: рассчитать среднегодовые темпы роста объема продаж предприятия за 4 года . Цепные темпы роста по годам составляют в %: 1- 103,4 (1,034 в коэффициентах), 2- 99,2 (0,992), 3 – 98,4, 4 – 96,9.
Среднегодовые темпы роста = T = 4√(1,034*0,992*0,984*0,969)= 4√0,9780 =0,994 или 99,4%.
Когда статистическая информация не содержит частот f по отдельным вариантам x совокупности, а представлена как их произведение х* f, применяется формула средней гармонической взвешенной. Чтобы исчислить среднюю, обозначим x-f = w, откуда f = w/x . Теперь преобразуем формулу средней арифметической таким образом, чтобы по имеющимся данным х и w можно было исчислить среднюю. В формулу средней арифметической взвешенной вместо x f подставим w, вместо f - отношение w/x и получим формулу средней гармонической взвешенной:
Особым видом средних величин являются структурные средние. Они применяются для изучения внутреннего строения и структуры рядов распределения значений признака. К таким показателям относятся мода и медиана.
Мода М0 — значение случайной величины, встречающееся с наибольшей вероятностью в дискретном вариационном ряду — вариант, имеющий наибольшую частоту.
В интервальных рядах
распределения с равными
,
где - нижняя граница модального интервала;
– величина модального интервала;
- частота модального интервала;
- частота интервала, предшествующего модальному;
- частота интервала, следующего за модальным;
Медиана Ме — это вариант, который находится в середине вариационного ряда. Медиана делит ряд на две равные (по числу единиц) части — со значениями признака меньше медианы и со значениями признака больше медианы. Чтобы найти медиану, необходимо отыскать значение признака, которое находится в середине упорядоченного ряда. В ранжированных рядах несгруппированных данных нахождение медианы сводится к отысканию порядкового номера медианы.
Пусть ряд состоит из показателей заработной платы 9 рабочих, руб. в месяц (в 1996 г.):
630, 650, 680, 690, 700, 710, 720, 730, 750.
Номер медианы для нечетного объема вычисляется по формуле:
где п — число членов ряда.
В нашем примере номер медианы равен 5, медиана равна 700 руб. (т.е. одна половина рабочих получила зарплату менее 700 руб., а другая — более 700 руб. в месяц).
В случае четного объема ряда медиана равна средней из двух вариантов, находящихся в середине ряда.
В интервальных рядах распределения медианное значение (поскольку оно делит всю совокупность на две равные по численности части) оказывается в каком-то из интервалов признака х. Этот интервал характерен тем, что его кумулятивная частота (накопленная сумма частот) равна или превышает полусумму всех частот ряда. Значение медианы вычисляется линейной интерполяцией по формуле:
,
где - нижняя граница медианного интервала;
- величина медианного интервала;
- накопленная частота интервала, предшествующего медианному;
- частота медианного интервала.
Понятие о вариации признака в совокупности. Система показателей вариации, их применение в анализе финансово-экономической деятельности предприятия
Вариация — это различие в значениях какого-либо признака у разных единиц данной совокупности в один и тот же период или момент времени.
Например, работники фирмы различаются по доходам, затратам времени на работу, росту, весу, любимому занятию в свободное время и т.д.
Вариация возникает в результате того, что индивидуальные значения признака складываются под совокупным влиянием разнообразных факторов (условий), которые по-разному сочетаются в каждом отдельном случае. Таким образом, величина каждого варианта объективна.
К показателям вариации относятся: размах вариации, среднее линейное отклонение, дисперсия и среднее кваратическое отклонение, коэффициент вариации.
Самым простым показателем вариации признака является размах вариации R, представляющий собой разность между максимальным и минимальным значениями признака:
Пример: Предположим, что одинаковую работу выполняют две бригады, каждая — из трех человек. Пусть количество деталей, шт., изготовленных за смену отдельными рабочими, составляло:
в первой бригаде — 95, 100, 105 ( = 100 шт.);
во второй бригаде — 75, 100, 125 ( = 100 шт.).
Средняя выработка на одного рабочего в обеих бригадах одинакова и составляет = =100шт., однако колеблемость выработки отдельных рабочих в первой бригаде значительно меньше, чем во второй.
размах вариации сменной выработки деталей составляет: в первой бригаде — R1= 10 шт. (т.е. 105 — 95); во второй бригаде — R2= 50 шт. (т.е. 125 — 75), что в 5 раз больше.
Это свидетельствует о том, что при численном равенстве средняя выработка первой бригады более «устойчива». Размах вариации может служить базой расчета возможных резервов роста выработки. Таких резервов больше у второй бригады, поскольку в случае достижения всеми рабочими максимальной для этой бригады выработки деталей, ею может быть изготовлено 375 шт., т.е. (3x125), а в первой — только 315 шт., т.е. (3 х 105).
Среднее линейное отклонение представляет собой среднюю арифметическую абсолютных значений отклонений отдельных вариантов от их средней арифметической (при этом всегда предполагают, что среднюю вычитают из варианта: .
Среднее линейное отклонение:
- для несгруппированных данных , где n – число членов ряда;
- для сгруппированных данных , где – сумма частот вариационного ряда;
С помощью среднего линейного отклонения анализируется состав работающих, ритмичность производства, оборот внешней торговли и т.д.
На практике меру вариации более объективно отражает показатель дисперсии (σ2 — средний квадрат отклонений), определяемый как средняя из отклонений, возведенных в квадрат (x — )2:
;
;
Корень квадратный из дисперсии σ2 среднего квадрата отклонений представляет собой среднее квадратическое отклонение:
σ2 и σ являются общепринятыми мерами вариации признака. Так, по бригаде 1 дисперсия составила:
; и среднеквадратическое
по бригаде 2:
и среднеквадратическое
Среднее квадратическое отклонение является мерилом надежности средней. Чем меньше среднее квадратическое отклонение, тем лучше средняя арифметическая отражает собой всю представляемую совокупность.
В бригаде №1 среднеквадратическое отклонение меньше, следовательно средняя из этих данных более близко отражает свойства статистической совокупности.
Расчет можно упростить, используя свойства дисперсии (доказываемые в математической статистике). Приведем два из них:
первое — если все значения признака уменьшить или увеличить на одну и ту же постоянную величину А, то дисперсия от этого не изменится;
второе — если все значения признака уменьшить или увеличить в одно и то же число раз (i раз), то дисперсия соответственно уменьшится или увеличится в i2 раз.
Учитывая, что среднеквадратическое отклонение дает обобщающую характеристику колеблемости всех вариантов совокупности, наиболее распространенным показателем колеблемости является коэффициент вариации, используемым для оценки типичности средних величин.
При этом исходят из того, что если v больше 40%, то это говорит о большой колеблемости признака в изучаемой совокупности. В нашем примере коэффициент вариации подтверждает большую колеблемость товарооборота в бригаде 2. ;
Виды дисперсий. Правило сложения дисперсий. Расчет на его основе коэффициента детерминации и эмпирического корреляционного отношения. Их практическое использование.
Изучая дисперсию интересующего признака в пределах исследуемой совокупности и опираясь на общую среднюю в своих расчетах, нельзя определить влияние отдельных факторов, характеризующих колеблемость индивидуальных значений (вариант) признака.
Это можно сделать при помощи группировок, подразделив изучаемую совокупность на группы, однородные по признаку-фактору. При этом можно определить три показателя колеблемости признака в совокупности: общую дисперсию, межгрупповую дисперсию и среднюю из внутригрупповых дисперсий.
Общая дисперсия характеризует вариацию признака, которая зависит от всех условий в данной совокупности. Исчисляется общая дисперсия по формуле
где — общая средняя для всей изучаемой совокупности.
Межгрупповая дисперсия отражает вариацию изучаемого признака, которая возникает под влиянием признака-фактора, положенного в основу группировки. Она характеризует колеблемость групповых (частных) средних около общей средней . Межгрупповая дисперсия вычисляется по формуле: