Автор: Пользователь скрыл имя, 06 Ноября 2012 в 19:41, курс лекций
Лекция 1. Предмет и метод статистики
Лекция 2. Статистическое наблюдение
Лекция 3. Сводка и группировка статистических данных
В зависимости от числа положенных в основание группировки признаков различают простые и многомерные группировки.
Простая группировка выполняется по одному признаку. Среди простых группировок особо выделяются ряды распределения. Ряд распределения – группировка, в которой для характеристики групп, упорядоченно расположенных по значению признака применяется один показатель – численность группы.
Возьмем условный пример дискретного
ряда распределения студентов
№ п/п |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
11 |
12 |
13 |
14 |
15 |
16 |
17 |
18 |
19 |
20 |
Рост, см |
152 |
155 |
157 |
160 |
163 |
165 |
166 |
166 |
166 |
169 |
170 |
170 |
171 |
172 |
171 |
175 |
179 |
180 |
181 |
184 |
Данный ряд является ранжированным, так как значения роста упорядочены по возрастанию.
Построим интервальный ряд распределения студентов по росту, для чего необходимо выбрать оптимальное число групп (интервалов признака) и установить длину (размах) интервала. Поскольку при дальнейшем анализе ряда распределения сравнивают частоты в разных интервалах, необходимо, чтобы длина интервалов была постоянной (иначе для сопоставимости придется частоты делить на единицу интервала - полученное значение называется плотностью).
Оптимальное число групп выбирается так, чтобы в достаточной мере отразилось разнообразие значений признака в совокупности и в то же время закономерность распределении, его форма не искажалась случайными колебаниями частот. Если групп будет слишком мало, то не проявится закономерность вариации; если групп будет чрезмерно много, то случайные скачки частот исказят форму распределения.
Чаще всего число групп в ряду распределения определяют по формуле Стерждесса:
где k – число групп (округляемое до ближайшего целого числа); N – численность совокупности.
В нашем примере про студентов по формуле Стерждесса определим число групп: k = 1 + 3,322lg20 = 5,32. Так как число групп не может быть дробным, то округляем k = 5,32 до ближайшего целого числа по правилам округлений - 5.
Зная число групп, рассчитывают длину (размах) интервала по формуле:
В нашем примере про студентов h = (184 - 152)/5 = 6,4 (см). То есть для построения интервального ряда распределения нужно 20 студентов разбить на 5 групп с интервалом по 6,4 см. Представим интервальный ряд распределения студентов по росту в виде таблицы:
Рост, см |
152 - 158,4 |
158,4 - 164,8 |
164,8 - 171,2 |
171,2 - 177,6 |
177,6 - 184 |
Итого |
Число студентов |
3 |
2 |
8 |
3 |
4 |
20 |
Многомерная группировка производится по двум и более признакам. Частным случаем многомерной группировки является комбинационная группировка, базирующаяся на двух и более признаках, взятых во взаимосвязи.
По отношениям между признаками выделяют: иерархические группировки, выполняемые по двум и более признакам, при этом значения второго признака определяются областью значений первого (например, классификация отраслей промышленности по подотраслям); неиерархические группировки, когда строгой зависимости значений второго признака от первого не существует.
По очередности обработки
информации группировки бывают первичными,
составленные на основе первичных данных,
и вторичные, являющиеся результатом
перегруппировки ранее уже
В соответствии со временным критерием различают статические группировки, дающие характеристику совокупности на определенный момент или за определенный период, и динамические, показывающие переходы единиц из одних групп в другие.
Статистические данные должны быть представлены так, чтобы ими можно было пользоваться. Существует 3 основных формы представления статистических данных:
Текстовая форма применяется при малом количестве цифровых данных.
Табличная форма применяется чаще всего, так как является более эффективной формой представления статистических данных. В отличие от математических таблиц, которые по начальным условиям позволяют получить тот или иной результат, статистические таблицы рассказывают языком цифр об изучаемых объектах.
Статистическая таблица – это система строк и столбцов, в которых в определенной последовательности и связи излагается статистическая информация о социально-экономических явлениях.
Например, в следующей таблице представлена информация о внешней торговле России, выражать которую в текстовой форме было бы неэффективным.
1995 |
2000 |
2001 |
2002 |
2003 |
2004 |
2005 |
2006 |
2007 | |
Миллиардов долларов США | |||||||||
Внешнеторговый оборот |
145,0 |
149,9 |
155,6 |
168,3 |
212,0 |
280,6 |
369,2 |
468,6 |
578,2 |
Экспорт |
82,4 |
105,0 |
101,9 |
107,3 |
135,9 |
183,2 |
243,8 |
303,9 |
355,2 |
Импорт |
62,6 |
44,9 |
53,8 |
61,0 |
76,1 |
97,4 |
125,4 |
164,7 |
223,1 |
Сальдо торгового баланса |
19,8 |
60,1 |
48,1 |
46,3 |
59,9 |
85,8 |
118,4 |
139,2 |
132,1 |
со странами дальнего зарубежья |
|||||||||
экспорт |
65,4 |
90,8 |
86,6 |
90,9 |
114,6 |
153,0 |
210,2 |
260,6 |
301,5 |
импорт |
44,3 |
31,4 |
40,7 |
48,8 |
61,0 |
77,5 |
103,5 |
140,1 |
191,2 |
сальдо торгового баланса |
21,2 |
59,3 |
45,9 |
42,1 |
53,6 |
75,5 |
106,7 |
120,4 |
110,3 |
со странами СНГ |
|||||||||
экспорт |
17,0 |
14,3 |
15,3 |
16,4 |
21,4 |
30,2 |
33,5 |
43,4 |
53,7 |
импорт |
18,3 |
13,4 |
13,0 |
12,2 |
15,1 |
19,9 |
21,9 |
24,6 |
31,9 |
сальдо торгового баланса |
-1,4 |
0,8 |
2,2 |
4,2 |
6,3 |
10,3 |
11,7 |
18,8 |
21,9 |
Различают подлежащее и сказуемое
статистической таблицы. В подлежащем
указывается характеризуемый
По характеру подлежащего статистические таблицы подразделяются на простые, групповые и комбинационные. В подлежащем простой таблицы объект изучения не подразделяется на группы, а дается либо перечень всех единиц совокупности, либо указывается совокупность в целом. В подлежащем групповой таблицы объект изучения подразделяется на группы по одному признаку, а в сказуемом указываются число единиц в группах (абсолютное или в процентах) и сводные показатели по группам. В подлежащем комбинационной таблицы совокупность подразделяется на группы не по одному, а по нескольким признакам.
При построении таблиц необходимо руководствоваться следующими общими правилами.
Иногда статистические таблицы дополняются графиками, когда ставится цель подчеркнуть какую-то особенность данных, провести их сравнение. Графическая форма является самой эффективной формой представления данных с точки зрения их восприятия. С помощью графиков достигается наглядность характеристики структуры, динамики, взаимосвязи явлений, их сравнения.
Статистические графики – это условные изображения числовых величин и их соотношений посредством линий, геометрических фигур, рисунков или географических карт-схем. Графическая форма облегчает рассмотрение статистических данных, делает их наглядными, выразительными, обозримыми. Однако графики имеют определенные ограничения: прежде всего, график не может включить столько данных, сколько может войти в таблицу; кроме того, на графике показываются всегда округленные данные – не точные, а приблизительные. Таким образом, график используется только для изображения общей ситуации, а не деталей. Последний недостаток – трудоемкость построения графиков. Он может быть преодолен использованием персонального компьютера (например, «Мастером диаграмм» из пакета Microsoft Office Excel).
Для характеристики массовых
явлений статистика используетстатистические
величины (показатели).
Они подразделяются наабсолютные, относительные и
Результаты статистических наблюдений представляют собой абсолютные величины, отражающие уровень развития какого-либо явления или процесса. Абсолютные величины обозначаются X, а их общее количество в статистической совокупности N.
Абсолютные величины всегда имеют свою единицу измерения (размерность), присущую изучаемому явлению. Широко распространены следующие виды единиц измерения:
Количество единиц с одинаковым значением признака обозначаетсяf и называется частота. Очевидно, что суммируя число всех единиц с одинаковыми значениями признака, получаем N.
Анализируя абсолютные величины, например, статистические данные о торговле, необходимо сопоставлять эти данные во времени и пространстве, исследовать закономерности их изменения и развития, изучать структуру совокупностей. С помощью абсолютных величин эти задачи не выполнимы, в этом случае необходимо использоватьотносительные величины.