Автор: Пользователь скрыл имя, 12 Декабря 2012 в 19:47, курсовая работа
Ряд распределения – это упорядоченное распределение единиц совокупности на группы по какому-либо одному признаку: по качественному или количественному.
В зависимости от того, какой признак взят за основу группировки данных, различают соответственно типы рядов распределения.
Если за основу группировки взят качественный признак, то такой ряд распределения называют атрибутивным (распределение по видам труда, по полу, по профессии, по религиозному признаку, национальной принадлежности и т.д.).
Министерство образования и науки Российской Федерации
Федеральное государственное бюджетное
образовательное учреждение высшего
профессионального образования
«Санкт-Петербургский государственный
политехнический университет»
Факультет экономики и менеджмента
Кафедра «Экономика и менеджмента недвижимости
и технологий»
Лабораторная работа
по дисциплине «Статистика»
На тему «Анализ эмпирического распределения
и выборочное наблюдение»
Выполнил студент группы № 3072/5: Речная Е.А.
Преподаватель: Пономарёва О.А.
Санкт-Петербург
2012
Введение
Ряд распределения – это упорядоченное распределение единиц совокупности на группы по какому-либо одному признаку: по качественному или количественному.
В зависимости от того, какой признак взят за основу группировки данных, различают соответственно типы рядов распределения.
Если за основу группировки взят качественный признак, то такой ряд распределения называют атрибутивным (распределение по видам труда, по полу, по профессии, по религиозному признаку, национальной принадлежности и т.д.).
Если ряд распределения
Ранжированный ряд - это распределение отдельных единиц совокупности в порядке возрастания или убывания исследуемого признака.
Дискретный ряд - это такой вариационный ряд, в основу построения которого положены признаки с прерывным изменением (дискретные признаки). К последним можно отнести тарифный разряд, количество детей в семье, число работников на предприятии и т.д. Эти признаки могут принимать только конечное число определенных значений.
Если признак имеет
Комплексный анализ ряда распределения включает:
- Табличное и графическое
- Расчёт и анализ показателей центра и структуры распределения;
- Расчёт и анализ показателей вариации;
- Характеристику формы
- Выбор теоретического распределения, которому соответствует изучаемое эмпирическое;
Одна из важнейших целей изучения рядов распределения состоит в том, чтобы выявить закономерность распределения и определить ее характер. Закономерности распределения наиболее отчетливо проявляются только при большом количестве наблюдений (т.н. закон больших чисел).
Исходными данными для анализа служит информация, полученная из сборника Федеральной службы Росстата «Регионы России», а именно статистическая информация о числе зрителей театров на 1000 человек населения в различных регионах России в 2000 году. Объём исходной совокупности –78 единиц.
1.Табличное и графическое
Анализ распределений
Рис. 1.1. Вид начала и конца таблицы исходных данных по численности зрителей театров на 1000 человек населения за 2000 год.
Прежде, чем приступить к
вычислению специальных
Для локализации и устранения выбросов необходимо, прежде всего, ранжировать исходные данные. Затем, в ППП Statistica строится график Box plot на основании ранжированной совокупности. Единицы совокупности, обозначенные на графике звёздочками (*), являются выбросами, которые необходимо исключить из изучаемой совокупности.
Выбросы- Москва, Санкт-Петербург, Республика Алтай. Москва и Санкт-Петербург попали в выбросы, потому что эти города являются крупными культурными центрами с большим количеством театров. Республика Алтай также попала в выбросы, в виду культурных особенностей и малого количества музеев.
Ниже представлен фрагмент таблицы с ранжированной совокупностью.
Рис. 1.2. Вид начала и конца таблицы с ранжированной совокупностью.
Вариационным называется ряд распределения,
построенный по количественному
признаку. Он может быть представлен
в виде таблицы и графически. Табличное
представление позволяет не только
выявить ту или иную закономерность
распределения, но и подробно охарактеризовать
структуру изучаемой
Таблицы вариационных рядов строятся по принципам группировки. Известные проблемы возникают при определении числа групп, поскольку формула Стерджеса, рекомендуемая для этих целей, дает приемлемые результаты только в условиях больших статистических совокупностей. Процесс определения числа выделяемых групп, в значительной степени, носит творческий характер и требует от исследователя применения не только теоретических знаний, но и практического опыта и интуиции.
Формула Стерджеса:
, (1.1)
где k – число групп; N – объем совокупности.
Использование ППП значительно упрощает задачу табличного представления вариационного ряда, поскольку позволяет с малыми временными затратами просмотреть несколько таблиц с разным числом групп и размером группировочного интервала. Конечный вариант таблицы должен отвечать следующим требованиям: в таблице не должно быть малонаполненных и нулевых групп; нужно стремиться к получению мономодального распределения (т.е. по обе стороны от максимальной частоты должно наблюдаться закономерное убывание частот). Если не удается избавиться от многовершинности в распределении, это, как правило, означает, что изучаемая статистическая совокупность неоднородна и требует более детального изучения. В этих условиях следует либо работать с выбросами, либо, если единицы совокупности не подчиняются единой закономерности распределения, разбить совокупность на объективно существующие группы, и анализировать их раздельно.
Далее представлены таблицы вариационного ряда, построенные с использованием разного числа интервалов.
Рис. 1.3. Распределение регионов России по числу зрителей театров на 1000 человек населения за 2000 год. k=10
Рис. 1.4. Распределение регионов России по числу зрителей театров на 1000 человек населения за 2000 год. k=5
Рис. 1.5. Распределение регионов России по числу зрителей театров на 1000 человек населения за 2000 год. k=6
При k=10 и k=6 получено много малонаполненных групп, что является нежелательным для анализа ряда распределения. Выбирая окончательный вариант табличного представления вариационного ряда в работе, следует остановиться на группировке с использованием 5 групп. Тогда величина группировочного интервала составит 61.
Необходимо подвести предварительные итоги (на примере второй строки): только в 28 регионах России, что составляет 37,3% от общего числа регионов, число зрителей театров на 1000 человек населения в 2000 году составляло от 95 до 156. В 41 регионе России (54,7% от всех регионов) число зрителей театров на 1000 человек населения в 2000 году составляло менее 156.
Табличное
представление вариационного
На
основе таблиц строятся графики, наглядно
представляющие закономерность распределения
анализируемой статистической совокупности.
Графическое представление
Рис. 1.6. Полигон распределения регионов России по числу зрителей театров на 1000 человек населения в 2000 году.
Рис. 1.7. Кумулята распределения регионов России по числу зрителей театров на 1000 человек населения в 2000 году.
Рис. 1.8. Гистограмма распределения регионов России по числу зрителей театров на 1000 человек населения в 2000 году.
2. Характеристика центральной тенденции распределения
Среднее значение признаков совокупности,
мода и медиана характеризуют
центральную тенденцию
Формулы расчёта.
Средняя арифметическая простая:
, (2.1)
где – значение признака у iой единицы совокупности, n – объём совокупности.
Медиана:
, (2.2)
где - нижняя граница медианного интервала, h - величина группировочного интервала, - сумма частот, - накопленная частота интервала, предшествующего медианному, - частота медианного интервала.
Мода:
, (2.3)
где – нижняя граница модального интервала, h - величина группировочного интервала, - частота модального интервала, - частота интервала, предшествующего / следующего за модальным.
Рис. 2.1. Показатели центра и структуры распределения
В среднем в регионах России число зрителей театров на 1000 человек населения в 2000 году составляло 163,1. В 50% регионов России число зрителей театров на 1000 человек населения в 2000 году было меньше 149 , а в другой половине – больше.
3. Оценка вариации изучаемого признака
Вариация – различия у индивидуального значения признака изучаемой совокупности. Расчёт показателей центра сопровождается расчётом показателей вариации. Показатели вариации бывают:
- Абсолютные (размах вариации, среднее линейное отклонение, дисперсия, среднее квадратическое отклонение);
- Относительные (коэффициент осцилляции, относительное линейное отклонение, коэффициент вариации).
Формулы расчёта.
Размах вариации:
Информация о работе Анализ эмпирического распределения и выборочное наблюдение