Контрольная работа по "Статистике"
Контрольная работа, 03 Ноября 2011, автор: пользователь скрыл имя
Краткое описание
Постройте интервальный вариационный ряд распределения количества предприятий по выпуску продукции, образовав 5 групп с равными интервалами. Составьте таблицу для полученной группировки.
Файлы: 1 файл
контр по статистике.doc
— 338.50 Кб (Скачать)| Границы интервалов, млн.руб | Середина интервала | Количество предприятий | (хср-Хср)*(хср-Хср) | (хср-Хср)*(хср-Хср)*N | |
| 19 | 33 | 26 | 3 | 707.56 | 2122.68 |
| 33 | 47 | 40 | 7 | 158.76 | 1111.32 |
| 47 | 61 | 54 | 12 | 1.96 | 23.52 |
| 61 | 75 | 68 | 6 | 237.16 | 1422.96 |
| 75 | 89 | 82 | 2 | 864.36 | 1728.72 |
| Сумма | 6409.2 | ||||
Деля сумму последнего столбца на количество предприятий, получим дисперсию D=6409.2/30=213.64 млн.руб.2
Среднеквадратическое
отклонение s=Корень(D)=Корень(213.64)=14.
Коэффициент вариации равен:
Так
как Vх = 27,8% > 30% то можно сделать
вывод, что совокупность однородная, а
средняя величина типичная ее характеристика.
Задание 2
По данным таблицы
- Постройте
ранжированный дискретный вариационный
ряд зависимости выпуска
продукции от потерь рабочего времени. Сделайте вывод о данной зависимости.
Произведем
сортировку исходной таблицы по второму
столбцу (потери рабочего времени)
| Номера предприятий | Потери рабочего времени (тыс.чел.дней) | Выпуск продукции (млн. руб.) |
| 1 | 2 | 3 |
| 2 | 12 | 89 |
| 5 | 20.4 | 82 |
| 24 | 23.1 | 74.4 |
| 7 | 34.9 | 68.3 |
| 10 | 36 | 65 |
| 12 | 37 | 66.4 |
| 15 | 38 | 63.8 |
| 20 | 42 | 61 |
| 23 | 44 | 60.4 |
| 30 | 46 | 57 |
| 1 | 52 | 56.5 |
| 3 | 53.1 | 56.7 |
| 6 | 53.6 | 53.4 |
| 13 | 54.6 | 49.4 |
| 9 | 55.4 | 54.6 |
| 16 | 55.7 | 48.7 |
| 11 | 56 | 52.1 |
| 19 | 56.4 | 49.5 |
| 21 | 57 | 47.3 |
| 25 | 57.4 | 47 |
| 27 | 66 | 45 |
| 29 | 70.4 | 42.2 |
| 4 | 72 | 38 |
| 8 | 72.8 | 38.5 |
| 14 | 78 | 36.1 |
| 18 | 79.8 | 37 |
| 22 | 85.2 | 33 |
| 26 | 91 | 19 |
| 17 | 100 | 22.5 |
| 28 | 112 | 20.5 |
Анализ
полученной таблицы показывает, что имеется
обратная зависимость выпуска продукции
от потерь рабочего времени, т.к. с увеличением
потерь рабочего времени выпуск продукции
уменьшается
- Постройте точечную диаграмму зависимости и сделайте вывод о виде связи двух переменных и о виде парной регрессии, характеризующей данную зависимость.
Построим точечную диаграмму
Анализ
диаграммы показывает, что связь
имеет линейный вид, т.е. парная регрессия
имеет вид y=a*x+b, где y-выпуск продукции,
x-потери рабочего времени, a,b –коэффициенты
регрессии.
- Оцените значение (или определите знак) линейного коэффициента корреляции.
Найдем
коэффициент парной корреляции, для
этого вычислим средние значения потерь
рабочего времени, выпуска продукции и
их произведения. По формулам хср=(х1+х2+…+х30)/30,
для вычисления среднего произведения
исследуемых величин добавим в таблицу
дополнительный столбец.
Далее
найдем средние квадратические отклонения
потерь времени и выпуска по формуле
s=КОРЕНЬ(((х1-хср)2+(х2-хср)2+
| Номера предприятий | Потери рабочего времени (тыс.чел.дней) | Выпуск продукции (млн. руб.) | Произведение |
| 1 | 2 | 3 | 4 |
| 2 | 12 | 89 | 1068 |
| 5 | 20.4 | 82 | 1672.8 |
| 24 | 23.1 | 74.4 | 1718.64 |
| 7 | 34.9 | 68.3 | 2383.67 |
| 10 | 36 | 65 | 2340 |
| 12 | 37 | 66.4 | 2456.8 |
| 15 | 38 | 63.8 | 2424.4 |
| 20 | 42 | 61 | 2562 |
| 23 | 44 | 60.4 | 2657.6 |
| 30 | 46 | 57 | 2622 |
| 1 | 52 | 56.5 | 2938 |
| 3 | 53.1 | 56.7 | 3010.77 |
| 6 | 53.6 | 53.4 | 2862.24 |
| 13 | 54.6 | 49.4 | 2697.24 |
| 9 | 55.4 | 54.6 | 3024.84 |
| 16 | 55.7 | 48.7 | 2712.59 |
| 11 | 56 | 52.1 | 2917.6 |
| 19 | 56.4 | 49.5 | 2791.8 |
| 21 | 57 | 47.3 | 2696.1 |
| 25 | 57.4 | 47 | 2697.8 |
| 27 | 66 | 45 | 2970 |
| 29 | 70.4 | 42.2 | 2970.88 |
| 4 | 72 | 38 | 2736 |
| 8 | 72.8 | 38.5 | 2802.8 |
| 14 | 78 | 36.1 | 2815.8 |
| 18 | 79.8 | 37 | 2952.6 |
| 22 | 85.2 | 33 | 2811.6 |
| 26 | 91 | 19 | 1729 |
| 17 | 100 | 22.5 | 2250 |
| 28 | 112 | 20.5 | 2296 |
| Среднее | 57.06 | 51.143 | 2552.986 |
| Сред.кв.откл | 24.257 | 18.305 |
Тогда коэффициент корреляции равен
Kxy=((X*Y)cp-Xcp*Ycp)/(s(
Kxy=(2552.99-57.06*51.14)
Значение коэффициента корреляции подтверждает полученные ранее вывод о то, что имеется обратная зависимость выпуска продукции от потерь рабочего времени, т.к. с увеличением потерь рабочего времени выпуск продукции уменьшается
Задание 3
- Используя группировку в задании 1 сделайте 20% типическую выборку из 30 исследуемых предприятий. Опишите способ отбора. Для полученной выборочной совокупности постройте таблицу зависимости выпуска продукции от потерь рабочего времени.
Для простоты используем уже полученные ранее результаты группировки по выпуску продукции в задании 1. Общий объем выборки n=30*0.2=6
Т.к. группы в этом случае сильно отличаются по объему, то используем способ формирования выборки, учитывающий объемы групп и колеблемость признака внутри них. Выделим 5 групп, для каждой группы определим ее среднее квадратическое отклонение и вычислим его произведение на объем группы. Расчеты будем оформлять в виде таблицы. Далее найдем сумму произведений ср.кв. откл. групп на их объемы. И для каждой группы найдем объем выборки из нее по формуле ni=6*Nisi/ СУММА(Nisi), где Ni, si – объем и среднее квадратическое отклонение i-й группы
| Номера предприятий | Потери рабочего времени (тыс.чел.дней) | Выпуск продукции (млн. руб.) | Среднее кв. отклонение (млн. руб.) | Произведение | Объем выборки | Объем выборки |
| 1 | 2 | 3 | 4 | 5 | 5 | |
| 26 | 91 | 19 | ||||
| 28 | 112 | 20.5 | ||||
| 17 | 100 | 22.5 | 1.755942 | 5.267826876 | 0.256746 | 1 |
| 22 | 85.2 | 33 | ||||
| 14 | 78 | 36.1 | ||||
| 18 | 79.8 | 37 | ||||
| 4 | 72 | 38 | ||||
| 8 | 72.8 | 38.5 | ||||
| 29 | 70.4 | 42.2 | ||||
| 27 | 66 | 45 | 3.967307 | 27.7711481 | 1.353525 | 1 |
| 25 | 57.4 | 47 | ||||
| 21 | 57 | 47.3 | ||||
| 16 | 55.7 | 48.7 | ||||
| 13 | 54.6 | 49.4 | ||||
| 19 | 56.4 | 49.5 | ||||
| 11 | 56 | 52.1 | ||||
| 6 | 53.6 | 53.4 | ||||
| 9 | 55.4 | 54.6 | ||||
| 1 | 52 | 56.5 | ||||
| 3 | 53.1 | 56.7 | ||||
| 30 | 46 | 57 | ||||
| 23 | 44 | 60.4 | 4.384442 | 52.6133063 | 2.564296 | 2 |
| 20 | 42 | 61 | ||||
| 15 | 38 | 63.8 | ||||
| 10 | 36 | 65 | ||||
| 12 | 37 | 66.4 | ||||
| 7 | 34.9 | 68.3 | ||||
| 24 | 23.1 | 74.4 | 4.592349 | 27.55409226 | 1.342946 | 1 |
| 5 | 20.4 | 82 | ||||
| 2 | 12 | 89 | 4.949747 | 9.899494937 | 0.482487 | 1 |
| Сумма | 123.1058685 |
Генерируя в Excel случайное число в диапазоне от 1 до Ni, выбирая соответствующий элемент группы.
Результаты
группировки оформим в виде таблицы
| Номера предприятий | Потери рабочего времени (тыс.чел.дней) | Выпуск продукции (млн. руб.) |
| 1 | 2 | 3 |
| 28 | 112 | 20.5 |
| 29 | 70.4 | 42.2 |
| 16 | 55.7 | 48.7 |
| 3 | 53.1 | 56.7 |
| 20 | 42 | 61 |
| 5 | 20.4 | 82 |
Построим таблицу зависимости выпуска продукции от потерь рабочего времени
| Потери рабочего времени (тыс.чел.дней) | Выпуск продукции (млн. руб.) |
| 20.4 | 82 |
| 42 | 61 |
| 53.1 | 56.7 |
| 55.7 | 48.7 |
| 70.4 | 42.2 |
| 112 | 20.5 |
Анализ
таблицы показывает, что рост потерь
рабочего времени приводит к падению
выпуска продукции.
2) По полученной выборочной совокупности вычислите коэффициенты линейной регрессии и постройте ее на том же поле, где точечная диаграмма.
На
основе графика сделайте первичный вывод
об адекватности построенной модели.
Найдем
коэффициенты парной линейной регрессии,
для этого найдем произведение элементов
столбцов и средние значения каждого из
них
| x | y | x*y | |
| 20.4 | 82 | 1672.8 | |
| 42 | 61 | 2562 | |
| 53.1 | 56.7 | 3010.77 | |
| 55.7 | 48.7 | 2712.59 | |
| 70.4 | 42.2 | 2970.88 | |
| 112 | 20.5 | 2296 | |
| Среднее | 58.93333 | 51.85 | 2537.507 |
Далее найдем среднее квадратическое отклонение потерь рабочего времени
s(x)=КОРЕНЬ(((20.4-58.
Тогда коэффициенты линейной регрессии равны
a=((x*y)cp-xcp*ycp)/sx2=
b=ycp-xcp*a=51.85+0.544*
Т.е.
уравнение имеет вид y(x)=-0.
Построим графики
Анализ
кривых показывает, что построенная регрессия
адекватна выборочным данным
- По построенной
модели вычислите значение выпуска
продукции любого предприятия, не попавшего
в выборку, и сравните его с
представленными данными
исходного исследования.
Вычислим
для каждого из не попавших в выборку
предприятий значение выпуска продукции
согласно построенной модели и относительное
отклонение от истинного значения в % по
формуле |y(x)-y|/y*100, где y(x)-значение полученное
при помощи модели, у-истинное значение