Контрольная работа по "Статистике"

Автор: Пользователь скрыл имя, 03 Ноября 2011 в 15:45, контрольная работа

Краткое описание

Постройте интервальный вариационный ряд распределения количества предприятий по выпуску продукции, образовав 5 групп с равными интервалами. Составьте таблицу для полученной группировки.

Файлы: 1 файл

контр по статистике.doc

— 338.50 Кб (Скачать)
Границы интервалов, млн.руб Середина интервала Количество  предприятий (хср-Хср)*(хср-Хср) (хср-Хср)*(хср-Хср)*N
19 33 26 3 707.56 2122.68
33 47 40 7 158.76 1111.32
47 61 54 12 1.96 23.52
61 75 68 6 237.16 1422.96
75 89 82 2 864.36 1728.72
        Сумма 6409.2

     Деля  сумму последнего столбца на количество предприятий, получим дисперсию D=6409.2/30=213.64 млн.руб.2

     Среднеквадратическое  отклонение s=Корень(D)=Корень(213.64)=14.62 млн.руб.

     Коэффициент вариации равен:

     

     Так как Vх = 27,8% > 30%  то можно сделать вывод, что совокупность однородная, а средняя величина типичная ее характеристика. 
 

Задание 2

По данным таблицы 

  1. Постройте ранжированный дискретный вариационный ряд зависимости выпуска продукции  от потерь рабочего времени. Сделайте вывод о данной зависимости.
 

Произведем  сортировку исходной таблицы по второму столбцу (потери рабочего времени) 

Номера  предприятий Потери рабочего времени (тыс.чел.дней) Выпуск продукции (млн. руб.)
1 2 3
2 12 89
5 20.4 82
24 23.1 74.4
7 34.9 68.3
10 36 65
12 37 66.4
15 38 63.8
20 42 61
23 44 60.4
30 46 57
1 52 56.5
3 53.1 56.7
6 53.6 53.4
13 54.6 49.4
9 55.4 54.6
16 55.7 48.7
11 56 52.1
19 56.4 49.5
21 57 47.3
25 57.4 47
27 66 45
29 70.4 42.2
4 72 38
8 72.8 38.5
14 78 36.1
18 79.8 37
22 85.2 33
26 91 19
17 100 22.5
28 112 20.5
 

      Анализ  полученной таблицы показывает, что имеется обратная зависимость выпуска продукции от потерь рабочего времени, т.к. с увеличением потерь рабочего времени выпуск продукции уменьшается 

  1. Постройте точечную диаграмму зависимости  и сделайте вывод о виде связи  двух переменных и о виде парной регрессии, характеризующей данную зависимость.
 

    Построим  точечную диаграмму

 

      Анализ  диаграммы показывает, что связь имеет линейный вид, т.е. парная регрессия имеет вид y=a*x+b, где y-выпуск продукции, x-потери рабочего времени, a,b –коэффициенты регрессии. 
 

      
  1. Оцените значение (или определите знак) линейного  коэффициента корреляции.
 

      Найдем  коэффициент парной корреляции, для этого вычислим средние значения потерь рабочего времени, выпуска продукции и их произведения. По формулам хср=(х1+х2+…+х30)/30, для вычисления среднего произведения исследуемых величин добавим в таблицу дополнительный столбец. 

      Далее найдем средние квадратические отклонения потерь времени и выпуска по формуле  s=КОРЕНЬ(((х1-хср)2+(х2-хср)2+…+(х30-хср)2)/30). Расчеты и их результаты оформим в виде таблицы 
 
 

Номера  предприятий Потери рабочего времени (тыс.чел.дней) Выпуск продукции (млн. руб.) Произведение
1 2 3 4
2 12 89 1068
5 20.4 82 1672.8
24 23.1 74.4 1718.64
7 34.9 68.3 2383.67
10 36 65 2340
12 37 66.4 2456.8
15 38 63.8 2424.4
20 42 61 2562
23 44 60.4 2657.6
30 46 57 2622
1 52 56.5 2938
3 53.1 56.7 3010.77
6 53.6 53.4 2862.24
13 54.6 49.4 2697.24
9 55.4 54.6 3024.84
16 55.7 48.7 2712.59
11 56 52.1 2917.6
19 56.4 49.5 2791.8
21 57 47.3 2696.1
25 57.4 47 2697.8
27 66 45 2970
29 70.4 42.2 2970.88
4 72 38 2736
8 72.8 38.5 2802.8
14 78 36.1 2815.8
18 79.8 37 2952.6
22 85.2 33 2811.6
26 91 19 1729
17 100 22.5 2250
28 112 20.5 2296
Среднее 57.06 51.143 2552.986
Сред.кв.откл 24.257 18.305  
 

     Тогда коэффициент корреляции равен

     Kxy=((X*Y)cp-Xcp*Ycp)/(s(x)*s(y)), где Xcp,Ycp, Xycp – средние значения потерь рабочего времени, выпуска продукции и их произведения, s(x), s(y) – средние квадратические отклонения потерь рабочего времени и выпуска продукции.

     Kxy=(2552.99-57.06*51.14)/(24.26*18.31)=-0.82

      Значение  коэффициента корреляции подтверждает полученные ранее вывод о то, что  имеется обратная зависимость выпуска продукции от потерь рабочего времени, т.к. с увеличением потерь рабочего времени выпуск продукции уменьшается

Задание 3

 
     
  1. Используя группировку в задании 1 сделайте 20% типическую выборку из 30 исследуемых  предприятий. Опишите способ отбора. Для полученной выборочной совокупности постройте таблицу зависимости  выпуска продукции от потерь рабочего времени.
 

     Для простоты используем уже полученные ранее результаты группировки по выпуску продукции в задании 1. Общий объем выборки n=30*0.2=6

     Т.к. группы в этом случае сильно отличаются по объему, то используем способ формирования выборки, учитывающий объемы групп и колеблемость признака внутри них. Выделим 5 групп, для каждой группы определим ее среднее квадратическое отклонение и вычислим его произведение на объем группы. Расчеты будем оформлять в виде таблицы. Далее найдем сумму произведений ср.кв. откл. групп на их объемы. И для каждой группы найдем объем выборки из нее по формуле ni=6*Nisi/ СУММА(Nisi), где Ni, si – объем и среднее квадратическое отклонение i-й группы

Номера  предприятий Потери рабочего времени (тыс.чел.дней) Выпуск продукции (млн. руб.) Среднее кв. отклонение (млн. руб.) Произведение Объем выборки Объем выборки
1 2 3 4   5 5
26 91 19        
28 112 20.5        
17 100 22.5 1.755942 5.267826876 0.256746 1
22 85.2 33        
14 78 36.1        
18 79.8 37        
4 72 38        
8 72.8 38.5        
29 70.4 42.2        
27 66 45 3.967307 27.7711481 1.353525 1
25 57.4 47        
21 57 47.3        
16 55.7 48.7        
13 54.6 49.4        
19 56.4 49.5        
11 56 52.1        
6 53.6 53.4        
9 55.4 54.6        
1 52 56.5        
3 53.1 56.7        
30 46 57        
23 44 60.4 4.384442 52.6133063 2.564296 2
20 42 61        
15 38 63.8        
10 36 65        
12 37 66.4        
7 34.9 68.3        
24 23.1 74.4 4.592349 27.55409226 1.342946 1
5 20.4 82        
2 12 89 4.949747 9.899494937 0.482487 1
      Сумма 123.1058685    
 

      Генерируя в Excel случайное число в диапазоне от 1 до Ni, выбирая соответствующий элемент группы.

      Результаты  группировки оформим в виде таблицы 

Номера  предприятий Потери рабочего времени (тыс.чел.дней) Выпуск продукции (млн. руб.)
1 2 3
28 112 20.5
29 70.4 42.2
16 55.7 48.7
3 53.1 56.7
20 42 61
5 20.4 82
 

      Построим  таблицу зависимости выпуска  продукции от потерь рабочего времени

Потери  рабочего времени (тыс.чел.дней) Выпуск продукции (млн. руб.)
20.4 82
42 61
53.1 56.7
55.7 48.7
70.4 42.2
112 20.5
 

      Анализ  таблицы показывает, что рост потерь рабочего времени приводит к падению  выпуска продукции. 

2)   По полученной выборочной совокупности вычислите коэффициенты линейной регрессии и постройте ее на том же поле, где точечная диаграмма.

      На  основе графика сделайте первичный вывод об адекватности построенной модели. 

      Найдем  коэффициенты парной линейной регрессии, для этого найдем произведение элементов столбцов и средние значения каждого из них 

  x y x*y
  20.4 82 1672.8
  42 61 2562
  53.1 56.7 3010.77
  55.7 48.7 2712.59
  70.4 42.2 2970.88
  112 20.5 2296
Среднее 58.93333 51.85 2537.507
 

      Далее найдем среднее квадратическое отклонение потерь рабочего времени

      s(x)=КОРЕНЬ(((20.4-58.93)2+(42-58.93)2+(53.1-58.93)2+(55.7-58.93)2+(70.4-58.93)2+(112-58.93)2)/30)=30.87 

      Тогда коэффициенты линейной регрессии равны

      a=((x*y)cp-xcp*ycp)/sx2=(2537.51-51.85*58.93)/ 30.87*30.87=-0.544

      b=ycp-xcp*a=51.85+0.544*58.93=83.91 

      Т.е. уравнение имеет вид y(x)=-0.544*x+83.91

      Построим графики

     Анализ  кривых показывает, что построенная регрессия адекватна выборочным данным 

     
  1. По построенной  модели вычислите значение выпуска  продукции любого предприятия, не попавшего  в выборку, и сравните его с  представленными данными исходного  исследования.
 

     Вычислим  для каждого из не попавших в выборку предприятий значение выпуска продукции согласно построенной модели и относительное отклонение от истинного значения в % по формуле |y(x)-y|/y*100, где y(x)-значение полученное при помощи модели, у-истинное значение 
 
 
 
 
 
 
 

Информация о работе Контрольная работа по "Статистике"