Первичный эконометрический анализ. Основные свойства выборки

Автор: Пользователь скрыл имя, 20 Ноября 2011 в 11:03, практическая работа

Краткое описание

Работа содержит решения заданий по "Эконометрике", приводятся выборки и операции над ними.

Файлы: 1 файл

лаба1 НАША.doc

— 367.50 Кб (Скачать)
 

Произведем все  вычисления для Х1:

. Это означает, что величина шага  при разбиении выборки будет  равна 19,4.

Построим кумулятивную линию эмпирического распределения (накопленную частоту):

 
 
 

Гистограмму: 

Полигон частот:

 

Выводы: Чаще всего  из своей фляги Робинзон выпивал  0-19% от ёмкости пива. 
 
 
 
 

Теперь произведем все вычисления для Х2:

. Это означает, что величина шага при разбиении выборки будет равна 2,2 утки.

Построим кумулятивную линию эмпирического распределения (накопленную частоту):

гистограмму:

 
 
 
 
 

полигон частот:

 
 

Выводы: Чаще всего Робинзон убивал от 6 до 8 уток.

Теперь произведем все вычисления для Х3:

 

= 2,6 

Это означает, что  величина шага при разбиении выборки будет равна 2,6 градуса.

Построим кумулятивную линию эмпирического распределения (накопленную частоту):

 
 
 
 

гистограмму:

 

полигон частот:

Выводы: Чаще всего температура на острове колебалась от   28 до 30 градусов и от 33до 35 градусов. 

  1. Сформулируем  и проверим гипотезу о нормальном распределении выборочных данных на основе критериев коэффициентов асимметрии и эксцесса и χ2-Пирсона.

    H0: F(x) = Фa,S2

    H1: F(x) ≠ Фa,S2

Значение  статистики Пирсона  вычисляется по формуле:

    

,

    где - мера близости между эмпирическими данными и теоретическим распределением признака, – наблюдаемая абсолютная частота (число выборочных значений, попавших в i-й интервал), - ожидаемая частота, вычисляемая в предположении о нормальном распределении значений фактора x.

 вычисляется по следующей  формуле:

    

,

    где - значение функции нормального распределения, вычисленное в точке z.

    Замечание: для вычисления значений функции  можно воспользоваться таблицей стандартного нормального распределения, при этом следует учесть, что:

    

.

    Для первой выборки:

Таблица для вычисления значения статистики
№ класса Границы интервала Наблюдаемая частота
Теоретическая

частота

1 [0;19,4) 7 3,84 0,00667
2 [19,4;38,8) 6 4,86 1,68305
3 [38,8;58,2) 3 5,35 0,02290
4 [58,2;77,6) 4 5,91 2,83047
5 [77,6;97] 5 5,04 0,21460
  25 25 4,75769
 

    Так как условие  не выполняется, целесообразно произвести укрупнение классов.

№ класса Границы интервала Наблюдаемая частота 
Теоретическая

частота

1 [0;38,8) 13 8,7 0,3321
2 [38,8;58,2) 3 5,35 0,02290
4 [58,2;77,6) 4 5,91 2,83047
5 [77,6;97] 5 5,04 0,21460
  25 25 4,75769
 

Следовательно, 4,75769. Число степеней свободы для критерия равняется 1 (т.к. ν = K-3=4-3). Уровень доверительной вероятности равен 0,995. Определим из таблицы распределения : .

    Так как условие  , то гипотеза не отвергается. 
 
 

Для второй выборки:

Таблица для вычисления значения статистики
№ класса Границы интервала Наблюдаемая частота 
Теоретическая

частота

1 [0;2,2) 4 1,486 4,25316
2 [2,2;4,4) 2 3,586 0,70145
3 [4,4;6,6) 5 6,832 0,49125
4 [6,6;8,8) 10 7,806 0,61666
5 [8,8;11] 4 5,29 0,31457
  25 25 10,2918
 

    Так как условие  не выполняется, целесообразно произвести укрупнение классов, но только до 4 классов.

№ класса Границы интервала Наблюдаемая частота 
Теоретическая

частота

1 [0;4,4) 6 5,072 4,95461
2 [4,4;6,6) 5 6,832 0,49125
3 [6,6;8,8) 10 7,806 0,61666
4 [8,8;11] 4 5,29 0,31457
  25 25 6,37709

    Следовательно, 6,37709. Число степеней свободы для критерия равняется 1 (т.к. ν = K-3=4-3). Уровень доверительной вероятности равен 0,995. Определим из таблицы распределения : .

    Так как условие  , то гипотеза не отвергается. 

Для третьей выборки:

Таблица для вычисления значения статистики
№ класса Границы интервала Наблюдаемая частота 
Теоретическая

частота

1 [25;27,6) 4 2,66208 0,67242
2 [27,6;30,2) 8 4,67008 2,37434
3 [30,2;32,8) 2 5,63218 2,34238
4 [32,8;35,4) 8 6,63128 0,28251
5 [35,4;38] 3 5,40438 1,06970
  25 25 6,74135
 

    Так как условие  не выполняется, целесообразно произвести укрупнение классов.

№ класса Границы интервала Наблюдаемая частота 
Теоретическая

частота

1 [25;30,2) 12 7,33216 2,97167
3 [30,2;32,8) 2 5,63218 2,34238
4 [32,8;35,4) 8 6,63128 0,28251
5 [35,4;38] 3 5,40438 1,06970
  25 25 6,66626

    Следовательно, 6,66626. Число степеней свободы для критерия равняется 1 (т.к. ν = K-3=4-3). Уровень доверительной вероятности равен 0,995. Определим из таблицы распределения : .

    Так как условие  , то гипотеза не отвергается. 
 

    По  результатам проведенного анализа сделаем выводы. 

Среднее значение выпиваемого Робинзоном пива составляет 45% от объема фляги. Однако разбросанность значений данной характеристики достаточно велика: 972 и если рассматривать несмещенную оценку то 1013. Полученные результаты говорят о нестабильности данной характеристики, так как получается, что среднеквадратичное отклонение достаточно высоко: S=31. Следовательно, результаты очень тяжело прогнозировать. Об этом также можно судить и по коэффициенту вариаций, который составляет 71%. То есть, разброс значений на единицу среднего очень высок, что затрудняет предсказание и выбор стратегии. Но, так как коэффициент асимметрии для Х1 положительный, значит объём выпитого пива в большинстве случаев больше среднего. Кроме того, коэффициент эксцесса говорит о том, что вероятность того, что количество дней, когда будет выпито пива около среднего уменьшатся на -1,29. Отсюда, можно порекомендовать Робинзону не так часто наполнять флягу пивом или наполнять меньше 45%. 

      Среднее количество убиваемых Робинзоном уток составляет 6 штук в день. Среднеквадратичное отклонение равноS=2,81. Коэффициент вариаций составляет 47,2%. Коэффициент асимметрии отрицательный, значит в большинстве случаев количество убитых уток было меньше среднего, асимметрия находится левее среднего на 0,42. Все эти оценки говорят о нестабильности получаемых результатов, значит, и их прогнозирование осложнено. Кроме того, на количество убитых уток могут влиять и внешние факторы, как трудно отслеживаемые, так и очевидные (температура).

      Температура же в дни охоты в среднем составляла 31 градус. Этот показатель является сравнительно удобным и точным для прогнозирования, так как по полученным характеристикам он достаточно стабильный (среднеквадратическое отклонение для несмещенной дисперсии равно 3,72). Об этом свидетельствует и коэффициент вариаций, который составляет 11,91%. Следует иметь в виду, что температура в основном была не выше среднего ее значения. 

      Опираясь  на полученные результаты Робинзону  Крузо можно посоветовать, прежде всего, начать заниматься оцениванием и прогнозированием погоды, так как это наиболее устойчивая характеристика, и на основе полученных фактов пытаться правильно распределять объемы изготавливаемого пива.

Информация о работе Первичный эконометрический анализ. Основные свойства выборки