Проверка статистических гипотез

Автор: Пользователь скрыл имя, 18 Ноября 2015 в 22:04, курсовая работа

Краткое описание

В условиях рыночной экономики возрастает интерес и потребность в познании статистических методов анализа и прогнозирования, к количественным оценкам социально-экономических явлений. Понятие практической статистики, процедура обоснованного сопоставления высказанной гипотезы относительно природы или величины неизвестных статистических параметров анализируемого явления с имеющимися в распоряжении исследователя выборочными данными (выборкой).

Оглавление

1. Введение……………………………………………………….
2. Проверка статистических гипотез…………………………..
3. Интерполирование…………………………………………...
4. Процедура линеаризации в решении
нелинейной задачи регрессии………………………………….
5. Заключение……………………………………………………
6. Список литературы…………………………………………...

Файлы: 1 файл

Курсовая.docx

— 213.20 Кб (Скачать)

Содержание.

 

1. Введение……………………………………………………….

2. Проверка статистических гипотез…………………………..

3. Интерполирование…………………………………………...

4. Процедура линеаризации  в решении

нелинейной задачи регрессии………………………………….

5. Заключение……………………………………………………

6. Список литературы…………………………………………...

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

                                          Введение.

 

В условиях рыночной экономики возрастает интерес и потребность в познании статистических методов анализа и прогнозирования, к количественным оценкам социально-экономических явлений. Понятие практической статистики, процедура обоснованного сопоставления высказанной гипотезы относительно природы или величины неизвестных статистических параметров анализируемого явления с имеющимися в распоряжении исследователя выборочными данными (выборкой).

Цель работы: – состоит в освоении основ обработки экспериментальных данных с использованием статистических  и  численных методов.

Задание:  Написать краткие (2-3страницы) рефераты  по указанным ниже темам. С целью лучшего освоения материала произвести практические расчеты по данным темам, сравнить и проанализировать полученные результаты и сделать выводы по работе.

 

 

1.Проверка статистических гипотез.

В процессе статистического анализа иногда бывает необходимо сформулировать и проверить предположения (гипотезы) относительно величины независимых параметров или закона распределения изучаемой генеральной совокупности (совокупностей).

Под статистической гипотезой понимаются различного рода предположения относительно характера или параметров распределения случайной переменной, которые можно проверить, опираясь на результаты наблюдений в случайной выборке. Иными словами, статистической гипотезой называется предположение о  свойстве генеральной совокупности, которое можно проверить, опираясь на данные выборки. Обозначается гипотеза буквой Н. Так, может быть выдвинута гипотеза о том, что средняя в генеральной совокупности равна некоторой величине.

Например, Н: m = a, или о том, что генеральная средняя больше некоторой величины: Н: m > b.

Смысл проверки статистической гипотезы состоит в том, чтобы по имеющимся статистическим данным принять или отклонить статистическую гипотезу с минимальным рисков ошибки. Эта проверка осуществляется по определенным правилам.

В регрессионном анализе проверяют гипотезы о значимости свободного члена а и о значимости коэффициента регрессии b.

Проверка гипотезы о значимости коэффициента регрессии b:

1. Определим гипотезы H0 и H1:

H0: b=0 (между переменными  нет линейной зависимости)

H1: b1≠0.

2. Зададим уровень значимости  α.

3.   
где  

Статистика F имеет распределение Фишера с 1 и (n-1) степенями свободы. 

4. Критические точки  и критическая область Kкр=Fкр(α,1,n-2).

5. Если |Fнабл|<f(α,1,n-2), то H0 отвергается, т.е. можно сделать вывод, что линейная зависимость – значима. Если |Fнабл|>F(α,1,n-2) то у нас нет оснований отвергать H0, т.е. можно сделать вывод, что линейная зависимость – незначима или что наши данные нельзя описать моделью линейной регрессии.

Следует иметь в виду, что статистическая проверка гипотез имеет вероятностный характер. С помощью статистической проверки гипотез можно определить вероятность принятия ложного решения по тем или иным результатам статистического изучения данного явления. Если вероятность ошибки невелика, то статистические показатели исчисленные при изучении явления, могут быть использованы для практических целей при малом риске ошибки.

Построение квадратичной модели функции регрессии.

Построим квадратичную модель вида уi= + .

Среднегодовая стоимость ОПФ, тыс.руб., х

Товарная продукция, тыс. руб., у

1

0,9

3300

2

1,0

3600

3

1,0

2000

4

1,3

2200

5

2,0

2500

6

3,0

1500


Построим вспомогательную таблицу.

Среднегодовая стоимость ОПФ, тыс.руб., х

Товарная продукция, тыс. руб., у

у

у

1

0,9

3300

0,81

0,729

0,6561

2970

2673

2

1,0

3600

1

1

1

3600

3600

3

1,0

2000

1

1

1

2000

2000

4

1,3

2200

1,69

2,197

2,8561

2860

3718

5

2,0

2500

4

8

16

5000

10000

6

3,0

1500

9

27

81

4500

13500

Всего

9,2

15100

17,5

39,926

102,512

20930

35491


 

Рассчитаем параметры a и решив систему:

Получаем:

15100 = 6a0  + 9,2a1 17,5a2

20930= 9,2а0+17,5а1+39,926а2

                 
             
             
       

35491= 17,5а1+39,926а2 + 102,512а2



 

 

 

 

 

 

 

 

 

 

 

Решив систему получим:

а0= 3608,48;

а1= - 767,33;

а2= 29,06

Получаем уравнение: . Y ( X ) = 29,06 x 2  − 767,33x + 3608,48

Построим график.

                                   Y= 29,054х^2  -767,3x + 3608.5


3500


 

3000

 

2500

 

2000

 

1500

 

1000

 

500

 

0

   0,0                 1,0                       2,0                3,0                     4,0

 

Определим коэффициент регрессии для линейной и квадратичной модели по формуле:

.

Построим вспомогательную таблицу.

Среднегодовая стоимость ОПФ, тыс.руб., х

Товарная продукция, тыс. руб., у

Линейная модель

Квадратичная модель

1

0,9

3300

613611,11

2931,611

135710,46

2941,46374

128548,25

2

1

3600

1173611,11

2866,09

538623,89

2870,254

532529,22

3

1

2000

266944,44

2866,09

750111,89

2870,254

757342,02

4

1,3

2200

100277,78

2669,527

220455,60

2660,11126

211702,37

5

2

2500

277,78

2210,88

83590,37

2190,116

96028,09

6

3

1500

1033611,11

1555,67

3099,15

1568,086

4635,70

Всего

9,2

15100

3188333,33

15099,868

1731591,36

15100,285

1730785,67

 

Среднее

2516,67

         

 

 

 

 

Получаем:

- для линейной модели: R^2 = 1-173159,36/3188333,33 = 0,4569;

- для квадратичной модели: R^2 = 1-1730785,67/3188333,33 = 0,4571

 

 

Оценку статистической значимости построенное модели регрессии в целом производится с помощью F-критерия Фишера. Фактическое значение F-критерия для парного линейного уравнения регрессии определяется как

F = ,

где Сфакт = - факторная, или объясненная регрессия, сумма квадратов; Сост = - остаточная сумма квадратов; - коэффициент детерминации.

Получаем:

- для линейной модели: F = 4569/1 − 0,4569× (6 − 2) = 3,365 ,

                           

 
 
 
 

         - для квадратичной модели: F = 0,4571/1− 0,4571× (6 − 2) = 3,368

     
   
   

Табличное значение F-критерия при числе степеней свободы 2 и 4 и уровне значимости 0,05 составит: F0,05,2,4  = 6,9, т. е. фактическое значение F (Fфакт = 1,46 и 1,44) не превышают табличное (Fтабл = 6,9), и можно сделать вывод, что уравнение регрессии статистически незначимо. Следовательно гипотеза Н1 о значимости уравнения отклоняется. Заметим, что значимость линейного уравнения несколько выше, чем квадратичного.

В качестве основной (нулевой) гипотезы выдвигают гипотезу о незначимом отличии от нуля параметра или статистической характеристики в генеральной совокупности. Наряду с основной (проверяемой) гипотезой выдвигают альтернативную (конкурирующую) гипотезу о неравенстве нулю параметра или статистической характеристики в генеральной совокупности. Проверим гипотезу H0 о равенстве отдельных коэффициентов регрессии нулю (при альтернативе H1 не равно) на уровне значимости α=0.05.

 

Если фактическое значение t-критерия больше табличного (по модулю), то основную гипотезу отвергают и считают, что с вероятностью (1-α) параметр или статистическая характеристика в генеральной совокупности значимо отличается от нуля.

 

 

Если фактическое значение t-критерия меньше табличного (по модулю), то нет оснований отвергать основную гипотезу, т.е. параметр или статистическая характеристика в генеральной совокупности незначимо отличается от нуля при уровне значимости α.

 

 

tкрит (n- m – 1) = (4; 0,025) = 2,776,2

 

 

tа1 = - 655,206/357,358 = - 1,833

 

 

Так  как – 1,833 < 2,776, то  статистическая  значимость  коэффициента регрессии  a1   не подтверждается (принимаем гипотезу о равенстве нулю этого коэффициента).

ta0 = 3521,316/610,157 = 5,771

Так как 5,771 > 2,776  то статистическая значимость коэффициента регрессии  a0     подтверждается ( не принимаем гипотезу о равенстве нулю этого коэффициента).

Следовательно коэффициент a0 уравнения регрессии статически значим а a1 не значим.

 

 

 

 

 

 

                                      2.Интерполирование

Интерполирование предполагает нахождение значений функции, соответствующих промежуточным значениям аргумента, отсутствующим в таблице логарифмов, тригонометрических и др. функций.

При интерполировании по таблице значений функции строится ее аналитическое выражение, т.е. по значениям функции y0, y1, ..., yn при значениях аргумента хо, х1, ..., хn определяется выражение неизвестной функции. Через данные точки можно провести множество различных кривых. Поэтому существует интерполирование в различных функциях F(х). Чаще всего требуется, чтобы функция F(х) была многочленом степени на единицу меньшей, чем число известных значений.

Таким образом, задачу интерполирования функций можно сформулировать следующим образом.

Для данных значений х º хо, х1, ..., хn и y º y0, y1, ..., yn найти многочлен y = Fn(х), удовлетворяющий условиям F(хо) = y0, F(х1) = y1, ..., F(хn) = yn. Точки хо, х1, ..., хn называют узлами интерполяции, многочлен Fn(х) - интерполяционным многочленом, а формулы его построения - интерполяционными формулами. Интерполяционный многочлен опишет кривую, проходящую точно через заданные точки.

При параболическом интерполировании в качестве интерполяционного многочлена F(х) принимают многочлен n - ой степени вида:

Fn(х) = ао + а1х + а2х2 + ... + аnxn.

Запишем многочлен F(х) для произвольного значения хi (i = 0, 1, 2, ..., n), принимающего значения F(хi) = yi, а во всех остальных точках х ¹ хi значение, равное нулю.

Как видно из записи, числитель не будет содержать выражения (х - хi), а знаменатель - (хi - хi), т.е. выражений, обращающих числитель и знаменатель в нуль.

Искомый многочлен будет равен сумме

Полученная формула называется интерполяционной формулой Лагранжа.

Пусть r(x) – некоторая функция, w(x)=(x-x0)(x-x1)…(x-xn) тогда формула погрешности имеет вид:

Блок-схема алгоритма программы интерполирования функции методом Лагранжа.

       

 

 

Используя исходные данные из КР №2 получим значение функции  Y(х) в точке «», соответствующей середине имеющегося интервала, используя  интерполяционный многочлен 2-й,  3-й и 5-й степени.

3.Процедура  линеаризации в решении нелинейной  задачи регрессии.

Регрессии нелинейные по включенным переменным приводятся к линейному виду простой заменой переменных (линеаризация), а дальнейшая оценка параметров производится с помощью метода наименьших квадратов. Рассмотрим некоторые функции.

Парабола второй степени приводится к линейному виду с помощью замены: . В результате приходим к двухфакторному уравнению , оценка параметров которого при помощи МНК, приводит к системе следующих нормальных уравнений:

Информация о работе Проверка статистических гипотез