Автор: Пользователь скрыл имя, 18 Ноября 2015 в 22:04, курсовая работа
В условиях рыночной экономики возрастает интерес и потребность в познании статистических методов анализа и прогнозирования, к количественным оценкам социально-экономических явлений. Понятие практической статистики, процедура обоснованного сопоставления высказанной гипотезы относительно природы или величины неизвестных статистических параметров анализируемого явления с имеющимися в распоряжении исследователя выборочными данными (выборкой).
1. Введение……………………………………………………….
2. Проверка статистических гипотез…………………………..
3. Интерполирование…………………………………………...
4. Процедура линеаризации в решении
нелинейной задачи регрессии………………………………….
5. Заключение……………………………………………………
6. Список литературы…………………………………………...
Содержание.
1. Введение……………………………………………………….
2. Проверка статистических гипотез…………………………..
3. Интерполирование……………………………………
4. Процедура линеаризации в решении
нелинейной задачи регрессии………………………………….
5. Заключение……………………………………………………
6. Список литературы…………………………………………...
В условиях рыночной экономики возрастает интерес и потребность в познании статистических методов анализа и прогнозирования, к количественным оценкам социально-экономических явлений. Понятие практической статистики, процедура обоснованного сопоставления высказанной гипотезы относительно природы или величины неизвестных статистических параметров анализируемого явления с имеющимися в распоряжении исследователя выборочными данными (выборкой).
Цель работы: – состоит в освоении основ обработки экспериментальных данных с использованием статистических и численных методов.
Задание: Написать краткие (2-3страницы) рефераты по указанным ниже темам. С целью лучшего освоения материала произвести практические расчеты по данным темам, сравнить и проанализировать полученные результаты и сделать выводы по работе.
В процессе статистического анализа иногда бывает необходимо сформулировать и проверить предположения (гипотезы) относительно величины независимых параметров или закона распределения изучаемой генеральной совокупности (совокупностей).
Под статистической гипотезой понимаются различного рода предположения относительно характера или параметров распределения случайной переменной, которые можно проверить, опираясь на результаты наблюдений в случайной выборке. Иными словами, статистической гипотезой называется предположение о свойстве генеральной совокупности, которое можно проверить, опираясь на данные выборки. Обозначается гипотеза буквой Н. Так, может быть выдвинута гипотеза о том, что средняя в генеральной совокупности равна некоторой величине.
Например, Н: m = a, или о том, что генеральная средняя больше некоторой величины: Н: m > b.
Смысл проверки статистической гипотезы состоит в том, чтобы по имеющимся статистическим данным принять или отклонить статистическую гипотезу с минимальным рисков ошибки. Эта проверка осуществляется по определенным правилам.
В регрессионном анализе проверяют гипотезы о значимости свободного члена а и о значимости коэффициента регрессии b.
Проверка гипотезы о значимости коэффициента регрессии b:
1. Определим гипотезы H0 и H1:
H0: b=0 (между переменными нет линейной зависимости)
H1: b1≠0.
2. Зададим уровень значимости α.
3.
где
Статистика F имеет распределение Фишера с 1 и (n-1) степенями свободы.
4. Критические точки
и критическая область Kкр=Fкр(
5. Если |Fнабл|<f(α,1,n-2), то H0 отвергается, т.е. можно сделать вывод, что линейная зависимость – значима. Если |Fнабл|>F(α,1,n-2) то у нас нет оснований отвергать H0, т.е. можно сделать вывод, что линейная зависимость – незначима или что наши данные нельзя описать моделью линейной регрессии.
Следует иметь в виду, что статистическая проверка гипотез имеет вероятностный характер. С помощью статистической проверки гипотез можно определить вероятность принятия ложного решения по тем или иным результатам статистического изучения данного явления. Если вероятность ошибки невелика, то статистические показатели исчисленные при изучении явления, могут быть использованы для практических целей при малом риске ошибки.
Построим квадратичную модель вида уi= + .
№ |
Среднегодовая стоимость ОПФ, тыс.руб., х |
Товарная продукция, тыс. руб., у |
1 |
0,9 |
3300 |
2 |
1,0 |
3600 |
3 |
1,0 |
2000 |
4 |
1,3 |
2200 |
5 |
2,0 |
2500 |
6 |
3,0 |
1500 |
Построим вспомогательную таблицу.
№ |
Среднегодовая стоимость ОПФ, тыс.руб., х |
Товарная продукция, тыс. руб., у |
|||||
1 |
0,9 |
3300 |
0,81 |
0,729 |
0,6561 |
2970 |
2673 |
2 |
1,0 |
3600 |
1 |
1 |
1 |
3600 |
3600 |
3 |
1,0 |
2000 |
1 |
1 |
1 |
2000 |
2000 |
4 |
1,3 |
2200 |
1,69 |
2,197 |
2,8561 |
2860 |
3718 |
5 |
2,0 |
2500 |
4 |
8 |
16 |
5000 |
10000 |
6 |
3,0 |
1500 |
9 |
27 |
81 |
4500 |
13500 |
Всего |
9,2 |
15100 |
17,5 |
39,926 |
102,512 |
20930 |
35491 |
Рассчитаем параметры a и решив систему:
Получаем:
15100 = 6a0 + 9,2a1 17,5a2 20930= 9,2а0+17,5а1+39,926а2 |
|||||||||||||||||||
35491= 17,5а1+39,926а2 + 102,512а2 |
Решив систему получим:
а0= 3608,48;
а1= - 767,33;
а2= 29,06
Получаем уравнение: . Y ( X ) = 29,06 x 2 − 767,33x + 3608,48
Построим график.
3500
3000
2500
2000
1500
1000
500
0
0,0 1,0 2,0 3,0 4,0
Определим коэффициент регрессии для линейной и квадратичной модели по формуле:
.
Построим вспомогательную таблицу.
№ |
Среднегодовая стоимость ОПФ, тыс.руб., х |
Товарная продукция, тыс. руб., у |
Линейная модель |
Квадратичная модель | |||
1 |
0,9 |
3300 |
613611,11 |
2931,611 |
135710,46 |
2941,46374 |
128548,25 |
2 |
1 |
3600 |
1173611,11 |
2866,09 |
538623,89 |
2870,254 |
532529,22 |
3 |
1 |
2000 |
266944,44 |
2866,09 |
750111,89 |
2870,254 |
757342,02 |
4 |
1,3 |
2200 |
100277,78 |
2669,527 |
220455,60 |
2660,11126 |
211702,37 |
5 |
2 |
2500 |
277,78 |
2210,88 |
83590,37 |
2190,116 |
96028,09 |
6 |
3 |
1500 |
1033611,11 |
1555,67 |
3099,15 |
1568,086 |
4635,70 |
Всего |
9,2 |
15100 |
3188333,33 |
15099,868 |
1731591,36 |
15100,285 |
1730785,67 |
Среднее |
2516,67 |
Получаем:
- для линейной модели: R^2 = 1-173159,36/3188333,33 = 0,4569;
- для квадратичной модели: R^2 = 1-1730785,67/3188333,33 = 0,4571
Оценку статистической значимости построенное модели регрессии в целом производится с помощью F-критерия Фишера. Фактическое значение F-критерия для парного линейного уравнения регрессии определяется как
F = ,
где Сфакт = - факторная, или объясненная регрессия, сумма квадратов; Сост = - остаточная сумма квадратов; - коэффициент детерминации.
Получаем:
- для линейной модели: F = 4569/1 − 0,4569× (6 − 2) = 3,365 ,
|
|||
- для квадратичной модели: F = 0,4571/1− 0,4571× (6 − 2) = 3,368
Табличное значение F-критерия при числе степеней свободы 2 и 4 и уровне значимости 0,05 составит: F0,05,2,4 = 6,9, т. е. фактическое значение F (Fфакт = 1,46 и 1,44) не превышают табличное (Fтабл = 6,9), и можно сделать вывод, что уравнение регрессии статистически незначимо. Следовательно гипотеза Н1 о значимости уравнения отклоняется. Заметим, что значимость линейного уравнения несколько выше, чем квадратичного.
В качестве основной (нулевой) гипотезы выдвигают гипотезу о незначимом отличии от нуля параметра или статистической характеристики в генеральной совокупности. Наряду с основной (проверяемой) гипотезой выдвигают альтернативную (конкурирующую) гипотезу о неравенстве нулю параметра или статистической характеристики в генеральной совокупности. Проверим гипотезу H0 о равенстве отдельных коэффициентов регрессии нулю (при альтернативе H1 не равно) на уровне значимости α=0.05.
Если фактическое значение t-критерия больше табличного (по модулю), то основную гипотезу отвергают и считают, что с вероятностью (1-α) параметр или статистическая характеристика в генеральной совокупности значимо отличается от нуля.
Если фактическое значение t-критерия меньше табличного (по модулю), то нет оснований отвергать основную гипотезу, т.е. параметр или статистическая характеристика в генеральной совокупности незначимо отличается от нуля при уровне значимости α.
tкрит (n- m – 1) = (4; 0,025) = 2,776,2
tа1 = - 655,206/357,358 = - 1,833
Так как – 1,833 < 2,776, то статистическая значимость коэффициента регрессии a1 не подтверждается (принимаем гипотезу о равенстве нулю этого коэффициента).
ta0 = 3521,316/610,157 = 5,771
Так как 5,771 > 2,776 то статистическая значимость коэффициента регрессии a0 подтверждается ( не принимаем гипотезу о равенстве нулю этого коэффициента).
Следовательно коэффициент a0 уравнения регрессии статически значим а a1 не значим.
Интерполирование предполагает нахождение значений функции, соответствующих промежуточным значениям аргумента, отсутствующим в таблице логарифмов, тригонометрических и др. функций.
При интерполировании по таблице значений функции строится ее аналитическое выражение, т.е. по значениям функции y0, y1, ..., yn при значениях аргумента хо, х1, ..., хn определяется выражение неизвестной функции. Через данные точки можно провести множество различных кривых. Поэтому существует интерполирование в различных функциях F(х). Чаще всего требуется, чтобы функция F(х) была многочленом степени на единицу меньшей, чем число известных значений.
Таким образом, задачу интерполирования функций можно сформулировать следующим образом.
Для данных значений х º хо, х1, ..., хn и y º y0, y1, ..., yn найти многочлен y = Fn(х), удовлетворяющий условиям F(хо) = y0, F(х1) = y1, ..., F(хn) = yn. Точки хо, х1, ..., хn называют узлами интерполяции, многочлен Fn(х) - интерполяционным многочленом, а формулы его построения - интерполяционными формулами. Интерполяционный многочлен опишет кривую, проходящую точно через заданные точки.
При параболическом интерполировании в качестве интерполяционного многочлена F(х) принимают многочлен n - ой степени вида:
Fn(х) = ао + а1х + а2х2 + ... + аnxn.
Запишем многочлен F(х) для произвольного значения хi (i = 0, 1, 2, ..., n), принимающего значения F(хi) = yi, а во всех остальных точках х ¹ хi значение, равное нулю.
Как видно из записи, числитель не будет содержать выражения (х - хi), а знаменатель - (хi - хi), т.е. выражений, обращающих числитель и знаменатель в нуль.
Искомый многочлен будет равен сумме
Полученная формула называется интерполяционной формулой Лагранжа.
Пусть r(x) – некоторая функция, w(x)=(x-x0)(x-x1)…(x-xn) тогда формула погрешности имеет вид:
Блок-схема алгоритма программы интерполирования функции методом Лагранжа.
Используя исходные данные из КР №2 получим значение функции Y(х) в точке «», соответствующей середине имеющегося интервала, используя интерполяционный многочлен 2-й, 3-й и 5-й степени.
Регрессии нелинейные по включенным переменным приводятся к линейному виду простой заменой переменных (линеаризация), а дальнейшая оценка параметров производится с помощью метода наименьших квадратов. Рассмотрим некоторые функции.
Парабола второй степени приводится к линейному виду с помощью замены: . В результате приходим к двухфакторному уравнению , оценка параметров которого при помощи МНК, приводит к системе следующих нормальных уравнений: