Автор: Пользователь скрыл имя, 04 Декабря 2011 в 20:43, лекция
При решении многих прикладных задач необходимые вероятностные характеристики случайных величин неизвестны исследователю и добываются экспериментально. Такое статистическое описание результатов наблюдений составляет содержание математической статистики.
Кодирование переменных представляет собой линейное преобразование факторного пространства, заключающееся в переносе начала координат в нулевую точку (см. рис. 2.3б) и выбор масштабов по осям в единицах интервалов варьирования. В относительных единицах значения факторов на верхнем и нижнем уровнях при таком преобразовании будут соответственно +1 и -1, пределы варьирований кодированных переменных λ1= λ2=1.
2.5. Матрицы планирования
Запись значений границ интервалов в относительных единицах ±1 приводит к стандартиой форме записи матрицы планирования, использующей только знаки. План, например, факторного эксперимента ПФЭ-22 показан в таблице 2.1, а геометрическое изображение плана в виде квадрата, вершины которого соответствуют номерам и условиям опытов (фиг. 2.3б). Для реализаций этого плана необходимо поставить N=2k т.е. N=22=4 опыта, а математическая модель будет иметь вид y=b0+b1x1+b2x2+b12x1x2 и требует определения N=22=4 коэффициентов.
План эксперимента ПФЭ-22, показанный в таблице 2.1 имеет один столбец с фиктивной переменной X0 которому во всех опытах придается значение +1, и столбец произведения X1X2. При этом столбцы матрицы X1 и X2 задают планирование (определяют условия опытов), а столбцы X0 и X1X2 используются только для расчетов коэффициентов b0 и b12 (коэффициент взаимодействия факторов X1 и X2 модели.
Матрицу
планирования для любого числа независимых
переменных можно получить из матрицы
планирования для двух независимых
переменных, используя разные приемы.
Один из них основан на правиле
чередования знаков. В таблице 2.2
знаки в первом столбце меняются
поочередно, во втором столбце они чередуются
через два, в третьем через четыре к так
далее по степеням двойки. Геометрическим
представлением планов при К>3
является гиперкуб в К-мерном пространстве.
Таблица 2.2 План эксперимента ПФЭ-23
№ опыта | Переменные | Выход | ||
Х1 | Х2 | Х3 | yu | |
1 | - | - | - | Y1 |
2 | + | - | - | Y2 |
3 | - | + | - | Y3 |
4 | + | + | - | Y4 |
5 | - | - | + | Y5 |
6 | + | - | + | Y6 |
7 | - | + | + | Y7 |
8 | + | + | + | Y8 |
Геометрическая интерпретация плана ПФЭ-23 дана на рис.2.4.
Рис. 2.4.
Геометрическое изображение трех факторного
эксперимента.
Плану полного факторного эксперимента (ПФЭ) присущи критерии оптимальности: ортогональность и ротатабельность. Ортогональность плана обеспечивает получение независимых оценок коэффециентов регрессии. Ротатабельность плана позволяет получить одинаковую дисперсию предсказанных значений функции отклика во всех равноудаленных от центра эксперимента точках.
Составленные описанным способом матрицы планирования и их геометрические образы (рис. 2.3б и рис. 2.4) обладают тремя важными свойствами: симметрии, нормировки и ортогональности.
Свойство симметрии состоит в том, что все наборы факторов (точки плана) симметричны относительно центра плана, или сумма элементов любого столбца матрицы планирования равна нулю:
Свойство нормировки имеет вид
т.е. сумма квадратов любого столбца равна количеству строк.
Свойство ортогональности состоит в том, что сумма произведения любых двух столбцов равна нулю:
Матрицы планирования показывают, в каких точках факторного пространства надо произвести измерения выхода (отклика), т.е. произвести опыты. А столбцы X1(i=1,2,3,…,) определяют условия проведения опытов. Например (см. табл. 2.1): опыт по третьей строке (U=3) проводится при условии, когда фактор X1, находится на нижнем уровне, а фактор Х2 – на верхнем.
В
целях «рандомизации» опыты проводятся
не в том порядке, какой указан
в плане, а в случайной
3. ОБРАБОТКА РЕЗУЛЬТАТОВ МНОГОФАКТОРНОГО ЭКСПЕРИМЕНТА
3.1. Структура и цель обработки данных
Результаты многофакторного эксперимента представляют собой выборку из некоторой генеральной совокупности, т.е. являются случайными величинами. Основная задачи обработки – оценка параметров принятой модели и проверка гипотезы об адекватности модели (её соответствии) результатам эксперимента. Если принятая модель не отвечает требованию адекватности, следует взять другую или провести иной эксперимент, например, изменить пределы варьирования. Обработка данных эксперимента в значительной мере формализована и может выполняться с помощью ЭВМ. На отдельных её этапах требуется принимать не формальные, а творческие решения. Однако никакой метод обработки не поможет, если данные эксперимента содержат грубые ошибки или необоснованные решения. Несоблюдение правил обработки данных может привести к ложным выводам.
Обработка данных опирается на методы математической статистики, даваемые в курсе высшей математики и кратко изложенные в первом разделе (см. п.1). Для более детального их изучения следует обратиться к специальным трудам, например [6].
Основной задаче обработки данных многофакторного исследования подчинен ряд следующих частных задач.
1. Оценка математических ожиданий и дисперсий выхода в отдельных точках факторного пространства или строках плана U=1,2,...,N. Чаще эти оценки называются построчечными средними , построчечными дисперсиями S2u (далее под термином дисперсия будем понимать оценку дисперсии).
2.
Проверка однородности
3.
Проверка однородности
4.
Определение дисперсии
5. Проверка информативности эксперимента.
6.
Определение коэффициентов
7.
Проверка значимости bi-
8. Проверка адекватности модели.
3.3.
Вычисление построчечных
средних
Эти величины определяются по формулам (1.11), например:
где m - число повторов.
Полученные данные заносятся в таблицу 3.1 и используется в дальнейшей обработке данных.
3.4. Исключение грубых ошибок
Грубые ошибки и промахи искажают результаты эксперимента и поэтому должны быть исключены. Имеется несколько способов исключения промахов, но чаще используется r-критерий. В соответствии с этим критерием данные строки, в которой подозревается промах, ранжируются, т.е. располагаются в возрастающем порядке yu1<yu3<yu2<…<yum где m – число параллельных опытов. Одно из крайних значений, например, yu1 считается подозрительным или промахом, если оно далеко отстоит от всех остальных. В этом случае необходимо проверить основную статистическую гипотезу H0:yu1 принадлежит остальной совокупности. Альтернативной гипотезой является гипотеза H1:yu1 не принадлежит остальной совокупности, т.е. его резкое отличие объясняется промахом в работе.
Доля проверки гипотезы H0 определяется расчетное значение критерия:
если сомнительным считается наименьшее в строке значение yu1 и
если сомнительным считается наибольшее в строке yum. Величина rkp по числу степеней fu=m-1 уровню значимости берется из таблицы r-распределения (см. приложение 1). Если расчетное значение rmin или rmax окажется меньше rkp гипотеза H0 принимается с надежностью вывода p=1-a т.е. сомнительное крайнее значение отклика считается принадлежащим остальному ансамблю yuj. В противном случае при rmin или rmax> rkp гипотеза H0 в отклоняется, т.е. резко выделяющиеся выборки yu1 или yum из дальнейшей обработки исключаются и в данной строке остается (m-1) наблюдений. Это приводит к нарушению условия ортогональности эксперимента, что затрудняет использование метода наименьших квадратов. Поэтому для применения стандартных процедур обработки данных надо исключить наблюдение, признанное промахом и провести в этой точке дополнительное измерение.
3.5. Проверка однородности построчечных дисперсий
Цель проверки – определить, являются ли измерения отклика во всех точках (строчках) плана равноточными или нет. Если разброс yuj в некоторой u-й строчке объясняется не только ошибкой измерения, но и шумом самого объекта исследований, проверяется однородность рассеивания, обусловленная обеими причинами. Понятие однородность нескольких оценок дисперсий S21, S22 означает, что все величины S2u являются оценками – одной и той же дисперсии s2u, которая называется дисперсией воспроизводимости или дисперсией опытов. В этом случае различия между оценками S2u, u=1,2,3,…,N объясняются их случайным характером, т.к. всякая статистика – случайная величина.
Дня проверки однородности оценок S2u применяют f-критерий, критерий Кохрена G и реже критерий Бартлетта. Строже работает критерий Кохрена, когда число поворотов во всех строках постоянно: m=const , u =1,2,...,N:
где S2u max – наибольшая построчная дисперсия.
С величиной G связаны два параметра fu=m-1 – число степеней свободы дисперсии S2u max; f∑ = N – число степеней свободы суммы, стоящей в знаменателе. По числам fu и f∑ и уровню значимости a (обычно =0,05) из распределения Кохрена (см. приложение 1) находят Gkp. Гипотеза об однородности дисперсий принимается, если Gp<= Gkp. При Gp> Gkp дисперсии признаются не однородными и принимаются меры для достижения их однородности, например, стабилизацией условий эксперимента, использованием одного и того же прибора для измерения отклика и т.д.
3.6. Дисперсия воспроизводимости
Выполнение
требования однородности построчных дисперсий
позволяет определить дисперсию
воспроизводимости как
Величина Sy=ÖS2y является оценкой среднеквадратического отклонения и называется ошибкой опытов.
Формула (3.5) может применяться, если в каждой строке проведено m>1 параллельных опытов. Если m=1, т.е. в каждой строке проведен один опыт, то дисперсию воспроизводимости можно определить по ряду параллельных опытов в одной и той же области эксперимента, например, в центре локальной области исследования. После проведения m опытов дисперсию воспроизводимости находят по (1.9 или 1.11).
В некоторых лабораторных экспериментах (на ЦВМ, например) повторные измерения в отдельных точках плана дают один и тот же результат. Тогда для расчета дисперсии воспроизводимости можно воспользоваться метрологическими характеристиками измерительных приборов и устройств.
В паспортных данных приборов указывается класс точности (К, % от предела измерения Ашк). Это позволяет определить максимальную ошибку измерения
Случайная
ошибка прибора подчиняется