Элементарные статистические процедуры

Автор: Пользователь скрыл имя, 04 Декабря 2011 в 20:43, лекция

Краткое описание

При решении многих прикладных задач необходимые вероятностные характеристики случайных величин неизвестны исследователю и добываются экспериментально. Такое статистическое описание результатов наблюдений составляет содержание математической статистики.

Файлы: 1 файл

Лекции.doc

— 798.50 Кб (Скачать)

    Кодирование переменных представляет собой линейное преобразование факторного пространства, заключающееся в переносе начала координат в нулевую точку (см. рис. 2.3б) и выбор масштабов по осям в единицах интервалов варьирования. В относительных единицах значения факторов на верхнем и нижнем уровнях при таком преобразовании будут соответственно +1 и -1, пределы варьирований кодированных переменных λ1= λ2=1.

2.5. Матрицы планирования

    Запись  значений границ интервалов в относительных  единицах ±1 приводит к стандартиой форме записи матрицы планирования, использующей только знаки. План, например, факторного эксперимента ПФЭ-22 показан в таблице 2.1, а геометрическое изображение плана в виде квадрата, вершины которого соответствуют номерам и условиям опытов (фиг. 2.3б). Для реализаций этого плана необходимо поставить N=2k т.е. N=22=4 опыта, а математическая модель будет иметь вид y=b0+b1x1+b2x2+b12x1x2 и требует определения N=22=4 коэффициентов.

    План  эксперимента ПФЭ-22, показанный в таблице 2.1 имеет один столбец с фиктивной переменной X0 которому во всех опытах придается значение +1, и столбец произведения X1X2. При этом столбцы матрицы X1 и X2 задают планирование (определяют условия опытов), а столбцы X0 и X1X2 используются только для расчетов коэффициентов b0 и b12 (коэффициент взаимодействия факторов X1 и X2 модели.

    Матрицу планирования для любого числа независимых  переменных можно получить из матрицы  планирования для двух независимых  переменных, используя разные приемы. Один из них основан на правиле  чередования знаков. В таблице 2.2 знаки в первом столбце меняются поочередно, во втором столбце они чередуются через два, в третьем через четыре к так далее по степеням двойки. Геометрическим представлением планов при К>3 является гиперкуб в К-мерном пространстве. 

Таблица 2.2 План эксперимента ПФЭ-23

№ опыта Переменные Выход
  Х1 Х2 Х3 yu
1 - - - Y1
2 + - - Y2
3 - + - Y3
4 + + - Y4
5 - - + Y5
6 + - + Y6
7 - + + Y7
8 + + + Y8
 

    Геометрическая  интерпретация плана ПФЭ-23 дана на рис.2.4.

Рис. 2.4. Геометрическое изображение трех факторного эксперимента. 

    Плану полного факторного эксперимента (ПФЭ) присущи критерии оптимальности: ортогональность  и ротатабельность. Ортогональность  плана обеспечивает получение независимых  оценок коэффециентов регрессии. Ротатабельность  плана позволяет получить одинаковую дисперсию предсказанных значений функции отклика во всех равноудаленных от центра эксперимента точках.

    Составленные  описанным способом матрицы планирования и их геометрические образы (рис. 2.3б  и рис. 2.4) обладают тремя важными  свойствами: симметрии, нормировки и ортогональности.

    Свойство  симметрии состоит в том, что  все наборы факторов (точки плана) симметричны относительно центра плана, или сумма элементов любого столбца  матрицы планирования равна нулю:

              

 i=1,2,3,….K (2.5)

   Свойство  нормировки имеет вид

              

 i=1,2,3,….K, (2.6)

т.е. сумма  квадратов любого столбца равна  количеству строк.

    Свойство  ортогональности состоит в том, что сумма произведения любых  двух столбцов равна нулю:

              

 i ¹ j, i,j =1,2,3,….K (2.7)

    Матрицы планирования показывают, в каких  точках факторного пространства надо произвести измерения выхода (отклика), т.е. произвести опыты. А столбцы  X1(i=1,2,3,…,) определяют условия проведения опытов. Например (см. табл. 2.1): опыт по третьей строке (U=3) проводится при условии, когда фактор X1, находится на нижнем уровне, а фактор Х2 – на верхнем.

   В целях «рандомизации» опыты проводятся не в том порядке, какой указан в плане, а в случайной последовательности, организованной по таблице случайных чисел или с помощью лотереи. 

3. ОБРАБОТКА РЕЗУЛЬТАТОВ МНОГОФАКТОРНОГО ЭКСПЕРИМЕНТА

3.1. Структура и цель  обработки данных

    Результаты  многофакторного эксперимента представляют собой выборку из некоторой генеральной  совокупности, т.е. являются случайными величинами. Основная задачи обработки – оценка параметров принятой модели и проверка гипотезы об адекватности модели (её соответствии) результатам эксперимента. Если принятая модель не отвечает требованию адекватности, следует взять другую или провести иной эксперимент, например, изменить пределы варьирования. Обработка данных эксперимента в значительной мере формализована и может выполняться с помощью ЭВМ. На отдельных её этапах требуется принимать не формальные, а творческие решения. Однако никакой метод обработки не поможет, если данные эксперимента содержат грубые ошибки или необоснованные решения. Несоблюдение правил обработки данных может привести к ложным выводам.

    Обработка данных опирается на методы математической статистики, даваемые в курсе высшей математики и кратко изложенные в первом разделе (см. п.1). Для более детального их изучения следует обратиться к специальным трудам, например [6].

    Основной  задаче обработки данных многофакторного  исследования подчинен ряд следующих  частных задач.

    1. Оценка математических ожиданий и дисперсий выхода в отдельных точках факторного пространства или строках плана U=1,2,...,N. Чаще эти оценки называются построчечными средними , построчечными дисперсиями S2u (далее под термином дисперсия будем понимать оценку дисперсии).

    2. Проверка однородности статистического  материала в целях исключения  грубых ошибок.

    3. Проверка однородности статистических  дисперсий.

    4. Определение дисперсии воспроизводимости.

    5. Проверка информативности эксперимента.

    6. Определение коэффициентов модели.

    7. Проверка значимости bi-коэффициентов модели.

    8. Проверка адекватности модели.

3.3. Вычисление построчечных  средних 

и дисперсией, S2u

    Эти величины определяются по формулам (1.11), например:

              

 
 (3.1)

где m - число повторов.

    Полученные  данные заносятся в таблицу 3.1 и  используется в дальнейшей обработке  данных.

3.4. Исключение грубых  ошибок

    Грубые  ошибки и промахи искажают результаты эксперимента и поэтому должны быть исключены. Имеется несколько способов исключения промахов, но чаще используется r-критерий. В соответствии с этим критерием данные строки, в которой подозревается промах, ранжируются, т.е. располагаются в возрастающем порядке yu1<yu3<yu2<…<yum где m – число параллельных опытов. Одно из крайних значений, например, yu1 считается подозрительным или промахом, если оно далеко отстоит от всех остальных. В этом случае необходимо проверить основную статистическую гипотезу H0:yu1 принадлежит остальной совокупности. Альтернативной гипотезой является гипотеза H1:yu1 не принадлежит остальной совокупности, т.е. его резкое отличие объясняется промахом в работе.

    Доля  проверки гипотезы H0 определяется расчетное значение критерия:

              

  (3.2)

если сомнительным считается наименьшее в строке значение yu1 и

              

 (3.3)

если  сомнительным считается наибольшее в строке yum. Величина rkp по числу степеней fu=m-1 уровню значимости берется из таблицы r-распределения (см. приложение 1). Если расчетное значение rmin или rmax окажется меньше rkp гипотеза H0 принимается с надежностью вывода p=1-a т.е. сомнительное крайнее значение отклика считается принадлежащим остальному ансамблю yuj. В противном случае при rmin или rmax> rkp гипотеза H0 в отклоняется, т.е. резко выделяющиеся выборки yu1 или yum из дальнейшей обработки исключаются и в данной строке остается (m-1) наблюдений. Это приводит к нарушению условия ортогональности эксперимента, что затрудняет использование метода наименьших квадратов. Поэтому для применения стандартных процедур обработки данных надо исключить наблюдение, признанное промахом и провести в этой точке дополнительное измерение.

3.5. Проверка однородности  построчечных дисперсий

    Цель  проверки – определить, являются ли измерения отклика во всех точках (строчках) плана равноточными или нет. Если разброс yuj в некоторой u-й строчке объясняется не только ошибкой измерения, но и шумом самого объекта исследований, проверяется однородность рассеивания, обусловленная обеими причинами. Понятие однородность нескольких оценок дисперсий S21, S22 означает, что все величины S2u являются оценками – одной и той же дисперсии s2u, которая называется дисперсией воспроизводимости или дисперсией опытов. В этом случае различия между оценками S2u, u=1,2,3,…,N объясняются их случайным характером, т.к. всякая статистика – случайная величина.

    Дня проверки однородности оценок S2u применяют f-критерий, критерий Кохрена G и реже критерий Бартлетта. Строже работает критерий Кохрена, когда число поворотов во всех строках постоянно: m=const , u =1,2,...,N:

              

  (3.4)

где S2u max – наибольшая построчная дисперсия.

    С величиной G связаны два параметра fu=m-1 – число степеней свободы дисперсии S2u max; f = N – число степеней свободы суммы, стоящей в знаменателе. По числам fu и f и уровню значимости a (обычно =0,05) из распределения Кохрена (см. приложение 1) находят Gkp. Гипотеза об однородности дисперсий принимается, если Gp<= Gkp. При Gp> Gkp дисперсии признаются не однородными и принимаются меры для достижения их однородности, например, стабилизацией условий эксперимента, использованием одного и того же прибора для измерения отклика и т.д.

3.6. Дисперсия воспроизводимости

    Выполнение  требования однородности построчных дисперсий  позволяет определить дисперсию  воспроизводимости как среднеарифметическое построчных дисперсией:

              

 (3.5) 

    Величина  Sy=ÖS2y является оценкой среднеквадратического отклонения и называется ошибкой опытов.

    Формула (3.5) может применяться, если в каждой строке проведено m>1 параллельных опытов. Если m=1, т.е. в каждой строке проведен один опыт, то дисперсию воспроизводимости можно определить по ряду параллельных опытов в одной и той же области эксперимента, например, в центре локальной области исследования. После проведения m опытов дисперсию воспроизводимости находят по (1.9 или 1.11).

    В некоторых лабораторных экспериментах (на ЦВМ, например) повторные измерения в отдельных точках плана дают один и тот же результат. Тогда для расчета дисперсии воспроизводимости можно воспользоваться метрологическими характеристиками измерительных приборов и устройств.

    В паспортных данных приборов указывается  класс точности (К, % от предела измерения Ашк). Это позволяет определить максимальную ошибку измерения

              

 (3.6)

    Случайная ошибка прибора подчиняется нормальному  закону распределения. В машиностроении считается, что rmax=3sy, при этом вероятность попадания в интервал – 3sy<=y<=3sy, P=0,9973 и является технической единицей.

Информация о работе Элементарные статистические процедуры