Элементарные статистические процедуры

Автор: Пользователь скрыл имя, 04 Декабря 2011 в 20:43, лекция

Краткое описание

При решении многих прикладных задач необходимые вероятностные характеристики случайных величин неизвестны исследователю и добываются экспериментально. Такое статистическое описание результатов наблюдений составляет содержание математической статистики.

Файлы: 1 файл

Лекции.doc

— 798.50 Кб (Скачать)

    При рассмотрении такой кибернетической  системы различают входы –  независимые переменные (управляемые  факторы) х123,…,хк, соответствующие состоянию системы или воздействиям на систему и выходы (параметры процесса или численные характеристики целей исследования) – параметры (критерии) оптимизации h1,h2,h3,….,hв.

    Каждый  фактор может принимать одно из нескольких значений, называемых уровнями. Фиксированный  набор уровней факторов определяет одно из возможных состояний кибернетической системы.

    Каждому сочетанию фиксированных значений факторов в многомерном факторном  пространстве соответствует определенная точка (см. рис.2.2., точка "О") и определенная реакция (отклик) системы. Между уровнями факторов и реакцией системы существует вполне определенная связь, которая характеризуется так

              hв = ¦1, χ 2, χ 3,……, χ к), l = 1,2,3,….,m. (2.1)

     Геометрический  образ соответствующей функции  отклика, называют поверхностью отклика (рис. 2.2.) 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Рис. 2.2. Факторное пространство и поверхность 

    Знание  функции отклика равносильно  знанию оптимизирующего процесса. Однако, исследователю в общем случае заранее не известен вид функции. Поэтому для описания поверхности  отклика используют разложение этой функции в степенной ряд, т.е. представляют функцию отклика в виде полинома (этo один из наиболее удобных и разработанных способов ее представления) степени от «К» переменных

              

 (2.2)

    где b0, bi, bij,…, bijq – коэффициенты регрессии, значения которых определяют форму поверхности отклика в изучаемой области. Такое уравнение обычно называют уравнением регрессии.

    Таким образом, задача отыскания функции  отклика может быть сведена к  получение эксперимента по данным функции  отклика (выборочной оценки для h) в виде:

              

 (2.3)

    Здесь b0,bi,bij,…,bijq - является оценками для теоретических коэффициентов регрессии.

    Функцию отклика y назовем математической моделью системы.

    Основная  задача планирования эксперимента заключается в такой постановке эксперимента, чтобы при минимальном количестве опытов, варьируя значения независимых переменных по специально сформулированным правилам, построить математическую модель системы и найти оптимальные значения свойств системы.

    Отметим основные возможности, которые дает исследователям теория эксперимента.

    1. Прежде всего, математическая  статистика ввела в теорию  эксперимента концепцию «случая», заставив исследователя искусственно  создать случайную ситуацию в  эксперименте. Программу эксперимента стали составлять специалисты по математической статистике так, чтобы рандомизировать (т.е. сделать случайными) систематически действующие факторы, которые трудно поддаются учету или контролю с тем, чтобы можно было рассмотреть их как случайные величины и, следовательно, учитывать статистически. Рандомизация условий проведения эксперимента стала одной из основных предпосылок в концепции планирования эксперимента. Полная рандомизация не всегда возможна, что привело к необходимости создания особо рандомизированных экспериментальных планов с ограничением на рандомизацию (неполноблочные сбалансированные планы, латинские, греко-латинские квадраты, кубы и т.д.).

    2. Планирование эксперимента позволяет  резко повысить эффективность  эксперимента за счет оптимального использования пространства независимых переменных. Это означает, что параметры, интересующие исследователя, могут быть определены со значительно меньшей ошибкой, чем при традиционных методах исследования. Разработана концепция многофакторного исследования, когда в эксперименте варьируются все факторы сразу. В силу известного свойства многомерного пространства при этом растет радиус обследуемой области, происходит повышение точности многофакторного исследования.

    3. Планирование эксперимента позволяет  построить стратегию исследования, основанную на последовательности частных, логически осмысленных, операций. При этом развивается стратегия последовательного эксперимента, когда исследователь отказывается от попытки заранее задать строго фиксированную схему проведения эксперимента. Принимаемая им стратегия предусматривает возможность принятия решений в зависимости от результатов, полученных на отдельных этапах исследования. Трудно переоценить выигрыш, который обеспечивается логически упорядоченной стратегией, особенно при решении экспериментальных задач (поиск оптимальных условий протекания процесса).

    4. В планировании эксперимента  разработана концепция редукции (свертки) полученной информации, результатов исследования. После  того, как эксперимент поставлен  и получены результаты, возникает еще одна задача – представить эти результаты в компактной форме, удобной для опубликования, хранения и сопоставления с другими данными. Результат каждого эксперимента всегда несвободен от некоторого элемента неопределенности. Раньше исследователь пытался дать представление о достоверности своих результатов путей пространного описания условий проведения эксперимента. Теперь достоверность полученных результатов оценивается числом, подученным путем статистического анализа результатов наблюдений. В планировании эксперимента оценки параметров и установление доверительных границ для них производится некоторым стандартным образом. И, наконец, математическая теория эксперимента позволяет получить сопоставимые результаты исследований, проведенных не только в различных организациях, но в различных странах.

2.2 Факторы, параметры  оптимизации и  модели.

    Выбор факторов, параметров оптимизации и  моделей осуществляется с учетом цели исследований и имеющихся условий  для проведения эксперимента.

    Факторами называются переменные величины, принимающие  в некоторый момент времени определенное значение и соответствующие способам воздействия на объект. Они определяют как сам объект, так и его  состояние. 

    Факторы могут быть количественными и  качественными. Количественными факторами являются переменные величины, которые можно оценить количественно. Качественные факторы, если это нужно экспериментатору, всегда можно сделать количественными, построив условную порядковую шкалу для кодирования уровня качества числами натурального ряда. Наиболее простой пример такого кодирования: оценка качества по пятибалльной системе.

    Основные  требования к факторам: факторы должны быть управляемы и однозначны, они  должны непосредственно воздействовать на объект, исследования, не должны быть коррелируемыми, а совокупность факторов должна быть совместимой.

    Под управляемостью фактора подразумевается  возможность установки и поддержания  выбранного уровня фактора постоянным в течение всего опыта или  его изменения по заданному плану.

    Требование непосредственного воздействия на объект имеет большое значение в связи с тем, что трудно управлять фактором, если он является функцией других переменных. Факторы нужно определить операционно, т.е. должен быть известен способ придания фактору любого возможного значения.

    Некоррелируемость факторов означает, что каждый фактор можно устанавливать на любой  уровень независимо друг от друга. Последнее  обстоятельство не означает, что между  факторами не существует никакой  связи. Достаточно, чтобы связь между ними не была линейной.

    Требование  совместимости всей совокупности факторов означает, что комбинации значений факторов должны быть осуществимы.

    Не  менее важной, чем определение  факторов, является задача выбора параметра  оптимизации, которая определяется целью исследований. Цель исследований должна быть сформулирована очень четко и допускать количественную оценку. К параметру оптимизации предъявляется ряд требований. Это эффективность с точки зрения достижения цели, универсальность, количественное выражение одним числом, статистическая эффективность, физический смысл, простота и достоверность вычисления, существование для всех различных состояний системы.

    Главным, определяющим корректность постановки задачи, является требование эффективности  с точки зрения достижения цели. Параметр оптимизации должен оценивать выход системы в целом, а не отдельных ее подсистем.

    Под универсальностью параметра оптимизации  понимают его способность всесторонней характеристики объекта исследования.

    Параметр  оптимизации должен быть количественным, задаваться числом. В тех случаях, когда возникают трудности с количественной оценкой параметров оптимизации, прибегают к числовому кодированию. С количественной природой параметра оптимизации связаны требования его выражения одним числом, а также однозначность в статистическом смысле (при любом сочетании факторов выход должен определяться одним с точностью ошибки эксперимента числовым выражением).

    Требование  статистической эффективности сводится фактически к выбору параметра оптимизации, определяемого с наибольшей возможной точностью.

    Требование  физического смысла связано с  последующей интерпретацией результатов  эксперимента.

    Конечная  цель исследований может иметь несколько  параметров оптимизации. Необходимо стремиться и искать возможность уменьшения количества параметров оптимизации путем их обобщения и рассмотрения части параметров как ограничений. Иногда прибегают к переформулированию задачи.

    Свойства  системы можно описывать различными моделями, одновременно имеющими право  на существование. Однако, всегда можно говорить о том, что одни из этих моделей хороши в каком-то смысле, другие – хуже. Дня выбора конкретной модели необходимо конкретно сформулировать требования. К ним относится адекватность, содержательность, простота и т.д. Адекватность модели определяет ее способность предсказывать результаты эксперимента в некоторой области с требуемой точностью. Содержательность модели определяется ее способностями не только объяснить уже известные факты, но и выявить новые, не замеченные явления, а также, в какой-то степени, предсказывать дальнейшее развитие и выдвигать перед исследователем новые проблемы. Простота модели во многом определяет эффективность ее использования. В теории математического планирования эксперименте наибольшее распространение получили полиномиаотные модели.

2.3. Полный факторный  эксперимент

    Традиционным  способом испытаний является однопараметрический  эксперимент, при котором все  переменные, кроме исследуемой, фиксируются  на постоянных уровнях. Поочередно варьируя переменными, получают зависимости, трудно сопоставимые и не отражающие взаимодействия параметров. При этом затрачивается много труда и времени. Факторное планирование как раз устраняет все эти недостатки.

    При факторном планировании число уровней  для каждого из факторов не может бить меньше двух. Так как число уровней определяет число состояний «черного ящика», и, следовательно, сложность эксперимента, то число уровней редко выбирают большее трех. Экспериментальные планы, в которых все факторы варьируются на двух уровнях, называются планами типа 2k , где k – количество факторов. А эксперимент, в котором реализуются все возможные комбинации уровней всех факторов, называют полным факторным экспериментом. Нетрудно видеть, что для того, чтобы исчерпать все возможные комбинации для факторов на двух уровнях, следует поставить.

2.4. Кодирование переменных

    Для облегчения расчета коэффициентов  регрессии по результатам факторного эксперимента производят так называемое кодирование или преобразование переменных по следующей формуле:

              

 i= 1,2,3,….k (2.4)

где xi – кодированное текущее значение фактора; - значение фактора на одном из уровней в натуральных переменных; - значение i – это фактора в натурных переменных на так называемом основном уровне, который является среднеарифметическим между выбранными уровнями фактора (см. рис. 2.3а), а - натуральное значение интервала варьирования, величина которого равна разности между любым из уровней и основным уровнем фактора.

   Выбор интервалов варьирования в области  определения факторов фактически означает выбор некоторой подобласти, предназначенной  для изучения. Эта подобласть симметрична  относительно нулевого уровня, то есть ее центра. Для качественных факторов нулевой уровень не имеет физического смысла, что, однако, несущественно.

   

Рис. 2.3. Геометрическое изображение двухфакторного эксперимента:

а - в  натуральных переменных;

б - в  кодированных переменных. 

Информация о работе Элементарные статистические процедуры