Прогнозирование в сельском хозяйстве

Автор: Пользователь скрыл имя, 11 Февраля 2012 в 12:32, контрольная работа

Краткое описание

В первую очередь необходимо выделить тенденцию постоянного сокращения их «жизненного цикла» (когда на смену одним объектам приходят качественно новые). Еще 30-40 лет назад этот цикл был сопоставим с длительностью среднего трудового стажа работника (например, технические системы не претерпевали существенных изменении деятельности), а ныне составляет обычно несколько лет.

Файлы: 1 файл

Прогнозирование.docx

— 34.50 Кб (Скачать)

    В случае агломеративной стратегии можно получить матрицы расстояний между объектами. Кроме того, можно получить последовательность кластеров возрастающей общности с указанием входящих в кластеры объектов и расстояния, на уровне которых произошло объединение кластеров.

    В результате анализа строится дендрограмма — дерево объединения кластеров с порядковыми номерами объектов по одной оси со шкалой расстояний — по другой.

    При выполнении анализа расстояния оценивают  с использованием различных метрик.

    Евклидова метрика, знакомая всем из школьного  курса геометрии, применима для  переменных, измеренных в одних единицах.

    Нормализованная евклидова метрика более подходит для переменных, измеренных в различных  единицах или сильно различающихся  по величине.

    Метрика суммы квадратов может использоваться, чтобы стратегии объединения  были аддитивны по отношению к  переменным то есть чтобы расстояние между кластерами было равно сумме расстояний между их компонентами.

    Если  переменные обладают существенно различной значимостью, то целесообразно взвешенное суммирование квадратов, но при этом матрица данных должна содержать веса переменных.

    Манхеттеновская метрика, как правило, применяется для номинальных или качественных, ранговых переменных.

    Метрика Брея—Картиса для номинальных и ранговых данных имеет значения между 0 и 1, переменные с большими значениям оказывают большее влияние на результат.

    Канберрова метрика для номинальных и ранговых переменны также лежат между 0 и 1, но обладают нечувствительностью к сильно асимметричным данным. Применение этой метрики при наличии нулевых и отрицательных значений нежелательно, поэтому рекомендуется предварительно преобразовать данные путем сложения каждой переменной с некоторым значением.

    В некоторых случаях необходимо классифицировать не объекты а переменные, отобрав для дальнейшего анализа наиболее удаленные переменные. В этом случае можно прямо воспользоваться метрикой, основанной на коэффициенте корреляции, а также любо; другой метрикой, предварительно транспонировав матрицу данных Вероятностное обоснование результатов кластеризации можно получить методом дискриминантного анализа.

Дискриминантный анализ

    Дискриминантный анализ позволяет проверить гипотезу о возможности классификации  заданного множества объектов n, характеризуемых некоторым числом m переменных X, на некоторое число классов или кластеров А: Он позволяет объективно классифицировать новые объекты по этим переменным

    При выполнении анализа ищется набор  дискриминирующих функции dl обеспечивающих классификацию объектов на заданное число классов:

    Исходные  данные представляются в виде матрицы  размером (m +1) × n, причем n строк характеризуют n объектов. Первые m столбцов — это значения т переменных для n объектов, а m + 1-й столбец для каждого объекта — это номер его класса. Классы нумеруются натуральными числами от 1 до k, где k — число классов. Объекты, характеризуемые строками в матрице, могут располагаться произвольно относительно номеров классов.

    Если  кроме вычисления дискриминирующей функции нужно с ее помощью  классифицировать ряд новых объектов, то такие объекты также исходно  включаются в матрицу данных с  номером класса 0.

    Результаты  анализа представляют собой следующие  оценки:

    суммарное межкластерное расстояние Махаланобиса D2 (Mahalanobis) между классами с уровнем значимости P для нулевой гипотезы "D2 = 0", то есть гипотезы о невозможности разбиения совокупности объектов на заданное число классов;

    коэффициенты  дискриминирующей функции, обеспечивающей отнесение объектов к данному  классу, отдельно для каждого класса;

    данные  для каждого объекта j, в том числе номер его класса r, расстояние Махаланобиса D2 от объекта до центра класса, уровень значимости Р нулевой гипотезы "D2j = 0", то есть гипотезы о том, что объект может быть отнесен к данному классу, а также вероятность Pjr отнесения объекта к этому классу.

    Если  Р > 0,05, соответствующая нулевая гипотеза может быть принята.

    Если  начальное разбиение на классы нельзя произвести с достаточной степенью уверенности, можно предварительно выполнить кластерный анализ с использованием дивизивной стратегии разбиения и испробовать несколько вариантов числа группировок.

Факторный анализ

    Переменные, значения которых представляют данные статистики или которые можно  измерять в эксперименте, имеют для  исследуемого объекта или явления  нередко достаточно условный характер. Они могут лишь опосредованно  отражать его внутреннюю структуру, движущие силы или факторы.

    Исследователь рынка, аналитик органа планирования ограничен  набором показателей, традиционно  используемых в официальной статистике, в анкетах для опросов. Когда  неизвестный фактор проявляется  в изменении нескольких переменных, в процессе анализа можно наблюдать  существенную корреляцию или связь  между переменными. Тем самым  число независимых, первоначально  скрытых факторов может быть существенно  меньше, чем число традиционно используемых показателей, которые выбирают достаточно субъективно.

    Степень влияния фактора на некоторый  показатель статистически характеризуется  величиной дисперсии, то есть разбросом  значения этого показателя при изменении  значений фактора. Если расположить  оси исходных переменных ортогонально друг к другу то можно обнаружить, что в этом пространстве объекты  группируются своим расположением, определенным координатами точек, в  виде некоторого облака или эллипса  рассеяния, более вытянутого в одних  направлениях и почти плоского в  других.

    Если  провести новые оси соответственно осям эллипса рассеяния, то можно  говорить о выделении факторов, более  субстанциальных по сравнению с  исходными переменными, и оценивать  сравнительную значимость этих факторов в терминах дисперсии. При этом обычно оказывается, что толщина такого облака рассеяний по некоторым осям настолько мала, что эти оси  можно в дальнейшем вовсе исключить  из рассмотрения.

    Метод факторного анализа первоначально  был разработан в психологии с  целью выделения отдельных компонентов  человеческого интеллекта из многомерных  данных по измерению различных проявлений умственных способностей. Однако очень  быстро этот метод завоевал популярность в экономических исследованиях, пpoгнозировании и планировании. Наиболее широко используется метод главных компонент.

    Как правило, основной задачей факторного анализа являете нахождение сокращенной  системы существенных факторов в  пространстве регистрируемых переменных, что включает следующие этапы:

    выделение первоначальных факторов; этот этап включает вычисление главных компонент и  выбор в качестве факторов тех  компонент, которые отвечают за большую  часть дисперсии, рассеяния данных наблюдения;

    вращение  выделенных факторов с целью облегчения их интерпретации в терминах исходных переменных; содержательная интерпретация  новых факторов является творческой задачей исследователя, выходящей  за рамки формального метода, однако она может принести много полезного  для дальнейшего понимания объекта  исследования.

    Исходные  данные представляются в виде матрицы  размером m × n, содержащей данные одного из следующих двух типов:

    значения  m переменных для n объектов;

    квадратная  матрица корреляции между m переменными.

    Анализ  выполняется следующим образом.

    Если  исходные данные представляют собой  значения m переменных для n объектов, то можно использовать один из двух методов анализа:

    по  корреляционной матрице;

    по  ковариационной матрице.

    Использование ковариационной матрицы сравнительно менее употребительно и позволяет  в вычислениях учитывать не только степень взаимосвязанности, коррелированности  переменных, но и абсолютную величину ковариаций.

    Производится  выделение главных компонент, для  каждого компонента находят:

    собственное значение, пропорциональное части общей  дисперсии экспериментальных данных, приходящейся на данный фактор, то есть объясняемой им;

    процент полной дисперсии, приходящейся на каждый фактор;

    процент накопленной дисперсии.

    Малозначительные  компоненты, собственные значения которых  составляют менее 1—2% накопленной дисперсии, обычно опускаются. В процессе анализа  могут быть получены следующие результаты:

    матрица собственных векторов аij, в которой строки соответствуют исходным переменным X, столбцы — факторам Z, ее элементы представляют собой коэффициенты перехода от системы исходных координат X к координатной системе факторов Z: ;

    таблица координат объектов в новой системе  факторов (только для исходных данных типа переменные—объекты);

    рисунки проекций объектов в новой системе  координат на плоскость двух факторов, номера которых указываются в  следующем бланке;

    график  собственных значений факторов в  порядке их убывания, который облегчает  выбор числа значимых факторов;

    значения  нагрузок каждой исходной переменном, показывающие относительные величины проекции переменной на факторную координатную ось; чем больше нагрузка, тем больше близость фактора к исходной переменной, меньше угол девиации между ним в  многомерном пространстве;

    графики факторных нагрузок в проекции на плоскости каждой из двух выбранных  переменных.

    Для облегчения интерпретации факторов можно произвести вращение факторов в пространстве переменных. Вращение позволяет получить более простую структуру системы факторов, при котором каждый фактор имеет большие нагрузки на малое число переменных и малые нагрузки на остальные переменные. Используют различные методы вращения.

    Метод квартимакс имеет тенденцию к выделению генерального фактора, что упрощает интерпретацию за счет уменьшения числа факторов, связанных с каждой переменной. Более употребительный метод варимакс обеспечивает лучшее разделение факторов за счет уменьшения числа переменных, связанных с каждым фактором. Методы эквимакс и биквартимакс дают промежуточный эффект.

    63. Основные приемы и методы прогнозирования  продуктивности сельскохозяйственных  животных.

      Задача № 25

    Рассчитать потребность в сахаре для производства кондитерских изделий индексным методом.

  1. Расчет потребности в сахаре нормативным методом

    Таблица 1 – Расчет потребности в сахаре нормативным методом

Наименование  продукции Норма расхода  сахара в базисном периоде на 1т, кг Планируемое снижение норм расхода, % Прогнозируемый  объем производства, т Потребность в  сахаре на общий выпуск продукции, т
Карамель 650 3 15000 9457500
Конфеты 470 1,5 7000 3240650
Ирис 490 2 4000 1920800
Итого 1610 6,5 26000 14618950

Информация о работе Прогнозирование в сельском хозяйстве