Функциональная и корреляционная зависимости

Автор: Пользователь скрыл имя, 26 Декабря 2011 в 23:25, доклад

Краткое описание

Корреляция - связь между двумя переменными. Расчёт корреляции основан на формировании парных значений, которые образовываются из рассматриваемых зависимых выборок.
Метод вычисления коэффициента корреляции зависит от вида шкалы, к которой относятся переменные.

Файлы: 1 файл

Документ Microsoft Office Word.docx

— 54.81 Кб (Скачать)

 Содержательная интерпретация двух типах факторов 
 
Для целей изложения факторного анализа остановимся на двух типах факторов, условно выделенных нами с точки зрения их содержательной ин-терпретации: 1) факторы, в состав которых входят, содержательно близкие или содержательно «гомогенные» переменные; 2) факторы, состоящие из содержательно разнородных, «гетерогенных» переменных. Первый тип факторов предполагает относительно простую интерпретацию фактора как общего свойства, черты и т. д., полученных на основании обобщения содер-жательно близких переменных.

23.

Кластерный анализ выполняет следующие основные задачи:

  • Разработка типологии или классификации.
  • Исследование полезных концептуальных схем группирования объектов.
  • Порождение гипотез на основе исследования данных.
  • Проверка гипотез или исследования для определения, действительно ли типы (группы), выделенные тем или иным способом, присутствуют в имеющихся данных (примечание 1).

Кластерный анализ предъявляет следующие требования к данным:

  1. показатели не должны коррелировать между собой
  2. показатели должны быть безразмерными
  3. распределение показателей должно быть близко к нормальному
  4. показатели должны отвечать требованию «устойчивости», под которой понимается отсутствие влияния на их значения случайных факторов
  5. выборка должна быть однородна, не содержать «выбросов» (примечание 2).

Если кластерному  анализу предшествует факторный анализ, то выборка не нуждается в «ремонте» — изложенные требования выполняются автоматически самой процедурой факторного моделирования (есть ещё одно достоинство — z-стандартизация без негативных последствий для выборки; если её проводить непосредственно для кластерного анализа, она может повлечь за собой уменьшение чёткости разделения групп). В противном случае выборку нужно корректировать.

Методы кластерного  анализа можно разделить на две  группы:

  • иерархические;
  • неиерархические.

Каждая из групп  включает множество подходов и алгоритмов.

Используя различные  методы кластерного анализа, аналитик может получить различные решения  для одних и тех же данных. Это  считается нормальным явлением.

Рассмотрим иерархические  и неиерархические методы подробно.

Иерархические методы кластерного  анализа

Суть иерархической  кластеризации состоит в последовательном объединении меньших кластеров  в большие или разделении больших  кластеров на меньшие.

Иерархические агломеративные методы (Agglomerative Nesting, AGNES)

Эта группа методов  характеризуется последовательным объединением исходных элементов и  соответствующим уменьшением числа  кластеров.

В начале работы алгоритма все объекты являются отдельными кластерами. На первом шаге наиболее похожие объекты объединяются в кластер. На последующих шагах  объединение продолжается до тех  пор, пока все объекты не будут  составлять один кластер.

 

  1. Виды  проявления количественных связей между  признаками
    • функциональная связь
    • корреляционная связь
  2. Определения функциональной и корреляционной связи

    Функциональная  связь — такой вид соотношения между двумя признаками, когда каждому значению одного из них соответствует строго определенное значение другого (площадь круга зависит от радиуса круга и т.д.). Функциональная связь характерна для физико-математических процессов.

    Корреляционная  связь — такая связь, при которой каждому определенному значению одного признака соответствует несколько значений другого взаимосвязанного с ним признака (связь между ростом и массой тела человека; связь между температурой тела и частотой пульса и др.). Корреляционная связь характерна для медико-биологических процессов.

  1. Практическое значение установления корреляционной связи. Выявление причинно-следственной между факторными и результативными признаками (при оценке физического развития, для определения связи между условиями труда, быта и состоянием здоровья, при определении зависимости частоты случаев болезни от возраста, стажа, наличия производственных вредностей и др.)

    Зависимость параллельных изменений нескольких признаков от какой-то третьей величины. Например, под воздействием высокой  температуры в цехе происходят изменения  кровяного давления, вязкости крови, частоты пульса и др.

  1. Величина, характеризующая направление и силу связи между признаками. Коэффициент корреляции, который одним числом дает представление о направлении и силе связи между признаками (явлениями), пределы его колебаний от 0 до ± 1
  2. Способы представления корреляционной связи
    • график (диаграмма рассеяния)
    • коэффициент корреляции
  3. Направление корреляционной связи
    • прямая
    • oбратная
  4. Сила корреляционной связи
    • сильная: ±0,7 до ±1
    • средняя: ±0,3 до ±0,699
    • слабая: 0 до ±0,299
  5. Методы определения коэффициента корреляции и формулы
    • метод квадратов (метод Пирсона)
    • ранговый метод (метод Спирмена)
  6. Методические требования к использованию коэффициента корреляции
    • измерение связи возможно только в качественно однородных совокупностях (например, измерение связи между ростом и весом в совокупностях, однородных по полу и возрасту)
    • расчет может производиться с использованием абсолютных или производных величин
    • для вычисления коэффициента корреляции используются не сгруппированные вариационные ряды (это требование применяется только при вычислении коэффициента корреляции по методу квадратов)
    • число наблюдений менее 30
  7. Рекомендации по применению метода ранговой корреляции (метод Спирмена)
    • когда нет необходимости в точном установлении силы связи, а достаточно ориентировочных данных
    • когда признаки представлены не только количественными, но и атрибутивными значениями
    • когда ряды распределения признаков имеют открытые варианты (например, стаж работы до 1 года и др.)
  8. Рекомендации к применению метода квадратов (метод Пирсона)
    • когда требуется точное установление силы связи между признаками
    • когда признаки имеют только количественное выражение
  9. Методика и порядок вычисления коэффициента корреляции

    1) Метод квадратов

    • построить вариационные ряды для каждого из сопоставляемых признаков, обозначив первый и второй ряд чисел соответственно х и у;
    • определить для каждого вариационного ряда средние значения (Ми М2);
    • найти отклонения (dх и dy) каждого числового значения от среднего значения своего вариационного ряда;
    • полученные отклонения перемножить (dX dy)
    • каждое отклонение возвести в квадрат и суммировать по каждому ряду (Σ dxи dy)
    • подставить полученные значения в формулу расчета коэффициента корреляции: 

Информация о работе Функциональная и корреляционная зависимости