Автор: Пользователь скрыл имя, 04 Декабря 2012 в 20:38, лекция
Опр. Переменные X и Y связаны корреляционной зависимостью, если значение одной из них зависит не только от значений второй, но и от значений других переменных.
Понятия корреляционной и регрессионной зависимости
Опр. Переменные X и Y связаны корреляционной зависимостью, если значение одной из них зависит не только от значений второй, но и от значений других переменных.
Примеры.
1. Зависимость спроса на товар не только от его цены, но и от дохода потребителя…
3. Курс $ относительно рубля в момент t зависит не только от значения курса в момент t-1
Основные числовые
характеристики случайного вектора
1)
2)
3)
4)
Основные свойства числовых характеристик ( - константы):
1) 2) 3)
4) 5) 6)
7) 8)
9) 10) лишь в том случае когда переменные X и Y связаны линейной зависимостью; , если зависимость прямая, и , если зависимость обратная.
Пример 1. Случайная величина X имеет числовые характеристики . Найти математическое ожидание и дисперсию случайной величины , а также и .
Решение. Воспользуемся свойствами числовых характеристик 3), 6)-8):
;
;
; , поскольку переменные связаны прямой линейной зависимостью.
Основные числовые характеристики случайного вектора
1.
2.
3. .
Свойства числовых характеристик случайного вектора
Пусть неслучайные матрица и вектор, согласованные с
1.
2.
Пример. Получить соотношения, связывающие числовые характеристики векторов и , где
Решение.
,
Точечные оценки числовых характеристик
- выборочное среднее;
- выборочная дисперсия;
Измерение силы корреляционной зависимости
Измерение силы линейной корреляционной зависимости между количественными переменными осуществляется обычно с помощью выборочного коэффициента корреляции Пирсона.
Опр. Пусть - результаты наблюдений переменных и . Коэффициент корреляции Пирсона между переменными X и Y определяется выражением
(1) .
Коэффициент корреляции Пирсона обладает следующими свойствами:
Статистическая проверка гипотез
Опр. Статистическая гипотеза – любое утверждение о виде или свойствах распределения исследуемой случайной величины (величин).
Опр. Основная (нулевая) гипотеза – утверждение, подлежащее проверке. Обозначение: .
Опр. Конкурирующая (альтернативная) гипотеза – утверждение, отличное от нулевой гипотезы. Обозначение: .
Формальное описание задачи проверки гипотез:
(5)
или
(6)
Опр. Статистический критерий (тест, решающее правило) – правило, с помощью которого решается задача проверки гипотез (5) или (6): критерий значимости, если решается задача (5); критерий согласия, если решается задача (6).
Решение задач (5)-(6) осуществляется по результатам наблюдений исследуемого показателя с помощью некоторой функции от наблюдений . Если в качестве аргументов этой функции подставлены произвольные результаты наблюдений , то ее называют статистикой критерия.
Проверка гипотез (5)-(6) завершается принятием одного из двух решений:
Шаг 1. Задаемся некоторым уровнем значимости - максимально возможным значением вероятности ошибки первого рода. Предпочтительные значения : 0,2, 0,1, 0,05.
Шаг 2. Исходя из заданного уровня значимости с помощью статистики критерия множество всех возможных результатов наблюдений разбивается на область принятия и критическую область.
Шаг 3. Если окажется, что значение статистики критерия принадлежит области принятия, то принимается нулевая гипотеза, если окажется, что это значение принадлежит критической области, то нулевая гипотеза отклоняется.
ПРИМЕЧАНИЕ. Если проверка гипотезы осуществляется с помощью компьютерной программы, то решение о принятии или отклонении нулевой гипотезы осуществляется путем сравнения p-значения статистики критерия (его также называют эмпирическим уровнем значимости критерия) с заданным уровнем значимости . Нулевая гипотеза при таком подходе принимается, если эмпирический уровень значимости не меньше заданного уровня значимости.
Элементы многомерного корреляционного анализа
Имеется вектор случайных показателей:
Парадигма корреляционного анализа: вектор имеет многомерное нормальное распределение с параметрами
Обозначим:
Основные решаемые задачи:
Проблема. Парный коэффициент может показывать наличие ложной корреляции. Причина: опосредованное влияние других переменных.
Частный коэффициент корреляции между и :
где – алгебраическое дополнение элемента с индексами корреляционной матрицы Q (измеряют зависимость с исключением влияния других)
Примечание. Для трех переменных:
,
Задача. По результатам наблюдений переменных: Y – выработка на одного рабочего (в у.е.), X1 – ввод новых производственных фондов (в % от имевшихся) и X2 – удельный вес рабочих высокой квалификации (в % от общего количества) вычислены парные коэффициенты корреляции:
Вывод 1. Выработка зависит от ввода новых фондов и удельного веса рабочих высокой квалификации.
Вычислим
Вывод 2. Выработка зависит в большей степени от ввода новых производственных фондов.
Множественный коэффициент корреляции между и остальными переменными :
Формулы для вычислений:
Свойства коэффициентов.
Замечание. Далее все характеристики будут выборочными!
Пример. . Тогда
Проверка значимости множественного коэффициента корреляции
Информация о работе Понятия корреляционной и регрессионной зависимости