КАТЕГОРИИ: Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748) |
Мультиколлинеарность, гетероскедастичность и автокорреляция остатков
Мультиколлинеарность Одним из условий классической линейной регрессионной модели является предположение о линейной независимости объясняющих переменных, что означает линейную независимость столбцов матрицы На практике полная коллинеарность встречается исключительно редко. Гораздо чаще приходится сталкиваться с ситуацией, когда матрица Мультиколлинеарность может возникнуть в силу разных причин. Например, несколько независимых переменных могут иметь общий временной тренд, относительно которого они совершают малые колебания. Признаки мультиколлинеарности: 1) Небольшое изменение исходных данных (например, добавление новых наблюдений) приводит к существенному изменению оценок 2) Оценки 3) Оценки коэффициентов 4) Парная корреляция между малозначимыми объясняющими переменными достаточно высока. 5) Высокие частные коэффициенты корреляции.
Напомним, что выборочный коэффициент (парной) корреляции между переменными
Выборочный частный коэффициент корреляции находится следующим образом. Пусть даны переменные Обозначим Пусть Пусть Построим регрессии
Найдем остатки для этих регрессий:
Частный коэффициент корреляции между
Таким образом, коэффициент частной корреляции позволяет исключить влияние других факторов на взаимосвязь между рассматриваемыми переменными. Например,
Последствия мультиколлинеарности 1) Большие стандартные ошибки затрудняют нахождение истинных значений определяемых величин и расширяют их интервальные оценки, ухудшая их точность. 2) Ухудшается качество прогноза. 3) Малые t -статистики коэффициентов могут привести к неоправданному выводу о их малой значимости, т.е. о слабом влиянии соответствующей объясняющей переменной на зависимую переменную. 4) Оценки коэффициентов и их стандартные ошибки становятся очень чувствительными к малейшим изменениям данных, т.е. они становятся неустойчивыми.
Методы устранения мультиколлинеарности 1) Исключение переменных из модели. Исключается из модели одна или несколько коррелированных объясняющих переменных. Например, можно последовательно исключать из модели объясняющие переменные с наименьшими незначащими t -статистиками коэффициентов регрессии (причем после каждого исключения из модели объясняющей переменной следует производить пересчет t -статистик для оставшихся объясняющих переменных). 2) Можно использовать описанный в предыдущей теме алгоритм оптимального отбора объясняющих переменных, основанный на использовании скорректированного коэффициента детерминации 3) Получение дополнительных данных или новой выборки 4) Изменение спецификации модели 5) Преобразование переменных. Например, вместо переменной
Гетероскедастичность и автокорреляция остатков Гетероскедастичность означает, что дисперсии Автокорреляция остатков означает, что ковариации
Суть и причины гетероскедастичности Гетероскедастичность означает, что Проблема гетероскедастичности характерна для перекрестных данных и довольно редко встречается при рассмотрении временных рядов.
Последствия гетероскедастичности 1) Оценки коэффициентов регрессии, оставаясь линейными и несмещенными, перестают быть эффективными, что (в частности) ухудшает прогноз. 2) Дисперсии и ковариации оценок являются смещенными. Это приводит к искажению значений статистик Стъюдента и Фишера, что негативным образом сказывается на результаты проверки гипотез и построении интервальных оценок.
Обнаружение гетероскедастичности Графический анализ остатков. По оси абсцисс откладываются либо номера наблюдений
Тест Уайта (White) Сначала к исходной модели применяется обычный метод наименьших квадратов и находятся остатки регрессии
асимптотически (т.е. при большом количестве наблюдений Напомним, что распределение «хи квадрат» с
где Следовательно, при выполнении нулевой гипотезы имеет место равенство:
где В случае, если
Тест ранговой корреляции Спирмана Этот тест применяется, когда есть предположение о прямой зависимости дисперсии ошибки от величины некоторой независимой переменной. Значения такой независимой переменной
где Доказано, что если коэффициент корреляции
имеет распределение Стъюдента с числом степеней свободы
(где
Тест Голфельда-Куандта (Goldfeld-Quandt) Этот тест также применяется, когда есть предположение о прямой зависимости дисперсии ошибки от величины некоторой независимой переменной. Нужно: 1) упорядочить данные по убыванию той независимой переменной, относительно которой есть подозрение на гетероскедастичность; 2) исключить 3) провести две независимые регрессии первых 4) составить статистику Если верна нулевая гипотеза (8) о постоянстве дисперсий случайных отклонений, то построенная статистика В случае, если
Суть и причины автокорреляции Автокорреляция остатков (отклонений) в подавляющем большинстве случаев встречается в регрессионном анализе при использовании данных временных рядов. В экономических задачах значительно чаще встречается положительная автокорреляция (т.е. когда Причины автокорреляции: 1) Ошибки спецификации. Неучет в модели какой-либо важной объясняющей переменной обычно приводит к системным отклонениям точек наблюден6ий от линии регрессии. 2) Инерция. Многие экономические показатели обладают определенной цикличностью. Экономические показатели реагируют на изменение экономических условий с запаздыванием (временным лагом). 3) Сглаживание данных. Часто данные по некоторому продолжительному временному периоду получают усреднением данных по составляющим его подынтервалам. Это может привести к определенному сглаживанию колебаний, которые имелись внутри рассматриваемого периода.
Последствия автокорреляции 3) Оценки коэффициентов регрессии, оставаясь линейными и несмещенными, перестают быть эффективными, что (в частности) ухудшает прогноз. 4) Дисперсии и ковариации оценок являются смещенными. Это приводит к искажению значений статистик Стъюдента и Фишера, что негативным образом сказывается на результаты проверки гипотез и построении интервальных оценок.
Обнаружение автокорреляции Выводы о независимости (либо зависимости) случайных отклонений Графический метод. По оси абсцисс откладываются значения временного индекса
Тест Дарбина-Уотсона (Durbin-Watson) Статистика Дарбина-Уотсона находится по формуле:
Можно показать, что при наличии в модели свободного члена:
где В соответствии с соотношением (15):
причем близость значения DW к нулю означает близость коэффициента Для более точного определения, какое значение статистики свидетельствует об отсутствии автокорреляции, а какое – об ее наличии (и ее виде), найдены критические точки распределения Дарбина-Уотсона: Выводы о наличии и характере автокорреляции делаются по следующему правилу: 1) 2) 3) 4) 5)
Дата добавления: 2014-12-17; Просмотров: 5982; Нарушение авторских прав?; Мы поможем в написании вашей работы! |