КАТЕГОРИИ: Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748) |
Тема 5. Гетероскедастичність
5.1. Виявлення гетероскедастичності та її природа Розглянемо класичну лінійну багатофакторну модель
Як завжди,
Для застосування МНК при оцінюванні параметрів моделі раніше було сформульовано основні припущення, які на практиці можуть порушуватись. Раніше розглядався особливий випадок багатофакторного регресійного аналізу, пов'язаний з проблемою мультиколінеарності. Тепер розглянемо інший особливий випадок, що стосується сталості дисперсії кожної випадкової величини Означення 5.1. Якщо дисперсія залишків стала для кожного спостереження, то це явище називається гомоскедастичністю:
Якщо це припущення не задовольняється в якомусь окремому випадку, то маємо гетероскедастичність (помилки Означення 5.2. Якщо дисперсія залишків змінюється для кожного спостереження або групи спостережень, то це явище називається ге- тероскедастичністю:
Розглянемо питання про доцільність припущення (5.3) і про те, що відбувається, якщо це припущення не задовольняється. Насамперед зауважимо, що сутність припущення про гомоскедастичність полягає в тому, що варіація кожної випадкової складової
Форма гетероскедастичності залежить від знаків і значень коефіцієнтів у залежності
Оскільки У прикладних дослідженнях, як правило, використовують зручне припущення, а саме: в разі простої лінійної регресії гетероскедастичиість має форму
( Наслідки порушення припущення про гомоскедастичність: 1)неможливо знайти середньоквадратичне відхилення параметрів 2)неможливо побудувати довірчий інтервал для прогнозних значень 3) отримані за МНК оцінки параметрів регресії не є ефективними (не мають найменшої дисперсії). Зазначимо, що якщо, незважаючи на гетероскедастичність, ми використовуватимемо звичайні процедури перевірки гіпотез, то висновки можуть бути неправильними. Зрозуміло, гетероскедастичність є суттєвою проблемою, а тому потрібно вміти з’ясовувати її наявність.
5.2. Тестування наявності гетероскедастичності Як і в разі мультиколінеарності, єдиних правил виявлення гетероскедастичності немає, а є різноманітні тести (критерії): критерій
5.2.1. Параметричний тест Гольдфельда–Квандта Зауваження. 1. Цей тест застосовується до великих вибірок. 2. Тест припускає нормальний розподіл і незалежність випадкових величин 1-й крок: спостереження (вихідні дані) впорядкувати відповідно до величини елементів вектора 2-й крок: відкинути 3-й крок: побудувати дві моделі на основі звичайного МНК за двома створеними сукупностями спостережень обсягом 4-й крок: знайти суму квадратів залишків моделей
де 5-й крок: розрахувати експериментальне значення критерію 6-й крок: значення критерію Зауваження: чим більше значення
5.2.2. Непараметричний тест Гольдфельда–Квандта Цей тест базується на встановленні кількості піків значень залишків після впорядкування (ранжування) спостережень за Зазначимо, що цей тест не цілком надійний для перевірки на гетероскедастичність. Однак він дуже простий і часто використовується для першої оцінки наявності гетероскедастичності множини спостережень.
5.2.3. Тест Глейсера Перевірка на гетероскедастичність базується на побудові регресійної функції, що характеризує залежність величини залишків за модулем від пояснюючої змінної Аналітична форма регресійних функцій може мати вигляд
Рішення про відсутність гетероскедастичності залишків приймається на основі значущості коефіцієнтів Оскільки явище гетероскедастичності пов’язане з тим, що змінюються дисперсії залишків, а коваріація між ними відсутня, то матриця Приклад. Перевірити гіпотезу про відсутність гетероскедастичності для побудови моделі, яка характеризує залежність заощаджень від доходів населення. Статистичні дані наведено в таблиці.
Таблиця 5.2 Дані до задачі
Розв'язання: Ідентифікуємо змінні:
Для перевірки гіпотези про відсутність гетероскедастичності залишків моделі застосуємо параметричний тест Гольдфельда–Квандта. 1-й крок: спостереження впорядкуємо за зростанням за величиною доходу (вектор Таблиця 5.3 Дані до задачі
2-й крок: відкинемо Отримаємо дві сукупності спостережень обсягом Таблиця 5.3 Перша сукупність спостережень:
Друга сукупність спостережень:
3-й крок: побудуємо дві моделі на основі звичайного МНК за двома створеними сукупностями спостережень:
4-й крок: знайдемо суму квадратів залишків
де 5-й крок: розрахуємо фактичне (експериментальне) значення критерію Приймаємо рівень значущості Число ступенів свободи: Розраховане значення критерію
Оскільки
5.3. Усунення гетероскедастичності Розглянемо питання усунення гетероскедастичності трансформуванням початкової моделі. Припустимо, що за статистичними даними побудовано початкову регресійну модель
і на базі будь-якого тесту встановлено наявність гетероскедастичності:
Для усунення гетероскедастичності початкову модель змінюють (трансформують) так, щоб помилки мали сталу дисперсію:
Трансформація моделі зводиться до зміни початкової форми моделі методом, який залежить від специфічної форми гетероскедастичності, тобто від форми залежності між дисперсіями залишків і значеннями незалежних змінних:
Розглянемо сутність трансформації моделі на прикладі простої лінійної регресії. Нехай початкова модель
де компоненти випадкового вектора Припустимо, що гетероскедастичність має форму
де Трансформація початкової моделі здійснюється діленням її на Зазначимо, що така трансформація еквівалентна застосуванню зваженого методу найменших квадратів (ЗМНК), який є особливим випадком узагальненого методу найменших квадратів (УМНК). Суть ЗМНК полягає в мінімізації зваженої суми квадратичних відхилень:
Зазначимо також, що ЗМНК, застосований до початкової моделі, дає такі самі результати, що й МНК, застосований до трансформованої моделі. Твердження. Оцінки трансформованої моделі мають меншу дисперсію (ефективніші), ніж оцінки, отримані із застосуванням МНК до початкової моделі. Нарешті, потрібно пам'ятати, що гетероскедастичність може існувати за рахунок неврахованих факторів (поганої специфікації моделі). У цьому разі можливим рішенням є включення неврахованих факторів у модель. Сліпе застосування трансформації (без аналізу причин гетероскедастичності) зробить гомоскедастичною випадкову змінну, однак оцінки параметрів залишаться неправильними через неврахування важливих факторів.
Дата добавления: 2014-10-23; Просмотров: 4110; Нарушение авторских прав?; Мы поможем в написании вашей работы! |