КАТЕГОРИИ: Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748) |
Проверка качества модели
Качество модели оценивается по адекватности и точности на основе анализа остатков регрессии e. Анализ остатков позволяет получить представление о том, насколько хорошо подобрана сама модель и насколько правильно выбран метод оценки коэффициентов. Согласно общим предположениям регрессионного анализа, остатки должны «вести себя» как независимые (в действительности почти независимые), одинаково распределенные случайные величины. В классических методах регрессионного анализа предполагается нормальный закон распределения. Исследование остатков полезно начинать с их графика. Нередко встречаются ситуации, когда остатки содержат тенденцию или подвержены циклическим колебаниям. В этом случае говорят о наличии автокорреляции остатков. Иногда автокорреляция связана с исходными данными и вызвана наличием ошибок измерения результативного признака. В других случаях автокорреляция указывает на наличие какой-то достаточно сильной зависимости, неучтенной в модели. Например, при подборе простой линейной зависимости график остатков может показать необходимость перехода к нелинейной модели или включения в модель периодических компонент. Существуют два наиболее распространенных метода определения автокорреляции остатков: 1. построения графика зависимости остатков от времени и визуальное определение наличия или отсутствия автокорреляции; 2. использование критерия Дарбина–Уотсона (приложение 3) и расчет величины
Таким образом, d это отношение суммы квадратов разностей последовательных значений остатков к остаточной сумме квадратов по модели регрессии. Коэффициент автокорреляции остатков определяется по
Если в остатках существует полная положительная автокорреляция и r1 ε = 1, то d = 0. если в остатках полная отрицательная автокорреляция и r1 ε = -1, то d = 4. Таким образом, величина d изменяется в переделах: 0£ d £ 4. Алгоритм выявления автокорреляции остатков на основе критерия Дарбина–Уотсона следующий: выдвигается гипотеза Но об отсутствии автокорреляции остатков; альтернативные гипотезы Н1 и Н1* состоят соответственно в наличии положительной или отрицательной автокорреляции в остатках. Далее по специальным таблицам (приложение 3) определяются Критические значения критерия Дарбина-Уотсона dL и du для заданного числа наблюдений n, числа независимых переменных модели k и уровня значимости g. По этим значениям числовой промежуток [0;4] разбивают на пять отрезков. Вопрос о принятии или отклонении каждой из гипотез с вероятностью (1-g) рассматривается в соответствии с рис. 2.1.
0 dL du 2 4- du 4- dL 4
Рис. 2.1. Механизм проверки гипотезы о наличии автокорреляции остатков
Если фактическое значение критерия Дарбина-Уотсона попадает в зону неопределенности, то нельзя сделать окончательный вывод по этому критерию. Выбросы. График остатков хорошо показывает и резко отклоняющиеся от модели наблюдения– выбросы. Подобным аномальным наблюдениям надо уделять особо пристальное внимание, так как их присутствие может грубо искажать значение оценок. Устранение эффектов выбросов может проводится либо с помощью удаления этих точек из анализируемых данных (эта процедура называется цензурированием), либо с помощью применения методов оценивания параметров, устойчивым к подобным грубым отклонениям. Кроме рассмотренных выше характеристик, целесообразно использовать коэффициент множественной корреляции и детерминации. Тесноту совместного влияния факторов на результат оценивает индекс множественной корреляции:
Значение индекса множественной корреляции лежит в пределах от 0 до 1 и должно быть больше или равно максимальному парному индексу корреляции:
Существует 2 способа вычисления R2: 1) через корреляционное отношение
Данный способ рационален в то случае, если n мало. 2) через определители матрицы.
в многофакторной регрессии добавление дополнительных объясняющих переменных увеличивает коэффициент детерминации. Следовательно, этот коэффициент должен быть скорректирован с учетом числа независимых переменных. В связи с этим необходимо корректировать коэффициент множественной детерминации на потерю степеней свободы вариации.
Скорректированный коэффициент Значимость уравнения множественной регрессии в целом оценивается с помощью F-критерия Фишера:
Частный F-критерий оценивает статистическую значимость присутствия каждого их факторов в уравнении. В общем виде для фактора xi частный F-критерий определиться как
Оценка значимости коэффициентов чистой регрессии с помощью t-критерия Стьюдента сводиться к вычислению значения
где mbi – средняя квадратическая ошибка коэффициента регрессии bi, она может быть определена как
Методика проверки значимости уравнения регрессии в целом и отдельных его параметров такая же, как и в парной регрессии.
Дата добавления: 2017-02-01; Просмотров: 64; Нарушение авторских прав?; Мы поможем в написании вашей работы! |