КАТЕГОРИИ: Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748) |
Сухопутные войска 1 страница
. В качестве примера модели множественной линейной регрессии рассмотрим обобщение предыдущей задачи. Имеются следующие данные (условные) о сменной добыче угля на одного рабочего
В предположении, что между переменными 1) найти ее аналитическое выражение (уравнение регрессии 2) найти 95%-ные доверительные интервалы для индивидуального и среднего значений сменной добычи угля на 1 рабочего для таких же шахт, 3) проверить значимость коэффициентов регрессии и построить для них 95%-ные доверительные интервалы, 4) найти интервальную оценку для дисперсии 1) Модель множественной линейной регрессии можно представить в виде:
где
Введем обозначения:
- матрица-столбец, или вектор, значений объясняющих переменных размера Тогда в матричной форме модель множественной линейной регрессии примет вид:
Оценкой этой модели по выборке является уравнение
где Для оценки вектора неизвестных параметров
при этом используется свойство произведения
Можно доказать, что задача минимизации функции
при этом матрица
Решением матричного уравнения
где Зная вектор
где Для заданного примера
Для удобства вычислений составляем вспомогательную таблицу.
Вычислим матрицу
Матрицу
Умножая эту матрицу на вектор
С учетом равенства
Оно показывает, что при увеличении только мощности пласта Добавление в регрессионную модель объясняющей переменной 2) Формулы, используемые при построении доверительных интервалов для индивидуального и среднего значений, можно получить из аналогичных формул парной модели, изменив число степеней свободы
где
Итак, с надежностью 0,95 индивидуальная сменная добыча угля на одного рабочего в шахтах с мощностью пласта 8 м и уровнем механизации 6% находится в пределах от 3,05 до 7,93 т. 3) Проверим значимость коэффициентов регрессии
где
Итак, значимость коэффициентов регрессии
(где
Из неравенств Доверительный интервал имеет смысл построить только для значимого коэффициента
дает:
Итак, с надежностью 0,95 за счет изменения на 1 м мощности пласта 4) Найдем 95%-ный доверительный интервал для дисперсии
с соответствующим изменением числа степеней свободы критерия
С учетом соотношения
Таким образом, с надежностью 0,95 дисперсия возмущений заключена в пределах от 0,565 до 5,349, а их стандартное отклонение – от 0,751 до 2,313 (т).
2.2. Свойства оценок, полученных методом наименьших квадратов (МНК) Зависимая переменная
имеет две составляющие: неслучайную составляющую
и случайную составляющую Неслучайные составляющие оценок На практике разложить коэффициенты регрессии Регрессионный анализ, основанный на применении метода наименьших квадратов (МНК), дает наилучшие из всех возможных результаты, если выполняются следующие условия (называемые условиями Гаусса-Маркова): 1. Математическое ожидание случайного слагаемого в любом 2. Дисперсия случайного слагаемого должна быть постоянной для всех наблюдений – 3. Случайные слагаемые должны быть статистически независимы, т.е. должно выполняться свойство некоррелированности их между собой. 4. Объясняющие переменные При выполнении условий Гаусса-Маркова модель
называется классической нормальной линейной регрессионной моделью. Наряду с условиями Гаусса-Маркова предполагается, что случайное слагаемое Первое условие означает, что нет постоянно действующего фактора, не включенного в модель, но оказывающего влияние на результативный фактор Если не выполнено это условие, то оценки параметров уравнения регрессии, поученное с помощью МНК, будут неэффективными и смещенными. Второе условие означает, что дисперсия случайного слагаемого в каждом наблюдении имеет только одно значение. Другими словами, не должно быть априорной причины для того, чтобы в одних наблюдениях величина Если дисперсии случайного слагаемого зависят от номера наблюдения (т.е. выполняется условие гетероскедастичности), то оценки коэффициентов регрессии, полученные с помощью МНК, будут неэффективными и смещенными. Поэтому (по крайней мере, формально) можно получить более надежные оценки с использованием других методов. Так как условия Гаусса-Маркова предполагают независимость дисперсии случайного слагаемого от номера наблюдения (т.е. предполагает выполнение условия гомоскедастичности), то разработаны специальные методы диагностирования и устранения гетероскедастичности. Характерная диаграмма рассеяния для одного из возможных вариантов гетероскедастичности показана на рис. 2.
Рис. 2. Случай гетероскедастичности остатков
Третье условие указывает, что между значениями случайного слагаемого в разных наблюдениях нет систематической связи, т.е. указывает на некоррелированность (на независимость) случайных слагаемых для разных наблюдений. Если это условие нарушается (например, для временных рядов), то имеет место автокорреляция остатков, оценки коэффициентов регрессии, полученные МНК, оказываются неэффективными. Существуют методы диагностирования и устранения автокорреляции. Если четвертое условие (о том, что объясняющие переменные должны быть неслучайными) не выполняется, то оценки коэффициентов регрессии оказываются смещенными и несостоятельными.
Теорема Гаусса-Маркова Если перечисленные четыре условия выполняются, то оценки, сделанные с помощью МНК, являются наилучшими оценками, так как они обладают свойствами: 1) несмещенности, что означает отсутствие систематической ошибки в положении линии регрессии; 2) эффективности – имеют наименьшую дисперсию в классе всех линейных несмещенных оценок; 3) состоятельности – при достаточно большом объеме данных оценки приближаются к истинным значениям. Если условия Гаусса-Маркова не выполнены, то можно найти другие оценки параметров уравнения регрессии, которые будут более эффективными по сравнению с оценками, найденными методом МНК. Кроме того, если не выполнены условия Гаусса-Маркова, то становятся неприменимы t-тесты и тест Фишера на качество оценивания и адекватность уравнения регрессии.
Дата добавления: 2014-11-09; Просмотров: 458; Нарушение авторских прав?; Мы поможем в написании вашей работы! |