КАТЕГОРИИ: Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748) |
Причины ложных результатов регрессионного анализа
Сравнение моделей Гиперболическая модель Показательная модель
Линеаризация:
Таблица 3
Y=-0.161+0.0133*x – вспомогательная линейная модель. Обратный переход:
Окончательно показательная модель примет вид:
Качественные характеристики модели:
77,6 % случайной вариации переменной средняя заработная плата (y) учтено в построенной модели и обусловлено случайными колебаниями фактора чистая прибыль (х);
фактические значения средней зарплаты отличаются от рассчитанных на основе модели в среднем на 28 %, модель неточная. График:
Линеаризация: используем простую замену
Таблица 4
Качественные характеристики модели:
86,6 % случайной вариации переменной средняя заработная плата (y) учтено в построенной модели и обусловлено случайными колебаниями фактора средняя чистая прибыль (х);
фактические значения средней зарплаты отличаются от рассчитанных на основе модели в среднем на 51,8 %, модель неточная. График:
Таблица 5
Часто при работе с выборками данных не все процедуры регрессионного анализа проходят гладко и дают результаты, пригодные для практического использования. Рассмотрим некоторые проблемы регрессионного анализа реальных данных, причины их возникновения и возможные пути преодоления: 1. Грубое искажение вида модели или оценок ее параметров 1) Проблема может возникнуть из-за неоднородности исходных данных, наличия, так называемых, аномальных наблюдений (выбросов). Например, на рисунке 1 одна единственная, последняя, точка показала смену тенденции, и результатом моделирования стала парабола.
Рис. 1. Эффект выбросов
Чтобы устранить эффект выбросов надо провести тщательный предварительный анализ данных и, возможно, даже удалить эти точки из анализируемой совокупности. Иногда для достижения однородности данных используют их преобразования и переход к производным переменным. 2) К названной проблеме могут привести ошибки выборки данных. Выборка может быть, например, недостаточной длины. При увеличении же объема выборки необходимо помнить, что все используемые данные должны быть сформированы в одних и тех же условиях. 3) Регрессионный анализ пойдет по ложному пути и в случае ошибок измерений.
2. Несоответствие результатов корреляционного и регрессионного анализа Проблема заключается в том, что корреляционный анализ, например, показывает прямую связь между переменными, а коэффициент регрессии Причины здесь, очевидно, в неправильном выборе фактора для исследования интересующей нас переменной или в несоответствии вида модели. Таким образом, при возникновении такой проблемы следует изменить спецификацию модели. 3. Отрицательные расчетные значения эндогенной переменной В этом случае нужно либо изменить метод оценивания параметров модели, либо изменить ее спецификацию. 4. Интервал прогноза с отрицательной нижней границей или слишком широкий Если модель обладает хорошим качеством, то достаточно изменить вероятность оценки ошибки прогнозирования U. 5. Эффект ложной регрессии Большинство финансово-экономических показателей являются нестационарными (рис. 2).
Рис. 2. Пример нестационарных данных К нестационарным данным, вообще говоря, нельзя применять обычные процедуры статистического анализа, в том числе и регрессионного. Полученные в этом случае регрессии могут быть ложными. Работа с нестационарными данными – это предмет отдельного разговора, выходящий за рамки нашего курса. Отметим лишь, что применение корреляционно-регрессионного анализа к нестационарным данным возможно, когда переменные имеют схожие тенденции в течение длительного промежутка времени (рис. 2)[9].
Рис. 2. Временные ряды с похожими тенденциями
Заключительные замечания для преподавателей 1) Тривиальность данных в примерах обусловлена намерением преподавателя показать все тонкости рассматриваемых эконометрических процедур без лишних проблем, связанных с особенностями реальных данных. Работу с реальными данными целесообразно продемонстрировать в начале практического занятии на ПЭВМ. 2) Количество презентаций на одной лекции не должно превышать 9-10. В противном случае студенты получат не наглядное изложение материала, а мелькание картинок, отвлекающее внимание и раздражающее психику. [1] Именно в такой интерпретации студенты изучали данный материал в названных выше курсах. Далее в лекции процедура оценки параметров линейной модели рассматривается в несколько иной интерпретации, наиболее приближенной к языку эконометрики. [2] В справедливости формул для оценки параметров, представленных через отклонения, студентам рекомендуется убедиться самостоятельно. [3] Этот материал рассматривается более подробно в студенческих группах с хорошей математической подготовкой (реализуется дифференцированный подход). [4] Здесь приведено несколько интерпретаций понятия «число степеней свободы». Это элементы методики вариативного изложения материала. Они будут использоваться в лекции и далее. [5] Реализуются междисциплинарные и межпредметные связи. [6] Используется методика вариативного изложения материала. [7] Опережающее обучение. [8] Этот материал можно рекомендовать отдельным студентам для более углубленного изучения с последующим представлением результатов работы в виде реферата. [9] Явление совпадения тенденций переменных в течение длительного промежутка времени называется коинтеграцией. За разработку метода коинтеграции американский ученый Роберт Ингл и британский экономист Клайв Грэнджер в 2003 г. получили премию Альфреда Нобеля.
Дата добавления: 2017-02-01; Просмотров: 71; Нарушение авторских прав?; Мы поможем в написании вашей работы! |