Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Причины ложных результатов регрессионного анализа




Сравнение моделей

Гиперболическая модель

Показательная модель

.

Линеаризация:

Таблица 3

n y x lg y=Y yp ei ei^2 eiотн
      0.301 3.119 -1.119 1.252 55.954
      0.602 4.245 -0.245 0.060 6.125
      1.041 9.173 1.827 3.339 16.611
      1.230 9.173 7.827 61.265 46.042
      1.255 14.564 3.436 11.807 19.089
      1.447 26.976 1.024 1.048 3.657
      1.531 49.967 -15.967 254.929 46.960
Сумма           333.700 194.439
Среднее 16.286 91.429         27.777

 

Y=-0.161+0.0133*x – вспомогательная линейная модель.

Обратный переход:

Окончательно показательная модель примет вид:

.

Качественные характеристики модели:

77,6 % случайной вариации переменной средняя заработная плата (y) учтено в построенной модели и обусловлено случайными колебаниями фактора чистая прибыль (х);

фактические значения средней зарплаты отличаются от рассчитанных на основе модели в среднем на 28 %, модель неточная.

График:

x y yp
    3.119
    4.245
    9.173
    9.173
    14.564
    26.976
    49.967

 

Линеаризация:

используем простую замену ,

.

Таблица 4

n y x 1/x=X yp ei ei^2 eiотн
      0.02 -2.298 4.2983 18.475 214.9137
      0.0167 5.6834 -1.683 2.8338 42.08507
      0.0118 17.421 -6.421 41.231 58.37421
      0.0118 17.421 -0.421 0.1774 2.477429
      0.01 21.647 -3.647 13.299 20.25976
      0.0083 25.638 2.3624 5.581 8.437161
      0.0071 28.488 5.5118 30.38 16.21119
Сумма           111.98 362.7585
Среднее 16.286 91.429         51.82265

 

– вспомогательная линейная модель;

– гиперболическая модель.

Качественные характеристики модели:

86,6 % случайной вариации переменной средняя заработная плата (y) учтено в построенной модели и обусловлено случайными колебаниями фактора средняя чистая прибыль (х);

фактические значения средней зарплаты отличаются от рассчитанных на основе модели в среднем на 51,8 %, модель неточная.

График:

x y yp
    -2.298
    5.6834
    17.421
    17.421
    21.647
    25.638
    28.488

 

 

Таблица 5

Модель
Степенная 0.844 14.02
Показательная 0.776 27.78
Гипербoлическая 0.866 51.8

 

 

Часто при работе с выборками данных не все процедуры регрессионного анализа проходят гладко и дают результаты, пригодные для практического использования.

Рассмотрим некоторые проблемы регрессионного анализа реальных данных, причины их возникновения и возможные пути преодоления:

1. Грубое искажение вида модели или оценок ее параметров

1) Проблема может возникнуть из-за неоднородности исходных данных, наличия, так называемых, аномальных наблюдений (выбросов). Например, на рисунке 1 одна единственная, последняя, точка показала смену тенденции, и результатом моделирования стала парабола.

Рис. 1. Эффект выбросов

 

Чтобы устранить эффект выбросов надо провести тщательный предварительный анализ данных и, возможно, даже удалить эти точки из анализируемой совокупности.

Иногда для достижения однородности данных используют их преобразования и переход к производным переменным.

2) К названной проблеме могут привести ошибки выборки данных. Выборка может быть, например, недостаточной длины. При увеличении же объема выборки необходимо помнить, что все используемые данные должны быть сформированы в одних и тех же условиях.

3) Регрессионный анализ пойдет по ложному пути и в случае ошибок измерений.

 

 

2. Несоответствие результатов корреляционного и регрессионного анализа

Проблема заключается в том, что корреляционный анализ, например, показывает прямую связь между переменными, а коэффициент регрессии в линейной модели регрессии отрицательный.

Причины здесь, очевидно, в неправильном выборе фактора для исследования интересующей нас переменной или в несоответствии вида модели. Таким образом, при возникновении такой проблемы следует изменить спецификацию модели.

3. Отрицательные расчетные значения эндогенной переменной

В этом случае нужно либо изменить метод оценивания параметров модели, либо изменить ее спецификацию.

4. Интервал прогноза с отрицательной нижней границей или слишком широкий

Если модель обладает хорошим качеством, то достаточно изменить вероятность оценки ошибки прогнозирования U.

5. Эффект ложной регрессии

Большинство финансово-экономических показателей являются нестационарными (рис. 2).

Рис. 2. Пример нестационарных данных

К нестационарным данным, вообще говоря, нельзя применять обычные процедуры статистического анализа, в том числе и регрессионного. Полученные в этом случае регрессии могут быть ложными.

Работа с нестационарными данными – это предмет отдельного разговора, выходящий за рамки нашего курса. Отметим лишь, что применение корреляционно-регрессионного анализа к нестационарным данным возможно, когда переменные имеют схожие тенденции в течение длительного промежутка времени (рис. 2)[9].

Рис. 2. Временные ряды с похожими тенденциями

 

Заключительные замечания для преподавателей

1) Тривиальность данных в примерах обусловлена намерением преподавателя показать все тонкости рассматриваемых эконометрических процедур без лишних проблем, связанных с особенностями реальных данных. Работу с реальными данными целесообразно продемонстрировать в начале практического занятии на ПЭВМ.

2) Количество презентаций на одной лекции не должно превышать 9-10. В противном случае студенты получат не наглядное изложение материала, а мелькание картинок, отвлекающее внимание и раздражающее психику.


[1] Именно в такой интерпретации студенты изучали данный материал в названных выше курсах. Далее в лекции процедура оценки параметров линейной модели рассматривается в несколько иной интерпретации, наиболее приближенной к языку эконометрики.

[2] В справедливости формул для оценки параметров, представленных через отклонения, студентам рекомендуется убедиться самостоятельно.

[3] Этот материал рассматривается более подробно в студенческих группах с хорошей математической подготовкой (реализуется дифференцированный подход).

[4] Здесь приведено несколько интерпретаций понятия «число степеней свободы». Это элементы методики вариативного изложения материала. Они будут использоваться в лекции и далее.

[5] Реализуются междисциплинарные и межпредметные связи.

[6] Используется методика вариативного изложения материала.

[7] Опережающее обучение.

[8] Этот материал можно рекомендовать отдельным студентам для более углубленного изучения с последующим представлением результатов работы в виде реферата.

[9] Явление совпадения тенденций переменных в течение длительного промежутка времени называется коинтеграцией. За разработку метода коинтеграции американский ученый Роберт Ингл и британский экономист Клайв Грэнджер в 2003 г. получили премию Альфреда Нобеля.

 




Поделиться с друзьями:


Дата добавления: 2017-02-01; Просмотров: 71; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopediasu.com - Студопедия (2013 - 2026) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.01 сек.