Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Представить графически фактические, расчетные и прогнозные значения




Замечание.

Пример.

Пусть зависимая переменная Y – прибыль некоторой компании (исходные данные приведены в таблице 1), а фактор X – объем продаж товара этой компании.

Требуется:

1) найти параметры уравнения линейной регрессии, дать экономическую интерпретацию коэффициента регрессии;

2) вычислить остатки, найти остаточную сумму квадратов, оценить дисперсию остатков , построить график остатков;

3) проверить выполнение предпосылок МНК;

4) осуществить проверку значимости параметров уравнения регрессии по t-критерию Стьюдента ( =0,05);

5) вычислить коэффициент детерминации, проверить значимость уравнения регрессии с помощью F-критерия Фишера ( =0,05), найти среднюю относительную ошибку аппроксимации, сделать вывод о качестве модели;

6) осуществить прогнозирование среднего значения показателя Y при уровне значимости =0,1, если прогнозное значение фактора составит 117 % от его максимального значения;

7) представить графически фактические, расчетные и прогнозные значения.

Решение:

1) найти параметры уравнения линейной регрессии, дать экономическую интерпретацию коэффициента регрессии:

Для решения задачи построим расчетную таблицу 1:

Таблица 1

№ п.п. Y X X-Xcp (X-cp)^2 Y-Ycp (X-Xcp)* (Y-Ycp) Yp e e^2 eотн (Y-Ycp)^2 X^2
      -9   -31   31.65 -6.65 44.22 26.6    
      -7   -22   37.07 -3.07 9.425 9.03    
      -4   -14   45.2 -3.2 10.24 7.62    
      -6   -5   39.78 11.22 125.9      
          -1   56.04 -1.04 1.082 1.89    
              64.17 2.83 8.009 4.22    
              75.01 -2.01 4.040 2.75    
              69.59 6.41 41.09 8.43    
              85.85 -4.85 23.52 5.99    
Сум-ма               -0.36 267.5 88.54    
Среднее                   9.84    

уравнение регрессии:

Y=-90.3+2.71*X,

экономический смысл коэффициента регрессии:

при изменении объема продаж компании (Х) на 1 единицу прибыль (Y) будет меняться в ту же сторону на 2,71 единиц.

Уравнение регрессии и целый ряд его характеристик можно получить, воспользовавшись инструментом Регрессия в пакете Анализ данных в Excel (см. отчет по регрессионному анализу).

2) вычислить остатки, найти остаточную сумму квадратов, оценить дисперсию остатков , построить график остатков:

Замечание:

В эконометрике рассматривается значительное количество различных видов дисперсий. Дисперсия – это величина, характеризующая степень отклонения (разброса, рассеяния) каких-либо величин друг относительно друга. В зависимости от величин, различают дисперсии:

1) общая дисперсия результативного признака Y характеризует степень отклонения фактических значений исследуемой переменной от их среднего значения (рис.3):

.

Рис.3. Общая дисперсия результативного признака

2) объясненная (факторная) дисперсия характеризует степень отклонения расчетных значений исследуемой переменной от среднего значения (рис.4):

,

где k – число независимых факторов в уравнении регрессии, в парной регрессии k=1.

 

 

Рис. 4. Объясненная (факторная) дисперсия

Из рисунка 4 видно, что факторная дисперсия позволяет оценить степень отклонения линии регрессии от линии, соответствующей .

3) остаточная дисперсия (дисперсия остатков) оценивает степень отклонения линии регрессии от фактических значений исследуемого показателя (рис.5):

,

где k – число факторов в уравнении регрессии.

Рис.5. Остаточная дисперсия

Все названные дисперсии связаны соотношением

.

Остатки:

Остаточная сумма квадратов:

.

Дисперсия остатков:

Корень из дисперсии называется среднеквадратическим отклонением (СКО) или стандартной ошибкой модели:

.

График остатков:

См. также регрессионный анализ в Excel.

2. Проверка качества модели

Основную информацию для оценки качества регрессионных моделей содержит ряд отклонений фактических уровней выборочной совокупности от их расчетных значений (ряд остатков ). Это связано с тем, что параметры регрессионного уравнения, а, значит, и случайные остатки, должны обладать определенными свойствами. Они должны быть несмещенными, состоятельными и эффективными.

Несмещенность оценок – математическое ожидание остатков равно 0.

Эффективность – оценки характеризуются наименьшей дисперсией.

Состоятельность – увеличение точности оценок с увеличением объема выборки.

Исследование ряда остатков на наличие этих свойств предполагает проверку следующих пяти предпосылок МНК:

1) случайный характер остатков;

2) независимость остатков или отсутствие их автокорреляции;

3) остатки подчиняются нормальному распределению;

4) нулевая средняя величина остатков (или их математическое ожидание), не зависящая от уровней фактора Х;

5) гомоскедастичность остатков – дисперсия каждого отклонения одинакова для всех значений фактора.

Проверка первых четырех предпосылок представляет собой исследование адекватности модели определенным статистическим критериям. Этот материал подробно рассмотрен в курсе ЭММиПМ.

Рассмотрим подробнее исследование гомоскедастичности остатков. Дисперсия остатков считается гомоскедастичной, если для каждого значения фактора остатки имеют одинаковую дисперсию. В этом случае на графике остатков они расположены в виде горизонтальной полосы (рис.5).

 

Рис. 6. Гомоскедастичные остатки

Если это условие не соблюдается, то имеет место гетероскедастичность. Рассмотрим наглядные примеры гетероскедастичности остатков (рис. 6 а, 6 б).

а) б)

Рис. 7. Гетероскедастичные остатки

При малом объеме выборки для оценки гетероскедастичности может использоваться метод Гольдфельда – Квандта, разработанный в 1965 году. Тест, предложенный этими учеными, включает в себя следующие шаги:

 

1. Упорядочение n наблюдений по мере возрастания переменной X.

2. Исключение из рассмотрения С центральных наблюдений; при этом (n-C):2>p, где р – число оцениваемых параметров ().

3. Разделение совокупности из (n-C) наблюдений на две группы (соответственно с малыми и большими значениями фактора Х) и определение по каждой из групп уравнений регрессии.

4. Определение остаточной суммы квадратов для первой (S1) и второй (S2) групп и нахождение их отношения: R=S1:S2 (в числителе должна стоять большая величина).

Вывод о гомоскедастичности делается с помощью F-критерия Фишера с (n-C-2p):2 (р – число оцениваемых в уравнении параметров; для парной регрессии р=2) степенями свободы для каждой остаточной суммы квадратов. Чем больше величина R превышает табличное значение F-критерия, тем более нарушена предпосылка о равенстве дисперсий остаточных величин.

Протестируем данные нашего примера на наличие гомоскедастичности остатков.

Пример (продолжение).

3) проверить выполнение предпосылок МНК:

 

Проверку предпосылок 1 – 4 выполнить самостоятельно, используя материал дисциплины ЭММиПМ.

Проверка предпосылки 5:

1. Упорядочим Y по мере возрастания Х (данные - сортировка):        
                   
Y X   Y X          
                   
                   
                   
                   
                   
                   
                   
                   
                   
                   
2. Исключаем из рассмотрения С=1 центральное наблюдение.        
                   
3. Разделим совокупность из 9-1=8 наблюдений на две группы и определим по каждой уравнения регрессии:
          Таблица 2        
Уравнения Y X Yp e e^2        
y=-148,35+3,9x     28.19231 -3.19231 10.19083        
      36.03846 -2.03846 4.155325        
      39.96154 11.03846 121.8476        
      47.80769 -5.80769 33.72929        
Сумма         169.9231        
                   
y=16,5+1,5x       -2          
                   
        -2          
        -3.3E-13 1.07E-25        
Сумма                  
                   
4. R=169,9/24= 7.080128                
                   
Число степеней свободы: (9-1-2*2):2=2            
Fтаб(0,05;2;2)=                  
                   
Fтаб>R                  
                   
Вывод: подтверждается наличие гомоскедастичности в остатках.        

Для анализа качества регрессионных моделей используется ряд дополнительных характеристик. К ним относится, например, индекс корреляции:

.

Этот коэффициент является универсальным, так как отражает тесноту связи и точность модели может использоваться при любой форме связи переменных. На практике чаще используется его квадрат, который называется коэффициентом детерминации:

.

, иногда выражают не в долях, а в процентах.

Коэффициент детерминации показывает,какая доля вариации (случайных колебаний, общей дисперсии) признака Y учтена в построенной модели и обусловлена случайными колебаниями включенных в нее факторов. Качество модели тем лучше, чем ближе к 1. Иными словами характеризует степень влияния включенных в модель факторов. Влияние факторов, не учтенных в модели, определяется тогда величиной 1- . Модель тем лучше, чем больше и меньше 1- .

 

3. Проверка статистической значимости уравнения регрессии и его параметров

а) проверка статистической значимости уравнения:

Проверка значимости (существенности) уравнения регрессии позволяет установить, существенна ли связь включенных в уравнение признаков (Y и X), соответствует ли математическая модель, выражающая зависимость Y и X, фактическим данным и достаточно ли включенных в уравнение объясняющих переменных Х для описания зависимой переменной Y.

Оценка значимости уравнения регрессии в целом проводится с помощью F-критерия Фишера:

или в терминах коэффициента детерминации

,

где n – длина совокупностей данных, k – количество факторов, включенных в модель (в уравнении парной регрессии k=1).

Уравнение регрессии статистически значимо, если

.

Замечания:

1) определяется максимальной величиной отношения дисперсий , которая может иметь место при случайном их расхождении;

2) для определения можно использовать статистическую функцию FРАСПОБР, предварительно задав три параметра , где – заданный уровень значимости проверки или уровень вероятности ( связано с вероятностью Р формулой ); – число степеней свободы числителя, равное количеству k факторов, включенных в модель; – число степеней свободы знаменателя (n-k-1). Таким образом, зависит от заданной вероятности, числа уровней в совокупностях данных и вида уравнения регрессии;

3) оценка значимости уравнения регрессии обычно дается в виде таблицы дисперсионного анализа (см. отчет по регрессионному анализу в Excel).

Пример (продолжение).

5) вычислить коэффициент детерминации, проверить значимость уравнения регрессии с помощью F-критерия Фишера ( =0,05), найти среднюю относительную ошибку аппроксимации, сделать вывод о качестве модели

 

вывод: 91,4 % случайной вариации исследуемого признака Y учтено в построенной модели и обусловлено случайными колебаниями включенного в нее фактора Х;

вывод: уравнение регрессии статистически значимо, связь включенных в него признаков существенна;

из таблицы 1 имеем:

вывод: фактические значения прибыли Y отличаются от модельных в среднем на 9.8 %; уровень точности модели недостаточный.

а) проверка статистической значимости параметров уравнения:

В линейной регрессии обычно оценивается значимость не только уравнения регрессии, но и отдельных его параметров. Для этого применяется t-критерий Стьюдента:

1) рассчитывают стандартные ошибки (среднеквадратические отклонения) и каждого из параметров уравнения по формулам

, ,

где – рассмотренная выше остаточная дисперсия;

2) определяют расчетные значения t-критерия Стьюдента:

, ;

3) определяют табличное значение t-критерия с помощью статистической функции СТЬЮДРАСПОБР по двум параметрам: заданному уровню значимости и одной степени свободы (n-k-1);

4) параметры уравнения регрессии будут статистически значимы, если выполняются неравенства:

, .

Замечания:

1) статистическая значимость (незначимость) коэффициента регрессии означает одновременно статистическую значимость (незначимость) фактора Х, включенного в уравнение; статистически незначимый (или несущественный) фактор должен быть устранен из модели или заменен другим;

2) статистическая значимость (незначимость) параметра уравнения означает неверную спецификацию модели, под которой понимают:

а) выбор вида уравнения;

б) определение независимых факторов для включения в модель;

3) t-критерий можно использовать также для определения интервальных оценок параметров модели:

,

.

Поскольку коэффициент регрессии в эконометрических исследованиях имеет четкую экономическую интерпретацию, доверительные границы интервала для коэффициента регрессии не должны содержать противоречивых результатов, то есть не должны содержать одновременно положительные и отрицательные величины и даже нуль.

Пример (продолжение).

3) осуществить проверку значимости параметров уравнения регрессии по t-критерию Стьюдента ( =0,05)

Вывод: оба параметра модели статистически значимы.

Дополнение: интервальные оценки параметров

Замечание:

Расчетные значения t-критерия, а также интервальные оценки параметров можно найти в отчете по результатам работы с инструментом Регрессия (показать).

 

 

4. Определение степени влияния фактора Х на показательY

Для определения степени влияния фактора Х на показатель Y используют коэффициент эластичности

.

В случае парной линейной регрессии производная определяется по формуле

,

Тогда формула для эластичности примет вид

.

Эластичность показывает: на сколько процентов изменится исследуемый признак Y при изменении фактора Х на 1 %. Положительное значение эластичности свидетельствует о прямой связи между переменными, отрицательное – об обратной. При изменение Y по Х считается эластичным, при – неэластичным (например, неэластичен спрос по цене на товары первой необходимости: хлеб, молоко, лекарства и др.; эластичный спрос по цене имеем на предметы роскоши).

В нашем примере эластичность равна

%.

Это означает, что при изменении объема продаж Х на 1 % прибыль Y изменится в ту же сторону на 2,6 %. Изменение эластично.

 

5. Экономический прогноз

Рассматриваемая модель может быть использована для определения прогнозных оценок исследуемой величины. При прогнозировании на основе регрессионных моделей можно выделить три основных этапа:

1) точечный прогноз фактора Х;

2) точечный прогноз показателя Y;

3) интервальный прогноз показателя Y.

Рассмотрим содержание этих этапов подробнее.

1) точечный прогноз фактора Х в зависимости от специфики исходных данных и условия задачи можно определить одним из следующих способов:

а) если исходные данные являются временными рядами, то для прогноза фактора можно воспользоваться методами экстраполяции и использовать наиболее подходящую модель временного ряда

.

Тогда прогноз фактора на k шагов вперед определяется по формуле

.

б) вслучае временных рядов можно найти также с помощью среднего абсолютного прироста (САП) по формуле

.

в) если исходные данные являются пространственными, то, очевидно, в задаче будет задано правило для определения . Например, прогнозное значение фактора составляет 80 % от его среднего значения. Тогда .

2) точечный прогноз показателя Y находят подстановкой в модель прогнозных значений фактора:

– в случае пространственных данных,

– в случае временных рядов.

3) интервальный прогноз показателя Y:

вначале находят ошибку прогнозирования

,

которая зависит от стандартной ошибки модели , удаления от своего среднего значения, количества наблюдений n, заданного уровня вероятности попадания в интервал прогноза (он определяет величину ;

затем находят сам доверительный интервал прогноза:

нижняя граница интервала – ,

верхняя граница интервала – .

Пример (продолжение).

6) осуществить прогнозирование среднего значения показателя Y при уровне значимости =0,1, если прогнозное значение фактора Х составит 117 % от его максимального значения

1) точечный прогноз фактора Х

,

2) точечный прогноз показателя Y

3) интервальный прогноз показателя Y

Нижняя граница интервала: 115,66-17,97=97,69

Верхняя граница интервала: 115,66+17,97=133,63.

X Y Yp
    31.65
    37.07
    45.2
    39.78
    56.04
    64.17
    75.01
    69.59
    85.85
    115.66
    97.69
    133.63



Поделиться с друзьями:


Дата добавления: 2017-02-01; Просмотров: 193; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopediasu.com - Студопедия (2013 - 2026) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.01 сек.