КАТЕГОРИИ: Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748) |
Представить графически фактические, расчетные и прогнозные значения
Замечание. Пример. Пусть зависимая переменная Y – прибыль некоторой компании (исходные данные приведены в таблице 1), а фактор X – объем продаж товара этой компании. Требуется: 1) найти параметры уравнения линейной регрессии, дать экономическую интерпретацию коэффициента регрессии; 2) вычислить остатки, найти остаточную сумму квадратов, оценить дисперсию остатков 3) проверить выполнение предпосылок МНК; 4) осуществить проверку значимости параметров уравнения регрессии по t-критерию Стьюдента ( 5) вычислить коэффициент детерминации, проверить значимость уравнения регрессии с помощью F-критерия Фишера ( 6) осуществить прогнозирование среднего значения показателя Y при уровне значимости 7) представить графически фактические, расчетные и прогнозные значения. Решение: 1) найти параметры уравнения линейной регрессии, дать экономическую интерпретацию коэффициента регрессии: Для решения задачи построим расчетную таблицу 1: Таблица 1
уравнение регрессии: Y=-90.3+2.71*X, экономический смысл коэффициента регрессии: при изменении объема продаж компании (Х) на 1 единицу прибыль (Y) будет меняться в ту же сторону на 2,71 единиц. Уравнение регрессии и целый ряд его характеристик можно получить, воспользовавшись инструментом Регрессия в пакете Анализ данных в Excel (см. отчет по регрессионному анализу). 2) вычислить остатки, найти остаточную сумму квадратов, оценить дисперсию остатков Замечание: В эконометрике рассматривается значительное количество различных видов дисперсий. Дисперсия – это величина, характеризующая степень отклонения (разброса, рассеяния) каких-либо величин друг относительно друга. В зависимости от величин, различают дисперсии: 1) общая дисперсия результативного признака Y характеризует степень отклонения фактических значений
Рис.3. Общая дисперсия результативного признака 2) объясненная (факторная) дисперсия характеризует степень отклонения расчетных значений
где k – число независимых факторов в уравнении регрессии, в парной регрессии k=1.
Рис. 4. Объясненная (факторная) дисперсия Из рисунка 4 видно, что факторная дисперсия позволяет оценить степень отклонения линии регрессии от линии, соответствующей 3) остаточная дисперсия (дисперсия остатков) оценивает степень отклонения линии регрессии
где k – число факторов в уравнении регрессии.
Рис.5. Остаточная дисперсия Все названные дисперсии связаны соотношением
Остатки:
Остаточная сумма квадратов:
Дисперсия остатков:
Корень из дисперсии
График остатков:
См. также регрессионный анализ в Excel. 2. Проверка качества модели Основную информацию для оценки качества регрессионных моделей содержит ряд отклонений фактических уровней выборочной совокупности от их расчетных значений (ряд остатков Несмещенность оценок – математическое ожидание остатков равно 0. Эффективность – оценки характеризуются наименьшей дисперсией. Состоятельность – увеличение точности оценок с увеличением объема выборки. Исследование ряда остатков на наличие этих свойств предполагает проверку следующих пяти предпосылок МНК: 1) случайный характер остатков; 2) независимость остатков или отсутствие их автокорреляции; 3) остатки подчиняются нормальному распределению; 4) нулевая средняя величина остатков (или их математическое ожидание), не зависящая от уровней фактора Х; 5) гомоскедастичность остатков – дисперсия каждого отклонения одинакова для всех значений фактора. Проверка первых четырех предпосылок представляет собой исследование адекватности модели определенным статистическим критериям. Этот материал подробно рассмотрен в курсе ЭММиПМ. Рассмотрим подробнее исследование гомоскедастичности остатков. Дисперсия остатков считается гомоскедастичной, если для каждого значения фактора остатки имеют одинаковую дисперсию. В этом случае на графике остатков они расположены в виде горизонтальной полосы (рис.5).
Рис. 6. Гомоскедастичные остатки Если это условие не соблюдается, то имеет место гетероскедастичность. Рассмотрим наглядные примеры гетероскедастичности остатков (рис. 6 а, 6 б).
а) б) Рис. 7. Гетероскедастичные остатки При малом объеме выборки для оценки гетероскедастичности может использоваться метод Гольдфельда – Квандта, разработанный в 1965 году. Тест, предложенный этими учеными, включает в себя следующие шаги:
1. Упорядочение n наблюдений по мере возрастания переменной X. 2. Исключение из рассмотрения С центральных наблюдений; при этом (n-C):2>p, где р – число оцениваемых параметров ( 3. Разделение совокупности из (n-C) наблюдений на две группы (соответственно с малыми и большими значениями фактора Х) и определение по каждой из групп уравнений регрессии. 4. Определение остаточной суммы квадратов для первой (S1) и второй (S2) групп и нахождение их отношения: R=S1:S2 (в числителе должна стоять большая величина). Вывод о гомоскедастичности делается с помощью F-критерия Фишера с (n-C-2p):2 (р – число оцениваемых в уравнении параметров; для парной регрессии Протестируем данные нашего примера на наличие гомоскедастичности остатков. Пример (продолжение). 3) проверить выполнение предпосылок МНК:
Проверку предпосылок 1 – 4 выполнить самостоятельно, используя материал дисциплины ЭММиПМ. Проверка предпосылки 5:
Для анализа качества регрессионных моделей используется ряд дополнительных характеристик. К ним относится, например, индекс корреляции:
Этот коэффициент является универсальным, так как отражает тесноту связи и точность модели может использоваться при любой форме связи переменных. На практике чаще используется его квадрат, который называется коэффициентом детерминации:
Коэффициент детерминации показывает,какая доля вариации (случайных колебаний, общей дисперсии) признака Y учтена в построенной модели и обусловлена случайными колебаниями включенных в нее факторов. Качество модели тем лучше, чем ближе
3. Проверка статистической значимости уравнения регрессии и его параметров а) проверка статистической значимости уравнения: Проверка значимости (существенности) уравнения регрессии позволяет установить, существенна ли связь включенных в уравнение признаков (Y и X), соответствует ли математическая модель, выражающая зависимость Y и X, фактическим данным и достаточно ли включенных в уравнение объясняющих переменных Х для описания зависимой переменной Y. Оценка значимости уравнения регрессии в целом проводится с помощью F-критерия Фишера:
или в терминах коэффициента детерминации
где n – длина совокупностей данных, k – количество факторов, включенных в модель (в уравнении парной регрессии k=1). Уравнение регрессии статистически значимо, если
Замечания: 1) 2) для определения 3) оценка значимости уравнения регрессии обычно дается в виде таблицы дисперсионного анализа (см. отчет по регрессионному анализу в Excel). Пример (продолжение). 5) вычислить коэффициент детерминации, проверить значимость уравнения регрессии с помощью F-критерия Фишера (
вывод: 91,4 % случайной вариации исследуемого признака Y учтено в построенной модели и обусловлено случайными колебаниями включенного в нее фактора Х;
вывод: уравнение регрессии статистически значимо, связь включенных в него признаков существенна; из таблицы 1 имеем:
вывод: фактические значения прибыли Y отличаются от модельных а) проверка статистической значимости параметров уравнения: В линейной регрессии обычно оценивается значимость не только уравнения регрессии, но и отдельных его параметров. Для этого применяется t-критерий Стьюдента: 1) рассчитывают стандартные ошибки (среднеквадратические отклонения)
где 2) определяют расчетные значения t-критерия Стьюдента:
3) определяют табличное значение t-критерия 4) параметры уравнения регрессии будут статистически значимы, если выполняются неравенства:
Замечания: 1) статистическая значимость (незначимость) коэффициента регрессии 2) статистическая значимость (незначимость) параметра уравнения а) выбор вида уравнения; б) определение независимых факторов для включения в модель; 3) t-критерий можно использовать также для определения интервальных оценок параметров модели:
Поскольку коэффициент регрессии Пример (продолжение). 3) осуществить проверку значимости параметров уравнения регрессии по t-критерию Стьюдента (
Вывод: оба параметра модели статистически значимы. Дополнение: интервальные оценки параметров
Замечание: Расчетные значения t-критерия, а также интервальные оценки параметров можно найти в отчете по результатам работы с инструментом Регрессия (показать).
4. Определение степени влияния фактора Х на показательY Для определения степени влияния фактора Х на показатель Y используют коэффициент эластичности
В случае парной линейной регрессии
Тогда формула для эластичности примет вид
Эластичность показывает: на сколько процентов изменится исследуемый признак Y при изменении фактора Х на 1 %. Положительное значение эластичности свидетельствует о прямой связи между переменными, отрицательное – об обратной. При В нашем примере эластичность равна
Это означает, что при изменении объема продаж Х на 1 % прибыль Y изменится в ту же сторону на 2,6 %. Изменение эластично.
5. Экономический прогноз Рассматриваемая модель 1) точечный прогноз фактора Х; 2) точечный прогноз показателя Y; 3) интервальный прогноз показателя Y. Рассмотрим содержание этих этапов подробнее. 1) точечный прогноз фактора Х в зависимости от специфики исходных данных и условия задачи можно определить одним из следующих способов: а) если исходные данные являются временными рядами, то для прогноза фактора можно воспользоваться методами экстраполяции и использовать наиболее подходящую модель временного ряда
Тогда прогноз фактора на k шагов вперед определяется по формуле
б) вслучае временных рядов
в) если исходные данные являются пространственными, то, очевидно, в задаче будет задано правило для определения 2) точечный прогноз показателя Y находят подстановкой в модель прогнозных значений фактора:
3) интервальный прогноз показателя Y: вначале находят ошибку прогнозирования
которая зависит от стандартной ошибки модели затем находят сам доверительный интервал прогноза: нижняя граница интервала – верхняя граница интервала – Пример (продолжение). 6) осуществить прогнозирование среднего значения показателя Y при уровне значимости 1) точечный прогноз фактора Х
2) точечный прогноз показателя Y
3) интервальный прогноз показателя Y
Нижняя граница интервала: 115,66-17,97=97,69 Верхняя граница интервала: 115,66+17,97=133,63.
Дата добавления: 2017-02-01; Просмотров: 193; Нарушение авторских прав?; Мы поможем в написании вашей работы! |