КАТЕГОРИИ: Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748) |
Парная регрессия и корреляция
1.1.Понятие о функциональной, статистической и корреляционной зависимостях. Поведение и значение любого экономического показателя зависит от множества факторов, хотя только их ограниченное количество существенно воздействует на исследуемый экономический показатель. Выделение и учет в модели лишь ограниченного числа факторов оказывающих существенное влияние на развитие моделируемого экономического процесса, определение их взаимосвязи, являются ключевыми для принятия решений. Остановимся вначале на изучении взаимосвязей между двумя переменными Зависимость между случайными величинами, имеющими общие случайные факторы, которые влияют как на одну, так и на другую случайную величину наряду с другими неодинаковыми для обеих случайных величин факторами, называется стохастической (вероятностной). Так как при построении эконометрических моделей используются значения случайных величин (эмпирические значения), то стохастическую зависимость называют статистической. Зависимость между исследуемыми случайными величинами называется статистической, если каждому эмпирическому значению одной случайной величины ( На практике при обработке эмпирических данных В зависимости от числа случайных величин, описывающих изучаемый экономический процесс, различают простую регрессию и множественную. Простая регрессия может быть положительной или отрицательной. При положительной регрессии с увеличением (уменьшением) независимой случайной величины увеличивается (уменьшается) зависимая случайная величина. При отрицательной регрессии – при увеличении (уменьшении) независимой случайной величины уменьшается (увеличивается) зависимая случайная величина. По форме различают линейную регрессию и нелинейную, т.е. регрессию, выражаемую линейной и нелинейной функциями. В зависимости от типа соответствия между случайными величинами рассматривают непосредственную регрессию и косвенную. При непосредственной регрессии случайные величины связаны непосредственно друг с другом; при косвенной регрессии они детерминируются общей для них причиной. Понятие регрессии тесно переплетается с понятием корреляции. Если в регрессионном анализе исследуется форма стохастической связи, то в корреляционном анализе оценивается интенсивность этой связи. Оба вида анализа служат для установления причинных соотношений между признаками изучаемых явлений и определения наличия или отсутствия связи между ними. В зависимости от числа переменных величин, корреляция, может быть, простой (парной), или множественной. Корреляция между двумя случайными величинами называется простой, а между более чем двумя переменными – множественной. Корреляция между двумя переменными при фиксированном значении остальных переменных для случая множественной корреляции называется частной. Простая корреляция может быть положительной или отрицательной. Корреляция может быть линейной или нелинейной; непосредственной или косвенной. 1.2. Основные задачи прикладного корреляционно-регрессионного анализа. Построение качественного уравнения регрессии, наилучшим образом описывающего изучаемую зависимость, соответствующего эмпирическим данным и целям исследования, определяется следующими задачами: - выбор формулы уравнения регрессии; - определение параметров выбранного уравнения; - нахождение точечных и интервальных оценок параметров функции регрессии; - проверка адекватности построенной эмпирической функции регрессии эмпирическим данным. Таким образом, основной задачей регрессионного анализа является подбор такой функции, которая бы наилучшим образом отражала экономическую закономерность, при помощи которой можно было бы решать задачи обоснованного прогноза. Наряду с задачами регрессионного анализа решаются задачи корреляционного анализа: - измерение интенсивности (силы, степени, тесноты) связи между факторами, описывающими изучаемый экономический процесс; - отбор факторов, оказывающих наиболее существенное влияние на результативный признак, на основании измерения степени связности между явлениями; - обнаружение неизвестных причинных связей. Корреляция непосредственно не выявляет причинных связей между явлениями, но устанавливает степень необходимости этих связей и достоверность суждения об их наличии. 1.3. Выбор формы однофакторной регрессионной модели. Для более углубленного исследования связей и взаимозависимости экономических явлений математические методы, изученные в высшей математике, дополняются функциями регрессии, которые выражают количественное соотношение между факторным и результативным признаками. Форма связи между экономическими явлениями выражается аналитическим уравнением. При этом нужно определить такое математическое уравнение, которое наилучшим образом описывало бы характер исследуемого экономического процесса. Форму этой связи можно определить из расположения точек на корреляционном поле или из корреляционной таблицы, в которой вычисляются средние результативного признака для каждой группы факторного признака:
где Для определения вида функции регрессии, используется также метод дисперсионного анализа, который позволяет оценивать линейность регрессии. Реализуем метод дисперсионного анализа для случая линейной формы связи: Сгруппируем всю совокупность наблюдений в виде таблицы:
где каждая строка соответствует определенному значению фактора X. Для определения параметров
которую представим в виде
где
Дисперсии Для проверки гипотезы о линейности связи между исследуемыми признаками составляется F -отношение:
которое подчиняется распределению Фишера – Снедокора с 1.4. Основные предпосылки применения метода наименьших квадратов в аппроксимации связей признаков социально-экономических явлений (условия Гаусса – Маркова). Так как при построении регрессионной модели мы не можем охватить весь комплекс причин и учесть случайность, присущую в той или иной степени причинному действию и определяемому им следствию, то в выражение функции регрессии необходимо ввести аддитивную составляющую – возмущающую переменную U, дающую суммарный эффект от воздействия всех неучтенных факторов и случайностей. Эмпирические значения Y можно вследствие этого представить в виде Наиболее существенными предположениями являются следующие. 1. Полагаем, что для фиксированных значений переменных
2. Дисперсия случайной переменной U должна быть для всех значений 3. Значения случайной переменной U попарно независимы в вероятностном смысле: 4. Число наблюдений должно превышать число параметров (n > m), иначе невозможна оценка этих параметров. Между факторными переменными не должно существовать строгой линейной зависимости, т.е. должна отсутствовать мультиколлинеарность между факторными переменными. При простой линейной регрессии это предположение сводится к условию 5. Переменные факторы
Это значит, что рассматривается односторонняя зависимость переменной Y от переменных 6. Возмущающая переменная распределена нормально. Предполагается, что переменная U не оказывает существенного влияния на переменную Y и представляет собой суммарный эффект от некоторого числа незначительных некоррелированных влияющих факторов. Метод наименьших квадратов – один из наиболее распространенных методов оценивания неизвестных параметров регрессии по эмпирическим данным, хотя существуют и другие методы оценивания. Отметим, что при одних и тех же предположениях и одной и тои же функции регрессии различные способы оценивания приводят к разным оценкам параметров регрессии. Задача регрессионного анализа состоит в нахождении истинных значений параметров, т.е. в определении соотношения между Состоятельность – важнейшее и минимально необходимое требование, предъявляемое к оценкам. Если выполняются предпосылки 1 – 6, то оценки параметров регрессии, полученные методом наименьших квадратов, являются состоятельными, несмещенными и эффективными. Оценки, полученные методом наименьших квадратов, обладают наименьшей дисперсией. В этом смысле они представляют собой наилучшие линейные несмещенные оценки параметров теоретической регрессии. При нарушении предпосылок 2 и 3 нарушается свойство эффективности оценок, а свойства несмещенности и состоятельности сохраняется. 1.5. Построение регрессионной прямой методом наименьших квадратов. Если, исходя из профессионально-теоретических соображений в сочетании с исследованием расположения точек на корреляционном поле или других соображений, предполагают линейный характер зависимости усредненных значений результативного признака, то эту зависимость выражают с помощью функции линейной регрессии. Эта функция, называемая эмпирической регрессией, служит оценкой линейной функциональной связи между результативным и факторным признаками. На результативный признак оказывает влияние и ряд других факторов. Чтобы элиминировать (сгладить) влияние этих факторов, нужно произвести выравнивание фактических величин Y на основании предположения, что между X и Y существует функциональная зависимость вида:
где оценки неизвестных параметров
где отклонение Так как все факторы, кроме фактора X, рассматриваются как постоянные средние величины и выражены параметрами
Величина S является функцией параметров
Выполнив преобразования и решив систему нормальных уравнений:
получим:
где
Оценки МНК являются: а) функциями от выборки (эмпирических данных); б) точечными оценками теоретических коэффициентов регрессии. Эмпирическая прямая регрессии проходит через точку Параметр
Рис.1.1
Коэффициент регрессии является мерой зависимости переменной Y от переменной X, т.е. Отыскание значений коэффициента регрессии представляет большей практический интерес, если ставится вопрос о прогнозе изменений какого-либо показателя в связи с изменением того или иного условия. В частности, коэффициент регрессии используется для определения эластичности спроса и потребления. В общем случае коэффициент эластичности представляет собой процентное изменение результативного признака при изменении факторного признака на один процент. Он вычисляется по формуле
где Например, коэффициент эластичности потребления выражает процентное изменение потребления или спроса на данный товар при изменении известных условий (дохода, цены и т.д.) на один процент. Параметры После вычисления оценок параметров регрессии
которые используются в качестве характеристики точности оценки регрессии или степени согласованности расчетных значений регрессии и наблюдаемых значений переменной Y. Для характеристики меры разброса фактических данных
Геометрический смысл параметров прямой регрессии следует из рис. 1.1. Используя дисперсию остатков, можно указать среднюю квадратичную ошибку коэффициента регрессии:
Кроме уравнения регрессии
Как уже отмечалось, функция регрессии указывает, в какой степени изменяются значения результативного признака в соответствии с изменением факторного признака. Однако этого недостаточно для глубокого изучения их взаимосвязи. Нужно измерить еще интенсивность между изучаемыми факторами. Оценки, полученные с помощью уравнения регрессии, имеют точность тем большую, чем интенсивнее корреляция. 1.6. Измерение интенсивности линейной корреляционной связи. Мы рассмотрели, как определяется форма связи между факторным и результативным признаками. Изучим теперь показатели интенсивности этой связи. При прямолинейной связи общим показателем интенсивности является линейный коэффициент корреляции (просто коэффициент корреляции)
Коэффициент корреляции является безразмерной величиной, так как сравниваются не индивидуальные отклонения, а нормированные отклонения · Величина коэффициента корреляции не зависит от выбора единиц измерения случайных величин · Коэффициент корреляции не превосходит по абсолютной величине единицы, т.е. · Коэффициент корреляции · Если между случайными величинами · Условие Степень интенсивности корреляционной связи можно определить из табл. 1.1.
Т а б л и ц а 1.1
Отметим, что коэффициент корреляции не отражает направление зависимости, т.е. он является функцией, симметричной относительно X и Y. Средняя квадратичная ошибка коэффициента корреляции определяется по формуле
Наряду с коэффициентом корреляции и корреляционным отношением в эконометрике применяется коэффициент детерминации, отражающий, в какой мере функция регрессии определяется факторными признаками, содержащимися в ней. Для определения коэффициента детерминации дисперсию, характеризующую рассеяние наблюдаемых значений переменной
где Дисперсия
видно, что чем меньше
которое указывает, какая часть общего рассеяния значений Y обусловлена изменчивостью переменной X, и называется коэффициентом детерминации. Чем большую долю в общей дисперсии составляет Коэффициент детерминации Таким образом, чем больше коэффициент детерминации Коэффициент детерминации Подставляя выражения
в формулу
откуда, так как
выводим формулу коэффициента детерминации, удобную для вычисления:
Укажем соотношения между коэффициентами корреляции, регрессии и детерминации при однофакторной линейной регрессии:
(перед корнем ставится знак коэффициента регрессии).
1.7. Нелинейная регрессия и корреляция. Подбор функции регрессии должен производиться с применением теории конкретной науки, на базе которой формулируется задача измерения связи между явлениями. При этом следует использовать методы выявления наличия связи. Односторонняя стохастическая зависимость может быть выражена и при помощи нелинейных функций. Различают два класса нелинейных регрессий. К первому классу относятся функции, нелинейные относительно факторного признака, но линейные относительно параметров, входящих в данные функции. Для оценок параметров таких функций применяется метод наименьших квадратов, следовательно, остаются в силе все исходные предпосылки линейного регрессионного анализа. Второй класс регрессий характеризуется нелинейностью факторного признака, входящего в уравнение регрессии.
Т а б л и ц а 1.2
Функции, наиболее часто встречающиеся в однофакторных регрессионных моделях, представлены в табл. 1.2 (квазилинейные функции) и 1.3 (нелинейные функции второго класса), где даны также нормальные уравнения для определения входящих в них параметров и преобразованные функции (для нелинейных функций второго класса). Т а б л и ц а 1.3
В табл. 1.2 и 1.3 указаны классы регрессий, характеризующихся нелинейностью относительно переменной X или относительно оцениваемых параметров. Квазилинейные функции (см. табл. 1.2) линейны относительно искомых параметров, т.е. их можно представить в виде
где
Правило составления нормальных уравнений системы состоит в следующем: первое уравнение системы получается суммированием функций Для получения оценок параметров функций из табл. 1.3 их предварительно подвергают преобразованиям, главное назначение которых – линеаризация рассматриваемых зависимостей по оцениваемым параметрам. Параметры регрессии исходных функций находят путем обратных преобразований. Например, путем логарифмического преобразования можно перейти от зависимости показательного типа Применяя метод наименьших квадратов к функции Вычислив дисперсию результативного признака
Корреляционное отношение удовлетворяет свойствам: · Величина корреляционного отношения не зависит от выбора единиц измерения случайных величин · Корреляционное отношение не превосходит единицы, т.е. · Корреляционное отношение · Если между случайными величинами · Условие · Корреляционное отношение не меньше коэффициента корреляции Из свойств корреляционного отношения следует, что чем больше значение корреляционного отношения приближается к единице (т. е. чем ближе нормированная разность Для оценки интенсивности нелинейной связи используется также индекс корреляции
Индекс корреляции принимает значения в интервале Средняя квадратичная ошибка корреляционного отношения
Различные уравнения регрессии, служащие для оценки уровня величин исследуемых зависимых переменных, представляют большей практический интерес, например в планировании. Оценки, полученные в уравнении регрессии, достаточно точно воспроизводят линию реальной эволюции явлений, если не слишком отдаляться от эмпирических данных. Экстраполяция допускается только тогда, когда доказана полная аналогия условий, места, времени и однородности явлений, к которым относятся оценки. 1.8. Проверка существенности оценок параметров регрессии, коэффициентов корреляции и детерминации. Мы отмечали, что оценки параметров регрессии являются случайными величинами с определенными распределениями вероятностей. При выполнении предположений 1 – 6, указанных выше, оценки параметров регрессии Практически проверка значимости начинается с формулировки нулевой гипотезы Рассмотрим проверку значимости параметров корреляционно-регрессионного анализа. Для оценки значимости каждого параметра регрессии выдвинем следующие гипотезы:
При такой альтернативной гипотезе Для проверки гипотезы
а гипотезы
подчиняющиеся распределению Стьюдента с
Проверяя значимость коэффициента парной корреляции, устанавливают наличие или отсутствие корреляционной связи между исследуемыми экономическими явлениями. При этом выдвигаются следующие гипотезы:
Из альтернативной гипотезы следует, что нужно воспользоваться двусторонней критической областью. Для проверки гипотезы
распределенная по закону Стьюдента с Вычисленные по результатам выборки статистики (1.4) – (1.6) сравниваются с критическим значением, определенным по таблице распределения Стьюдента при заданном уровне значимости Значимость коэффициента корреляции можно определить, если воспользоваться критическими значениями коэффициента корреляции
Существуют подробные таблицы критических значений коэффициента корреляции. При этом, если В случае, если при формулировке гипотезы
к статистике t и получают статистику
которая имеет t -распределение с Иногда возникает необходимость проверки гипотезы об отличии друг от друга двух коэффициентов корреляции. При этом предполагается, что рассматриваются одни и те же признаки однородных совокупностей: данные представляют собой результаты независимых испытаний и применяются коэффициенты корреляции одного типа (коэффициенты парной или частной корреляции при исключении одинакового количества переменных). Объемы двух выборок могут быть различны. Нулевая гипотеза формируется в виде
где Если
после преобразования
может служить оценкой коэффициента корреляции
имеющей нормальное распределение. Для проверки значимости ко Дата добавления: 2014-01-06; Просмотров: 2697; Нарушение авторских прав?; Мы поможем в написании вашей работы! |