КАТЕГОРИИ: Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748) |
Линейная парная регрессия
Наиболее простой с точки зрения понимания, интерпретации и техники расчетов является линейная форма регрессии. Уравнение линейной парной регрессии a0, a1– параметры модели, εi – случайная величина (величина остатка). Параметры модели и их содержание: Ø a0 – свободный коэффициент (член) регрессионного уравнения. Не имеет экономическою смысла и показывает значение результативного признака y, если факторный признак x =0. Ø a1 - коэффициент регрессии показывает, на какую величину в среднем изменится результативный признак y, если переменную х увеличить на единицу измерения. Знак при коэффициенте регрессии показывает направление связи: при a1 > 0 – связь прямая; при a1 < 0 - связь обратная. Ø εi- независимая, нормально распределенная случайная величина. Отражает тот факт, что изменение y будет неточно описываться изменением x, так как присутствуют другие факторы, не учтенные в данной модели.
Оценка параметров модели а0 и а, осуществляется методом наименьших квадратов. Система нормальных уравнений для нахождения параметра линейной парной регрессии методом наименьших квадратов
Формулы для определения значения параметров a0 и a1
Ковариацияпризнаков характеризует сопряженность вариации двух признаков и представляет собой статистическую меру взаимодействия двух случайных переменных.
Дисперсия – характеристика случайной величины, определяемая как математическое ожидание квадрата отклонения случайной величины от ее математического ожидания. Математическое ожидание – сумма произведений значений случайной величины на соответствующие вероятности.
Уравнение регрессии дополняется показателем тесноты связи между признаками - линейным коэффициентом корреляции
Коэффициент корреляции принимает значение от -1 до +1. Положительное значение коэффициента свидетельствует о наличии прямой связи, отрицательное значение — обратной. Если rух = ±1, корреляционная связь представляется линейной функциональной зависимостью. При rух = 0 линейная корреляционная связь отсутствует. Для оценки качества подбора линейной функции рассчитывается квадрат линейного коэффициента корреляции
где
Соответственно величина
Оценка значимости уравнения регрессии в целом производится на основе В случае парной линейной регрессии значимость модели регрессии определяется по следующей формуле: Если при заданном уровне значимости расчетное значение F -критерия с γ1=k, γ2=(п – k – 1) степенями свободы больше табличного, то модель считается значимой, гипотеза о случайной природе оцениваемых характеристик отклоняется и признается их статистическая значимость и надежность.
Для оценки статистической значимости коэффициентов регрессии и корреляции производят расчет Порядок расчетов: 1. Расчет случайных ошибок параметров линейной регрессии и коэффициента корреляции
2. Расчет фактических значений t-статистик
Расчетные значения t-критерия сравнивают с табличным значением критерия t αγ,.которое определяется при (n — k — 1) степенях свободы и соответствующем уровне значимости α. Если расчетное значение t -критерия превосходит его табличное значение t αγ,то параметр признается значимым.
В качестве меры точности модели применяют точностные характеристики: Для определения меры точности модели рассчитывают: Ø максимальная ошибка - соответствует отклонению расчетному отклонению расчетных значений от фактических Ø средняя абсолютная ошибка – ошибка показывает, насколько в среднем отклоняются фактические значения от модели Ø дисперсия ряда остатков (остаточная дисперсия) Ø средняя квадратическая ошибка. Представляет собой корень квадратный из дисперсии, чем меньше значение ошибки, тем точнее модель Ø средняя относительная ошибка аппроксимации.
Средняя ошибка аппроксимации не должна превышать 8–10%. Если модель регрессии признана адекватной, а параметры модели значимы, то переходят к построению прогноза. Прогнозируемое значение переменной у получается при подстановке в уравнение регрессии ожидаемой величины независимой переменной х прогн.
Данный прогноз называется точечным. Вероятность реализации точечного прогноза практически равна нулю, поэтому рассчитывается доверительный интервал прогноза с большой надежностью. Доверительные интервалы прогноза зависят от стандартной ошибки, удаления х прогн от своего среднего значения
t табл – определяется по таблице распределения Стьюдента для уровня значимости α и числа степеней свободы γ=n-k-1. Пример13. По данным проведенного опроса восьми групп семей известны данные связи расходов населения на продукты питания с уровнем доходов семьи
Решение: Предположим, что связь между доходами семьи и расходами на продукты питания линейная. Для подтверждения нашего предположения построим поле корреляции. Для удобства дальнейших вычислений составим таблицу 37. Рассчитаем параметры линейного уравнения парной регрессии
Уравнение регрессии: Т.е. с увеличением дохода семьи на 1000 руб. расходы на питание увеличиваются на 168 руб. Расчет линейного коэффициента корреляции
Близость коэффициента корреляции к 1 указывает на тесную линейную связь между признаками.
Расчет коэффициента детерминации Коэффициент детерминации Оценим качество уравнения регрессии в целом с помощью
Табличное значение ( Для оценки статистической значимости коэффициентов регрессии и корреляции рассчитаем
Фактические значения
Табличное значение Рассчитываем среднюю ошибку аппроксимации:
Рассчитываем прогнозное значение результативного фактора
Значит, если доходы семьи составят 9,845 тыс. руб., то расходы на питание будут 2,490 тыс. руб. Рассчитываем доверительный интервал прогноза.
Дата добавления: 2014-01-20; Просмотров: 2299; Нарушение авторских прав?; Мы поможем в написании вашей работы! |