КАТЕГОРИИ: Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748) |
Тема лекции 11. Статистическое изучение взаимосвязи социально-экономических явлений
Конспект лекции: Как правило, вычисления в социально-экономических исследованиях проводятся на основе ограниченного числа данных, которые можно рассматривать как выборочные. Поэтому, естественно, возникает вопрос о вероятностной оценке полученных данных, а именно о значимости полученных результатов корреляционного и регрессионного анализа. Простейшей системой корреляционной связи является линейная связь между двумя признаками — парная линейная корреляция. Уравнение парной линейной корреляционной связи называется уравнением парной регрессии и имеет вид: Уравнение парной линейной регрессии имеет вид:
где а — свободный член уравнения; b — коэффициент регрессии, измеряющий среднее отношение отклонения результативного признака от его средней величины к отклонению факторного признака (от его средней величины на одну единицу его измерения), — вариация у, приходящаяся на единицу вариации х. Параметры уравнения (36) рассчитываются методом наименьших квадратов (МНК) по данным о значениях признаков х и у в изучаемой совокупности, состоящей из n единиц. Исходное условие МНК для прямой линии имеет вид:
Отсюда система нормальных уравнений имеет вид:
Нормальные уравнения (МНК) для прямой линии регрессии являются системой двух уравнений с двумя неизвестными a и b. Все остальные величины, входящие в систему, определяются по исходной информации. Таким образом, оба параметра уравнения линейной регрессии однозначно вычисляются при решении этой системы уравнений. Если первое нормальное уравнение разделить на n, получим
По уравнению (35) обычно на практике вычисляется свободный член уравнения регрессии а. Параметр b — коэффициент регрессии вычисляется по преобразованной формуле, которую можно вывести, решая систему нормальных уравнений относительно b:
Так как знаменатель этого выражения есть не что иное, как дисперсия признака, т.е. ах, то можно записать формулу коэффициента регрессии в виде
где в числителе ковариация переменных. При оценке могут быть подвергнуты показатели тесноты связи изучаемых признаков, параметры полученного корреляционного уравнения, точность аппроксимации, индивидуальные значения теоретического уровня признака и, наконец, уравнение корреляции в целом. Оценка вышеперечисленных результатов корреляционного анализа производится с применением распределения Стьюдента и распределения Фишера - Снедекора. Рассмотрим статистическую оценку некоторых результатов корреляционного анализа для линейной зависимости. Значение коэффициента парной корреляции является случайной величиной, изменяющейся от выборки к выборке. Оценку «истинного» коэффициента корреляции в генеральной совокупности р, который характеризует «истинную» тесноту связи явлений в генеральной совокупности, можно произвести с помощью построения доверительного интервала:
где
Здесь n — число наблюдений. Величина r (табличное значение) имеет распределение t- Стьюдента с числом степеней свободы, равным n - 2, уровень значимости а определяется как единица минус принятая величина вероятности. Если мы хотим определить значимость отличия r от р, то при уровне значимости а проверяем нулевую гипотезу Нo (о равенстве нулю р): р = 0. Для этого вычислим наблюдаемое значение критерия:
и сравним его с табличным. При этом если: ♦ ♦ При небольшом числе наблюдений в выборке и при высоком коффициенте корреляции (> 0,9) для построения доверительного интервала и проверки значимости используют преобразование Фишера:
Наблюдаемое значение критерия определяют как
и сравнивают с теоретическим t та6л (интеграл вероятностей). Значимость полученной величины коэффициента регрессии а1 в выборочном теоретическом уравнении у проверяется аналогично значимости коэффициента корреляции r. Среднеквадратическая ошибка равна:
Для проверки нулевой гипотезы вычисляем наблюдаемое значение критерия:
и сравниваем с табличным распределением Стьюдента при избранном уровне значимости а. Доверительные интервалы для индивидуальных значений
Графически приведенное выражение — это две симметричные прямые, параллельные линии регрессии. Остаточная дисперсия
где r 2 — коэффициент детерминации (показывает долю дисперсии у, объясняемую аргументом х). Остаточная дисперсия
Проверку значимости найденной зависимости можно произвести с помощью распределения Фишера—Снедекора:
Полученное значение Для оценки адекватности можно также воспользоваться показателем средней ошибки аппроксимации:
Исследователь сам задает величину средней ошибки. Обычно в социально-экономических исследованиях считается приемлемым Конспект лекции: Основная литература 1 [ 320-391], 4 [ 98-110]. Контрольные вопросы: 1. Распределение t- Стьюдента. 2. Проверка нулевой гипотезы. 3. Доверительные интервалы для индивидуальных значений 4. Формула остаточной дисперсии 5. Показатели средней ошибки аппроксимации:
Дата добавления: 2014-12-23; Просмотров: 415; Нарушение авторских прав?; Мы поможем в написании вашей работы! |