КАТЕГОРИИ: Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748) |
Методы изучения связи социальных явлений
Рассчитаем коэффициент детерминации по следующей формуле:, т. е. на 92% изменение производительности труда рабочего обусловлено изменением его стажа работы. Остальные 8% связаны с другими факторами, которые мы не рассматриваем. Для измерения степени тесноты связи между изменениями величины результативного признака (у) и изменениями значений факторных признаков определяется коэффициент множественной (совокупной) корреляции (R). Изучение множественной корреляционной зависимости начинается с анализа матрицы парных коэффициентов корреляции, что позволяет произвести отбор факторов, включаемых в модель множественной зависимости. Матрица имеет следующий вид (табл. 9.2). Таблица 9.2
Анализ первой строки матрицы позволяет выявить факторы, у которых степень тесноты связи с результативным показателем значительна, а поэтому они могут быть включены в модель. Однако при построении многофакторных моделей должно соблюдаться требование возможно меньшей коррелированности (зависимости) включенных в модель признаков-факторов (отсутствие мультиколлинеарности). В качестве критерия мультиколлинеарности может быть принято соблюдение следующих неравенств:
Если приведенные неравенства (или хотя бы одно из них) не выполняются, то исключается тот фактор 8) Отобранные факторы включаются в модель множественной зависимости. При этом следует учитывать, что число факторов, включаемых в модель, должно быть в 5–6 раз меньше, чем число единиц, входящих в совокупность. Угадать функцию, которая наилучшим образом отображала бы взаимосвязь между признаками, бывает очень сложно. Обычно проверяют пять основных видов функций: а) б) в) г) д) Мерой достоверности уравнения является процентное отношение средней квадратической ошибки уравнения к среднему уровню результативного показателя, так же как в случае парной корреляции. Для случая зависимости результативного признака от двух факторных признаков формула коэффициента корреляции имеет вид:
Величина R2 называется коэффициентом детерминации; она показывает, в какой мере вариация результативного признака обусловлена влиянием признаков-факторов, включенных в уравнение множественной зависимости. Величина совокупного коэффициента корреляции изменяется в пределах от 0 до 1 и численно не может быть меньше, чем любой из образующих его парных коэффициентов корреляции. Чем ближе он к единице, тем меньше роль неучтенных в модели факторов и тем более оснований считать, что параметры регрессионной модели отражают степень эффективности включенных в нее факторов. Для оценки существенности (значимости) совокупного коэффициента корреляции используется критерий F -Фишера. Алгоритм: 1. Определяется F -расчетное по следующей формуле:
где
n – число данных; m – число параметров уравнения. 2. По таблице F- распределения с учетом принятого уровня значимости 3. Если Кроме совокупного коэффициента корреляции познавательное значение имеют частные коэффициенты корреляции, позволяющие установить степень тесноты связи между результативным признаком у и каждым из факторных признаков при исключении искажающего влияния других факторных признаков. Следовательно, коэффициенты частной корреляции отражают степень «чистого» влияния факторного признака на результативный признак. Для их расчета могут быть использованы парные коэффициенты корреляции. Для случая зависимости результативного признака у от двух признаков-факторов (х1 и х2) определяются два коэффициента частной корреляции: 1) частный коэффициент корреляции между результативным признаком у и фактором х1 при элиминировании фактора х2:
2) частный коэффициент корреляции между результативным признаком у и фактором х2 при элиминировании фактора х1:
Величина частного коэффициента корреляции лежит в пределах от 0 до 1, а знак определяется знаком соответствующих параметров регрессии. Рассчитывая величины частных коэффициентов корреляции, следует иметь в виду, что каждый из них по своей абсолютной величине не может быть больше величины коэффициента множественной (совокупной) корреляции. 10) Для сравнения роли различных факторов в формировании моделируемого показателя определяется коэффициент эластичности (Э j) или Частный коэффициент эластичности показывает, на сколько процентов в среднем изменяется результативный признак у с изменением признака-фактора х на 1%, и определяется по формуле:
где
Пример: Рассмотрим построение однофакторного уравнения регрессии зависимости производительности труда (y) от стажа работы (x) 10 рабочих одной бригады: Таблица 9.3
1) Для уточнения формы связи между рассматриваемыми признаками используем графический метод. Графически взаимосвязь признаков изображается с помощью поля корреляции.
Область, которую образуют эмпирические точки на поле корреляции, близка к прямой линии. Следовательно, можно считать наличие прямолинейной корреляции. 2) Для измерения степени тесноты связи между признаками используем линейный коэффициент корреляции:
Для расчета r использована вспомогательная таблица (табл. 9.4) Поскольку r > 0, то связь между стажем работы и выработкой рабочих прямая, то есть с увеличением стажа работы средняя дневная выработка рабочего увеличивается. Так как линейный коэффициент корреляции находится в промежутке Проверяем значимость коэффициента корреляции:
По таблице t- распределения Стьюдента с учетом принятого уровня значимости 3) Определяем модель связи. График показывает наличие линейной связи (рис. 3), поэтому используется функция
где a0 – значение y при х = 0; a1 – коэффициент регрессии (пропорциональности), характеризующий изменение значения y при изменении х на 1 единицу. Параметры уравнения a0 и a1 находим методом наименьших квадратов. Для линейной функции условие метода наименьших квадратов равносильно следующей системе нормальных уравнений:
где n – число уровней (членов) ряда (в нашем примере 10); Σ x – сумма значений факторного признака; Σ y – сумма значений результативного признака; Σ x2 – сумма значений квадратов факторного признака; Σхy – сумма произведений значений факторного признака на значение результативного признака. Чтобы решить данную систему, построим вспомогательную таблицу (табл. 9.4). Таблица 9.4 Вспомогательная таблица для расчета линейного коэффициента корреляции и уравнения связи
Полученные в итоговой строке значения подставляем в систему нормальных уравнений и решаем ее.
Вычитая из первого уравнения второе, получаем:
Подставляем числовое значение
Таким образом, нами получено следующее линейное уравнение регрессии:
Коэффициент регрессии a1 показывает, что при увеличении стажа рабочих на 1 год их производительность труда в среднем возрастает на 0,6 шт. Если перед угловым коэффициентом прямой a1 знак «-», то наблюдается тенденция к снижению (связь между признаками обратная). Для проверки значимости параметров уравнения а0 и а1 рассчитаем:
где В формуле
где По таблице t- распределения Стьюдента с учетом принятого уровня значимости Поскольку Средняя квадратическая ошибка уравнения
Тогда отношение Применение корреляционного и регрессионного анализа требует, чтобы все признаки были количественно измеримы. Построение аналитических группировок предполагает, что количественным должен быть результативный признак. Вместе с тем в статистике применяются также непараметрические методы, с помощью которых устанавливается связь между качественными (атрибутивными) признаками. Сфера их применения шире, поскольку не требуется соблюдения условия нормальности распределения зависимой переменной, однако при этом снижается глубина исследования связей. При изучении зависимости между качественными признаками не ставится задача представления ее уравнением. Здесь речь идет об установлении наличия связи и измерения ее тесноты.
Коэффициенты ассоциации и контингенции Для определения тесноты связи двух качественных признаков, каждый из которых состоит только из двух групп, применяются коэффициенты ассоциации и контингенции. При исследовании связи числовой материал располагается в виде таблиц сопряженности, например табл. 9.5: Таблица 9.5 Таблица для вычисления коэффициентов ассоциации и контингенции
Для вычисления строится таблица, которая показывает связь между двумя явлениями, каждое из которых должно быть альтернативным, т. е. состоящим из двух качественно отличных друг от друга значений признака (например, хороший, плохой). Коэффициенты определяются по формулам: • ассоциации • контингенции Коэффициент контингенции всегда меньше коэффициента ассоциации. Связь считается подтвержденной, если Пример. Исследовалась связь между успеваемостью студентов-заочников и работой их по специальности. Результаты обследования характеризуются следующими данными (табл. 9.6). Таблица 9.6 Зависимость успеваемости студентов-заочников от работы их по специальности
Таким образом, связь между успеваемостью студентов-заочников и работой их по специальности существенная. Коэффициенты взаимной сопряженности Пирсона и Чупрова Когда каждый из качественных признаков состоит более чем из двух групп, то для определения тесноты связи возможно применение коэффициентов взаимной сопряженности Пирсона и Чупрова (табл. 9.7). Таблица 9.7 Вспомогательная таблица для расчета коэффициентов взаимной сопряженности
Эти коэффициенты вычисляются по следующим формулам:
где
К1 – число значений (групп) первого признака; К2 – число значений (групп) второго признака. Чем ближе величины КП и КЧ к 1, тем связь теснее.
Пример: С помощью коэффициентов взаимной сопряженности исследовать связь между себестоимостью продукции и производительностью труда.
Для определения тесноты связи между произвольным числом ранжированных признаков применяется множественный коэффициент ранговой корреляции (коэффициент конкордации), который вычисляется по формуле:
где m – количество факторов; n – число наблюдений; S – отклонение суммы квадратов рангов от средней рангов в квадрате. Значимость коэффициента конкордации проверяется на основе
По таблице В случае наличия связных рангов (т. е. одинаковых рангов) коэффициент конкордации определяется по формуле:
где
Проверка значимости осуществляется по формуле
Коэффициент конкордации принимает любые значения в интервале
Дата добавления: 2014-01-05; Просмотров: 802; Нарушение авторских прав?; Мы поможем в написании вашей работы! |