КАТЕГОРИИ: Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748) |
Дисперсионный анализ
Вопрос о проверке существенности расхождения двух выборочных характеристик может быть поставлен при сравнении не только двух выборочных средних, но и двух выборочных дисперсий. Для сравнения дисперсий применяется критерий, предложенный Рональдом Фишером, который называют дисперсионным отношением, или F-критерием. Критерий Фишера представляет собой отношение двух дисперсий:
где При вычислении дисперсионного отношения в числителе берется большая из оценок Для определения границ случайных колебаний отношения дисперсии Р.Фишером разработаны специальные таблицы F-pacпределения (см. Приложение VI). В этих таблицах указываются предельные значения F-критерия для различных комбинаций числа степеней свободы числителя Рассчитанная по фактическим данным величина дисперсионного отношения сопоставляется стабличной величиной дисперсионного отношения, соответствующей данному сочетанию числа степеней свободы числителя и знаменателя и принятому уровню значимости. Гипотеза, которая проверяется с помощью этих таблиц, состоит в том, что сравниваемые дисперсии характеризуют вариацию признака в совокупностях, отобранных из одной и той же нормально распределенной генеральной совокупности или же отобранных из нормально распределенных генеральных совокупностей с одинаковой дисперсией. Если фактическое дисперсионное отношение будет больше табличного, то лишь с вероятностью 0,05 или 0,01 можно утверждать, что различие между дисперсиями определяется случайными факторами. Однако события, имеющие столь малую вероятность, считаются практически невозможными, а потому в этом случае с вероятностью 1 - α можно утверждать существенность различий в величине дисперсий. Если же фактическое значение дисперсионного отношения будет меньше соответствующего табличного значения, например, при 1 %-ном уровне значимости, то с вероятностью 99% можно утверждать, что расхождение между дисперсиями несущественно. Дисперсионный анализ приобретает самостоятельное значение при оценке существенности расхождения нескольких средних, что позволяет проверить гипотезу о наличии связи между признаком, положенным в основу группировки, и результативным признаком. В зависимости от количества факторов, определяющих вариацию результативного признака, дисперсионный анализ подразделяется на однофакторный и многофакторный. Методы дисперсионного анализа позволяют также проверить гипотезу относительно формы корреляционной зависимости и оценить целесообразность включения в модель дополнительных факторов. Рассмотрим применение дисперсионного анализа для случая однофакторного комплекса. Пусть все n наблюдений разбиты на k групп в соответствии с определенным признаком и число наблюдений в j -й группе равно nj Систему таких наблюдений в общем виде можно записать таким образом:
Номер группы Значения результативного признака
Обозначим общую среднюю для всей совокупности среднюю — в соответствующей группе
где первое слагаемое в правой части представляет собой сумму квадратов отклонений наблюдаемых значений от групповых средних и характеризует вариацию внутри групп, а второе слагаемое — сумма квадратов отклонений групповых средних от общей средней — характеризует вариацию между группами. Колебания изучаемого признака внутри группы вокруг средней возникают под влиянием прочих причин, исключая влияние фактора, положенного в основу группировки. Колеблемость групповых средних вокруг общей средней обусловлена влиянием признака-фактора. Если фактор, положенный в основу группировки, не оказывает влияния на вариацию изучаемого признака, то дисперсия групповых средних будет отражать только влияние тех же самых прочих факторов, которые определяют и вариацию внутри групп, а потому отношение дисперсий будет близко к единице или отличаться от нее в силу наличия случайных колебаний. Предельный размер этих колебаний можно установить по таблицам F-распределения (приложение 7). При применении дисперсионного анализа для расчета дисперсий учитывается число степеней свободы. В каждой группе при определении дисперсии мы располагаем Поскольку мы использовали k средних, а сумма Тогда межгрупповая
Если группировочный признак оказывает влияние на вариацию результативного признака, то вариацию групповых средних нельзя считать обусловленной только случайными воздействиями, и это найдет отражение в различии величины межгрупповой и внутригрупповой дисперсии, т.е. Fрасч. будет больше единицы. Если при этом F расч. > Fтабл., то с вероятностью 0,95 (0,99) можно утверждать, что между факторным и результативным признаками существует взаимосвязь. Рассмотрим дисперсионный анализ на следующем примере. За месяц известны данные о выработке рабочего за время работы в первую и во вторую смены (см. табл. 8.13). Таблица 8.13
Можно ли считать, что расхождение между уровнями выработки рабочего в первую и во вторую смены несущественно, т.е. можно ли считать, что генеральные средние в двух подгруппах одинаковы и, следовательно, выработка рабочего может быть охарактеризована общей средней. Для того чтобы ответить на поставленный вопрос, рассчитаем среднюю выработку рабочих в каждой смене (см. графу 2 табл. 8.14). Величина средней выработки в первую и вторую смены различна. Теперь возникает вопрос о том, насколько существенны эти расхождения, т.е. нужно проверить предположение о возможном влиянии сменности на выработку рабочих. Используя данные графы 4 и графы 5, рассчитаем Таблица 8. 14
Число степеней свободы для расчета внутригрупповой дисперсии равно 21(23-2), а для расчета межгрупповой дисперсии — 1(2-1). Следовательно,.
В соответствии с числом степеней свободы числителя (1) и знаменателя (21) в таблице F-распределения для 5%-ного уровня значимости находим Fрасч.= 4,32, а для 1%-ного уровня значимости — Fтабл.=8,02. Так как Fрасч. значительно меньше табличных значений, гипотеза о несущественности различия выработки рабочего в первую и во вторую смены не опровергается, т.е. сменность не оказывает влияния на уровень выработки рабочего.
Дата добавления: 2014-12-10; Просмотров: 725; Нарушение авторских прав?; Мы поможем в написании вашей работы! |