КАТЕГОРИИ: Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748) |
Расчет среднего квадратического отклонения в генеральной совокупности из пяти человек
У нас есть возможность вычислить среднее квадратическое отклонение генеральной совокупности σген =24,5 мин. Теперь, узнав среднее квадратическое отклонение генеральной совокупности, мы можем вычислить среднее квадратическое отклонение выборочных средних μ = 17,32 мин. Это соотношение, устанавливающее прямо пропорциональную зависимость средней ошибки выборки от среднего квадратического отклонения генеральной совокупности и обратно пропорциональную зависимость от корня квадратного из величины выборочной совокупности, позволяет не производить сотни и тысячи выборок. Ошибка выборки рассчитывается на основе сведений об однородности генеральной совокупности, а также об объеме выборки. Вернемся к нашему примеру с затратами времени на чтение. Мы знаем среднее значение изучаемой переменной в генеральной совокупности — 40 мин. — и ее среднее квадратическое отклонение — 24,52 мин. Средняя ошибка выборки объемом в две единицы равна 17,32 мин. Это означает, что из 1000 выборок 683 дадут результаты от 22,68 мин. (40 — 17,32) до 57,32 мин. (40 + 17,32). Если бы выборка состояла из трех человек, ее ожидаемая ошибка была бы поменьше: 14,14 мин. В данном случае с такой же вероятностью в 683 из 1000 мы можем утверждать, что результат выборочного наблюдения не будет ниже 25,86 мин и выше 54,14 мин. Выборка из четырех человек еще больше повысит точность предсказания: 12,25 мин. Интервал среднего отклонения от истинного значения признака уменьшился: от 27,75 мин. до 52,25 мин. Таким образом, величина средней ошибки выборки, т. е. средняя всех отклонений выборочной средней от общей средней, зависит от двух параметров: от степени однородности распределения изучаемого признака в генеральной совокупности и объема выборки. Представим себе, что обследуемая совокупность совершенно однородна — отклонения от средней равны нулю. Например, все респонденты имеют один и тот же возраст — вариация данного признака нулевая. Величина знаменателя в формуле μ не имеет значения, потому что, даже если выборка будет состоять из одного-единственного наблюдения, ошибка останется нулевой. При разнородной генеральной совокупности ошибка выборки уменьшается с увеличением ее объема. Если объем выборки приближается к объему генеральной совокупности, ошибка стремится к нулю. Задача исчисления ошибки выборки сводится к определению вероятности того или иного варианта. В нашем примере выборочного наблюдения двух человек из пяти вероятность выборочного значения 40 мин, равно как и прочих, равна 0,04. Но вероятность установления значений от 35 до 45 мин. возрастает: 0,04 + 0,08 + 0,16 = 0,28 — это хорошо видно в табл. 5.11. Чем меньше точность, тем выше надежность выборочных данных. «Сигмы» имеют в каждом конкретном случае разную размерность: минуты, белые и черные шары, метры, баллы. Метры и минуты нельзя сопоставить друг с другом. Поэтому целесообразно нормировать отклонения выборочной средней путем введения относительной величины: Величина t показывает, в каком отношении находится средняя ошибка выборки к одному среднему квадратическому отклонению. Аналогия со стрельбами в данном случае не покажется лишней. Чем меньше размер цели, тем меньше уверенность в попадании. При t = 1 отклонение выборочной средней от генеральной равно одной «сигме» и, как мы знаем, вероятность такого варианта равняется 683 случаям из 1000, т. е. 0,683. При снижении точности предсказания в два раза, т. е. при t = 2, вероятность возрастает до 0,954, при t = 3 — до 0,997, при t = 4 — до 0,999. Используя коэффициент t, мы можем ввести определение предельной ошибки выборки Δ. Предельная ошибка выборки непосредственно зависит от принятого нами уровня точности — коэффициента t. Δ= t х μ. Если мы не хотим ошибиться в своих заключениях, надо увеличить t, при t = 4 вероятность того, что выборочная средняя не выйдет за пределы четырех средних отклонений, составит 0,999. Расчет средней ошибки выборки, как было показано выше, зависит от однородности генеральной совокупности — σген. Новыборка производится как раз для того, чтобы установить параметры генеральной совокупности. Поэтому практического смысла формула Рассмотрим частотное распределение выборочной совокупности 807 школьников по количеству имевшихся у них наличных денег (табл. 5.14). Прежде всего необходимо подсчитать среднюю арифметическую где х — значения переменной, р — частоты. Среднее количество Таблица 5.14 Распределение школьников по количеству имевшихся у них наличных денег, 1987 г., %
Вывод: с вероятностью 0,997 можно утверждать, что среднее количество денег у советских школьников в 1987 г. составляло от 41,1 до 48,9 руб. Если этот вывод не устраивает нас из-за своей приблизительности, мы имеем возможность повысить точность предельной ошибки, например, принять t = 1. Тогда Δ= 1,3 руб. Интервал сокращается: нижний предел составляет 45 — 1,3 = 43,7 руб; верхний предел 45 + 1,3 = 46,3 руб. Утверждать, что генеральная средняя будет находиться в установленных таким образом пределах, мы можем с вероятностью 0,683. Это значит, что мы ошибемся в 317 случаях из 1000. Выборка должна быть достаточно большой, но, как мы знаем из опыта, ее объем выше определенного предела расширять нецелесообразно — на точность результата это уже не влияет. Поэтому прежде всего требуется определить точность предстоящего измерения. Вряд ли нужно измерять сумму наличных денег с точностью до рубля или затраты времени с точностью до минуты. Если требуются самые высокие гарантии и самая точная информация, выборка должна быть большой. Кроме точности и надежности результатов выборочного наблюдения, на объем выборки влияет независимый от исследователя фактор — степень однородности генеральной совокупности. В однородной совокупности не нужны многократно повторяющиеся замеры. Представим три фактора, влияющие на объем выборки, в формальном виде. Греческая буква Δ обозначает заданную точность — предельную ошибку выборки; t — коэффициент, обозначающий заданную надежность предсказания генеральной средней, — обычно устанавливается вероятность 0,997, t = 3; степень однородности генеральной совокупности измеряется средним квадратическим отклонением σген. Предельная ошибка выборки А = t x μ, а средняя ошибка выборки Часто при измерении социологических признаков приходится оперировать долями. В этом случае формула видоизменяется. Средняя ошибка для выборочной доли равна Б.Ц. Урланис приводит следующий пример27. Производится обследование студентов по полу. Предельная ошибка выборки (точность) устанавливается 2 процента (0,02). Надежность t = 3, т. е. в 997 случаях из 1000 генеральная средняя попадет в требуемый интервал. В итоге вычисляется объем выборки:
Исходя из возможноймаксимальной вариации признака в генеральной совокупности В.И. Паниотто рекомендует следующие объемы выборочной совокупности в зависимости от величины генеральной совокупности (при допущении, что с вероятностью 0,954 генеральная средняя попадает в интервал Таблица 5.15 Соотношение объемов выборочной и генеральной совокупностей при Р = 0,954 и ошибке 5%
Таким образом, для выборки с пятипроцентной ошибкой достаточно обследовать 400 единиц при практически бесконечной генеральной совокупности и уровне надежности 95%. Повышение требований к точности предсказания до 4% при сохранении прочих условий увеличивает объем выборки до 625 единиц, точность 3% предполагает объем 1111 единиц, 2% — 2500 единиц и 1% — 10 000 единиц. Фактически объем выборки зависит не столько от величины генеральной совокупности и допустимой ошибки, сколько от количества градаций, используемых при анализе массива. Для часто используемых в социологии двумерных распределений основную роль играет значимость различий между долями изучаемого признака при сравнении двух совпадающих по численности групп респондентов, выбранных случайным образом из бесконечной генеральной совокупности. Например, различия в 10% не случайны с вероятностью 0,954, если сравниваются группы по 200 человек. Двухпроцентные различия не случайны с той же вероятностью при сравнении пятитысячных групп (табл. 5.16)29. Таблица 5.16 Зависимость численности сравниваемых групп от значимости различий при Р=0,954, %
Таким образом, увеличение выборочной совокупности необходимо лишь для статистически корректного анализа межгрупповых различий.
Дата добавления: 2014-01-03; Просмотров: 676; Нарушение авторских прав?; Мы поможем в написании вашей работы! |