КАТЕГОРИИ: Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748) |
Принципы построения статистических группировок
Задачи сводки и ее содержание СВОДКА И ГРУППИРОВКА СТАТИСТИЧЕСКИХ МАТЕРИАЛОВ На основе информации, собранной в ходе статистического наблюдения, как правило, нельзя непосредственно выявить и охарактеризовать закономерности социально-экономических явлений. Это связано с тем, что наблюдение дает сведения по каждой единице исследуемого объекта. Полученные данные не являются обобщающими показателями. С их помощью нельзя сделать выводы в целом об объекте без предварительной обработки данных. Поэтому цель следующего этапа статистического исследования состоит в систематизации первичных данных и получении на этой основе сводной характеристики всего объекта при помощи обобщающих статистических показателей. Сводка представляет собой комплекс последовательных операций по обобщению конкретных единичных фактов, образующих совокупность, для выявления типичных черт и закономерностей, присущих изучаемому явлению в целом. Таким образом, если при статистическом наблюдении собирают данные о каждой единице объекта, то результатом сводки являются подробные данные, отражающие в целом всю совокупность. Статистическая сводка должна вестись на основе предварительного теоретического анализа явлений и процессов. Это необходимо для того, чтобы во время сводки не потерять информацию об исследуемом явлении и чтобы все статистические итоги отражали важнейшие характерные черты объекта. По глубине обработки материала сводка бывает простая и сложная. Простой сводкой называется операция по подсчету общих итогов по совокупности единиц наблюдения. Сложная сводка представляет собой комплекс операций, включающих группировку единиц наблюдения, подсчет итогов по каждой группе и по всему объекту и представление результатов группировки и сводки в виде статистических таблиц. Проведению сводки предшествует разработка ее программы, которая состоит из следующих этапов: выбор группировочных признаков; определение порядка формирования групп; разработка системы статистических показателей для характеристики групп и объекта в целом; разработка системы макетов статистических таблиц, в которых должны быть представлены результаты сводки. По форме обработки материала сводка бывает децентрализованная и централизованная. При децентрализованной сводке (именно она используется, как правило, при обработке статистической отчетности) разработка материала производится последовательными этапами. Так, отчеты предприятий сводятся статистическими органами субъектов Российской Федерации, а уже итоги по региону поступают в Госстат России, и там определяются показатели в целом по народному хозяйству страны. При централизованной сводке весь первичный материал поступает в одну организацию, где и подвергается обработке от начала и до конца. Централизованная сводка обычно используется для обработки материалов единовременных статистических обследований. По технике выполнения статистическая сводка подразделяется на механизированную и ручную. Механизированная сводка - это способ выполнения сводки статистических данных, при котором все операции осуществляются с помощью применения электронно-вычислительных машин. При ручной сводке все основные операции (подсчет групповых и общих итогов) осуществляются вручную. В настоящее время с появлением персональных компьютеров, созданием автоматизированных рабочих мест, разработкой статистических пакетов прикладных программ ручная сводка в обработке информации используется крайне редко. Для проведения сводки составляется план, в котором излагаются организационные вопросы: кем и когда будут осуществляться все операции, порядок ее проведения, состав сведений, подлежащих опубликованию в периодической печати.
Отдельные единицы статистической совокупности объединяются в группы при помощи метода группировки. Это позволяет «сжать» информацию, полученную в ходе наблюдения, и на этой основе выявить закономерности, присущие изучаемому явлению. Группировкой называется расчленение множества единиц изучаемой совокупности на группы по определенным существенным для них признакам. Группировка является одним из самых сложных в методологическом плане этапов статистического исследования. С помощью метода группировок решаются следующие задачи: • выделения социально-экономических типов явлений; • изучения структуры явления и структурных сдвигов, происходящих в нем; • выявления связи и зависимости между явлениями. Типологическая группировка - это разделение исследуемой качественно разнородной совокупности на классы, социально-экономические типы, однородные группы единиц в соответствии с правилами научной группировки. Примером типологической группировки является группировка промышленных предприятий по формам собственности (табл. 3.1).
Таблица 3.1 Группировка промышленных предприятий одного из регионов России по формам собственности в 2000 г.
Согласно данным таблицы, подавляющее большинство предприятий находилось в федеральной собственности, менее 5% составляли предприятия с частной формой собственности и только 1% - с муниципальной и смешанной собственностью. Типологические группировки широко применяются в исследовании социально-экономических явлений и процессов. Другой вид группировки - структурная. Структурной называется группировка, в которой происходит разделение однородной совокупности на группы, характеризующие ее структуру по какому-либо варьирующему признаку. С помощью таких группировок могут изучаться: состав населения по полу, возрасту, месту проживания; состав предприятий по численности занятых, стоимости основных фондов; структура депозитов по сроку их привлечения и т.д. Структурная группировка представлена в табл. 3.2. Данные группировки показывают, что более 34,1% населения имели среднедушевой денежный доход от 400 до 1000 руб. в месяц, Явления общественной жизни и отражающие их признаки тесно взаимосвязаны. Группировка, выявляющая взаимосвязи между изучаемыми явлениями и их признаками, называется аналитической группировкой.
Таблица 3.2 Группировка населения России по размеру среднедушевого дохода в декабре 1998 г.
Всю совокупность признаков можно разделить на две группы: факторные и результативные. Факторными называются признаки, под воздействием которых изменяются другие признаки - они и образуют группу результативных признаков. Взаимосвязь проявляется в том, что с возрастанием значения факторного признака систематически возрастает или убывает среднее значение признака результативного. Например, производительность труда зависит от технического уровня предприятия: чем он выше, тем при прочих равных условиях выше производительность труда занятых на предприятии. Особенности аналитической группировки следующие: во-первых, в основу группировки кладется факторный признак; во-вторых, каждая выделенная группа характеризуется средними значениями результативного признака. Аналитическая группировка приведена в табл. 3.3. Данные таблицы характеризуют зависимость между суммой активов банка и численностью занятых, а также суммой балансовой прибыли. Чем больше сумма активов, тем больше прибыль банка и численность его сотрудников. У первой группы средняя численность занятых в 2,8 раза меньше, чем у пятой, а балансовая прибыль меньше в 9,1раза.
Таблица 3.3 Группировка коммерческих банков России по сумме активов баланса (данные условные)
Аналитические группировки позволяют изучить многообразие связей и зависимости между варьирующими признаками. Преимущество метода аналитических группировок перед другими методами анализа связи (например, корреляционно-регрессионным) состоит в том, что он не требует соблюдения каких-либо условий для своего применения, кроме одного - качественной однородности исследуемой совокупности. Все рассмотренные в данном параграфе группировки объединяет то, что единицы объекта разделены на группы по какому-то одному признаку: форма собственности (табл. 3.1), размер среднедушевого дохода (табл. 3.2), и сумма активов баланса банка (табл. 3.3). Группировка, в которой группы образованы по одному признаку, называется простой. Для характеристики явления бывает недостаточно разбить совокупность на группы по какому-либо одному признаку. В этом случае строят сложные группировки. Сложной называется группировка, в которой разделение совокупности на группы производится по двум и более признакам, взятым в сочетании (комбинации). Сначала группы формируются по одному признаку, затем они делятся на подгруппы по другому признаку, которые, в свою очередь, подразделяются по третьему и т.д. Таким образом, сложные группировки дают возможность изучать распределение единиц совокупности одновременно по нескольким признакам. В табл. 3.4 приведена сложная группировка семей России по месту проживания и числу детей. По первому признаку образованы две группы, а по второму - пять. Группировка показывает, что большинство семей и в городе, и в деревне имеет только одного ребенка, а в общей численности семей они составляют почти 51% (11 933: 23 486). Число городских семей, в которых два ребенка, меньше почти в 1,4 раза, чем семей с одним ребенком. В сельской местности численность таких семей различается незначительно - всего на 1%. Меньше всего семей с численностью детей 5 и более человек. Однако среди сельского населения они составляют 2,5%, городского - лишь 0,4%, а во всем населении - 0,9%.
Группировка семей России по месту проживания и числу детей в 1989 г. (по материалам переписи населения)
Приемы проведения статистических группировок весьма разнообразны. Это связано с разными задачами, которые в соответствии с целью исследования ставятся перед группировками. Группировочным признаком называется признак, по которому проводится разбивка единиц совокупности на отдельные группы. Его часто называют основанием группировки. В качестве основания группировки следует использовать существенные признаки. В основание группировки могут быть положены как количественные, так и качественные признаки. Первые имеют числовое выражение (объем торгов, курс доллара в рублях, возраст человека, денежный доход семьи и т.д.), а вторые отражают состояние единицы совокупности (пол человека, его национальность, семейное положение, отраслевая принадлежность предприятия, его форма собственности и организационно-правовая форма и т.д.). После определения основания группировки следует решить вопрос о количестве групп, на которые надо разбить исследуемую совокупность. Число групп зависит от задач исследования и вида признака, положенного в основание группировки, численности совокупности, степени вариации признака. Единицы анализируемого объекта могут быть разбиты по одному и тому же признаку на разное число групп. Например, при группировке населения по возрасту с целью определения трудовых ресурсов страны все население в практической статистике делится на три группы: население моложе трудоспособного возраста, трудоспособное население и население старше трудоспособного возраста. Если же анализируется продолжительность жизни, то строится более детальная группировка и выделяются пятигодичные группы. При построении группировки по качественному признаку групп, как правило, будет столько, сколько имеется градаций, видов, состояний у этого признака. Например, в случае проведения группировки населения по полу можно образовать только две группы: мужчины и женщины. Если проводится группировка производства товаров народного потребления по экономическим районам, то вся исследуемая совокупность делится на 11 групп: именно на столько экономических районов поделена территория страны. Если группировка проводится по количественному признаку, то необходимо обратить особое внимание на число единиц исследуемого объекта и степень колеблемости группировочного признака. При небольшом объеме совокупности не следует образовывать большое число групп, так как группы будут малочисленными. Поэтому показатели, рассчитанные для таких групп, не будут представительными и не позволят получить адекватную характеристику исследуемого явления. Часто группировка по количественному признаку имеет задачу отразить распределение единиц совокупности по этому признаку. В данном случае количество групп зависит в первую очередь от степени колеблемости группировочного признака: чем больше его колеблемость, тем больше следует образовать групп. (Степень колеблемости признака измеряется показателями вариации, которые подробно рассмотрены в разделе 6.) При использовании электронно-вычислительных машин и персональных компьютеров для обработки статистических данных группировка единиц объекта проводится с помощью стандартных процедур. Одна из таких процедур основана на использовании следующей формулы Стерджесса для определения оптимального числа групп:
п = 1 + 3,322 • lgN, (3.1) где п - число групп; N - число единиц совокупности. Получаем следующее соотношение:
После определения числа групп следует определить интервалы группировки. Интервал - это значения варьирующего признака, лежащие в определенных границах. Каждый интервал имеет свою величину, верхнюю и нижнюю границы или хотя бы одну из них. Нижней границей интервала называется наименьшее значение признака в интервале, а верхней границей - наибольшее значение признака в нем. Величина интервала (ее еще часто называют интервальной разностью) представляет собой разность между верхней и нижней границами интервала. Интервалы группировки в зависимости от их величины бывают равные и неравные. Последние делятся на прогрессивно возрастающие, прогрессивно убывающие, произвольные и специализированные. Если вариация признака проявляется в сравнительно узких границах и распределение носит более или менее равномерный характер, то строят группировку с равными интервалами. Величина равного интервала определяется по следующей формуле: h = R / N, (3.2) где R = Хmax – Xmin т.е. размах вариации; Хmax, Xmin - максимальное и минимальное значение признака в совокупности. Прежде чем определять размах вариации, из совокупности рекомендуется исключить аномальные наблюдения. Если максимальные или минимальные значения сильно отличаются от смежных с ними значений вариантов в упорядоченном ряду значений группировочного признака, для определения величины интервала следует использовать не максимальное и минимальное значения, а значения, несколько превышающие минимум и несколько меньшие, чем максимум. Полученную по формуле (3.2) величину округляют. Она является шагом интервала. Существуют следующие правила определения шага интервала. Если величина интервала, рассчитанная по формуле (3.2), представляет собой величину, имеющую один знак до запятой (например, 0,66; 1,372; 5,8), то полученные значения целесообразно округлить до десятых и их использовать в качестве шага интервала. В приведенном выше примере шагом интервала будут соответственно значения 0,7; 1,4; 5,8. Когда рассчитанная величина интервала имеет две значащие цифры до запятой и несколько знаков после запятой; то это значение надо округлить до целого числа. Пусть величина интервала, исчисленная по формуле (3.2), равна 12,785. Тогда это значение следует округлить до целого числа, т. е. до 13. В случае когда рассчитанная величина интервала представляет собой трехзначное, четырехзначное и так далее число, эту величину необходимо округлить до ближайшего числа, кратного 100 или 50. Например, 248 следует округлить до 250. Рассмотрим пример. Пусть требуется произвести группировку с равными интервалами предприятий по стоимости основных фондов, при этом максимальное значение признака равно 2 040 млн руб., а минимальное его значение - 290 млн руб. Совокупность включает 80 единиц. Согласно формуле (3.1) она должна быть разбита на 7 групп. Сначала следует найти: R = 2040 - 290 = 1750 млн. руб. Затем определим величину интервала: h = 1750: 7= 250 млн. руб. После этого построим интервалы групп (табл. 3.5).
Варианты построения групп
Чтобы не писать каждый раз от... до, границы групп обозначают следующим образом: 290 - 540, 540 - 790 и т.д. Особенностью первого варианта построения групп является то, что у всех групп имеются закрытые интервалы. Во втором варианте первая и последняя группы - это группы с открытыми интервалами. Открытые - это те интервалы, у которых указана только одна граница: верхняя - у первого, нижняя - у последнего. Например, открытыми будут первый и последний интервалы в группировке населения по размеру среднедушевого дохода (табл. 3.2). Закрытыми называются интервалы, у которых обозначены обе границы. Ширина открытого интервала принимается равной ширине смежного с ним интервала. При группировке по количественному признаку границы интервалов могут быть обозначены по-разному. Если основанием группировки служит непрерывный признак, то одно и то же значение признака выступает и верхней, и нижней границами у двух смежных интервалов. Таким образом, верхняя граница /-го интервала равна нижней границе i+1-го интервала. Примером такой группировки является приведенная в табл. 3.5. группировка предприятий по стоимости основных фондов. При таком обозначении границ может возникнуть вопрос, в какую группу включать единицы объекта, значения признака у которых совпадают с границами интервалов. Например, во вторую или третью группу должно войти предприятие со стоимостью фондов 790 млн. руб. Если нижняя граница формируется по принципу «включительно», а верхняя - по принципу «исключительно», то предприятие должно быть отнесено к третьей группе, в противном случае - ко второй. Для того чтобы правильно отнести к той или иной группе единицу объекта, у которой значение признака совпадает с границами интервалов, можно использовать открытые интервалы. Так, единицы объекта (табл. 3.3), у которых размер среднедушевого денежного дохода равен 40 тыс. руб., попали во вторую группу (так как верхняя граница первой группы построена по принципу «исключительно»), а 80 тыс. руб. - в третью группу и т.д. Если в основании группировки лежит дискретный признак, то нижняя граница i-го интервала равна верхней границе i-1-го интервала, увеличенной на 1. В этом случае возможны следующие варианты построения групп (табл. 3.6) по вышеприведенному примеру.
Таблица 3.6 Варианты построения групп
Неравные интервалы применяются в статистике, когда значения признака варьируют неравномерно и в значительных размерах, что характерно для большинства социально-экономических явлений, особенно при анализе макроэкономических показателей.
Статистический ряд распределения - это упорядоченное распределение единиц совокупности на группы по определенному варьирующему признаку. В зависимости от признака, положенного в основу образования ряда распределения, различают атрибутивные и вариационные ряды распределения. Атрибутивными называют ряды распределения, построенные по качественным признакам. Ряд распределения принято оформлять в виде таблиц. Ниже приведен атрибутивный ряд распределения юридической помощи адвокатов гражданам. Представленный в табл. 3.7 ряд показывает, как общее число случаев юридической помощи адвокатов распределялось по видам и формам правовой помощи в 1994 г. Таблица 3.7 Распределение видов юридической помощи, оказанной адвокатами гражданам одного из регионов РФ в 2000 г. (цифры условные)
Элементами этого ряда распределения являются значения атрибутивного признака, представленного названиями видов правовой помощи, оказанной адвокатами, и числа случаев, относящихся к каждому виду и форме помощи. Наибольший удельный вес (почти 70%) приходится на оказание юридической помощи в виде устных советов. Атрибутивные ряды распределения характеризуют состав совокупности по тем или иным существенным признакам. Взятые за несколько периодов, эти данные позволят исследовать изменение структуры Вариационными называют ряды распределения, построенные по количественному признаку. Любой вариационный ряд состоит из двух элементов: вариантов и частот. Вариантами называются отдельные значения признака, которые он принимает в вариационном ряду, т. е. конкретное значение варьирующего признака. Частота - это количество элементов совокупности, которые имеют данное значение признака. Сумма всех частот определяет численность всей совокупности, ее объем. Частостями называются частоты, выраженные в долях единицы или в процентах к итогу. Соответственно сумма частостей равна 1 или 100%. В зависимости от характера вариации признака различают дискретные и интервальные вариационные ряды. Как известно, вариация количественных признаков может быть дискретной (прерывной) или непрерывной. В случае дискретной вариации величина количественного признака принимает только целые значения. Следовательно, дискретный вариационный ряд характеризует распределение единиц совокупности по дискретному признаку. Примером дискретного вариационного ряда является распределение семей по числу комнат в отдельных квартирах, приведенное в табл. 3.8. Во второй колонке таблицы представлены варианты дискретного вариационного ряда, в третьей - помещены частоты вариационного ряда, а в четвертой - показаны частости. Таблица 3.8 Распределение семей по числу занимаемых комнат в отдельных квартирах в 1989 г. в РФ (по данным переписи населения)
В случае непрерывной вариации величина признака у единиц совокупности может принимать в определенных пределах любые значения, отличающиеся друг от друга на сколь угодно малую величину. Построение интервальных вариационных рядов целесообразно прежде всего при непрерывной вариации, а также если дискретная вариация проявляется в широких пределах, т. е. число вариантов дискретного признака достаточно велико. В табл. 3.2 представлен интервальный вариационный ряд.
Дата добавления: 2017-02-01; Просмотров: 65; Нарушение авторских прав?; Мы поможем в написании вашей работы! |