Принципы построения группировок
Для построения любой группировки нужно:
1. Выбрать группировочный признак,
2. Определить количество групп, на которые разбивают изучаемую статистическую совокупность,
3. Зафиксировать границы интервалов группировки.
Для каждой группировки нужно находить конкретные показатели или их систему, которые должны охарактеризовать изучаемые группы.
Выбор группировочного признака – сложный вопрос в теории статистической группировки и статистического исследования в целом.
Группировочный признак – это основание, по которому проводится разбивка единиц совокупности на отдельные группы. От степени точности группировочного признака зависит правильность выводов статистического исследования. В качестве основания группировки нужно отобрать самые значимые и существенные признаки.
В группировку входят количественные и атрибутивные (качественные) признаки.
Количественные признаки обычно имеют числовое выражение (например, объем выпускаемой продукции, возраст человека, доход семьи и т. д.).
Количественные признакимогут быть дискретными (целые числа) и непрерывно изменяющимися (могут принимать любое значение в некотором диапазоне). Если в основании группировки лежит дискретный признак, то нижняя граница i – го интервала равна верхней границе i – го интервала, увеличенной на 1.
Качественные (атрибутивные) признаки дают качественную характеристику единицы совокупности (например, пол, семейное положение, политическая ориентация человека и т. д.). Выделенные группы по атрибутивному признаку в группировке должны отличаться друг от друга по качественной характеристике признака.
Построение группировки по атрибутивному признаку
Если с точки зрения составителя группировки количество разновидностей атрибутивного признака сравнительно невелико, то количество групп берется равным количеству разновидностей. В противном случае часть разновидностей объединяется в одну группу.
Построение группировки по количественному признаку
При составлении структурных группировок на основе количественных признаков определяют количество групп и интервалы группировки.
Интервал– количественное значение, определяющее и отделяющее одну группу от другой, т.е. он очерчивает количественные границы групп.
Каждый интервал имеет свою длину (ширину), верхнюю и нижнюю границы.
Нижняя граница интервала – это наименьшее значение признака в интервале, а верхняя граница интервала – его наибольшее значение. За нижнюю границу первого интервала принимают наименьшее значение признака в совокупности единиц наблюдения. Верхняя граница последнего интервала не может быть меньше наибольшего значения признака в совокупности единиц наблюдения.
Ширина интервала– это разность между верхней и нижней границами.
Интервалы группировки в зависимости от их ширины бывают:
Равными
2. Неравными. Неравные делятся на прогрессивно возрастающие, прогрессивно убывающие, произвольные и специализированные.
1. Если вариация признака проявляется в сравнительно узких границах и распределение носит равномерный характер, то строят группировку с равными интервалами.
Для группировок с равными интервалами величина (длина, шаг) интервала определяется по формуле:
i = ,
где ,
– наибольшее и наименьшее значение признака;
k – число групп (интервалов), определяемое по формуле Стерджесса:
,
где N – число единиц совокупности.
Округлениеполученных в расчетах нецелых чисел производится в большую сторону.
Значение k для формулы Стерджесса:
N | 15-24 | 25-44 | 45-89 | 90-179 | 180-359 | 360-719 | 720-1439 |
k |
Например: необходимо произвести группировку с равными интервалами 20 рабочих цеха по производительности их труда. Наибольшая производительность 180 деталей за смену, наименьшая – 60.
Количество групп:
Длина интервала: дет.
Нижняя граница 1-ой группы 60 деталей, верхняя 60+20=80 деталей. Вторая группа: нижняя граница 80, верхняя 80+20=100 и т.д. В результате получаем такой интервальный ряд (или такие группы рабочих), деталей:
В этом распределении имеется неопределенность, к какой группе отнести единицу совокупности, значение признака которой равно граничному значению интервала (рабочих с производительностью 80, 100, 200 и т. д. дет/см). Для устранения неопределенности используют принцип единообразия: левая, нижняя граница интервала включает в себя указанное значение, а верхняя – нет. Значит, рабочего, производящего 100 дет/см, относят к 3 группе.
2. Если размах вариации признака в совокупности велик и значения признака варьируются неравномерно, то используют группировку с неравными интервалами. Неравные интервалы могут быть получены, если построенная группировка с равными интервалами содержит группы, не отражающие определенные типы изучаемого явления или процесса или не содержащие ни одной единицы совокупности, возникает необходимость увеличения – объединения двух или нескольких малочисленных или «пустых» последовательных равных интервалов.
Величина интервала может изменяться как произвольно (по желанию составителя), так и в соответствии с каким-либо законом (по закону прогрессии).
Группировка от 500 до 4000 с прогрессивным интервалом
Интервал | Величина интервала |
500-600 | |
600-900 | |
900-1500 | |
1500-2500 | |
2500-4000 | |
Размах вариации |
Величина интервала может изменяться по арифметической или геометрической прогрессии.
Интервал | Величина интервала |
500-800 | |
800-1300 | |
1300-2000 | |
2000-2900 | |
2900-4000 |
Интервал | Величина интервала |
500-600 | |
600-1000 | |
1000-1700 | |
1700-2700 | |
2700-4000 |
В группировках, отражающих качественные особенности и специфику выделяемых групп единиц изучаемой совокупности по определенному признаку, применяются специализированные интервалы.
Специализированные интервалы– это интервалы, которые применяются для выделения из совокупности одних и тех же типов по одному и тому же признаку у явлений, находящихся в различных условиях.
Сказанное выше относится к группировкам, которые производятся на основе анализа первичного статистического материала. Но довольно часто приходится пользоваться уже имеющимися группировками, которые не удовлетворяют требованиям анализа. Например, группировки могут быть не сопоставимы из-за различного числа групп или неодинаковых границ интервалов.
Для приведения группировок к сопоставимому виду используется методвторичной группировки, который заключается в образовании новых групп на основе ранее осуществленной группировки. Эта перегруппировка возможна двумя способами:
1) объединением первоначальных интервалов (т.е. их укрупнением);
Источник
Статистические группировки, их виды. Группировочные признаки.
Метод: выделяется группировочный признак (основание группировки), потом группировочный интервал(совокупность варьирующих значений признака в группе, границы). Ширина интервала— разница между min и max значениями.
Правило группировки – различия между единицами, отнесенными к разным группам должны быть больше различий у единиц, отнесенных к одной группе.
Виды группировок:
1. Простая (одномерная): если однородные группы формируются по одному признаку.
· Структурная: изучение состава однородной совокупности по варьирующему признаку, позволяет выделить части объекта и соотношение между ними, или удельный вес каждой части (исп-ся для изучения внутреннего строения стат совокупности и характеристики структурных сдвигов)
· Аналитические: исп-ся для выявления связи между изучаемыми признаками.
2. Сложная (многомерная): группы образуются по 2-м и более признакам:
· Комбинационные: выполняются по нескольким признакам последовательно (от 2 до 4 признаков): каждая группа, выделенная по одному признаку, разбивается на подгруппы по второму, а последние – по третьему признаку и.т.д.
· Многомерные: группы образуются по нескольким признакам одновременно.
Классификация – разновидность типологической группировки, предполагающая группировку по относительно однообразным и устойчивым признакам, например, классификатор форм собственности или видов экономической деятельности. Принятые Классификаторы являются международными и национальными стандартами.
Группировочный признак – основание группировки, на базе значений которого (рых) происходит разбиение совокупности на однородные группы.
Виды группировочного признака:
1) атрибутивные (признак, характеризующий свойство, качество данного явления без количественного выражения)
2) количественные (признак, характеризующий размеры, величину изучаемой совокупности и дающий возможность разделить ее на группы по величине индивидуальных значений группировочного признака)
3) признаки пространства
4) признаки времени.
Правила группировочных признаков:
1. В качестве основания группировки должен выступать типичный существенный признак в соответствии с целями группировки;
2. При выборе признаков необходимо учитывать время и место наблюдения;
3. При изучении сложных общественных явлений рекомендуется производить группировки не по одному, а по нескольким признакам. (Хотя это и не всегда удаётся.)
Если в основе группировки лежат несколько признаков, группировка называется сложная или комплексная группировка.
4. Необходимо обращать внимание на интервалы обследования;
5. Необходимо установить минимальное и максимальное значение признака.
Правила группировок:
1. Базовый признак группировки должен быть чётко определён;
2. Нужно выбрать необходимый минимум группировок, в зависимости от целей исследования;
3. Социально-экономические системы целесообразно описывать через системы сложных группировок.
Задачи группировок:
а) Выделение качественно однородных групп. Обычно разрабатываются к.-то однотипные группировки (например, классификатор товаров и
б) Определение структуры совокупности и структурных сдвигов;
в) Распределение единиц однородной совокупности по величине варьирующего признака.
Источник
Лекция 5 Статистическая сводка и группировка
Статистическая сводка и группировка. В результате проведения статистического наблюдения получают данные о признаках каждой обследованной единицы статистической совокупности. Однако эти массивы данных, содержащие подробные сведения о каждой единице совокупности, собирают не для того, чтобы получить характеристики каждой из них, а с целью изучить совокупность в целом, выявить ее характерные группы и закономерности. Для этого необходимо обобщить и систематизировать сведения, полученные в ходе статистического наблюдения.
Обобщение и систематизация первичных статистических данных – это самостоятельный этап статистического исследования, основная задача которого получить полную и всестороннюю характеристику как совокупности в целом, так и отдельных ее частей и представить полученную информацию об изучаемой совокупности в наиболее удобной для пользователей форме. В статистической практике данный этап статистического исследования называют этапом сводки и группировки статистических данных.
Статистическая сводка
Сводка – это научная обработка первичных данных с целью получения обобщенных характеристик изучаемого социально-экономического явления по ряду существенных для него признаков с целью выявления типичных черт и закономерностей, присущих изучаемому явлению в целом.
По глубине и точности обработки материала различают простую сводку и сложную сводку.
Простая сводка – это операция по подсчету общих итогов по совокупности единиц наблюдения и оформление этого материала в статистических таблицах.
Сложная сводка – это комплекс последовательных операций, включающих группировку полученных при наблюдении материалов, составление системы показателей для характеристики типичных групп и подгрупп изучаемой совокупности явлений, подсчет числа единиц и итогов по каждой группе и подгруппе, и по всему объекту и представление результатов в виде статистических таблиц.
Этапы проведение сводки
Статистическая группировка
Группировка – разбиение общей совокупности единиц объекта наблюдения по одному или нескольким существенным признакам на однородные группы, различающиеся между собой в количественном и качественном отношении и позволяющие выделить социально-экономические типы, изучить структуру совокупности и проанализировать связи между отдельными признаками.
Задачи, решаемые с помощью метода группировок:
Виды группировок. В соответствии с познавательными задачами, решаемыми в ходе построения статистических группировок, различают следующие их виды: типологические, структурные, аналитические.
Типологическая группировка – это разбиение разнородной совокупности единиц наблюдения на отдельные качественно однородные группы и выявление на этой основе социально-экономических типов явлений. При построении группировки этого вида основное внимание должно быть уделено идентификации типов и выбору группировочного признака. Решение вопроса об основании группировки должно осуществляться на основе анализа сущности изучаемого социально-экономического явления.
Структурная группировка – предназначена для изучения состава однородной совокупности по какому-либо варьирующему признаку, а также структуры и структурных сдвигов, происходящих в нем.
Аналитическая группировка – выявляет взаимосвязи между изучаемыми явлениями и признаками, их характеризующими.
. В статистике при изучении связей социально-экономических явлений признаки подразделяют на факторные и результативные.
Особенности построения аналитической группировки:
По способу построения группировки бывают простые и комбинационные.
Простая группировка – группы образованы только по одному признаку.
Комбинационная группировка – разбиение совокупности на группы производится по двум и более признакам, взятым в сочетании (комбинации).
Сначала группы формируются по одному признаку, затем группы делятся на подгруппы по другому признаку, а эти в свою очередь делятся по третьему и так далее. Таким образом, комбинационные группировки дают возможность изучить единицы совокупности одновременно по нескольким взаимосвязанным признакам.
При построении комбинационной группировки возникает вопрос о последовательности разбиения единиц объекта по признакам. Как правило, рекомендуется сначала производить группировку по атрибутивным признакам, значения которых имеют ярко выраженные качественные различия.
Этапы построения статистических группировок
При небольшом объеме совокупности (n
Определение числа групп можно осуществить несколькими способами. Формально-математический способ предполагает использование формулы Стерджесса (формула 5.2): (5.2)
где n – число групп; N – число единиц совокупности.
Согласно этой формуле выбор числа групп зависит только от объема изучаемой совокупности.
Применение данной формулы дает хорошие результаты в том случае, если совокупность состоит из большого числа единиц наблюдения (n>50).
Другой способ определения числа групп основан на применении показателя среднего квадратического отклонения (σ). Если величина интервала равна 0,5σ, то совокупность разбивается на 12 групп, а когда величина интервала равна 2/3σ и σ, то совокупность делится, собственно, на 9 и 6 групп. Однако при определении групп данными методами существует большая вероятность получения «пустых» или малочисленных групп, характеристики изучаемого явления на основе которых будут недостаточно типичными для выделенной группы и изучаемой совокупности в целом.
Когда определено число групп, то следует определить интервалы группировки.
Интервал – это значения варьирующего признака, лежащие в определенных границах. Каждый интервал имеет верхнюю и нижнюю границы или одну из них. Нижней границей интервала называется наименьшее значение признака в интервале. Верхней границей интервала называется наибольшее значение признака в интервале. Величина интервала представляет собой разность между верхней и нижней границами интервала.
Интервалы группировки бывают: равные и неравные; открытые и закрытые.
Ширина равного интервала определяется по (формуле 5.3):
(5.3)
Если максимальные или минимальные значения сильно отличаются от смежных с ними значений вариантов в упорядоченном ряду значений группировочного признака, то для определения величины интервала следует использовать не максимальное или минимальное значения, а значения, несколько превышающие минимум, и несколько меньше, чем максимум.
Полученную по формуле (5.3) величину округляют и она будет являться шириной интервала.
Существуют следующие правила определения ширины интервала.
Если величина интервала, рассчитанная по формуле (5.3) представляет собой величину, которая имеет один знак до запятой (например: 0,67; 1,487; 3,82), то в этом случае полученные значения целесообразно округлить до десятых и их использовать в качестве ширины интервала. В приведенном выше примере это будут соответственно значения: 0,7; 1,5; 3,8.
Если рассчитанная величина интервала имеет две значащие цифры до запятой и несколько после запятой (например, 14,876), то это значение необходимо округлит до целого числа (15).
В случае, когда рассчитанная величина интервала представляет собой трехзначное, четырехзначное и так далее число, то эту величину следует округлить до ближайшего числа, кратного 100 или 50. Например, 652 следует округлить до 650 или до 700.
Если размах вариации признака в совокупности велик и значения признака варьируют неравномерно, то надо использовать группировку с неравными интервалами.
Неравные интервалы могут быть получены в процессе объединения пустых, не содержащих ни одной единицы совокупности, равных интервалов. Это происходит в том случае, если после построения равных интервалов по изучаемому признаку образуются группы, содержащие мало или не содержащие вообще ни одной единицы, т.е. группы, не отражающие определенных типов изучаемого явления по признаку. В этом случае возникает необходимость в увеличении интервалов группировки.
Также неравные интервалы могут быть прогрессивно-возрастающие или прогрессивно-убывающие в арифметической или геометрической прогрессии. Величина интервалов, изменяющихся в арифметической и геометрической прогрессии, определяется следующим образом:hi+1=hi+а,
а – константа: для прогрессивно-возрастающих интервалов имеет знак «+», а при прогрессивно-убывающих – знак «-».
q — константа: для прогрессивно-возрастающих – больше «1»; для прогрессивно-убывающих ‑ меньше «1».
Применение неравных интервалов обусловлено тем, что в первых группах небольшая разница в показателях имеет большое значение, а в последних группах эта разница не существенна.
Например, при построении группировки строительных компаний города по показателю численности работающих, который варьирует от 500 человек до 3500 человек, нецелесообразно рассматривать равные интервалы, т. к. учитываются как малые, так и крупнейшие строительные фирмы города. Поэтому следует образовывать неравные интервалы: 500–1000, 1000–2000, 2000–3500, т.е. величина каждого последующего интервала больше предыдущего на 500 человек и увеличивается в арифметической прогрессии. Выбор исследователя в построении равных или неравных интервалов зависит от степени заполнения каждой выделенной группы, т.е. от числа единиц в них. Если величина интервала существенна и содержит большое число единиц совокупности, то эти интервалы необходимо дробить, а в противном случае – объединять.
Интервалы статистической группировки
Интервалы группировок могут быть закрытыми и открытыми.
Закрытые интервалы – это интервалы, у которых есть и верхняя и нижняя границы.
Открытые интервалы – это интервалы, у которых указана только одна граница: как правило, верхняя – у первого интервала и нижняя – у последнего.
Например, группы страховых компаний по числу работающих в них сотрудников (чел.): до 50, 50–100, 100–150, 150 и более. Применение открытых интервалов целесообразно в тех случаях, когда в совокупности встречается незначительное число единиц наблюдения с очень малыми или очень большими значениями вариантов, которые резко, в несколько раз, отличаются от всех остальных значений изучаемого признака.
Если основанием группировки служит непрерывный признак (например, группы строительных фирм по объему строительно-монтажных работ, выполненных собственными силами (тыс. руб.): 1200–1400, 1400–1600, 1600–1800, 1800–2000), то одно и то же значение признака выступает и верхней и нижней границами двух смежных интервалов. В данном случае объем работ 1400 тыс. руб. составляет верхнюю границу первого интервала и нижнюю границу второго, 1600 тыс. руб. ‑ соответственно второго и третьего и т.д., т.е. верхняя граница i-го интервала равна нижней границе (i+1)-го интервала.
При таком обозначении границ может возникнуть вопрос, в какую группу включать единицы наблюдения, значения признака у которых совпадают с границами интервалов.
Например, во вторую или третью группу должна войти строительная фирма с объемом строительно-монтажных работ 1600 тыс. рублей? Если верхняя граница формируется по принципу «исключительно», то фирма должна быть отнесена к третьей группе, в противном случае – ко второй. Для того, чтобы правильно отнести к той или иной группе единицу совокупности, значение признака которой совпадает с границами интервалов, можно ориентироваться на открытые интервалы (по нашему примеру группы строительных фирм по объему строительно-монтажных работ преобразуются в следующие: до 1400, 1400–1600, 1600–1800, 1800 и более). В данном случае, вопрос отнесения отдельных единиц совокупности, значения которых являются граничными, к той или иной группе решается на основе анализа последнего открытого интервала. Возможны два случая обозначения последнего открытого интервала: 1) 1800 тыс. руб. и более; 2) более 1800 тыс. руб. В первом случае, строительные фирмы с объемом строительно-монтажных работ 1600 тыс. руб. попадут в третью группу; во втором случае – во вторую группу.
Если в основании группировки лежит дискретный признак, то нижняя граница 1-го интервала равна верхней границе i-1-го интервала, увеличенной на 1.
Например, группы строительных фирм по числу занятого персонала (чел.) будут иметь вид: 100–150, 151–200, 201–300.
Строя такую группировку, следует дифференцированно устанавливать границы интервалов для разных отраслей народного хозяйства. Это достигается путем использования группировок со специализированными интервалами.
Специализированные интервалы – применяются дли выделения из совокупности одних и тех же типов по одному и тому же признаку для явлений, находящихся в различных условиях.
При изучении социально-экономических явлений на макроуровне часто применяют группировки, интервалы которых не будут ни прогрессивно-возрастающими, ни прогрессивно-убывающими. Такие интервалы называются произвольными и, как правило, используются при группировке предприятий, например, по уровню рентабельности.
Пример. Далее на примере данных приведенных в табл. 5.1. произведем аналитическую группировку совокупности, включающей 30 банков.
Таблица 5.1 ‑ Совокупность 30 банков Российской Федерации
(на 01.01.19 г., цифры условные)
Номер банка | Капитал, млн. руб. | Активы, млн. руб. | |
1 | 2 | 3 | 4 |
1 | 207,7 | 2,48 | 1,14 |
2 | 200,3 | 2,40 | 1,10 |
3 | 190,2 | 2,28 | 1,05 |
4 | 323,2 | 3,88 | 1,88 |
5 | 247,1 | 2,96 | 1,36 |
6 | 177,7 | 2,12 | 0,97 |
7 | 242,5 | 2,90 | 1,33 |
8 | 182,9 | 2,18 | 0,99 |
9 | 315,6 | 3,78 | 1,73 |
10 | 183,2 | 2,20 | 1,01 |
11 | 320,2 | 3,84 | 1,76 |
12 | 207,3 | 2,48 | 1,14 |
13 | 181,0 | 2,17 | 0,99 |
14 | 172,4 | 2,06 | 0,94 |
15 | 234,3 | 2,81 | 1,29 |
16 | 189,5 | 2,27 | 1,04 |
17 | 187,8 | 2,24 | 1,03 |
18 | 166,9 | 1,99 | 0,91 |
19 | 157,7 | 1,88 | 0,86 |
20 | 168,3 | 2,02 | 0,93 |
21 | 224,4 | 2,69 | 1,23 |
22 | 166,5 | 1,99 | 0,91 |
23 | 198,5 | 2,38 | 1,09 |
24 | 240,4 | 2,88 | 1,32 |
25 | 229,3 | 2,75 | 1,26 |
26 | 175,2 | 2,10 | 0,96 |
27 | 156,0 | 1,87 | 0,86 |
28 | 160,1 | 1,92 | 0,88 |
29 | 178,7 | 2,14 | 0,98 |
30 | 171,6 | 2,05 | 0,94 |
По данным табл.5.1 группировочным (факторным) признаком является капитал, результативным – прибыль. Группировку производим по факторному признаку. Зададим количество групп (условно) – 4, а величину интервала определим по формуле (5.3).
Обозначим границы групп:
1-я группа – 156,0-197,8;
2-я группа – 197,8-239,6;
3-я группа – 239,6-281,4;
4-я группа – 281,4-323,2.
После того, как определен группировочный признак – капитал, задано число групп – 4 и образованы сами группы, необходимо отобрать показатели, которые характеризуют группы, и определить их величины по каждой группе.
Далее показатели, характеризующие банки, разносятся по четырем указанным группам и подсчитываются групповые итоги. Результаты группировки заносятся в таблицу и определяются общие итоги по совокупности единиц наблюдения по каждому показателю.
Таблица 5.2 ‑ Группировка коммерческих банков по величине капитала
Источник