Сводка и группировка статистических данных.

Вторичная группировка

На практике иногда приходится пользоваться уже имеющимися группировками, которые могут быть несопоставимы из-за неодинаковых границ интервалов или различного количества выделяемых групп. Для приведения таких группировок к сопоставимому виду используется метод вторичной группировки.

Вторичная группировка заключается в образовании новых групп на основе ранее произведенной группировки.

Во вторичной группировке применяются два способа образования новых групп:

  • § Первый способ состоит в укреплении первоначальных интервалов. Это наиболее простой и распространенный способ вторичной группировки.
  • § Второй способ называется методом долевой перегруппировки и состоит в том, что за каждой группой закрепляется определенная доля единиц совокупности.

Ряды распределения

Группировка может быть построена на основе ряда распределения. В то же время построение рядов может осуществляться на основе группировки. Всестороннее изучение статистического явления наиболее плодотворно, если в его основе лежит система группировок. Система группировок - это ряд взаимосвязанных статистических группировок по наиболее существенным признакам, всесторонне отражающим важнейшие стороны явления.

Рядом распределения называется упорядоченное распределение единиц совокупности на группы по какому-либо признаку.

Виды рядов распределения:

  • - атрибутивный;
  • - вариационный - дискретный и интервальный.

Иными словами, ряд распределения - результат группировки.

Под атрибутивным рядом понимается ряд распределения по атрибутивному признаку, не имеющему количественной меры. Например, атрибутивный ряд можно составить по признаку «Социальное положение», «Профессия», «Пол» и т.д.

Любой ряд, представленный в табличном виде, состоит из двух колонок. В первой колонке указываются значения изучаемого признака (атрибутивные или количественные). Во второй колонке фиксируется число единиц наблюдения, обладающих данным значением. Таким образом, построение вариационного ряда сводится к определению значения признака в каждой классификационной группе и определению количества элементов, попавших в эту группу.

Каждое индивидуальное значение признака в ряду распределения называется вариантой.

Количество элементов в каждой классификационной группе или количество элементов в совокупности с данной вариантой называется частотой, или, иначе, число единиц наблюдения, содержащееся в каждой отдельной группе, принято называть частотой ряда распределения.

Удельный вес данной группы в совокупности называется частостью. Частость или структура, показывает долю совокупности данной классификационной группы.

Частость - отношение частоты к общему количеству исследуемых элементов, то есть объему совокупности.

Частоту обозначим n или f , частость - p или j.

Пример дискретного ряда.

Успеваемость в группе студентов-экономистов из 15 человек по одному из предметов.

Группировки, построенные за один и тот же период времени, но для разных объектов или, наоборот, для одного объекта, но за два разных периода времени, могут оказаться несопоставимыми из-за различного числа выделенных групп или неодинаковости границ интервалов.

Вторичная группировка, или перегруппировка сгруппированных данных, применяется для лучшей характеристики изучаемого явления (в случае, когда первоначальная группировка не позволяет четко выявить характер распределения единиц совокупности), либо для приведения к сопоставимому виду группировок в целях проведения сравнительного анализа.

Вторичная группировка - это операция по образованию новых групп на основе ранее осуществленной группировки.

Применяют два способа образования новых групп. Первым, наиболее простым и распространенным способом является изменение (чаще укрупнение) первоначальных интервалов. Второй способ получил название долевой перегруппировки. Он состоит в образовании новых групп на основе закрепления за каждой группой определенной доли единиц совокупности. Проиллюстрируем методику вторичной группировки на примере (табл. 3.14).

Таблица 3.14. Распределение предприятий розничной торговли одного из городов Московской области по среднегодовой численности работников в 2011 г.*

* Данные условные.

Произведем перегруппировку данных, образовав новые группы с интервалами до 5, 5-10, 10-20, 20-30, 30 и более человек.

В первую новую группу войдет полностью первая группа предприятий розничной торговли и часть второй группы. Чтобы образовать группу до пяти человек, необходимо от интервала второй группы взять одного человека. Величина интервала этой группы составляет шесть человек. Следовательно, необходимо взять от нее 1/6 часть. Аналогичную же часть во вновь образуемую первую группу надо взять и от числа предприятий, т.е. 20 -= 3 предприятия. 6

Тогда в первой группе предприятий розничной торговли будет 16 + 3 = 19 ед.

Вторую новую группу образуют предприятия розничной торговли второй группы за вычетом отнесенных к первой, т.е. 20 - 3 = 17 предприятий. Во вновь образованную третью группу войдут все предприятия третьей группы и часть предприятий четвертой. Для определения этой части от интервала 18 30 (ширина интервала равна 12) нужно добавить к предыдущему 2,0 (чтобы верхняя граница интервала была равна 20 человек). Следовательно, необходимо взять часть интервала, равную 2/12 = 1/6. В этой группе 74 предприятия, значит надо взять 74 (1/6) = 12 предприятий. В новую третью группу войдут 44 + 12 = 56 предприятий.

Во вновь образованную четвертую группу войдут 74 - 12 = = 62 предприятия, оставшиеся от прежней четвертой группы. Пятую вновь образованную группу составят предприятия розничной торговли пятой и шестой прежних групп: 37 + 9 = 46 предприятий.

В результате получим новые группы (табл. 3.15).

Таблица 3.15. Распределение предприятий розничной торговли одного из городов Московской области по среднегодовой численности работников в 2011 г. после перегруппировки данных*

* Данные условные.

Статистическая таблица: сущность, элементы и классификация

Статистическая таблица - наиболее рациональная, наглядная и компактная форма представления статистического материала, в том числе результатов статистической группировки. Однако не всякая таблица является статистической. Таблица умножения, опросный лист социологического обследования могут носить табличную форму, но еще не являются статистическими таблицами.

Статистическая таблица - это таблица, которая содержит сводную числовую характеристику исследуемой совокупности по одному или нескольким существенным признакам, взаимосвязанным логикой экономического анализа.

Основные элементы статистической таблицы, составляющие ее остов (основу), показаны на схеме 3.1.

Табличной называется такая форма расположения числовой информации, при которой число располагается на пересечении четко сформулированного заголовка по вертикальному столбцу, называемому графой, и названия по соответствующей горизонтальной полосе - строке. Таким образом, внешне таблица представляет собой пересечение граф и строк, которые формируют остов таблицы.

Статистическая таблица содержит три вида заголовков: общий, верхние и боковые. Общий заголовок отражает содержание всей таблицы (к какому месту и времени она относится), располагается над макетом таблицы по центру и является внешним заголовком. Верхние заголовки характеризуют содержание граф (заголовки сказуемого), а боковые (заголовки подлежащего) - строк. Они служат внутренними заголовками.

Остов таблицы, заполненный заголовками, образует макет таблицы; если на пересечении граф и строк записать цифры, то получается полная статистическая таблица. Название таблицы (общий заголовок)

Схема 3.1. Остов (основа) статистической таблицы

Цифровой материал может быть представлен абсолютными (уставный капитал, объем инновационных товаров и т.д.), относительными (ВВП на душу населения, число персональных компьютеров на 100 работников и т.д.) и средними (средний курс акций, средний надой молока на одну корову и т.д.) величинами.

Таблицы могут сопровождаться примечанием, используемым для пояснения, в случае необходимости, заголовков, методики расчета некоторых показателей, источников информации и т.д.

По логическому содержанию таблица представляет собой "статистическое предложение", основными элементами которого являются подлежащее и сказуемое.

Подлежащим называется объект, который характеризуется цифрами. Это может быть одна или несколько совокупностей, отдельные единицы совокупности в порядке их перечня или сгруппированные по каким-либо признакам, территориальные единицы и т.д. Обычно подлежащее таблицы дается в левой части, в наименовании строк.

Сказуемое образует система показателей, которыми характеризуется объект изучения, т.е. подлежащее таблицы. Сказуемое формирует верхние заголовки и составляет содержание граф с логически последовательным расположением показателей слева направо.

Расположение подлежащего и сказуемого в отдельных случаях может меняться местами для более полного и лучшего способа прочтения и анализа исходной информации об исследуемой совокупности.

По структуре подлежащего, в зависимости от группировки единиц в нем, различают простые и сложные статистические таблицы.

Простой называется статистическая таблица, в подлежащем которой дается перечень объектов или территориальных единиц. Простые статистические таблицы подразделяются на монографические и перечневые.

Монографические таблицы характеризуют не всю совокупность единиц изучаемого объекта, а только одну какую-либо единицу или группу, выделенную по определенному признаку (табл. 3.16).

Таблица 3.16. Ввод в действие объектов социально-культурного назначения в субъектах РФ в 2009 г.

Перечневыми таблицами называются таблицы, подлежащее которых содержит перечень объектов или единиц изучаемого объекта (табл. 3.17).

Сложные статистические таблицы в отличие от простых дают возможность выявить социально-экономические типы изучаемых явлений, их структуру, а также взаимосвязи и взаимозависимости между характеризующими их признаками. Эти задачи более полно могут быть решены с помощью групповых и, особенно, комбинационных таблиц.

Групповыми называют статистические таблицы, подлежащее которых содержит группировку единиц совокупности по одному количественному или атрибутивному признаку.

Простейшим видом групповых таблиц являются ряды распределения. Групповая таблица может быть более сложной, если в сказуемом дополнительно приводится ряд показателей, характеризующих группы подлежащего. Такие таблицы часто используются в целях сопоставления обобщающих показателей по группам (табл. 3.18).

Таблица 3.17. Поступление иностранных инвестиций в экономику РФ но основным странам-инвесторам в 2009 г.

Группа населения по возрасту, лет

Всего

В том числе

мужчины

женщины

Таким образом, групповые таблицы позволяют выявить и охарактеризовать социально-экономические типы явлений, их структуру в зависимости только от одного признака.

Комбинационными называют статистические таблицы, подлежащее которых содержит группировку единиц совокупности одновременно по двум и более признакам: каждая из групп, построенная по одному признаку, разбивается, в свою очередь, на подгруппы по какому-либо другому признаку и т.д. (табл. 3.19).

Таблица 3.19. Группировка построенных квартир в жилом доме по количеству комнат и среднему размеру

Таблица 3.18. Распределение численности занятых в экономике РФ по возрастным группам на конец ноября 2009 г., % к итогу

Подлежащим в таблице являются группы построенных квартир по количеству комнат и их среднему размеру.

Комбинационные таблицы позволяют характеризовать типические группы, выделенные по нескольким признакам, и связь между ними. Последовательность разбиения единиц совокупности на однородные группы по признакам определяется либо важностью одного из них в комбинации, либо порядком их изучения.

В сказуемом статистической таблицы, как уже говорилось, приводятся показатели, которые являются характеристикой изучаемого объекта.

По структуре сказуемого различают простые и сложные статистические таблицы.

При простой разработке сказуемого представленные в нем признаки не пересекаются и итоговые значения получаются путем простого суммирования значений по каждому признаку отдельно, независимо друг от друга. Примером простой разработки сказуемого может служить табл. 3.20.

При сложной разработке сказуемого получается более полная и подробная характеристика объекта. В этом случае оба признака сказуемого (по полу и по возрасту) тесно связаны друг с другом. Можно сначала проанализировать состав Государственной Думы в разрезе фракций

Таблица 3.20.

по возрастным группам, а затем каждую возрастную группу разделить на две подгруппы по полу. Иными словами, при сложной разработке сказуемого явление или объект могут быть охарактеризованы различной комбинацией признаков, формирующих их.

Во всех случаях исследователь при построении статистических таблиц должен руководствоваться оптимальным соотношением показателей сказуемого.

Основные правила построения и анализ статистических таблиц

Статистические таблицы как средство наглядного и компактного представления цифровой информации должны быть статистически правильно оформлены. Существуют следующие основные приемы, определяющие технику формирования статистических таблиц.

  • 1. Цифровой материал необходимо излагать таким образом, чтобы при анализе таблицы сущность явления раскрывалась чтением строк слева направо и сверху вниз.
  • 2. Заголовок таблицы и названия граф и строк должны быть четкими, лаконичными, представлять собой законченное целое, органично вписывающееся в содержание текста. В названии таблицы должны найти отражение объект, признак, время и место совершения события.
  • 3. Информация, располагаемая в столбцах (графах) таблицы, завершается итоговой строкой.
  • 4. Если названия отдельных граф повторяются между собой, содержат повторяющиеся термины или несут единую смысловую нагрузку, то необходимо им присвоить объединяющий заголовок.
  • 5. Графы и строки полезно нумеровать. Графы слева, заполненные названием строк, принято обозначать заглавными буквами алфавита (А), (Б) и т.д., а все последующие графы - номерами в порядке возрастания.
  • 6. Взаимосвязанные данные, характеризующие одну из сторон анализируемого явления, целесообразно располагать в соседних друг с другом графах.
  • 7. Графы и строки должны содержать единицы измерения, соответствующие поставленным в подлежащем и сказуемом показателям. При этом используются общепринятые сокращения единиц измерения (руб., кВт ч и т.д.).
  • 8. Числа целесообразнее по возможности округлять. Округление чисел в пределах одной и той же графы или строки следует проводить с одинаковой степенью точности.
  • 9. В случае необходимости дополнительной информации (разъяснений к таблице) могут даваться примечания.

Соблюдение приведенных правил построения и оформления статистических таблиц делает их основным средством представления, обработки и обобщения статистической информации о состоянии и развитии анализируемых социально-экономических явлений.

Анализ статистических таблиц проводится в двух направлениях: структурный и содержательный.

Структурный анализ предполагает разбор строения таблицы и характеристику:

  • совокупности и единиц наблюдения, формирующих ее;
  • признаков и их комбинаций, формирующих подлежащее и сказуемое таблицы;
  • вида таблицы;
  • решаемых задач.
  • анализ отдельных групп подлежащего по соответствующим признакам сказуемого;
  • выявление соотношений и пропорций между группами явлений по признакам;
  • сравнительный анализ и формулировку выводов, установление закономерностей и определение резервов развития изучаемого объекта.

Анализ отдельных признаков и групп необходимо начинать с изучения абсолютных величин, затем - связанных с ними относительных величин.

Если этого требуют задачи исследования, то анализ таблиц может быть дополнен расчетными относительными и средними величинами, графиками, диаграммами и т.д.

Анализ данных таблиц производится по каждому признаку в отдельности, а затем в логико-экономическом сочетании признаков.

Соблюдение правил и последовательности работы со статистическими таблицами позволит исследователю осуществить комплексный научно обоснованный экономико-статистический анализ изучаемых объектов и процессов.

Группировка данных производится в соответствии с программой сводки для того, чтобы впоследствии представить полученную информацию доступно для восприятия.

Группировка — объединение единиц совокупности в некоторые группы, имеющие свои характерные особенности, общие черты и сходные размеры изучаемого признака.

Результаты группировки оформляются в виде группировочных таблиц , делающих информацию обозримой. Таблица содержит сводную числовую характеристику исследуемой совокупности по одному или нескольким существенным признакам, взаимосвязанным логикой анализа.

Пример 5.2. Основа группировочной таблицы

Название таблицы (общий заголовок)

Группировочная таблица содержит три вида заголовков: общий, верхний и боковые. Заголовки таблиц должны быть краткими и раскрывать содержание показателей.

Общий заголовок отражает содержание всей таблицы с указанием, к какому месту и времени она относится. Он располагается над макетом по центру и является внешним заголовком. Верхние заголовки характеризуют содержание граф (заголовки сказуемого), а боковые (заголовки подлежащего) — строк. Подлежащее статистической таблицы — объект, характеризующийся цифрами. Сказуемое — система показателей, которыми характеризуется объект изучения, т.е. подлежащее. Следует избегать появления клеток, в которых не может быть исходных данных. В клетках, где отсутствуют данные по причине неполноты исходной информации, делают специальные пометки.

Пример 5.3. Пример группировочной таблицы

Отношение студентов факультета ГиСЭО к понижению размера стипендии (по результатам исследования в январе 1999 г.)

Таким образом, группировка — это разделение единиц совокупности на группы по выбранным варьирующим признакам.

Группировки различают по:

Задачам систематизации данных;

Числу группировочных признаков;

Используемой информации.

По задачам систематизации данных различают: типологические, структурные и аналитические.

Типологические группировки предназначены для выявления качественно однородных групп совокупностей, т.е. объектов, близких друг к другу одновременно по всем группировочным признакам. Например, группировка предприятий города по формам собственности. Типологическая группировка разбивает разнородную совокупность единиц наблюдения на качественно однородные группы (классы, типы явлений). При ее построении в качестве группировочных признаков могут использоваться количественные и атрибутивные признаки.

Структурные группировки— это разделение однородной совокупности на группы, характеризующие ее структуру по определенному группировочному признаку. Например, группировка рабочих цеха по квалификации. Другим примером структурной группировки является группировка отраслей экономики в топливно-энергетическую, нефтехимию, аграрно-промышленный комплекс, горнодобывающую, телекоммуникационную, транспортную, металлургию, оборонные отрасли и т.п. По своей природе структурная группировка является также достаточно общей, хотя в отдельных случаях по общности она и уступает типологическим группировкам.

Аналитические группировки предназначены для выявления зависимости между признаками. Строят аналитические группировки, выделив результирующие признаки, т.е. признаки, которые изменяются под влиянием факторных признаков, и факторные признаки, т.е. те, зависимость результирующих признаков от которых исследуется. Аналитическая группировка отличается следующими особенностями: единицы совокупности группируются по факторному признаку; каждая выделенная группа характеризуется средними значениями результативного признака, по изменению величины которых определяется наличие связи и зависимостей между признаками. Каждая выделенная группа должна содержать статистически однородные единицы совокупности по группировочному признаку. Количество единиц в каждой выделенной группе должно быть достаточным для получения надежных статистических характеристик исследуемого явления или процесса.

По используемой информации различают первичные и вторичные группировки.

Первичные группировки производятся на основе исходных данных, полученных в результате статистических наблюдений.

Вторичные группировки — результат объединения или расщепления первичных группировок, они позволяют преодолевать несопоставимость исходных данных в первичных группировках и тем самым объединять их в одну общую и выполнять сравнение, сопоставление данных, представленных в них после проведения вторичной группировки.

При разработке первичной группировки существенное значение имеет выбор числа групп . Число групп зависит от типа признака, положенного в основу группировки (основания группировки), от объема совокупности, степени вариации признака.

При построении группировок по качественному признаку количество групп соответствует количеству уровней градации признака. При группировании по количественному признаку все множество значений признака делится на интервалы. При этом возможно два подхода: группировка с равными и неравными интервалами.

Для определения этих параметров в первом случае рекомендуется формула Стерджесса:

n = 1 + (3,322× lgN) , (5.1)

где N — количество наблюдений.

В этом случае величина интервала:

I = (Хmax - Xmin)/n . (5.2)

Основные этапы построения статистических группировок включают:

Выбор группировочного признака;

Определение необходимого числа групп, на которые следует разбить изучаемую совокупность;

Установление границ интервалов группировки;

Установление для каждой группировки показателей или их системы, которыми должны характеризоваться выделенные группы.

Группировка с неравными интервалами порождает массу проблем при обработке данных, поэтому следует, по мере возможности, избегать таких группировок.

Вопросы для самопроверки:

Что такое сводка?

Что представляет собой группировка данных?

Какие вы знаете виды группировок?

В чем особенности каждого вида группировки?

Какова связь между группировкой, таблицей и сводкой?

В чем особенность сложных многомерных группировок?

Что означает вторичная группировка?

Для чего нужна вторичная группировка?

Группировки различают:

  1. Первичные , составленные на основе первичного материала собранного при наблюдениях.
  2. Вторичные , составленные на основе первичных, используется в двух случаях:
    • когда необходимо мелкие формальные группы, переформировать, в более крупные;
    • когда надо дать сравнительную оценку материалов собранных в разных местах и по различным методикам.
Группировка, составленная по двум или более признакам, называется – комбинационной .
Признак, по которому происходит выделение групп или типов явлений, называется группировочным или основанием группировки . Основание может быть количественным или атрибутивным. Атрибутивный – это признак, имеющий наименование, (например профессия: швея, учитель и т.д.).

Пример №1 . Имеются следующие данные о распределении торговых фирм по численности работников двух регионов.


Постройте вторичную группировку данных о распределении фирм, пересчитав данные региона 1 в соответствии с группировкой региона 2. В каком регионе средняя численность работников больше?

Решение:
В первую группу «Менее 5» войдет 4/5 от группы «1-5». Тогда число фирм составит: 6*4/5 = 4,8 ≈ 5.
В группу «5-10» полностью входит группа «6-10» и часть группы «1-5», т.е. число фирма будет равно 4 + (6-5) = 5
В группу «11-20» полностью войдет группа «11-15» и часть группы «16-20», а именно ¼*50 = 12,5 ≈ 13.
В группу «21 -30» полностью входит группа «16-20» и группа «21-25», а группа «более 25». Получаем: (50-13) + 20 + 15 = 72


Находим среднюю численность работников:
Для первого региона.

Средняя взвешенная: x ср = 1960/105 = 18,67

Для второго региона.


Средняя взвешенная: x ср = 3502,5/117 = 29,94
Таким образом, во втором регионе средняя численность работников больше.

Пример №2 .
Распределение рабочих по стажу работы

№ группы Группы рабочих по стажу, лет Число рабочих, чел. Число рабочих в процентах к итогу
I 2-6 6 30,0
II 6-10 6 30,0
III 10-14 5 25,0
IV 14-18 3 15,0
ИТОГО 20 100,0

В ряду распределения, для наглядности, изучаемый признак исчисляют в процентах. Результаты первичной группировки показали, что 60,0% рабочих имеют стаж до 10 лет, причем поровну от 2-6 лет – 30% и от 6-10 лет – 30%, а 40% рабочих имеют стаж от 10 до 18 лет.
Для изучения зависимости между стажем работы и выработкой необходимо построить аналитическую группировку. В основании ее возьмем те же группы, что в ряду распределения. Результаты группировки представим в таблице 2.

Таблица 2 - Группировка рабочих по стажу работы

№ группы Группы рабочих по стажу лет Число рабочих, чел. Средний стаж работы, лет Выработка продукции, руб.
Всего На одного раб.
I 2-6 6 3,25 1335,0 222,5
II 6-10 6 7,26 1613,0 268,8
III 10-14 5 11,95 1351,0 270,2
IV 14-18 3 16,5 965,0 321,6
ИТОГО: 20 8,62 5264 236

Для заполнения таблицы 2. необходимо составить рабочею таблицу 3.

Таблица 3.

№ п/п Группы рабочих по стажу, лет Номер рабочего Стаж Выработка в руб.
1 2 3 4 5
1 2-6 1, 2, 3, 4, 2,0; 2,3; 3,0; 5,0; 4,5; 2,7 205, 200, 205, 250, 225, 250
Итого по группе: 6 19,5 1335
2 6-10 5, 6, 8, 13, 17, 19 6,2; 8,0; 6,9; 7,0; 9,0; 6,5 208, 290, 270, 250, 270, 253
Итого по группе 6 43,6 1613
3 10-14 9, 12, 15, 16, 18 12,5; 13,0; 11,0; 10,5; 12,8 230, 300, 287, 276, 258
Итого по группе 5 59,8 1351
4 14-18 11, 20, 14 16, 18, 15,5 295, 320, 350
Итого по группе 3 49,5 965
Всего 20 172.4 5264,0

Разделив графы (4:3); (5:3) табл. 3 получим соответствующие данные для заполнения таблицы 2. Итак далее по всем группам. Заполнив таблицу 2. получим аналитическую таблицу.
Рассчитав рабочую таблицу сверяем итоговые результаты таблицы с данными условия задачи, они должны совпадать. Таким образом, кроме построения группировок, нахождения средних величин, проверим еще арифметический контроль.
Анализируя аналитическую таблицу 2, можно сделать вывод о том, что и изучаемые признаки (показатели) зависят друг от друга. С ростом стажа работы постоянно увеличивается выработка продукции на одного рабочего. Выработка рабочих четвертой группы на 99,1 руб. выше, чем первой или на 44,5 % мы рассмотрели пример группировки по одному признаку. Но в ряде случаев для решения поставленных задач такая группировка является недостаточной. В таких случаях переходят к группировке по двум или более признакам, т.е. к комбинационной. Произведем вторичную группировку данных по средней выработке продукции.
Каждую группу охарактеризуем числом рабочих, средним стажем работы, средней выработкой – всего и на одного рабочего расчеты представлены в таблице 4.

Таблица 4 - Группировка рабочих по стажу и средней выработке продукции

№ п/п Группы рабочих Число раб., чел. Сред. стаж работы, лет Средняя выработка прод., руб.
по стажу по средней выраб. прод. в руб. всего на одного раб.
1 2-6 200,0-250,0 4 2,5 835,0 208,75
Итого по группе 6 3,25 1335,0 222,5
2 6-10 200,0-250,0 - - - -
3 10-14 200,0-250,0 1 12,5 230,0 230,0
Итого по группе 5 11,96 1351,0 270,2
4 14-18 200,0-250,0 - - - -
Итого по группе 3 16,5 965,0 321,6
Итого по группам 200,0-250,0 5 3,0 1065,0 213,0
Всего 20 8,62 5264 263,2

Для построения вторичной аналитической группировки по средней выработке продукции в пределах первоначально созданных групп, определим интервал вторичной группировки, выделив при этом три группы, т.е. на одну меньше чем в первоначальной группировке.
Тогда, i=(350-200)/3 = 50 руб.
Больше групп брать нет смысла, будет очень маленький интервал, меньше можно. Итоговые данные по группе рассчитываются как сумма стажа по группе, направить по первой 19, 5 лет делится на число рабочих – 6 человек, получим 3,25 года.
Данные таблицы показывают, что выработка продукции находится в прямой зависимости от стажа работы.

Иногда первоначальная группировка не позволяет четко выявить характер распределения единиц совокупности, либо для приведения к сопоставимому виду группировок с целью проведения сравнительного анализа, необходимо имеющуюся группировку несколько изменить: объединить ранее выделенные относительно мелкие группы в небольшое число более крупных типичных групп или изменить границы прежних групп, с тем чтобы сделать группировку сопоставимой с другими.

Аналитическая группировка

Аналитические – такие группировки, которые применяются для исследования взаимосвязей между явлениями. Для проведения аналитической группировки нужно определить факторный и результативный признак.

Факторные – это те признаки, которые оказывают влияние на другие связанные с ними признаки.

Результативные – это признаки, которые изменяются под влиянием факторных.

Аналитические группировки позволяют изучить многообразие связей и зависимостей между варьирующими признаками. Чтобы исследовать взаимосвязь между признаками, производится группировка единиц совокупности по факторному признаку. В каждой группе вычисляется среднее значение результативного признака. Изменение признака от группы к группе под влиянием факторного будет говорить о наличии или отсутствии связи между факторами.


Группировки, построенные за один и тот же период времени, но для разных регионов или, наоборот, для одного региона, но за два разных периода, могут оказаться несопоставимыми из-за различного числа групп или неодинаковости границ интервалов. Для того, чтобы привести такие группировки к сопоставимому виду (это позволяет провести их сравнительный анализ), используется метод вторичной группировки.

Вторичная группировка – операция по образованию новых групп на основе ранее осуществленной группировки.

Применяют два способа образования новых групп. Первым, наиболее простым и распространенным способом является объединение первоначальных интервалов. Он используется в случае перехода от мелких к более крупным интервалам и когда границы новых и старых интервалов совпадают. Второй способ получил название долевой перегруппировки и состоит в образовании новых групп на основе закрепления за каждой группой определенной доли единиц совокупности. Этот способ употребляется, когда необходимо в ходе перегруппировки данных определить, какая часть (доля) единиц совокупности перейдет из старых групп в новые.

Рассмотрим первый способ проведения вторичной группировки.

Пример1 Пусть даны две группировки кредитов по сроку выдачи за ноябрь и декабрь (таблица 3.1, таблица 3.2).

Таблица 3.1руппировка кредитов коммерческих банков по сроку выдачи, ноябрь 2011 г. (данные условные)



Таблица 3.2 – Группировка кредитов коммерческих банков по сроку выдачи, декабрь 2011г. (данные условные)

Для удобства сравнения группировки ноябрьских и декабрьских кредитов произведем вторичную группировку ноябрьских кредитов, приняв за основу группировку декабрьских кредитов. Составим таблицу 3.3.

Таблица 3.3 – Группировка кредитов коммерческих банков по сроку выдачи, ноябрь-декабрь 2011 г. (данные условные)

Теперь можно сравнить группировки ноябрьских и декабрьских кредитов. Доля заключенных договоров по краткосрочным кредитам снизилась почти на 11 процентных пунктов, доля среднесрочных кредитов осталась без изменения, а количество долгосрочных кредитов в анализируемом периоде значительно выросло. Несмотря на эти изменения, в декабре так же, как и в ноябре, в структуре суммы выданных кредитов преобладающую долю занимали краткосрочные кредиты, затем следовали среднесрочные, а на последнем месте – долгосрочные кредиты. Для решения данного примера использовали метод объединения первоначальных интервалов.

Пример2 Имеются данные о структуре колхозов по числу дворов. Исходные данные не позволяют произвести сравнительный анализ структуры, так как в разных районах имеется разное число групп.

Структура колхозов по числу дворов

1 район 2 район
№ группы Уд. вес колхозов, % № группы Группы колхозов по числу дворов Уд. вес колхозов, %
До 100 4,3 До 50 1,0
100-200 18,3 50-70 1,0
200-300 19,5 70-100 2,0
300-500 28,2 100-150 10,0
свыше 500 29,7 150-250 18,0
250-400 21,0
400-500 23,0
свыше 500 24,0
ИТОГО 100,0 100,0

Проведем вторичную группировку колхозов второго района, приняв за основу группировку первого района, используя метод долевой перегруппировки (таблица 3.5).Таблица 3.5 – Вторичная группировка

Поясним расчеты. В первую, вновь образованную группу колхозов второго района с числом дворов до 100 войдут первые три группы колхозов, удельный вес которых равен 4% (1+1+2).Теперь надо образовать вторую группу колхозов с числом дворов от 100 до 200. В нее входит четвертая группа колхозов с числом дворов от 100 до 150, составляющая 10% общего числа колхозов, а также часть пятой группы, из которой должны перейти 50 дворов. Для определения числа колхозов, которые надо взять из пятой группы во вновь образованную, условно принимается, что оно должно быть пропорционально удельному весу отобранных дворов. Удельный вес 50 дворов в пятой группе равен: , или 50%.

Следовательно, в новую группу надо взять половину колхозов из пятой группы: .

Таким образом, удельный вес колхозов новой группы с числом дворов 100–200 составит 19% (10+9).

При формировании группы колхозов с числом дворов 200 – 300 видно, что в нее войдет часть пятой группы с удельным весом колхозов 9% и часть шестой группы, из которой надо добавить в третью группу 50 дворов, пропорционально которым должно быть отобрано из этой группы 7% колхозов: .Тогда группа колхозов с числом дворов 200–300 составит 16% (9+7).

Аналогично производится расчет при образовании других групп. Если наряду с удельными весами имеются абсолютные значения показателей по группам, то все расчеты показателей по вновь образованным группам ведутся в тех же соотношениях, что и численность распределения единиц. Таким образом, сравнивая оба района по числу дворов в колхозах, видно, что во втором районе оно было более дифференцировано, чем в первом районе.