Статистика: Тема 3. Класифікації та групування
3.
Тема 3. Класифікації та групування
3.1.
Класифікація і групування як метод обробки і аналізу первинної статистичної інформації
У практичній статистиці широко застосовується метод класифікацій і групувань. Класифікація - це систематичний розподіл явищ і об'єктів за певними групами, класами, розрядами на підставі їх подібності та відмінності [ література : 10]. Використовують класифікації: галузеву; професійну; основних фондів; капітальних вкладень; будівельних машин. У статистиці зовнішньої торгівлі використовується «Товарна номенклатура зовнішньоекономічної діяльності». В умовах виникнення нових форм господарювання починають використовуватися класифікатори форм власності, організаційно-правових форм суб'єктів господарювання.
Для подальшої обробки зібраних в ході статистичного спостереження первинних даних широко використовують і метод угруповання.
Угруповання - це розподіл безлічі одиниць досліджуваної сукупності по групах відповідно до істотним для даної групи ознакою. Метод угруповання дозволяє забезпечувати первинне узагальнення даних, подання їх в більш впорядкованому вигляді. Завдяки угрупованню можна співвіднести зведені показники за сукупністю в цілому зі зведеними показниками по групах. З'являється можливість порівнювати, аналізувати причини відмінностей між групами, вивчати взаємозв'язку між ознаками. Угруповання дозволяє робити висновок про структуру сукупності і про роль окремих груп цієї сукупності. Саме угруповання формує основу для подальшої зведення та аналізу даних.
Ознаки, за якими проводиться угруповання, називають группіровочнихознак. Группіровочний ознака іноді називають підставою угруповання. Правильний вибір істотного группировочного ознаки дає можливість зробити науково обґрунтовані висновки за результатами статистичного дослідження. Группіровочние ознаки можуть мати як кількісне вираження (обсяг, дохід, курс валюти, вік і т.д.), так і якісне (форма власності підприємства, стать людини, галузева приналежність, сімейний стан і т.д.).
При визначенні числа груп, як правило, враховуються завдання дослідження, обсяг сукупності і види ознак, які беруться в якості підстави угруповання. Наприклад, за кількісною ознакою вік населення може бути розбитий на найрізноманітніші групи. Їх число буде залежати від поставлених завдань. Наприклад, це можуть бути групи за віком працездатного населення; економічно активного населення і т.д.
Якщо береться, припустимо, такий якісний ознака, як освіта, то груп буде рівно стільки, скільки існує ступенів або профілів освіти. В освіті сходами груп буде шість (неповну середню; середнє; неповне середню спеціальну; спеціальну середню; неповна вища; вища). За профілем освіти кількість груп може збігатися або з числом професійних груп, або з числом сфер освіти (гуманітарна; інженерно-технічне; природничо).
3.2.
Основні прийоми побудови і виконання угруповань
Якщо для побудови угруповання використовується тільки одна ознака, то таке угруповання називаються простий, якщо угруповання проводиться за кількома ознаками, її називають складною. Складна угруповання буває або комбінаційна, або багатовимірна.
Комбінаційна угруповання виконується послідовно: групи, виділені за однією ознакою, потім виділяються в підгрупи за іншою ознакою, які, в свою чергу, можуть виділятися за наступним іншою ознакою. У цьому випадку число груп буде дорівнює добутку числа виділених груп на число группіровочнихознак. Процедура визначення оптимального числа груп заснована на застосуванні формули Стерджесса
(3.1)
де n - число груп; N - число одиниць сукупності.
З формули видно, що вибір числа груп залежить від обсягу сукупності. Якщо груп виявляється багато і вони включають мале число одиниць, то групові показники можуть стати ненадійними. Тому альтернативою комбінаційної угруповання є багатовимірна угруповання, яке здійснюється за комплексом ознак одночасно. Її застосування вимагає використання електронної обчислювальної техніки. За допомогою спеціально розроблених електронних програм формуються однорідні групи на підставі близькості з усього комплексу ознак.
Визначення числа груп тісно пов'язане з поняттям величина інтервалу: чим більше число груп, тим менше величина інтервалу, і навпаки. Інтервал - різниця між максимальним і мінімальним значеннями ознаки в кожній групі. Він визначає кількісні межі груп, що для статистичної практики має велике значення, особливо коли потрібно утворити якісно однорідні групи. Наприклад, досліджується сукупність підприємств по виконанню колективних договорів. Тут не можна об'єднувати підприємства, які не виконали зобов'язання, і ті, які їх перевиконали. Показник тут - величина інтервалу.
Іншим прикладом є неможливість утворювати групу 95 - 105%, оскільки це різні частини сукупності. Слід утворити дві групи: 95 - 100% і 101 - 105%. В цьому випадку кордону, за якими розрізняються сукупності, абсолютно дотримуються.
Кожен інтервал має нижню (найменше значення ознаки) і верхню (найбільше значення ознаки) кордону або одну з них. Тому величина інтервалу є різниця між верхньою і нижньою межами інтервалу. Якщо у інтервалу вказана лише одна межа (у першого - верхня, у останнього - нижня), то мова йде про відкритих інтервалах. Якщо у інтервалу є і нижня, і верхня кордону, то мова йде про закритих інтервалах. Закриті інтервали поділяються на рівні і нерівні (прогресивно зростаючі, прогресивно убутні), а також спеціалізовані та довільні.
угруповання з рівними інтервалами будують тоді, коли досліджуються кількісні відмінності у величині ознаки всередині груп однакової якості, а також якщо розподіл носить більш-менш рівномірний характер. Якщо можна заздалегідь встановити певну кількість груп, то величину рівного інтервалу можна обчислити за формулою
(3.2)
де i - величина рівного інтервалу; xmax, xmin - найбільше і найменше значення ознаки; n - число груп.
Якщо не потрібно попереднього встановлення числа груп, то використовується інший спосіб визначення величини рівного інтервалу - за формулою Стерджесса
(3.3)
де n - число спостережень.
Якщо величина рівного інтервалу розраховується за цією формулою, то слід знаменник попередньо округлити до цілого числа (як правило, завжди більшого), так як кількість груп не може бути дробовим числом.
У статистичній практиці частіше застосовуються нерівні інтервали (поступово зростаючі або поступово убувають). При цьому досліджувана сукупність ділиться на групи приблизно рівного заповнення з великим числом одиниць. Нерівні інтервали можуть використовуватися, наприклад, в таких випадках:
а) при дослідженні угруповання із застосуванням декількох ознак, що дають можливість скласти кілька підгруп, де потрібні вже і довші і більш короткі інтервали;
б) при утворенні великих груп з новою якістю на базі дрібних груп за умови збереження їх однорідності, що призводить до збільшення інтервалів.
У статистичній практиці використовуються також спеціалізовані інтервали. Інтервали називають спеціалізованими, якщо мова йде про встановлення меж інтервалу в групах, схожих за типом і за ознакою, але мають відношення, скажімо, до різних галузей виробництва.
3.3.
Види угруповань. статистична таблиця
Види угруповань залежать від цілей і завдань, які вони виконують. За допомогою методу статистичних угруповань виділяють якісно однорідні сукупності, вивчають структури сукупності і зміни, що відбуваються в них, а також вирішують завдання по дослідженню існуючих зв'язків і залежностей.
З певною мірою умовності для виконання цих завдань угруповання відповідно ділять на типологічні, структурні і аналітичні.
Метод типологічної угруповання полягає в виявленні в якісно різнорідної сукупності однорідних груп. При цьому дуже важливо правильно відібрати группіровочний ознака, який допоможе ідентифікувати обраний тип. Типологічні угруповання широко застосовуються в дослідженні соціально-економічних явищ. Прикладами такого виду угруповань можуть бути групи підприємств за формами власності (табл. 3.1), за формами господарювання, соціальні групи населення і т.д. У типологічних угрупованнях часто використовуються спеціалізовані інтервали.
Таблиця 3.1
Угруповання поліграфічних підприємств
одного з міст Росії
за формами власності
Тип власності Число підприємств абсолютне у відсотках до підсумку Федеральна
акціонерна
приватна
Разом 3
7
5
15 20
46,7
33,3
100,0
Метод структурної угруповання є поділ однорідної сукупності на групи з того чи іншого варьирующему группіровочнихознак. Прикладами такого виду угруповань можуть бути групи населення за статтю, віком, місцем проживання, доходу і т.д., тобто може вирішуватися завдання по вивченню структурного складу тієї чи іншої однорідної сукупності, структурних змін з того чи іншого группіровочнихознак. На основі структурних змін вивчаються закономірності суспільних явищ (табл. 3.2).
Таблиця 3.2
Угруповання населення Росії
за розміром середньодушового доходу
(Умовні цифри)
№ п / п Середньодушовий грошовий дохід, тис. Руб. в місяць Чисельність населення всього, млн. осіб у% до підсумку 1.
2.
3.
4.
5.
6.
7.
8. До 1000
1000-1500
1500-1700
1700-2000
2000-3000
3000-3500
3500-5000
5000 і більше 3,4
22,4
34,5
28,7
21,6
12,6
9,8
15,4 2,3
15,2
23,3
19,4
14,6
8,3
6,6
10,3
Метод аналітичної угруповання полягає в дослідженні взаємозв'язків між факторними ознаками в якісно однорідної сукупності. За допомогою аналітичних угруповань вдається виявляти ознаки, які можуть виступати або причиною, або наслідком того чи іншого явища. В аналітичних угрупованнях найчастіше використовуються нерівні інтервали. Приклад аналітичної угруповання представлений в табл. 3.3.
Таблиця 3.3
Угруповання тривалості договірних зв'язків
книгарні та якості продукції
Тривалість договірних зв'язків магазина з постачальниками, років Число постачальників Частка якісної стандартної книжкової продукції,% абсолютне у% до підсумку До 2 3 14 65 3-5 8 38 69 5-8 6 29 74 Понад 8 4 19 91 Разом 21 100 74,8
Результати группировочного матеріалу оформляються у вигляді таблиць, де він викладається в наочно-раціональній формі. Не всяка таблиця може бути статистичної. Табличні форми календарів, тестових і опитувальних листів, таблиця множення не є статистичними.
Статистична таблиця - це цифрове вираз підсумкової характеристики всієї спостерігається сукупності або її складових частин по одному або декільком істотним ознаками. Статистична таблиця містить два елементи: підмет і присудок.
Підлягає статистичної таблиці є перелік груп або одиниць, складових досліджувану сукупність одиниць спостереження.
Присудок статистичної таблиці - це цифрові показники, за допомогою яких дається характеристика виділених в підлягає груп і одиниць.
Розрізняють прості, групові і комбінаційні таблиці.
В простих таблицях, як правило, міститься довідковий матеріал, де дається перелік груп або одиниць, що складають об'єкт вивчення. При цьому частини підлягає не є групами однакової якості, відсутня систематизація досліджуваних одиниць. Присудок цих таблиць містить абсолютні величини, що відображають обсяги досліджуваних процесів.
групові та комбінаційні таблиці призначені для наукових цілей, де, на відміну від простих таблиць, в присудок - середні і відносні величини на основі абсолютних величин.
Групова таблиця - це таблиця, де статистична сукупність розбивається на окремі групи по якому-небудь одній суттєвій ознаці, при цьому кожна група характеризується рядом показників. Прикладом такого угрупування може бути поділ російських сімей на групи за місцем проживання (сільське і міське), де утворюються підгрупи сімей за кількістю дітей. Аналіз цих угруповань за матеріалами перепису 1989 року дозволив зробити висновок, що більшість сімей, незалежно від приналежності до міського або сільського населення, мають тільки по одній дитині.
Комбінаційна таблиця - це таблиця, де підмет являє собою угруповання одиниць сукупності за двома і більше ознаками, які розподіляються на групи спочатку за однією ознакою, а потім на підгрупи за іншою ознакою всередині кожної з уже виділених груп. Комбінаційна таблиця встановлює істотну зв'язок між факторами угруповання. Прикладом комбінаційної угруповання може бути розподіл поліграфічних підприємств за трьома істотними ознаками: ступеня оснащеності сучасним поліграфічним устаткуванням, ступеня застосування сучасних технологій і рівнем продуктивності праці. Такого роду статистичні таблиці дозволяють здійснити всебічний аналіз, але вони менш наочні.
При складанні таблиць необхідно дотримуватися загальних правил:
таблиця повинна бути легко доступній для огляду;
загальний заголовок повинен коротко висловлювати основний зміст;
наявність рядків «загальних підсумків»;
наявність нумерації рядків, які заповнюються даними;
дотримання правила округлення чисел.