Ноу Інти, лекція, зведення і групування статистичних даних

3.3. Ряди розподілу: види, правила побудови, графічне зображення

Результати угруповання зібраних статистичних даних, як правило, подаються у вигляді рядів розподілу. Ряд розподілу - це впорядкований розподіл одиниць сукупності на групи по досліджуваному ознакою.

Ряди розподілу діляться на атрибутивні та варіаційні, в залежності від ознаки, покладеної в основу угруповання. Якщо ознака якісний, то ряд розподілу називається атрибутивною. Прикладом атрибутивного ряду є розподіл підприємств і організацій за формами власності (див. Табл. 3.1).

Якщо ознака, по якому будується ряд розподілу, кількісний, то ряд називається варіаційним.

Варіаційний ряд розподілу завжди складається з двох частин: варіант і відповідних їм частот (або частостей). Варіант називається значення. яке може приймати ознака у одиниць сукупності, частотою - кількість одиниць спостереження, що володіють даним значенням ознаки. Сума частот завжди дорівнює обсягу сукупності. Іноді замість частот розраховують частости - це частоти, виражені або в частках одиниці (тоді сума всіх частостей дорівнює 1), або у відсотках до обсягу сукупності (сума частостей буде дорівнює 100%).

Варіаційні ряди бувають дискретними і інтервальними. У дискретних рядів (табл. 3.7) варіанти виражені конкретними числами, найчастіше цілими.

Таблиця 3.8. Розподіл працівників за часом роботи в страховій компанії

Час роботи в компанії, повних років (варіанти)

В інтервальних рядах (див. Табл. 3.2) значення показника задаються у вигляді інтервалів. Інтервали мають два кордони: нижню і верхню. Інтервали можуть бути відкритими і закритими. У відкритих немає однієї з меж, так, в табл. 3.2 у першого інтервалу немає нижньої межі, а у останнього - верхньої. При побудові інтервального ряду в залежності від характеру розкиду значень ознаки використовують як рівні інтервальні проміжки, так і нерівні (в табл. 3.2 представлений варіаційний ряд з рівними інтервалами).

Якщо ознака приймає обмежена кількість значень, зазвичай не більше 10, будують дискретні ряди розподілу. Якщо варіант більше, то дискретний ряд втрачає свою наочність; в цьому випадку доцільно використовувати интервальную форму варіаційного ряду. При безперервної варіації ознаки, коли його значення в певних межах відрізняються один від одного на як завгодно малу величину, також будують інтервальний ряд розподілу.

3.3.1. Побудова дискретних варіаційних рядів

Розглянемо методику побудови дискретних варіаційних рядів на прикладі.

Приклад 3.2. Є такі дані про кількісний склад 60 сімей:

2 3 3 1 4 2 3 3 1 5 2 4 3 2 2 1 2 3 4 5

2 2 1 3 4 3 3 3 6 6 3 3 6 1 3 4 3 4 4 5

3 3 2 2 1 3 2 5 5 2 4 3 6 1 2 2 3 1 3 4

Для того щоб отримати уявлення про розподіл сімей за кількістю їх членів, слід побудувати варіаційний ряд. Оскільки ознака приймає обмежена кількість цілих значень будуємо дискретний варіаційний ряд. Для цього спочатку рекомендується виписати всі значення ознаки (число членів в сім'ї) в порядку зростання (тобто провести ранжування статистичних даних):

1 1 1 1 1 1 1 1 2 2 2 2 2 2 2 2 2 2 2 2

2 2 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3

Для нашого прикладу

Інтервали варіаційного ряду наочні, якщо їх межі мають "круглі" значення, тому округлимо величину інтервалу 1,9 до 2, а мінімальне значення ознаки 12,3 до 12,0.

  • Визначимо межі інтервалів.

    Інтервали, як правило, записують таким чином, щоб верхня межа одного інтервалу була одночасно нижньою межею наступного інтервалу. Так, для нашого прикладу отримаємо: 12,0-14,0; 14,0-16,0; 16,0-18,0; 18,0-20,0; 20,0-22,0; 22,0-24,0; 24,0-26,0.

    Подібна запис означає, що ознака безперервний. Якщо ж варіанти ознаки приймають строго певні значення, наприклад, тільки цілі, але їх кількість дуже велика для побудови дискретного ряду, то можна створити інтервальний ряд, де нижня межа інтервалу не співпадатиме з верхньою межею наступного інтервалу (це буде означати, що ознака дискретний ). Наприклад, в розподілі працівників підприємства за віком можна створити такі інтервальні групи років: 18-25, 26-33, 34-41, 42-49, 50-57, 58-65, 66 і більше.

    Крім того, в нашому прикладі ми могли б зробити перший і останній інтервали відкритими, тощо записати: до 14,0; 24,0 і вище.

  • За вихідними даними побудуємо ранжируваних ряд. Для цього запишемо в порядку зростання значення, які приймає ознака. Результати представимо в таблиці:

    Таблиця 3.13. Ранжируваний ряд величин процентної ставки комерційних банків

    Ставка банку% (варіанти)

    При підрахунку частот може виникнути ситуація, коли значення ознаки потрапить на кордон будь-якого інтервалу. В такому випадку можна керуватися правилом: дана одиниця приписується до того інтервалу, для якого її значення є верхньою межею. Так, значення 16,0 у нашому прикладі буде ставитися до другого інтервалу.

    Результати угруповання, отримані в нашому прикладі, оформимо в таблиці.

    Таблиця 3.14. Розподіл комерційних банків за величиною кредитної ставки

    Кількість банків, од. (Частоти)

    В останній графі таблиці представлені накопичені частоти, які отримують шляхом послідовного підсумовування частот, починаючи з першої (наприклад, для першого інтервалу - 5, для другого інтервалу 5 + 9 = 14, для третього інтервалу 5 + 9 + 4 = 18 і т.д .). Накопичена частота, наприклад, 33, показує, що у 33 банків кредитна ставка не перевищує 20% (верхня межа відповідного інтервалу).

    В процесі угруповання даних при побудові варіаційних рядів іноді використовуються нерівні інтервали. Це відноситься до тих випадків, коли значення ознаки підпорядковуються правилу арифметичної або геометричної прогресії або коли застосування формули Стерджесса призводить до появи "порожніх" інтервальних груп, що не містять жодної одиниці спостереження. Тоді межі інтервалів задаються довільно самим дослідником виходячи зі здорового глузду і цілей обстеження або за формулами. Так, для даних, що змінюються в арифметичній прогресії, величина інтервалів обчислюється таким чином:

    де ik - величина обчислюється інтервалу;

    ik - 1 - величина попереднього інтервалу;

    с - константа, на яку відбувається збільшення довжин інтервалів.

    Порядок розрахунків кордонів нерівних інтервалів для даних, що змінюються приблизно в арифметичній прогресії, показаний в табл. 3.15.

    Таблиця 3.15. Схема інтервального варіаційного ряду з нерівними інтервалами для даних, що підкоряються правилу арифметичної прогресії

    с - константа-множник геометричній прогресії.

    Для графічного зображення дискретного варіаційного ряду використовується полігон розподілу: на осі абсцис відкладають значення варіант, а на осі ординат - відповідні їм частоти або частості, отримані точки з'єднують відрізками (утворюється ламана лінія). За даними табл. 3.7 побудуємо полігон розподілу (рис. 3.1).


    Мал. 3.1. полігон розподілу

    Для графічного зображення інтервального ряду використовують гістограму, що має вигляд багатоступінчастої фігури, що складається з прямокутників. По осі абсцис відкладають значення кордонів інтервалів. Самі інтервали будуть підставами прямокутників. Висота прямокутників відповідає частоті або частості інтервалів, які відкладаються по осі ординат.

    За даними таблиці, наведеної в прикладі 3.3, побудуємо гістограму (рис. 3.2).

    При нерівних інтервалах у гістограми розподілу висотами прямокутників будуть показники щільності розподілу, що розраховуються як частка від ділення частоти інтервалу на його величину.

    Залежність між значеннями ознаки і накопиченими частотами показують особливі графіки, звані кумуляти і огіви розподілу.

    Якщо ряд дискретний, то по осі абсцис відкладають значення варіант ряду, а по осі ординат - розраховані накопичені частоти, одержувані для кожної конкретної варіанти як сума всіх попередніх частот. Отримані точки з'єднують ламаною лінією. Замість значень накопичених частот можна взяти значення накопичених частостей, тоді верхня точка на кумулятивної кривої по осі ординат буде відповідати значенню 100%.


    Мал. 3.2. Гістограма розподілу

    У разі інтервального ряду при побудові кумуляти по осі абсцис відзначають кордону інтервальних груп, накопичені частоти по осі ординат відносять до верхніх меж інтервалів.

    За даними таблиці, наведеної в прикладі 3.3, побудуємо кумуляту розподілу для інтервального ряду (рис. 3.2).


    Мал. 3.3. кумулята розподілу

    Якщо у кумулятивної кривої поміняти місцями вісь абсцис з віссю ординат, отримаємо графік, званий огіви розподілу (рис. 3.4).

    Схожі статті