Способи відбору одиниць з генеральної сукупності

У статистиці для формування вибіркової сукупності з урахуванням завдань дослідження і специфіки об'єкта вивчення можуть застосовуватися різні способи.

Основною умовою проведення вибіркового обстеження є попередження виникнення систематичних (тенденційних) помилок. Для цього треба забезпечити реалізацію принципу рівних можливостей потрапляння у вибірку кожної одиниці генеральної сукупності.

Практика застосування вибіркового методу в економіко-статистичних дослідженнях розрізняє такі основні способи відбору одиниць з генеральної сукупності:

1. Індивідуальний відбір - у вибірку відбираються окремі одиниці генеральної сукупності;

2. Груповий відбір - у вибірку потрапляють якісно однорідні групи або серії досліджуваних одиниць

3. Комбінований - як комбінація індивідуального і групового відбору.

Як зазначалося вище, способи відбору визначаються правилами формування вибіркової сукупності. Тут в зв'язку з цим доречно згадати основні види вибірок:

Власне-випадкова вибірка утворюється в результаті випадкового (ненавмисного) відбору одиниць з генеральної сукупності. При цьому кількість відібраних в вибіркову сукупність одиниць зазвичай визначають виходячи з прийнятої частки (відсотка) вибірки.

Частка вибірки є ставлення числа одиниць вибіркової сукупності n до числа одиниць у генеральній сукупності N

Одним із прикладів використання власне-випадкової вибірки є проведення виграшною грошово-речової лотереї, при якій забезпечується рівна можливість попадання в тираж будь-якого номера лотерейного квитка.

Формування власне-випадкової вибірки може здійснюється за допомогою спеціальних фішок (з номерами одиниць генеральної сукупності) однакової форми або таблиці випадкових чисел.

Власне-випадкова вибірка може бути здійснена за схемами повторного і бесповторного відбору.

При повторному відборі кожна одиниця, що потрапила у вибірку після її фіксації (включена у вибірку), повинна назад повернутися в генеральній сукупність.

Наприклад, при вивченні купівельного попиту населення не виключена повторна реєстрація попиту одного і того ж особи в декількох магазинах міста. Однак при тестуванні якості електролампи одна і та ж лампа не може бути піддана повторній перевірці на тривалість горіння. Повертати в генеральну сукупність лампочки з перегоріли нитками не має сенсу. Тому на практиці частіше застосовуються схеми бесповторного відбору.

При бесповторном відборі одиниця, що потрапила у вибірку, виключається з генеральної сукупності і подальший відбір здійснюється. з решти одиниць.

Механічна вибірка полягає в тому, що відбір одиниць у вибірку проводиться з генеральної сукупності, розбитою на рівні групи (інтервали).

Розмір інтервалу дорівнює зворотній величині частки вибірки. Так. при 2% -ної вибірці відбирається кожна 50-я одиниця (1: 0,02) і т.д.

Таким чином, відповідно до прийнятої часткою відбору ген сукупність як би механічно розбивається на рівновеликі групи і з кожної групи до вибірки відбирається лише одна одиниця.

Виникає питання: як розташувати одиниці в генеральної сукупності? Адже від цього буде залежати репрезентативність вибірки. Як показує практика, по відношенню до досліджуваного показника одиниці генеральної сукупності можуть бути впорядковані за істотного, другорядного або нейтральному ознакою.

При упорядкуванні щодо істотного ознакою (який цілком визначає поведінку досліджуваного показника), в вибіркову сукупність повинна відбиратися та одиниця, яка знаходиться в середині кожної групи.

При упорядкуванні по нейтральному ознакою (не робить вплив на поведінку досліджуваного ознаки) до вибірки може бути взята будь-яка одиниця з кожної групи. Для дотримання принципу випадкового відбору у всіх групах механічної вибірки беруть ті номери одиниць, які відібрані у першій групі.

При упорядкуванні одиниць генеральної за сукупністю другорядними ознаками (лише частково можуть вплинути на досліджувану ознаку) доцільно для виключення систематичної помилки вибірки також відбирати одиниці, що знаходяться в середині групи.

Важливою особливістю механічної вибірки є те, що формування вибіркової сукупності можна здійснить, не вдаючись до складання списків. Наприклад, використовуємо порядок фактичного розміщення одиниць генеральної сукупності (послідовність вихід готових виробів з конвертера, порядок розміщення партії товарів при зберіганні і т.д.).

Величина середньої помилки механічної вибірки теоретично повинна визначатися з урахуванням показника внутрішньогрупових дисперсій. Однак з практики доведено, що механічна вибірка за точністю результату дуже близько підходить до власне випадковому способу відбору. Тому для визначення середньої помилки механічної вибірки зазвичай використовуються формули власне випадкової бесповторной вибірки.

При типовій вибірці генеральна сукупність спочатку розчленовується на однорідні типові групи. Потім з кожної типової групи власне випадковим або механічним способом виробляється індивідуальний відбір одиниць у вибіркову сукупність.

Типова вибірка зазвичай застосовується для вивчення складних сукупностей. Наприклад, при вивченні продуктивності праці працівника з урахуванням їх рівня кваліфікації або професії.

Як показує практика, типова вибірка дає точніші результати в порівнянні з іншими способами відбору одиниць.

Угруповання можна проводити за результатами досліджень з сутності досліджуваного явища або використовувати вже наявні класифікації і угруповання. Адже ясно, що чим однорідніше склад утворених типових груп, тим краще типова вибірка буде відтворювати характеристику досліджуваного ознаки в генеральній сукупності.

При визначенні помилки типової вибірки в якості показника варіації виступає середня з внутрішньогрупових дисперсій.

Для частки альтернативної ознаки вона обчислюється за формулою

і для середньої величини кількісної ознаки застосовується формула

На практиці типова вибірка формується пропорційно чисельності одиниць, складових типові групи. Тому для визначення середньої помилки типової вибірки використовують формули

а) для частки альтернативної ознаки

б) для середньої величини кількісної ознаки

(**) Досить широке застосування знаходить так звана серійна або гніздовий вибірка. При цьому способі генеральна сукупність розбивається на серії і в випадковому порядку відбираються цілі гнізда, в яких проводиться суцільне обстеження.

Наприклад, при контролі якості товару раціональніше перевірити кілька окремих упаковок, ніж з усіх упаковок відбирати необхідну кількість одиниць товару.

Відбір окремих серій здійснюється або за допомогою власне випадкової вибірки або механічним добором. Зазвичай серійна вибірка проводиться за схемою бесповторного відбору.

Для визначення середньої помилки серійної вибірки застосовуються такі формули

а) для кількісної ознаки,

де межсерийная дисперсія вибірки; R і r - число серій у вибірці і генеральної сукупності;

б) для альтернативної ознаки,

де - межсерийная дисперсія вибіркової частки.

(***) У порівнянні з типової вибіркою серійна вибірка дає більш високу помилки репрезентативності, тому що обстежується порівняно невелике число серій.

Як бачили в розглянутих способах вибірки здійснюється:

1. Індивідуальний відбір - у вибірку відбираються окремі одиниці генеральної сукупності (при власне-випадковому і механічному)

2. Груповий відбір - у вибірку потрапляють якісно однорідні групи як серії досліджуваних одиниць (0 в серійному відборі

3. Однак на практиці ці способи застосовуються комбіновано в різних поєднаннях і з різною послідовністю. Так, наприклад, в серійної вибірці:

· Випадковим або механічним способом відбираються окремі серії;

· У вибірку включаються всі одиниці відібраних серій або однакові частки одиниць з кожної серії.

Середня помилка комбінованої вибірки складається з відповідних середніх помилок застосовуваних способів.

Наприклад, розбиваємо всю сукупність на групи і потім здійснюємо гніздовий відбір.

Середня помилка для такої комбінованої вибірки визначається за формулами:

а) при повторному відборі;

б) при бесповторном відборі.

У статистиці розрізняють також одно- і багатоступінчасті способи відбору одиниць у вибіркову сукупність.

При одноступінчастої вибірці кожна відібрана одиниця відразу ж піддається вивченню за заданим ознакою.

При багатоступінчастої вибірці проводиться відбір з генеральної сукупності окремих груп, а з груп вибираються окремі одиниці. Наприклад, типова вибірка з механічним способом відбору одиниць у вибіркову сукупність.

Комбінована вибірка може бути двоступеневою (розбиття на групи, відбір груп і всередині останніх відбір окремих одиниць) і багатоступінчастої (відбір груп, потім з них відбір середніх, дрібних і в всередині останніх відбір окремих одиниць). Наприклад, при бюджетних обстеженнях сімей використовується триступеневий відбір (добір районів, відбір населених пунктів, відбір сімей). При цьому на окремих ступенях можуть змінюватися і види вибірки. Слід мати на увазі, що при багатоступінчастої вибірці проводиться відбір самих груп, тому не всі вони потрапляють до вибірки.

Середня помилка вибірки при многоступенчатом відборі визначається за формулою

де помилка вибірки на зсувах - чисельність вибірки по ступені відбору

Як бачили з попередніх параграфів, в залежності від завдань дослідження в вибірках може бути включено різну кількість одиниць досліджуваної сукупності. Якщо n> 100, то вибіркове спостереження вважається з порівняльною великим об'ємом вибірки. А якщо n<100. то стат. Обследование принято называть малой выборкой.

Під малою вибіркою розуміється стат. обстеження. при якому вибіркова сукупність утворюється з порівняно невеликого числа одиниць генеральної сукупності.

Обсяг малої вибірки зазвичай не перевищує 30 одиниць і може доходити до 4-5 одиниць

На практиці до малої вибірці вдаються, коли колишня вибірка недоцільна (наприклад, якщо проведення дослідження пов'язане зі знищенням або псуванням обстежуваних зразків) або неможлива (при експрес-обстеження)

Через невеликого обсягу вибірки величина помилки малої вибірки визначається по спец. формулі

де дисперсія малої вибірки.

Згадаймо співвідношення між дисперсіями в ген. сукупності () і вибіркової сукупності ():

У малій вибірці має істотне значення, то обчислення дисперсії малої вибірки проводиться з урахуванням так званого числа ступенів свободи. Під числом ступенів свободи розуміється кількість варіантів, які можуть приймати довільні значення. не змінюючи величини середньої.

При визначенні дисперсії числа ступенів свободи одно (n-1)

Гранична помилка малої вибірки (ЦЦЦ) визначається за формулою

При цьому значення коефіцієнта довіри (t) залежить не тільки від заданої довірчої ймовірності. але і від чисельності малої вибірки (n). Для цих цілей ісп. спеціальна таблиця (таблиці Стьюдента). У цих таблицях дані розподілу стандартизованих відхилень

Таблиця Стьюдента наводиться в підручниках з математичної статистики або збірниках спеціальних математичних таблиць.

Наведемо фрагмент цієї таблиці

0,861 0,898 0,914 0,923 0,936 0,940

0,942 0,970 0,980 0,983 0,991 0,993

Як видно з цих таблиць, що при збільшенні обсягу вибірки розподіл Стьюдента наближається до нормального і вже при n = 20 воно мало відрізняється від нормально розподілу. Звідси ж видно. що чим менше обсяг вибірки, тим більше ця різниця і наприклад. при n = 4 це відмінність має велике значення. Отже зменшується точність результатів малої вибірки.

Приклад. Припустимо відібрано 10 робочих для визначення часу виконання ними певної операції. Середній час у них виявилося рівним 10,4 хв і дисперсія вибірки 4. Приймемо довірчу ймовірність р = 0,984.

По таблиці розподілу Стьюдента t = 3 визначимо звідси. Довірчий інтервал 6,4

Перевіримо правильність висновків шляхом заміни.

Контрольні питання по темі 12

1. У чому переваги вибіркового методу в порівнянні з іншими видами несплошного спостереження?

2. Які переваги і недоліки має метод вибіркового спостереження в порівнянні з суцільним статистичним спостереженням?

3. Які способи формування вибіркової сукупності Ви знаєте Дайте коротку характеристику ім.

4. Що означає помилка репрезентативності і які чинники визначають її величину?

5. Від чого залежить точність оцінки параметрів генеральної сукупності (генеральної середньої та генеральної частки)?

6. Чим відрізняється величина усередненої помилки простий випадкової вибірки при повторному і бесповторном відборі? Яка з цих помилок більше?

7. Чим відрізняється помилка простий випадкової вибірки при проведенні великих і малих вибірок?

8. Як визначається гранична помилка при проведенні великої і малої вибірки?

9. У чому відмінність механічного способу відбору в порівнянні з простим випадковим (власне-випадковою відбором? Як визначається величина стандартної (середньої) помилки механічної вибірки?

10. У чому специфіка організації механічного відбору при систематизації одиниць генеральної сукупності щодо істотного, другорядного і нейтральному ознаками?

11. Який вид вибіркового спостереження слід використовувати, якщо генеральна сукупність не є однорідною?

12. У чому полягають переваги серійної вибірки перед простий випадкової вибірки?

13. Як повинна формуватися вибіркова сукупність при проведенні типової вибірки?

14. Як визначається усереднена помилка типової і серійної вибірок?

15. Які способи розподілу вибіркових характеристик Вам відомі? Дайте коротку характеристику і назвіть найбільш доцільні області їх застосування.

16. Запишіть довірчі інтервали генеральної середньої з ймовірністю 0,95 і 0,99.

17. У чому полягає проблема визначення оптимальної чисельності вибірки?

18. Для вирішення яких питань організації вибіркового спостереження і оцінки його результатів може використовуватися формула середньої помилки вибірки?

19. Чим відрізняється величина відносної чисельності вибірки простий випадкової вибірки при повторному і безповоротне відборі? Яка з цих величин більше?

20. Назвіть найважливіші галузі застосування виборного методу в практиці державної статистики.

ТЕМА 13. кореляційний зв'язок І
ЇЇ СТАТИСТИЧНЕ ВИВЧЕННЯ

13.1. Передумови вивчення кореляційної зв'язку.

13.2. Статистичні методи виявлення кореляційної зв'язку.

13.3. Статистичне вимірювання тісноти кореляційної зв'язку. Показники заходи тісноти кореляційної зв'язку.

13.4. Кореляція рангів.

13.5 Множинна і приватна кореляція.

13.6. Статистичні дослідження форми кореляційної зв'язку. Лінія регресії і рівняння регресії.

13.7. Статистичне дослідження залежності між якісними ознаками.

13.8. Вивчення кореляційної залежності між рядами динаміки.

Контрольні питання по темі 13.