Проста і випадкова вибірки

Вибіркове спостереження відноситься до різновиду несплошного спостереження. Воно охоплює відібрану частину одиниць генеральної сукупності. Мета вибіркового спостереження - по відібраної частини одиниць дати характеристику всієї сукупності одиниць. Щоб відібрана частина була репрезентативна (тобто представляла всю сукупність одиниць), вибіркове спостереження має бути спеціально організовано. Отже, на відміну від генеральної сукупності, яка представляє всю сукупність досліджуваних одиниць, вибіркова сукупність репрезентує ту частину одиниць генеральної сукупності, яка є об'єктом безпосереднього спостереження.

Зі зрозумілих причин вибірковий метод може широко використовуватися органами державної статистики. Він дозволяє при значній економії коштів і витрат отримувати необхідну достовірну інформацію. Гарантія репрезентативності забезпечується застосуванням науково обгрунтованих способів відбору одиниць, які підлягають обстеженню.

Слід відразу ж мати на увазі, що при зіставленні показників за результатами вибіркового дослідження з характеристиками для всієї генеральної сукупності можуть мати місце відхилення. Величина цих відхилень називається помилкою спостереження, яка може бути або помилкою реєстрації (недосконалість технічних умов), або помилкою репрезентативності (випадкове або систематичне порушення правил при відборі одиниць).

У статистиці прийняті такі умовні позначення:

N - обсяг генеральної сукупності;

п - обсяг вибіркової сукупності;

- середня в генеральної сукупності;

- середня в вибіркової сукупності;

р - частка одиниць у генеральній сукупності;

w - частка одиниць в вибіркової сукупності;

S2 - вибіркова дисперсія;

- середньоквадратичне відхилення ознаки у генеральній сукупності;

S - середньоквадратичне відхилення ознаки в вибіркової сукупності.

За способом відбору (способу формування) вибірки одиниць з генеральної сукупності поширені такі види вибіркового спостереження:

проста випадкова вибірка (власне-випадкова);

Проста випадкова вибірка (власне-випадкова) є відбір одиниць з генеральної сукупності шляхом випадкового відбору, але за умови ймовірності вибору будь-якої одиниці з генеральної сукупності. Відбір проводиться методом жеребкування або за таблицею випадкових чисел.

Типова (стратифікована) вибірка передбачає поділ неоднорідної генеральної сукупності на типологічні або районовані групи по якомусь суттєвого ознакою, після чого з кожної групи проводиться випадковий відбір одиниць.

Для серійної (гніздовий) вибірки характерно те, що генеральна сукупність спочатку розбивається на певні рівновеликі або неравновелікіх серії (одиниці всередині серій пов'язані з певною ознакою), з яких шляхом випадкового відбору відбираються серії і потім всередині відібраних серій проводиться суцільне спостереження.

Механічна вибірка представляє собою відбір одиниць через рівні проміжки (за алфавітом, через тимчасові проміжки, по просторовому способу і т.д.). При проведенні механічного відбору генеральна сукупність розбивається на рівні за чисельністю групи, з яких потім відбирається по одній одиниці.

Комбінована вибірка заснована на поєднанні декількох способів вибірки.

Багатоступенева вибірка є утворення всередині генеральної сукупності спочатку великих груп одиниць, з яких утворюються групи, менші за обсягом, і так до тих пір, поки не будуть відібрані ті групи або окремі одиниці, які необхідно досліджувати.

Вибірковий відбір може бути повторним і бесповторного. При повторному відборі ймовірність вибору будь-якої одиниці не обмежена. При бесповторном відборі обрана одиниця в вихідну сукупність; не повертається.

Для відібраних одиниць розраховуються узагальнені показники (середні або відносні) і в подальшому результати вибіркового дослідження поширюються на всю генеральну сукупність.

Основним завданням при вибірковому дослідженні є визначення помилок вибірки. Прийнято розрізняти середню і граничну помилки вибірки. Для ілюстрації можна запропонувати розрахунок помилки вибірки на прикладі простого випадкового відбору.

Розрахунок середньої помилки повторної простий випадкової вибірки проводиться таким чином:

cредняя помилка для середньої

cредняя помилка для частки

Розрахунок середньої помилки бесповторной випадкової вибірки:

середня помилка для середньої

середня помилка для частки

Розрахунок граничної помилки повторної випадкової вибірки:

гранична помилка для середньої

гранична помилка для частки

де t - коефіцієнт кратності;

Розрахунок граничної помилки бесповторной випадкової вибірки:

гранична помилка для середньої

гранична помилка для частки

Слід звернути увагу на те, що під знаком радикала в формулах при бесповторном відборі з'являється множник, де N - чисельність генеральної сукупності.

Що стосується розрахунку помилки вибірки в інших видах вибіркового відбору (наприклад, типової і серійної), то слід зазначити таке.

Для типової вибірки величина стандартної помилки залежить від точності визначення групових середніх. Так, у формулі граничної помилки типової вибірки враховується середня з групових дисперсій, тобто

При серійної вибірці величина помилки вибірки залежить не від числа досліджуваних одиниць, а від числа обстежених серій (s) і від величини міжгруповий дисперсії:

Серійна вибірка, як правило, проводиться як бесповторная, і формула помилки вибірки в цьому випадку має вигляд десь межсерийная дисперсія; s - число відібраних серій; S - число серій у генеральній сукупності.

Всі вищенаведені формули застосовні для великої вибірки. Крім великої вибірки використовуються так звані малі вибірки (n <30), которые могут иметь место в случаях нецелесообразности использования больших выборок.

При розрахунку помилок малої вибірки необхідно врахувати два моменти:

1) формула середньої помилки має вигляд

2) при визначенні довірчих інтервалів досліджуваного показника в генеральній сукупності або при знаходженні ймовірності допуску тієї або іншої помилки необхідно використовувати таблиці ймовірності Стьюдента, де Р = S (t, n), при цьому Р визначається в залежності від обсягу вибірки і t.

У статистичних дослідженнях за допомогою формули граничної помилки можна вирішувати ряд завдань.

1. Визначати можливі межі знаходження характеристики генеральної сукупності на основі даних вибірки.

Довірчі інтервали для генеральної середньої можна встановити на основі співвідношень

де - генеральна і вибіркова середні відповідно; - гранична помилка вибіркової середньої.

Довірчі інтервали для генеральної частки встановлюються на основі співвідношень

2. Визначати довірчу ймовірність, яка означає, що характеристика генеральної сукупності відрізняється від вибіркової на задану величину.

Довірча ймовірність є функцією від t, де

Довірча ймовірність за величиною t визначається за спеціальною таблицею.

3. Визначати необхідний обсяг вибірки за допомогою допустимої величини помилки:

Щоб розрахувати чисельність п повторної і бесповторной простий випадкової вибірки, можна використовувати такі формули:

(Для середньої при повторному способі);

(Для середньої при бесповторном способі);

(Для частки при повторному способі);

(Для частки при бесповторном способі).

Основними методами поширення вибіркового спостереження на генеральну сукупність є прямий перерахунок і спосіб коефіцієнтів.

Прямий перерахунок є добуток середнього значення ознаки на обсяг генеральної сукупності. Однак велика кількість факторів не дозволяє в повній мірі використовувати точкову оцінку прямого перерахунку при поширенні результатів вибірки на генеральну сукупність. На практиці частіше користуються інтервального оцінкою, яка дає можливість враховувати розмір граничної помилки вибірки, яка розрахована для середньої або для частки ознаки.

Спосіб коефіцієнтів використовується в тих випадках, коли вибіркове спостереження проводиться для перевірки і уточнення даних суцільного спостереження.

При цьому рекомендується використовувати формулу

де Y1 - чисельність сукупності з поправкою на недооблік; Y0 - чисельність сукупності без цієї поправки; y0 - чисельність сукупності в контрольних точках за первинними даними; y1 - чисельність сукупності в тих же точках за даними контрольних заходів.

Приклад. при проведенні суцільного обліку гаражів-черепашок в місті було зареєстровано по південному (Ю) близько 1000 гаражів; по північному (С) - 750; східному (В) - 400. На основі контрольних вибіркових заходів було встановлено наступне кількість гаражів, шт .:

Використовуючи формулу способу коефіцієнтів (або використовуючи розрахований коефіцієнт при вибірковому обліку), отримуємо чисельність гаражів після контролю (У) з поправкою на недооблік:

У (Ю) = 1000 210. 200 = 1050; У (С) = 750 160. 150 = 800; У (В) = 400 110. 100 = 440.

[1] Найчастіше використовується, тобто середня помилка буде двох кратної

практична статистика

теоретична статистика