Репрезентативність в опитуваннях

Чи можна довіряти результатам опитувань громадської думки, що таке вибірка і генеральна сукупність і наскільки масові опитування політизовані

Репрезентативність в опитуваннях

Поняття «репрезентативність» стосовно до соціологічних опитувань - з опитуваннями громадської думки - володіє майже магічним дією на людей. Сам термін «репрезентація» має крім наукового ще і явно політичне значення.

В чому причина? Вся справа в тому, що передбачається, що вибірка (група людей, відібрана для опитування) може репрезентувати (представляти) всю генеральну сукупність. Генеральною сукупністю в разі загальноросійських опитувань є все населення країни. Тепер уявімо, що мова йде про політичне рішення - підтримку законопроекту або голосуванні на виборах. За допомогою опитування ми отримуємо відмінний механізм політичної репрезентації - механізм, при якому невелика група людей може представляти думку чи позицію всього населення країни. Тому репрезентативності дослідження відводиться таке важливе місце.

Поняття репрезентативності використовується, зрозуміло, не тільки в політичних дослідженнях. Термін застосовується практично завжди, коли мова йде про великі дослідженнях, будь то в сфері маркетингу, економічної поведінки або освіти.

Методологія репрезентативних опитувань

Як, опитавши 1,5 тисячі осіб, можна робити висновки про всі росіян, яких більше 140 мільйонів (і навіть виборців понад 110 мільйонів)? Технологія, яка стоїть за репрезентативними опитуваннями, заснована на статистичних законах. Найближчим підставою служить закон великих чисел, або теорема Бернуллі. Спрощено його зміст можна передати так. Припустимо, у нас є деякий ознака, наприклад кількість опадів за день в Єкатеринбурзі протягом ХХ століття. Якщо ми випишемо всі його значення разом з їх частотою (це називається розподілом), а потім випадково візьмемо досить велике число випадків (тобто в повному обсязі дні в ХХ столітті, але досить багато), то ми побачимо, що розподіл в нашій вибірці буде дуже схожим на розподіл за все ХХ століття. Таким чином, якщо ми відбираємо з сукупності деякі одиниці, вони дійсно можуть представляти всю сукупність, і насправді немає необхідності збирати дані по всіх випадках.

Уявіть, що з 143,5 мільйонів росіян ви випадковим чином відбираєте необхідні вам 1,5 тисячі осіб. Тоді, наприклад, частка менеджерів середньої ланки серед них буде приблизно дорівнює частці менеджерів середньої ланки в генеральної сукупності, що і показує, що ваша вибірка може представляти всю сукупність. Чи може так статися, що ці два показники будуть сильно відрізнятися? Наприклад, серед росіян він становить 14%, а в вибірці він складе лише 1%? Теоретично це можливо, однак імовірність цього настільки мала, що нею можна знехтувати (приблизно як зустріти дракона на вулиці).

Більш того, найприємніше в цій ймовірності навіть не те, що вона мала, а то, що для випадкових процесів цю ймовірність можна обчислити. Ми можемо сказати, з якою ймовірністю наше вибіркове значення відхилиться від значення в генеральній сукупності на 13% (як в прикладі вище), а з якою, скажімо, на 2,5%. Зазвичай, втім, роблять навпаки: спочатку визначають ймовірність, з якою ми хочемо, щоб наше значення не відхиляється від значення в генеральній сукупності (найчастіше його фіксують на рівні 95%), а потім вже дивляться, як і величина відхилення при тому чи іншому розмірі вибірки. Це відхилення називається довірчим інтервалом, іноді його називають помилкою вибірки або статистичною похибкою - його часто призводять поруч з результатами опитування.

Отже, ймовірність відхилення, величина відхилення (довірчий інтервал) і розмір вибірки пов'язані між собою. Виходячи з цього, формула для розрахунку розміру вибірки виглядає наступним чином:

Репрезентативність в опитуваннях

де n - розмір вибірки, Δ - довірчий інтервал, z - значення функції нормального розподілу для даної ймовірності відхилення (для ймовірності 5% це значення становить 1,96).

Це спрощена формула, в реальних опитуваннях використовуються кілька більш складні формули. Ця формула також може давати збій, якщо значення показника сильно відрізняється від 50% (тому, наприклад, ця формула не підійде для того, щоб оцінити частку хворих на рідкісну хворобу в країні).

Ось що буде, якщо підставити в цю формулу деякі значення:

Іншими словами, якщо ми взяли випадкову вибірку росіян розміром в 1600 чоловік і оцінили якийсь показник, наприклад готовність голосувати за певного політика, то з імовірністю 95% наша оцінка не буде відрізнятися від готовності проголосувати за нього серед усіх росіян більш ніж на 2, 45%.

Репрезентативність в опитуваннях

Розмір вибірки

Отже, чим більше розмір вибірки, тим більша ймовірність того, що ми будемо ближче до частки у генеральній сукупності. Здавалося б, це означає, що нам потрібно намагатися наблизити вибірку до 143,5 млн. Насправді, як можна бачити з таблиці, природа випадкових процесів така, що з певного моменту ймовірність потрапити в інтервал починає підвищуватися дуже повільно (і цей момент настає доволі швидко). Після того як ми відбираємо 1,5 тисячі одиниць, як би ми сильно не збільшували обсяг вибірки, вірогідність, що наше значення по вибірці потрапить в значення по генеральної сукупності, буде зростати дуже і дуже повільно.

Репрезентативність і точність

Щоб зрозуміти сенс поняття «репрезентативність», давайте розглянемо вибірку в 15 чоловік. Як не дивно, якщо ви зробили її випадково, вона теж репрезентативна. Більш того, ви можете зробити вибірку в одну одиницю. Уявіть ящик з кулями, звідки ви випадковим чином берете один шар. Якщо це випадково обраний куля, то він теж буде репрезентувати всі кулі, що є в цьому ящику. Просто він репрезентуватиме їх неточно. Чому? Тому що є дуже велика ймовірність помилитися. Наступного разу ми можемо витягти інша куля і отримати інше уявлення про кулях в ящику. Репрезентувати неточно означає мати великий розкид оцінок.

Точно так же і 15 осіб репрезентують будь-яку генеральну сукупність, але вони репрезентують її неточно, тому що похибка, довірчий інтервал дуже великі. Нам доведеться додавати по +/- 33%, щоб отримати 95% ймовірності того, що ми потрапимо в інтервал. Якщо ми готові це допустити, то беремо 15 осіб, з'ясовуємо, що 7 з них - це менеджери середньої ланки, а далі отримуємо оцінку, що 7/15 від сукупності, тобто 47% +/- 33%, - це і є оцінка частки менеджерів у генеральній сукупності, і це абсолютно коректний висновок. Просто він не має ніякої цінності. Це ми могли сказати і без обстеження. Тому, плануючи вибірку, має сенс досягати такого обсягу, який буде доцільним з точки зору співвідношення витрат і ефективності.

Все сказане покликане донести одну просту думку, яку дуже часто не усвідомлюють: обсяг вибірки не пов'язаний з її репрезентативністю.

Маленька вибірка неточна, але вона все одно може бути репрезентативною. Обсяги вибірок, які використовуються сьогодні в масових опитуваннях в Росії, майже завжди мають досить високою точністю.

Чи загрожує же репрезентативності вибірки не її обсяг, а зсув, тобто відхилення від принципу випадковості.

Порушення принципу випадковості

Якщо ми починаємо вибирати одиниці невипадковим чином, вибірка стає репрезентативної. Наприклад, якщо що-небудь заважає нам відбирати їх випадково. Уявімо собі, що ми хочемо відібрати кулі з нашого ящика випадковим чином, але тут виявляється, що частина куль кусається. Механізм, при якому ми будемо брати тільки ті кульки, які даються нам в руки, - це механізм, який порушує випадковість і тому порушує репрезентативність. В цьому випадку, скільки б ми кульок ні взяли з ящика (навіть якщо ми візьмемо все кульки, які не кусаються), у нас буде нерепрезентативна вибірка, тому що ми не врахуємо жодного з тих, що кусаються, - вони просто минуть нашу вибірку .

Найбільша проблема з кусаються кулями полягає в тому, що вони можуть відрізнятися від тих, які йдуть до нас в руки, і відрізнятися як раз за тією ознакою, який нас цікавить. Така ситуація називається систематичною помилкою вибірки.

Чому репрезентативність неможлива

В примітках до таблиць з результатами опитувань часто можна побачити, що «обсяг вибірки становить 1600 осіб, вибірка репрезентативна за статтю та віком». Зі сказаного вище очевидно, що це два різних параметра: вказівка ​​на репрезентативність не пов'язане з обсягом вибірки. Насправді тут мається на увазі те, що виконувалися певні процедури, для того щоб забезпечити відповідність між вибіркою і генеральною сукупністю. Наприклад, щоб забезпечити репрезентативність по підлозі, до вибірки набирають чоловіків і жінок в таких же співвідношеннях, які існують серед росіян за даними перепису. Але репрезентативність по підлозі не означає репрезентативності, наприклад, за політичними поглядами.

Ті, хто зводить проблему репрезентації в масових опитуваннях до статистики, забувають про те, що люди - це дуже специфічні кульки. Є кульки, які тікають і ховаються. Є кульки, які кусаються. Вони не пасивні об'єкти, вони дають здачі. Вони кажуть: «Я не хочу брати участь у твоєму опитуванні», тим самим порушують випадковість. Тому в строгому сенсі слова репрезентативність в масових опитуваннях, звичайно, неможлива ні в якому вигляді.

Репрезентативна вибірка - технологія, запозичена соціологами з статистики. Тому вона неминуче несе в собі елементи математико-статистичної картини світу. Мабуть, найсильніше допущення полягає в тому, що сам по собі вибіркове опитування політично і соціологічно нейтральний: участь і неучасть в опитуванні не несе в собі політичного сенсу і не пов'язане з іншими соціологічно важливими параметрами. Але сьогодні опитування стали одним з головних політичних інститутів і перетворилися в ключового посередника між великими корпораціями і споживачами. У цих умовах вірити в їхню політичну стерильність вже неможливо. Однак ми як і раніше мало знаємо про те, як опитування розуміються в сучасних суспільствах і що вони насправді репрезентують.

Репрезентативність в опитуваннях

Схожі статті