Репрезентативність - студопедія

Питання про ймовірність, що постають перед людьми, як правило, відносяться до одного з наступних типів: наскільки ймовірним є те, що об'єкт А належить класу Б? Яка ймовірність того, що подія А - наслідок процесу Б? Яка ймовірність того, що процес Б призведе до події А? Відповідаючи на подібні питання, люди зазвичай спираються на евристику репрезентативності (типовості): ймовірності оцінюються по тій мірі, в якій А репрезентативно по відношенню до Б, тобто за ступенем, в якій А нагадує Б. Наприклад, якщо А дуже репрезентативно по відношенню до Б, ймовірність того, що А - результат Б, оцінюється як висока. З іншого боку, якщо А не схоже на Б, ймовірність того, що А - результат Б, оцінюється як низька.
Для ілюстрації судження по репрезентативності уявімо людини, якого колишній сусід про виписує наступним чином: «Стів - сором'язливий і замкнутий, завжди готовий допомогти, але його мало цікавлять люди і реальний світ. Лагідний і акуратний, Стів в усьому шукає порядок і структуру; він дуже уважний до дрібниць ». Як оцінити ймовірність того, що Стів вибере те чи інше заняття із запропонованого списку (наприклад, фермер, продавець, льотчик, бібліотекар або лікар)? Як вибудувати ці професії від найбільш імовірною до найменш вірогідною? У евристиці репрезентативності ймовірність того, наприклад, що Стів - бібліотекар, оцінюється за ступенем його репрезентативності, тобто за відповідністю стереотипу бібліотекаря. Дослідження показують, що професії вибираються в рівній мірі за принципом вірогідності і за принципом схожості [1]. Такий підхід до оцінки ймовірності призводить до серйозних помилок, тому що схожість або репрезентативність не враховують декількох факторів, які повинні впливати на оцінку ймовірності.

Ігнорування розмірів вибірки. Для оцінки ймовірності отримання конкретного результату у вибірці з якоїсь популяції зазвичай застосовують евристику репрезентативності, тобто оцінюють ймовірність результату в вибірці (наприклад, що середній зріст у випадковій вибірці з десяти чоловіків складе 6 футів) по схожості цього результату з відповідним параметром (тобто зі середнім ростом для всіх чоловіків). Схожість статистики в вибірці і у всій популяції не залежить від розміру вибірки. Отже, якщо ймовірність оцінюється по репрезентативності, тоді оцінюється ймовірність для вибірки абсолютно не буде залежати від розміру вибірки. Коли учасники оцінювали розподіл середнього зросту в вибірках різного розміру, розподіл виходило однаковим. Наприклад, ймовірність отримання середнього зросту вище 6 футів отримувала однакові значення для вибірки в 1000, 100 і 10 чоловіків [4]. Більш того, учасники не враховували важливість розміру вибірки, навіть коли вона особливо під підкреслюється в формулюванні завдання. Розглянемо наступний приклад.

У місті працюють дві лікарні. У великій лікарні кожен день народжується приблизно 45 немовлят, у маленькій лікарні кожен день народжується приблизно 15 немовлят. Як відомо, близько 50% всіх новонароджених - хлопчики. Однак точне співвідношення змінюється день у день.
Іноді хлопчиків більше 50%, іноді менше.
Протягом року кожна лікарня відзначає дні, коли хлопчиків народжується більше 60% від усіх новонароджених. В якій лікарні, по-вашому, таких днів більше?

У великій (21)
У маленькій (21)
Приблизно однаково (тобто різниця менше 5%) (53)

Цифри в дужках показують число студентів, які обрали зазначену відповідь.
Більшість учасників вирішили, що ймовірність народження більше 60% хлопчиків буде однаковою для маленької і великої лікарні. мабуть, тому що ці події описані однією і тією ж статистикою і, таким чином, однаково уявляють загальну популяцію. Однак теорія вибірок стверджує: днів, коли хлопчиків народжується понад 60%, очікується значно більше в маленькій лікарні, ніж у великій, оскільки розподіл у великих вибірках буде рідше відхилятися від 50%. Очевидно, це фундаментальне поняття статистики не входить в набір інтуїтивних навичок.
Схоже ігнорування розміру вибірки виявлено при оцінці апостеріорної ймовірності, тобто ймовірності того, що вибірка взята з тієї чи іншої популяції, а не з іншої. Розглянемо наступний приклад.

Уявіть посудину, наповнений кульками, з яких # 8532; одного кольору, а # 8531; - іншого. Одна людина, витягнувши з посудини 5 куль, виявив 4 червоних і один білий. Інша людина витягнув 20 куль і нарахував 12 червоних і 8 білих. Хто з двох учасників буде більше впевнений, що в посудині # 8532; червоних куль і _ 531; - білих, а не навпаки? Які шанси назве кожен з учасників?

У цьому завданні правильні апостеріорні шанси складають 8 до 1 для вибірки 4: 1 і 16 до 1 - для вибірки 12: 8, за умови рівних апріорних ймовірностей. Однак більшості людей здається, що перша вибірка представляє більш сильне доказ гіпотези про переважання червоних куль в посудині, тому що частка червоних куль в першій вибірці більше, ніж у другій. Знову-таки, на інтуїтивний вибір впливає співвідношення в вибірці і зовсім не впливає розмір вибірки, який грає найважливішу роль у визначенні реальних апостеріорного ймовірностей [5]. Крім того, інтуїтивні оцінки апостеріорного шансів виявляються далеко не настільки екстремальними, як реальні величини. Недооцінка впливу доказів постійно спостерігається в задачах подібного типу [6]. Це явище отримало назву «консерватизм».

Невірні уявлення про шанси. Люди очікують, що послідовність подій, ген еріруемих випадковим процесом, є суттєвою характеристикою процесу, навіть якщо послідовність коротка. Наприклад, кидаючи монету (орел чи решка), людина розглядає підсумкову послідовність О-Р-О-Р-Р-О як найбільш ймовірну, ніж послідовність О-О-О-Р-Р-Р, яка випадає рідко, а також більш вірогідною, ніж послідовність О-О-О-О-Р-О, яка не відображає рівноймовірно результатів при підкиданні монети [7]. Таким чином, люди очікують, що істотні характеристики процесу будуть представлені не тільки глобально в повній послідовності, але і локально в кожній її частині. Насправді ж локально репрезентативна послідовність систематично відхиляється від очікуваних ймовірностей: в ній занадто багато чергувань і занадто мало повторень. Ще один наслідок віри в локальну репрезентативність - добре відома помилка гравця. Наприклад, помітивши довгу послідовність випадання червоного на рулетці, більшість людей вважають, що настала черга чер ного, оскільки випадання чорного дасть більш репрезентативну послідовність, ніж ще одне поява червоного. Шанс часто розглядається як саморегулюючий процес, в якому відхилення в одну сторону викликає відхилення в протилежну сторону - для підтримки рівноваги. Насправді відхилення не "коригуються» в міру розвитку процесу; вони просто згладжуються.
Невірні уявлення про шанси - доля не тільки недосвідчених людей. Проведені дослідження статистичної інтуїції досвідчених дослідників-психологів [8] виявили завзяте оману, яке можна назвати «закон малих чисел», - згідно з ним навіть маленькі вибірки високо репрезентативні для своїх популяцій. Відповіді дослідників відображають очікування того, що валідна гіпотеза про популяцію дасть статистично значущі результати у вибірці будь-якого розміру. Як з'ясувалося, дослідники занадто довіряли результатам по маленьким вибірках і сильно переоцінювали відтворюваність таких результатів. В умовах реального дослідження подібні спотворення ведуть до вибірок неадекватного розміру і надто сміливою інтерпретації результатів.

Ігнорування передбачуваності. Людям іноді доводиться робити чисельні прогнози - наприклад, передбачати майбутній курс акцій, попит на товар або результат футбольного матчу. Ці прогнози часто робляться на основі репрезентативності. Наприклад, уявіть, що комусь пропонують опис компанії і просять дати прогноз майбутнього прибутку. Якщо опис компанії дуже сприятливе, високі прибутки здадуться репрезентативними для цього опису; якщо опис середнє, найбільш репрезентативними вважатимуть середні показники. На сприятливість опису не впливає ступінь його надійності або те, наскільки воно дозволяє робити точні прогнози. Значить, якщо прогноз роблять на підставі тільки сприятливості опису, то передбачення ігнорують надійність доказів і очікувану точність прогнозу.
Такий спосіб винось ть судження йде врозріз зі статистичною теорією, в якій крайність і діапазон прогнозів стримуються міркуваннями передбачуваності. Коли передбачуваність дорівнює нулю, у всіх випадках повинні бути дані однакові передбачення. Наприклад, якщо в описі компаній немає інформації, пов'язаної з прибутками, тоді правильно буде дати однаковий прогноз (наприклад, середній прибуток) для всіх компаній. Якщо передбачуваність ідеальна, передбачені величини, зрозуміло, співпадуть з реальними, а діапазон прогнозів співпаде з діапазоном підсумків. Загалом, чим вище передбачуваність, тим більш широкий діапазон передбачених величин.
Деякі дослідження числових прогнозів показали, що інтуїтивні передбачення порушують це правило і що люди рідко враховують - або зовсім не враховують - міркування передбачуваності [9]. В одному з досліджень учасникам пропонувалося кілька абзаців, в кожному з яких описувалися дії вчителя-практиканта під час уроку. Деяких учасників просили оцен ить (в процентилями) якість описаного в тексті уроку щодо конкретної популяції. Інших учасників просили передбачити (теж в Процентільние балах) успіхи даного практиканта через п'ять років після цього уроку. Судження, висловлені в даних умовах, виявилися ідентичні, тобто прогноз по віддаленому критерієм (успішність вчителя через п'ять років) збігався з оцінкою інформації, на якій грунтувався прогноз (якість описаного уроку). Студенти, які давали відповіді, зрозуміло, знали, що передбачуваність викладацької компетентності по одному-єдиному уроку п'ятирічної давності обмежена; проте їх прогнози були такими ж радикальними, як і їх оцінки.

Ілюзія валідності. Як уже згадувалося, люди, даючи прогноз, вибирають результат (наприклад, професію), максимально репрезентативний для вхідних даних (наприклад, опису людини). Впевненість у правильності прогнозу безпосередньо залежить від ступеня репрезентативності (тобто від ступеня збігу я між обраним результатом і вхідними даними); при цьому майже (або зовсім) не розглядаються фактори, що обмежують точність прогнозу. Так, люди з великою впевненістю називають професію бібліотекаря, якщо запропоноване опис людини відповідає стереотипу бібліотекаря, навіть якщо опис убоге, ненадійне або застаріле. Необгрунтовану упевненість, викликану хорошим збігом між передбаченим результатом і вхідними даними, можна назвати ілюзією валідності. Ця ілюзія залишається, навіть коли людина знає про фактори, що обмежують точність прогнозу. Широко відомий факт, що психологи, які проводять відбіркові співбесіди при прийомі на роботу, часто вельми впевнені в своїх прогнозах, незважаючи на знайомство з великою літературою, де показана невисока надійність співбесід. Те, яку роль продовжують відводити відбірковим співбесід, незважаючи на численні приклади їх неадекватності, підтверджує силу зазначеного ефекту.
Внутрішня згоди ванность структури вхідних даних - головне джерело впевненості в прогнозі, заснованому на цих входах. Наприклад, люди з більшою впевненістю пророкують підсумкові оцінки студента, який в перший рік навчання отримував суцільні оцінки «В», ніж студента, який одержував в перший рік багато «А» і «С». Високо узгоджені структури спостерігаються найчастіше у випадках, коли вхідні змінні надлишкові або взаємопов'язані. Значить, люди з більшою впевненістю будують передбачення на надлишкових вхідних змінних. Однак елементарний висновок з статистики кореляції свідчить, що при вхідних даних зазначеної валідності заснований на них прогноз буде точнішим, якщо дані незалежні один від одного, ніж якщо вони взаємопов'язані або корелюють. Так що взаємозв'язок між вхідними даними знижує точність, хоча підвищує впевненість; і люди часто впевнені в прогнозах, які б'ють мимо цілі [10].

Схожі статті