Описова статистика і графічне представлення даних в медичних журналах, omnibus rebus,

У медичній літературі широко використовуються поняття медіана і інтерквартільний розмах, а в поданні даних - ящічковие діаграми. Нижче ми наводимо роз'яснення з цього приводу.

У медичних публікаціях при описі даних найчастіше можна зустріти уявлення числових значень (наприклад, артеріального тиску, рівня гемоглобіну, віку і т.д.) у вигляді середнього і стандартного відхилення, що відбивається як М ± σ (наприклад, 136 ± 12). У такого запису «М» означає середнє, а σ - стандартне відхилення. Це опис даних можливо тільки для ознак, розподіл яких носить нормальний характер (рис 1а) - найчастіше це стосується росту, ваги, віку та ін.

Мал. 1а. Приклад нормального розподілу (середнє 95,0, стандартне відхилення 20,0 г / л). Сірими стовпцями показано розподіл рівня гемоглобіну. Колоколообразная крива над стовпцями відповідає кривої нормального розподілу.

При нормальному розподілі всі значення ознаки можна розташувати в формі симетричною колоколообразной кривої (рис. 1а). При цьому в межах одного стандартного відхилення від середнього знаходиться 68% всіх значень ознаки (для прикладу на малюнку 1а в інтервалі 75-115 знаходиться 68% всіх значень), в межах двох стандартних відхилень від середнього знаходиться 95% всіх значень ознаки (для прикладу на малюнку 1а це інтервал 55-135 г / л), і в межах трьох стандартних відхилень знаходиться 99,5% усіх значень ознаки.

Однак в медицині зустрічаються і дані, розподіл яких відмінно від нормального. Як характерний приклад можна привести тривалість спостереження пацієнтів. На початкових термінах спостереження пацієнтів завжди більше, а потім їх кількість зменшується внаслідок втрати з спостереження, смерті, і інших причин. Такий розподіл показано на рис 2а. Можна бачити, що крива нормального розподілу абсолютно не відповідає реальній картині, відображеної сірими стовпцями.

Мал. 2а. Приклад розподілу, відмінного від нормального: тривалість спостереження 4389 пацієнтів.

Для таких розподілів поняття середнє і стандартне відхилення втрачають сенс, оскільки вони дають неправильний опис распреденія змінної. Так, для прикладу на малюнку 2а середнє становить 3,5 м а стандартне відхилення 3,2 року. Виходить, що 95% пацієнтів повинні мати термін спостереження від «мінус» 2,9 м до 9,9 м Цілком ясно, що негативних термінів спостереження не буває. Навіть в інтервал одного стандартного відхилення, в якому повинно знаходитися 68% всіх значень, явно потрапляє близько 80% всіх спостережень. Відмінною рисою розподілу, відмінного від нормального, є несиметричне по відношенню до середнього значення розподіл ознаки ( «скошенность») або наявність явно вибиваються із загальної картини значень.

Розподілу, відмінні від нормального, прийнято описувати за допомогою медіани і інтерквартільного розмаху. Медіана - це значення ознаки, яке ділить весь ряд значень навпіл, тобто половина значень ознаки менше медіани, і половина - більше її. Інтерквартільний розмах - це інтервал між 25 і 75 процентилями, тобто чверть всіх значень ознаки будуть менше 25 процентилю, а чверть - більше 75 процентилю. Таким чином, інтерквартільний розмах містить «центральні» 50% значень ознаки.

Для тривалості спостереження, показаного на малюнку 2а, медіана становить 2,5 року і інтерквартільний розмах 1,0 - 5,1 років. Це означає, що половина всіх хворих знаходилася на лікуванні гемодіалізом 2,5 року. Чверть всіх хворих - менше одного року, і чверть всіх хворих - більше 5,1 року. Це опис правильно характеризує реальний розподіл ознаки.

В принципі, поняття медіани і інтерквартільного розмаху цілком можна застосувати і до нормального розподілу. В цьому випадку медіана буде дорівнює середньому, а в межах інтерквартільного розмаху буде знаходитися трохи менше значень (50% всіх значень), ніж в межах одного стандартного відхилення (68% всіх значень).

Для розподілів, відмінних від нормального, не підходить і графічне відображення даних, прийняте для нормального розподілу. Серед кількох варіантів, які підходять для візуального представлення даних будь-якого розподілу, на наш погляд, найбільш зручні ящічковие діаграми.

На малюнку 3а показана ящічковая діаграма. Шухлядка зафарбований сірим кольором. Його нижня межа є 25 процентиль, верхня - 75 процентиль. Горизонтальна чорна риса, яка перетинає скриньку - це медіана. Як бачимо, медіана ділить скриньку на дві нерівні частини - значить в розподіл, відображене на малюнку 3а, носить неправильний характер. Від шухлядки відходять «вуса». У прикладі на малюнку 3а нижній «вус» відображає інтервал, в якому перебувають 25% найнижчих значень - від 9 до 17. Слід звернути увагу, що над верхнім «вусом» є дві точки - викиди (так позначаються значення ознаки, сильно виділяються з його загальної сукупності). Тому верхній «вус» відображає інтервал, в якому перебувають 22,2% (25% мінус два значення, які становлять 2,8%). Таким чином, якщо викидів немає, то «вус» відображає інтервал, в якому перебувають 25% всіх спостережень. Якщо ж викиди є, то «вус» відображає інтервал, в якому знаходяться значення від квартили до величини, яка менше, ніж півтори довжини шухлядки (в прикладі на рис. 3а це інтервал 27-42 року). На малюнку 3а також видно, що «вуса» мають різну довжину. Це також говорить про те, що розподіл віку до початку гемодіалізу для даної патології носить ненормальний характер.

Слід зазначити, що значення середнього і стандандартного відхилення чутливі до викидів, і можуть значно змінюватися при наявності екстремальних значень в ряду даних. Опис даних за допомогою медіани і інтерквартільного розмаху дозволяє уникнути впливу викидів.

Ящічковая діаграма на малюнку 4а має однакові «вуса», однак медіана збігається з 25-й процентиль, і в області як мінімальних, так і максимальних значень є викиди. Це говорить про те, що розподіл носить ненормальний характер. Факт збігу медіани і 25-й процентилі пояснюється досить просто. Діастолічний тиск нижче 75 мм. рт. ст. мають 19,1% пацієнтів, а тиск 80 мм.рт.ст. - 35,2% хворих. Таким чином, і медіана і 25-ая процентріль рівні 80 мм.рт.ст.

На малюнку 4а показані також графіки, які використовуються для представлення даних нормального розподілу. Один з них демонструє середнє значення АТ для тієї ж групи хворих і стандартне відхилення від середнього (позначено цифрою 2), а інший - середнє і два стандартних відхилення (під цифрою 3). Середнє становить 84 мм. рт. ст, стандартне відхилення - 12 мм.рт.ст. Хоча середнє відрізняється від медіани всього на 4 мм.рт.ст. для популяційних досліджень це є дуже істотною різницею, яка може призводити до неправильної інтерпретації результатів. Крім того, хоча межі стандартних відхилень і близькі до реально наявними даними, вони ніяк не відображають наявну неоднорідність розподілу значень артеріального тиску.

З огляду на, що ящічковие діаграми добре відображають як нормальне, так і ненормальне розподілу, виявляють крайні значення ознаки і більш інформативні в поданні частоти народження окремих значень, вони широко використовуються при відображенні числових ознак.

Помістити посилання в або інші