описова статистика

У практичних спостереженнях ми зазвичай маємо сукупність спостережень х1, х2. хn, на основі яких потрібно зробити ті чи інші висновки. Часто цих спостережень багато, тому виникає задача їх компактного опису. В ідеалі таким описом могло б бути твердження, що х1, х2. хn є вибіркою, тобто незалежними реалізаціями випадкової величини x з відомим законом розподілу F (x). Це дозволило б теоретично провести розрахунки всіх необхідних досліднику характеристик спостережуваного явища.

Однак далеко не завжди ми можемо стверджувати, що х1, х2. хn є незалежними і однаково розподіленими випадковими величинами. По-перше, це необхідно перевірити, а по-друге, часто наперед відомо, що це не так. Тому для компактного опису сукупності спостережень використовують інші методи - методи описової статистики.

1.Методи описової статистики

1 Показники описової статистики

Показники, що описують вибірку можна розбити на кілька груп:

1. Показники стану описують стан даних (або середини сукупності) на числовій осі:

- Мінімальний і максимальний елементи вибірки

- Вибіркові верхній і нижній квартили

2. Показники розкиду описують ступінь розкиду даних щодо свого центру (наскільки купчасто основна маса даних групується близько середини сукупності)

- Вибіркове середнє відхилення (стандартне відхилення)

3. Показники асиметрії описують симетричність розподілу даних біля свого центру

- Положення вибіркової медіани щодо вибіркового середнього і щодо вибіркових квартилей

4. Показники, що описують закон розподілу. дають уявлення про закон розподілу даних

- Вибіркова функція розподілу

З перерахованих вище характеристик на практиці за традицією найчастіше використовують вибіркові середнє, медіану і дисперсію (або стандартне відхилення). Однак для отримання більш точних і достовірних висновків необхідно використовувати і інші показники.

Особливу увагу слід звернути на наявність у вибірці викидів - грубих, сильно відрізняються від основної маси, спостережень. Більшість традиційних статистичних методів вельми чутливі до відхилень від умов застосовності методу. Тому викиди можуть не тільки спотворити значення вибіркових показників, але і привести до помилкових висновків. Підозра про присутність таких спостережень повинно виникнути, якщо вибіркова медіана сильно відрізняється від вибіркового середнього, хоча в цілому сукупність симетрична, або, якщо положення медіани сильно несиметрично щодо мінімального і максимального елементів вибірки. Найпростіше виявити викиди за допомогою переходу від вибірки до варіаційного ряду або гістограмі з великим числом інтервалів угруповання.

2 Порядок виконання роботи

2.1 Вихідні дані

Вихідними даними є набір реалізацій випадкової величини (наприклад, значення якої-небудь величини, отримані при вимірюванні). Розмір вибірки - n шт. Вихідні дані оформити у вигляді таблиці (таблиця 1).

Таблиця 1 - Вихідні дані

2.2Построеніе варіаційного ряду

Для зручності роботи з даними вибірку перетворять в варіаційний ряд - ряд, в якому елементи вибірки упорядковуються по зростанню.

1. Знайти найменший елемент ряду Xmin

2. Знайти найбільший елемент ряду Xmax

3. Записати ряд, починаючи з найменшого елемента Xmin і закінчуючи найбільшим Xmax (таблиця 2)

4. Для спрощення процедури обробки та з метою зменшення помилок при обчисленнях необхідно відняти з кожного елемента ряду постійне число (наприклад, округлене Xmin) і використовувати в розрахунках не самі розміри, а їх відхиленнями. Утворені відхилення записати в таблицю 2.

Таблиця 2 - Варіаційний ряд з відхиленнями щодо x0 = <значение>[1]

При невеликих вибірках

.

2. Призначити довжину інтервалів. Довжину інтервалів Dx найчастіше вибирають однаковою: Dx = R / r. Її округлюють до значення, зручного для графічного відображення.

3. Призначити нижню межу xн першого інтервалу (у відхиленнях від x0). Вона повинна бути менше xmin і зручною з позиції графічного відображення. Результат занести в таблицю 3.

4. Призначити нижні xн і верхні xв кордону всіх, хто лишився інтервалів (у відхиленнях від x0). Результати занести в таблицю 3.

5. Визначити число розмірів, що потрапляють в інтервал mi. Умова попадання розміру xj в інтервал xiн

.

2.4 Визначення частостей

Ставлення частоти mi до загальної кількості спостережень n називається частостей:

Частість є емпіричну оцінку ймовірності попадання результатів спостережень Хj в i інтервал.

Визначити частости і результати занести в таблицю 3.

Отримані результати перевірити за умовою

.

2.5 Визначення емпіричної щільності ймовірностей

Емпірична щільність ймовірностей дорівнює:

Визначити емпіричну щільність ймовірності, результати занести в таблицю 3.

1. Визначити всі твори в таблиці 4.

2. Визначити всі суми в таблиці 4.

3. Визначити відносні початкові моменти в таблиці 4.

4. Перерахувати отримані моменти для розмірності вимірюваної величини.

5. Розрахувати коефіцієнти ексцесу і асиметрії.

6. Визначити графічно верхній і нижній квартили.

7. Визначити графічно вибіркову медіану.

8. Визначити вибіркову моду (по вариационному ряду).

9. Визначити розмах.

2.9 Оформлення результатів

Таблиця 5 - Показники описової статистики для вибірки n =<>

1. Показники стану

- Мінімальний елемент вибірки MIN

- Максимальний елемент вибірки MAX

- вибірковий верхній квартиль x0,75

- вибірковий нижній квартиль x0,25

- вибіркова медіана Md

- вибіркова мода Mo

2. Показники розкиду

- дисперсія вибірки S2

- вибіркове середнє квадратичне відхилення S

- коефіцієнт ексцесу kекс

3. Показники асиметрії

- Коефіцієнт асиметрії kас

- становище вибіркової медіани щодо вибіркового середнього і щодо вибіркових квартилей

Схожі статті