У практичних спостереженнях ми зазвичай маємо сукупність спостережень х1, х2. хn, на основі яких потрібно зробити ті чи інші висновки. Часто цих спостережень багато, тому виникає задача їх компактного опису. В ідеалі таким описом могло б бути твердження, що х1, х2. хn є вибіркою, тобто незалежними реалізаціями випадкової величини x з відомим законом розподілу F (x). Це дозволило б теоретично провести розрахунки всіх необхідних досліднику характеристик спостережуваного явища.
Однак далеко не завжди ми можемо стверджувати, що х1, х2. хn є незалежними і однаково розподіленими випадковими величинами. По-перше, це необхідно перевірити, а по-друге, часто наперед відомо, що це не так. Тому для компактного опису сукупності спостережень використовують інші методи - методи описової статистики.
1.Методи описової статистики
1 Показники описової статистики
Показники, що описують вибірку можна розбити на кілька груп:
1. Показники стану описують стан даних (або середини сукупності) на числовій осі:
- Мінімальний і максимальний елементи вибірки
- Вибіркові верхній і нижній квартили
2. Показники розкиду описують ступінь розкиду даних щодо свого центру (наскільки купчасто основна маса даних групується близько середини сукупності)
- Вибіркове середнє відхилення (стандартне відхилення)
3. Показники асиметрії описують симетричність розподілу даних біля свого центру
- Положення вибіркової медіани щодо вибіркового середнього і щодо вибіркових квартилей
4. Показники, що описують закон розподілу. дають уявлення про закон розподілу даних
- Вибіркова функція розподілу
З перерахованих вище характеристик на практиці за традицією найчастіше використовують вибіркові середнє, медіану і дисперсію (або стандартне відхилення). Однак для отримання більш точних і достовірних висновків необхідно використовувати і інші показники.
Особливу увагу слід звернути на наявність у вибірці викидів - грубих, сильно відрізняються від основної маси, спостережень. Більшість традиційних статистичних методів вельми чутливі до відхилень від умов застосовності методу. Тому викиди можуть не тільки спотворити значення вибіркових показників, але і привести до помилкових висновків. Підозра про присутність таких спостережень повинно виникнути, якщо вибіркова медіана сильно відрізняється від вибіркового середнього, хоча в цілому сукупність симетрична, або, якщо положення медіани сильно несиметрично щодо мінімального і максимального елементів вибірки. Найпростіше виявити викиди за допомогою переходу від вибірки до варіаційного ряду або гістограмі з великим числом інтервалів угруповання.
2 Порядок виконання роботи
2.1 Вихідні дані
Вихідними даними є набір реалізацій випадкової величини (наприклад, значення якої-небудь величини, отримані при вимірюванні). Розмір вибірки - n шт. Вихідні дані оформити у вигляді таблиці (таблиця 1).
Таблиця 1 - Вихідні дані
2.2Построеніе варіаційного ряду
Для зручності роботи з даними вибірку перетворять в варіаційний ряд - ряд, в якому елементи вибірки упорядковуються по зростанню.
1. Знайти найменший елемент ряду Xmin
2. Знайти найбільший елемент ряду Xmax
3. Записати ряд, починаючи з найменшого елемента Xmin і закінчуючи найбільшим Xmax (таблиця 2)
4. Для спрощення процедури обробки та з метою зменшення помилок при обчисленнях необхідно відняти з кожного елемента ряду постійне число (наприклад, округлене Xmin) і використовувати в розрахунках не самі розміри, а їх відхиленнями. Утворені відхилення записати в таблицю 2.
Таблиця 2 - Варіаційний ряд з відхиленнями щодо x0 = <значение>[1]
При невеликих вибірках
.
2. Призначити довжину інтервалів. Довжину інтервалів Dx найчастіше вибирають однаковою: Dx = R / r. Її округлюють до значення, зручного для графічного відображення.
3. Призначити нижню межу xн першого інтервалу (у відхиленнях від x0). Вона повинна бути менше xmin і зручною з позиції графічного відображення. Результат занести в таблицю 3.
4. Призначити нижні xн і верхні xв кордону всіх, хто лишився інтервалів (у відхиленнях від x0). Результати занести в таблицю 3.
5. Визначити число розмірів, що потрапляють в інтервал mi. Умова попадання розміру xj в інтервал xiн . Ставлення частоти mi до загальної кількості спостережень n називається частостей: Частість є емпіричну оцінку ймовірності попадання результатів спостережень Хj в i інтервал. Визначити частости і результати занести в таблицю 3. Отримані результати перевірити за умовою . Емпірична щільність ймовірностей дорівнює: Визначити емпіричну щільність ймовірності, результати занести в таблицю 3. 1. Визначити всі твори в таблиці 4. 2. Визначити всі суми в таблиці 4. 3. Визначити відносні початкові моменти в таблиці 4. 4. Перерахувати отримані моменти для розмірності вимірюваної величини. 5. Розрахувати коефіцієнти ексцесу і асиметрії. 6. Визначити графічно верхній і нижній квартили. 7. Визначити графічно вибіркову медіану. 8. Визначити вибіркову моду (по вариационному ряду). 9. Визначити розмах. Таблиця 5 - Показники описової статистики для вибірки n =<> 1. Показники стану - Мінімальний елемент вибірки MIN - Максимальний елемент вибірки MAX - вибірковий верхній квартиль x0,75 - вибірковий нижній квартиль x0,25 - вибіркова медіана Md - вибіркова мода Mo 2. Показники розкиду - дисперсія вибірки S2 - вибіркове середнє квадратичне відхилення S - коефіцієнт ексцесу kекс 3. Показники асиметрії - Коефіцієнт асиметрії kас - становище вибіркової медіани щодо вибіркового середнього і щодо вибіркових квартилей2.4 Визначення частостей
2.5 Визначення емпіричної щільності ймовірностей
2.9 Оформлення результатів
Схожі статті