Навчально-довідковий посібник із статистичними розрахунками в вивченні курсу математична 1

Тіснота зв'язку між результативною ознакою Х і фактором У при нелінійній формі їх зв'язку оцінюється за допомогою коефіцієнта детермінації R 2. який знаходиться за тією ж формулою (8) з п.5.6, що і для лінійного зв'язку. Якісна оцінка тісноти зв'язку проводиться за шкалою Чеддока.

Аналогом коефіцієнта кореляції для нелінійного випадку служить кореляційне відношення.

5.8 Множинна регресія

Оскільки в гірничій справі важливі виробничі показники найчастіше пояснюються кількома факторами, то для їх прогнозу застосовується множинна регресія, параметри якої визначаються також за методом найменших квадратів.

Загальний вигляд моделі:,

де х1. х2. ..., хk - незалежні фактори, а у - результуючий показник. При цьому функція регресії може бути як лінійна, так і нелінійна.

Дуже важливим є питання про те, скільки незалежних факторів може бути в рівнянні множинної регресії при заданому обсязі вибірки n. Зазвичай використовують таке правило: число спостережень має бути не менше ніж в 8-10 разів більше числа факторів в рівнянні регресії.

Найбільш зручна форма розрахунку лінійної регресії - матрична. Наведемо розрахункові формули, які можна легко реалізувати в комп'ютері за допомогою пакету програм Mathcad.

Нехай дані рівняння регресії має вигляд:.

Введемо матрицю оцінок параметрів регресії. Вона невідома.

Для складання регресії візьмемо вибірку обсягу n і запишемо спостережувані значення ознак Х1. Х2. ..., Хk і У.

На підставі отриманих даних запишемо матриці:

. . Тут хij позначає спостережуване значення i - го ознаки для j -го спостереження.

У матричної формі рівняння регресії має вигляд: Х × А = У

Помножимо обидві частини рівняння зліва на транспоновану матрицю Х Т.

Отримаємо: Х Т × Х × А = Х Т × У. Позначимо матрицю моментів В = Х Т × Х. Тоді з матричного рівняння В × А = Х Т × У можна знайти матрицю оцінок:

Розрахунок коефіцієнта детермінації здійснюється за формулою:

Кореляційне відношення знаходиться за формулою:.

Перевірка моделі на адекватність здійснюється за критерієм Фішера:. де n - обсяг вибірки, k - число змінних в рівнянні регресії. Потім по таблиці критичні точки розподілу Фішера - Снедекора (Додаток 7) знаходимо критичне значення критерію

Якщо бачимо значення критерію F виявиться більше критичного, то визнаємо отриману множинну регресію адекватної; якщо ж бачимо значення критерію F виявиться менше критичного, то робимо висновок, що побудована модель неадекватною реальної.

Зауваження 1 Даний спосіб перевірки моделі на адекватність можна застосовувати і для двовимірних як лінійних, так і нелінійних моделей.

Зауваження 2 Матричний підхід у складанні рівняння регресії можна також використовувати для випадку лінійної регресії з однією змінною.

Розглянемо приклад складання множинної регресії.

Завдання. Досліджується залежність місячної видобутку вугілля по ділянці від потужності пласта і глибини проведення робіт.

Введемо позначення чинників:

У - місячна видобуток вугілля; Х1 - потужність пласта, Х2 - глибина проведення робіт.

Використовуючи фізичну сутність факторів, визначимо залежні і незалежні ознаки.

Результативний (залежний) ознака - У;

незалежні ознаки - Х1 і Х2.

Вихідні дані по 20 лав, що працюють приблизно в однакових умовах, наводяться в таблиці:

Число незалежних змінних одно k = 2.

Рівняння лінійної регресії має вигляд:

Розрахунки здійснимо за допомогою пакета програм Mathcad.

Реалізація розрахунків всіх необхідних параметрів і характеристик даного завдання в середовищі Mathcad демонструється нижче.

Використовуючи результати розрахунків, зробимо висновки.

1) Рівняння лінійної регресії має вигляд:

Значить, зі збільшенням потужності пласта (Х1) місячна видобуток вугілля збільшується, а зі збільшенням глибини робіт (Х2) місячна видобуток вугілля зменшується.

2) Коефіцієнт детермінації дорівнює R 2 = 0,612. Отже, варіації ознак Х1 і Х2 пояснюють 61,2% загальної дисперсії результативної ознаки У. Решта дисперсії У (38,8%) пояснюється іншими факторами, неврахованими в даній моделі. Користуючись шкалою Чеддока, можна стверджувати, що між місячної видобутком вугілля і незалежними факторами, такими як потужність пласта і глибина проведення робіт існує помітний зв'язок.

3) Корреляционное відношення для лінійної множинної моделі одно