Достовірність коефіцієнта кореляції

Отриманий будь-яким із способів коефіцієнт кореляції є вибірковим, тому що він визначений для обмеженої сукупності, яка є вибіркою з генеральної сукупності. Тому існує помилка при розрахунку коефіцієнта кореляції. Ця помилка - розбіжність між коефіцієнтом кореляції для генеральної сукупності і коефіцієнтом для вибірки. Ця помилка визначається наступним чином:

У наведені вище формули замість r можна підставити r або Т4.

Для визначення достовірності коефіцієнта кореляції використовується критерій Стьюдента.

Основні етапи перевірки гіпотези про достовірність коефіцієнта кореляції.

1. Формулювання гіпотези, яку в подальшому необхідно прийняти або відхилити. Але: r = 0.

2. Визначити розрахункове значення t критерію Стьюдента

3. Визначити табличное критичне значення (додаток 1) tтабл. Для цього необхідно знати:

n = n-2 - число ступенів свободи і - рівень значущості.

4. Порівняти значення розрахункового коефіцієнта з табличним

5. Зробити висновок. Статистична гіпотеза приймається або відкидається.

· Якщо tpacч. ³ tтабл. (, N), то отриманий коефіцієнт кореляції достовірний, і між досліджуваними показниками існує статистичний зв'язок з ймовірністю q = 1;

· Якщо tpacч.

При вивченні кореляційної зв'язку було відзначено, що коефіцієнт кореляції показує ступінь зв'язку, напрямок зв'язку, форму зв'язку між двома досліджуваними вибірками, але він не дає можливості визначити, як кількісно змінюється одна величина в міру зміни іншої.

Регресія - це залежність середнього значення випадкової величини У від величини Х і, навпаки, залежність середнього значення випадкової величини Х від величини У. описана рівнянням, отримана шляхом побудови емпіричної або теоретичної лінії регресії і за допомогою обчислення коефіцієнтів регресії. Існує лінійна і нелінійна взаємозв'язок між досліджуваними показниками, отже, можна скласти рівняння лінійної або нелінійної регресії.

Існує залежність між двома показниками і декількома. І рівняння регресії можуть бути множинними.

У виборі регресійній моделі допомагає графічне представлення експериментальних даних у вигляді діаграми розсіювання або кореляційного поля. За вибірковими даними складається кореляційне поле, на яке наносяться також середні значення У в кожному інтервалі зміни Х. Ці точки з'єднуються між собою ламаною лінією, з вигляду якої можна судити, як в середньому змінюється У залежно від зміни Х. Така ламана лінія називається емпіричною лінією регресії. Потім ламану лінію апроксимують прямою лінією. При лінійної залежності можна зробити простіше: замінити кореляційний еліпс прямою лінією.

Лінійна регресія, або лінійна форма зв'язку між випадковими змінними займає особливе місце в теорії кореляції. При такій формі зв'язку У є лінійна функція від Х. т. Е.

де а і b - коефіцієнти регресії, Х - незалежна випадкова змінна. Лінійна регресія обумовлюється двовимірним нормальним законом розподілу пари випадкових величин (Х, У).

Параметри в рівнянні регресії, т. Е. Коефіцієнти регресії, визначаються за способом найменших квадратів. Суть його полягає в тому, щоб сума квадратів відхилень виміряних величин від істинного значення була б мінімальною.

У разі лінійної регресії за теоретичне значення приймається значення У. отримується за відомою формулою, т. Е. Шукається така пряма лінія, сума квадратів відхилень виміряних Уi від якої була б мінімальною.

Значення коефіцієнтів регресії визначаються рішенням системи нормальних рівнянь.

Схожі статті