5.6. ПЕРЕВІРКА ЗНАЧУЩОСТІ КОЕФІЦІЄНТІВ КОРЕЛЯЦІЇ

Коефіцієнти кореляції як міри зв'язку між випадковими величинами є та­кож величинами випадковими, носять імовірнісний характер. Статистичні висновки про кореляційний зв'язок між величинами роблять не з генерально­го коефіцієнта кореляції р (значення цього параметра є звичайно невідомим), а за його вибірковим аналогом г. Оскільки коефіцієнти кореляції г розрахову­ється за значеннями змінних, які випадково потрапили у вибірку з генераль­ної сукупності, то й статистика г є величиною випадковою, яка потребує ста­тистичної оцінки.. Як правило, перевіряють нульову гіпотезу про відсутність кореляційного зв'язку між змінними у генеральній сукупності, тобто Н0: р = 0. Достовірність (вірогідність) коефіцієнтів кореляції залежить від прийнято­го рівня значущості а і обсягу вибірки п.

Коефіцієнт лінійної кореляції Персона гху

Коефіцієнт кореляції гху як вибіркова статистика є мірою оцінкою свого генерального параметра рху. Статистика лінійного коефіцієнта кореляції має розподіл Стьюдента:

г

г   7(1 - гі)/(п - 2) •     (530)

Нульову гіпотезу Н0 відхиляють на рівні значущості а, якщо критичне значення ґ-критерію      не перевищує емпіричного значення ґг.

Приклад 5.21. Оцінити значущість кореляційного зв'язку між успішністю виконання тестових завдань з фізики (X) і математики (У) учнями загальноос­вітньої школи (табл. 5.46).

Послідовність рішення:

• за емпіричними даними В2:С13 (рис. 5.46) оцінити характер лінійності зв'язку між ознаками X і У за допомогою діаграми розсіяння (рис. 5.47);


•           переконатися, що кореляція лінійна. З діаграми видно, що зв'язок пря­мий і лінійний (рис. 5.47).Це дає підстави для застосування критерію tr для оцінювання значущості коефіцієнта кореляції Пірсона rxy;

у комірці В14 розрахувати коефіцієнт кореляції Пірсона за допомо­гою функції MS Excel =ПИРСОН(В2:В13;С2:С13). Значення = +0,77 свід­чить про сильний прямий зв'язок між ознакамиX і Y;

у комірці В15 розрахувати емпіричний критерій tr за допомогою виразу =В14*КОРЕНЬ((СЧЕТ(Л2:Л13)-2)/(1-В14Л2)) і отримати значення tr~ 3,87;

отримати однобічне критичне значення t-критерію Стьюдента за допо­могою функції =СТЬЮДРАСПОБР(), яка повертає t0ioi ~ 2,76. Для цього у комірку В17 внести вираз =СТЬЮДРАСПОБР(2*В16;СЧЕТ(Л2:Л13)-2).

Прийняття рішення: Оскільки tr >t001 (3,87>2,76), нульова гіпотеза від­хиляється.

Висновки: значення ~ +0,77, яке свідчить про суттєвий прямий лі­нійний зв'язок між результатами виконання учнями тестових завдань з фізики і математики, можна вважати істотними на рівні значущості а=0,01.


Коефіцієнт рангової кореляції Спірмена ґ3

Коефіцієнт рангової кореляції Спірмена г* використовується для визна­чення тісноти зв'язків між кількісними і якісними ознаками, якщо їх значення проранжовані. Коефіцієнт кореляції рангів г* розраховується за формулою:


¡=1

(5.31)

г* = 1 -

п ■ (п2 -1)

де: п - обсяг сукупності об'єктів; (х—у/) - різниця рангів /-го об'єкта. Кое­фіцієнт г* приймає значення в інтервалі від -1 до +1.

Приклад 5.22. Оцінити наявність і значущість зв'язку між оцінками експе­ртів толерантності студентів до викладача (змінна X) і толерантності до ін­ших студентів (змінна У). Дані представлено в таблиці рис. 5.48.



Для обчислення коефіцієнта кореляції г* внести відповідні вирази:

у комірку     вираз =В4-С4, аналогічні вирази -у комірки Б5:

у комірку Е4 вираз =Б4Л2, аналогічні вирази внести у комірки Е5: Е15;

у комірку Е16 вираз =СУММ(Е4:Е15);

- у комірку В17 вираз = 1-6*Е16/Л15/(Л15л2-1), отримати значення 0,77:

г = 1    2          » 0,77 .

1       12 • (122 -1)

• Оцінка значущості коефіцієнта рангової кореляції г5. Вибірковий роз­поділ гет що характеризує нульову кореляцію між двома групами рангів, по­в'язаний з ґ-розподілом Стьюдента. Якщо значення г5 дорівнює 0 і п >10, ем­піричний критерій для ступенів вільності (п-2) визначається за формулою:

г.

ґ емп

- г})/(п - 2)

У комірку В18 внести вираз: =В17/КОРЕНЬ((1-Б17л2)/(Л15-2)), отримати значення 4„и ~ 3,81. Для малих сукупностей (п<10) перевірка нуль-гіпотези вимагає точного визначення вибіркового розподілу г8.

• Критичне значення ґ-критерію отримати для а =0,01 і п=15. У комірку В19 внести функцію =СТЬЮДРАСПОБР(0,01/2;Л15-2), яка дасть ґкр~ 3,58.

Висновки: оскільки ґеЛЯ > ^ (3,81 >3,58), нуль-гіпотеза про відсутність ко­реляції відхиляється на рівні 0,01. Чисельне значення г^=0,77 свідчить про суттєвий прямий зв'язок.

Дихотомічний коефіцієнт кореляції Пірсона <р

Для визначення тісноти зв'язку ознак X і У, які оцінюються у двох зна­ченнях 1 і 0, застосовується коефіцієнт <р Пірсона:

(р=  ,    ,           (5.32)

-\рх ■ ру ■ (п ~ рх ) • (п " ру )

де: рху - число об'єктів, що мають «1» і з X, і з У; рх і ру - число об'єктів, що мають «1» з X і з У відповідно; п - загальна кількість об'єктів.

Приклад 5.23. Оцінити зв'язаність між захопленістю учнів спортом та їх­ньою схильністю до математики. У таблиці рис. 5.50 позначення для X і У: 1 -наявність ознаки, 0 - її відсутність.

Послідовність рішення:

•           Розрахунки коефіцієнта <р проводимо за допомогою таких виразів:

у комірку В15 внести вираз =СЧЕТ(Б3:Б14);

у комірку В16 - вираз =СУММЕСЛИ(Б3:Б14;"=Г;С3:С14);

у комірку В17 - вираз =СУММ(Б3:Б14);

у комірку В18 - вираз =СУММ(С3:С14);

у комірку В19 - вираз =(Б15*Б16-Б17*Б18)/КОРЕНЬ(Б17*Б18*(Б15-Б17)*(Б15-Б18)). Звичайні арифметичні розрахунки дають аналогічний ре­зультат коефіцієнта кореляції <р Пірсона длярху = 5,рх = 6,ру = 7 і п = 12:

у> =     ~ 0,51,

д/6 • 7 • (12 - 6) • (12 - 7)

•           Оцінка значущості коефіцієнта кореляції ^. Якщо прийняти, що вибір­ковий розподіл коефіцієнта ер приблизно описується нормальним законом з нульовим середнім і одиничним стандартним відхиленням, перевірка нуль-гіпотези виконується за допомогою г-критерію: гемп = д) -4п ,

Внести у комірку В20 вираз =Б19*КОРЕНЬ(Б15) і отримати гемп:


іеяп = 0,51 -ТЛ * 1,76,

•           Критичне значення г-критерію для а=0,05 розташоване нижче го/2 стан­дартного нормального розподілу (0,025 або 0,975). У комірку В21 внести фу­нкцію =НОРМСТОБР(1-0,05/2), яка поверне значення гкр ~ 1,96.

Висновки: оскільки гем„<ікр (1,76<1,96), на рівні значущості 0,05 нульова гіпотеза Нд приймається. Отже, значення коефіцієнта <р ~ 0,51 не може свід­чити про існування зв'язку між захопленістю спортом учнів і проявом схиль­ності до математики.

Точково-бісеріальний коефіцієнт кореляції грь

Точково-бісеріальний коефіцієнт кореляції грЬ використовується для емпі­ричних даних, значення яких отримано за різними шкалами вимірювань, на­приклад, якщо змінна x вимірюється за дихотомічною шкалою, а змінна У - у шкалі інтервалів або відносин:

_ У і - У 0 І п1 ■ п0
грь -    лі   :    тг,         (5.33)

*у     \п ■ (п -1)

де У і і п1- середнє і кількість У об'єктів, що мають 1 з X; У0 і п0 - середнє і кількість У об'єктів, що мають 0 з X; яу - стандартне відхилення всіх п значень У; п = п1 + п0 . Приклад 5.24. Оцінити зв'язок між показниками «стать» і «зріст» рис. 5.51 для 15 підлітків (x = 1 для чоловічої, x = 0 для жіночої статі). Послідовність рішення:

•           Розрахунки коефіцієнта кореляції грЬ :

у комірку Е3 внести =СЧЕТ(Л3:Л12) і отримати п = 10;

у комірку Е4 внести =СУММ(Б3:Б12) і отримати п1=6;

у комірку Е5 внести =Е3-Е4 і отримати п0=4;

-           у комірку Е6 внести =СУММЕСЛИ(Б3:Б12;1;С3:С12)/Е4 і отримати середній зріст хлопчиків У1 «167,83 см;

-           у комірку Е7 внести =СУММЕСЛИ(Б3:Б12;0;С3:С12)/Е5 і отримати середній зріст дівчат У о ~ 154 см;

у комірку Е8 внести =СТАНДОТКЛОН(С3:С12) і отримати стандартне відхилення 5у= 11,35;

у комірку Е9 внести вираз для розрахунку точково-бісеріального коефі­цієнта =(Е6-Е7)/Е8*КОРЕНЬ(Е4*Е5/Е3/(Е3-1)) і отримати його значення:

167,83-154 /    6 ■ 4~

0,63 .

11,35     \ 10 • (10 -1)

На рис. 5.51 представлено результати розрахунку точково-бісеріального коефіцієнта кореляції грЬ, на рис. 5.52 - відповідні розрахункові формули.



• Оцінка значущості коефіцієнта кореляції грь зводиться до перевірки нуль-гіпотези (Н0: трЬ = 0) , для якої використовується статистика і-критерій Стьюдента з (и-2) ступенями вільності:

г

(5.34)

Для розрахунку іеля у комірку Е10 внести =Е9/КОРЕНЬ((1-Е9л2)/(Е3-2)) і отримати значення іеля ~ 2,29.

• Критичне значення і-критерію можна отримати за допомогою функції =СТЬЮДРАСПОБР(<х/2; и-2). При а =0,05 і и=10 у комірку В256 внести фу­нкцію =СТЬЮДРАСПОБР(0,05/2;Е3-2), яка дає значення ^ = 2,75.


• Висновки: оскільки отримане значення ґеЛЯ -2,29 не перевищує критичне значення ^—2,75 нуль-гіпотеза про відсутність кореляції приймається. Отже, з імовірністю 95% (а=0,05) правдоподібно, що у цій ситуації коефіцієнт ко­реляції грЬ , який приймає доволі суттєве значення (0,63), не є вірогідним!

Запитання. Завдання.

Охарактеризуйте особливості застосування, розрахунку і перевірки значущості коефіцієнта лінійної кореляції Пірсона.

Охарактеризуйте особливості застосування, розрахунку і перевірки значущості коефіцієнта рангової кореляції Спірмена.

Охарактеризуйте особливості застосування, розрахунку і перевірки значущості дихотомічного коефіцієнта кореляції Пірсона ^.

Охарактеризуйте особливості застосування, розрахунку і перевірки значущості точково-бісеріального коефіцієнта кореляції.

Повторіть математичні процедури завдань за прикладами 5.21 - 5.24.

Виконайте лабораторні роботи № 20 - № 22.