2.1. ЕМПІРИЧНІ РОЗПОДІЛИ

Варіаційні ряди та статистичні розподіли

Емпіричні дані, які отримані шляхом вимірювань властивостей вибірко­вих об'єктів, повинні пройти первинну обробку і систематизацію: внесення у табличні форми (етап табуляціі), упорядкування у варіаційні послідовності (ряди), представлення у вигляді емпіричних розподілів4.

Приклад 2.1. Систематизувати результати виконання випадковою вибір­кою студентів тестових завдань: 3, 4, 4, 4, 3, 2, 4, 4, 5, 1 (обсяг вибірки п = 10) .

Послідовність рішення:

•           припустимо, що результати виконання тестових завдань адекватно хара­ктеризують досліджувану властивість5 студентів, яку позначимо змінною x;

4          Емпіричні розподіли іноді мають і такі назви: «статистичні розподіли», «ви­біркові ряди розподілу», «емпіричні розподіли частот», «розподіли емпіричних даних» та ін.

5          Наприклад, успішність розв'язування логічних завдань, рішення проблемних ситу­ацій, уміння виконувати різноманітні вправи тощо.

за умовами прикладу зміннаxприймає значення: х1 = 3, х2 = 4, „., х10 = 1;

первинні емпіричні дані (х,) внесено у перші два стовпчики табл. 2.1;

упорядковані дані (х/ ) представлено як варіаційний ряд у третьому сто­впчику табл. 2.1;

• значення варіант (х) та їхня кількість (т) наведено в останніх двох стовпчиках табл. 2.1.

Таблиця 2.1

Систематизація результатів виконання тестових завдань (X)

 

 

 

 

 

 

 

 

 

 

 

Первині дані

Варіаційний ряд

Варіанти x

Кількість варіант

}

х

*

х

Хі

ті

1

3

1

1

1

2

4

2

2

1

3

4

3

}    3

2

4

4

3

5

3

4

4

5

6

2

4

7

4

4

8

4

4

9

5

4

10

1

5

5

1

 

Як бачимо, варіаційний ряд - це упорядкована за збільшенням (або за зменшенням) послідовність значень досліджуваної змінної X (у табл. 2.1 зна­чення х/). Варіаційний ряд дає можливість наочно і швидко сприйняти стру­ктуру даних: варіанти значень (х;), які може приймати і приймає змінна X, а також кількість відповідних варіант (т), їхні мінімальне і максимальне зна­чення. Варіаційний ряд дозволяє безпосередньо оцінити деякі важливі показ­ники вибірки, наприклад, моду і медіану. Систематизація даних у варіацій­ний ряд є підготовчим етапом до розрахунків і побудови статистичних роз­поділів досліджуваної змінної.

Статистичний розподіл - це математична модель об'єктів реальності у вигляді співвідношення значень змінної X, що характеризує властивості вибі­рки, до частот їх появи. Наприклад, стовпчики значень Хі (варіанти X) і зна­чень ті (кількість варіант) у табл. 2.1 по суті утворюють статистичний роз­поділ, який розкриває залежність частоти появи (/і) від значень (х) змінної, тобто / ~ хг. Отже, під поняттям «статистичний розподіл»»/(х) слід розуміти емпіричний розподіли частот появи певних значень досліджуваної змінної (слово «частота» нерідко опускають, маючи на увазі його присутність). Час­тота / - це функція, де аргументом виступає варіанта хі.

Статистичні розподіли можна класифікувати за ознакою типів вимірювань6 змінної на: варіаційні, ранжировані та атрибутивні (рис. 2.1).

Статистичні розподіли


Варіаційні


Ранжировані


Атрибутивні


 

Рис. 2.1. Класифікація статистичних розподілів за типами вимірювань

Варіаційні розподіли базуються на даних, які виміряні за шкалою відно­шень або інтервалів. Ранжировані розподіли застосовуються у разі порядкових (рангових) типів вимірювання. Атрибутивні розподіли характеризують дані, які виміряні за номінальними шкалами або шкалами «найменувань».

Основні види статистичних розподілів такі: диференціальні та інтеграль­ні, які можуть складатися з абсолютних і відносних частот (рис. 2.2).

Статистичні розподіли


Диференціальні


Інтегральні


 


Абсолютні


Відносні


Абсолютні


Відносні


 

Рис. 2.2. Основні види статистичних розподілів

Диференціальні розподіли представляють значення частот окремо (тобто диференційовано) для кожної варіанти х,- змінної X.

Диференціальні абсолютні частоти - це кількості об'єктів Ші з однаковими значенням хі змінної X(або кількість однакових значень).

6 Найчастіше використовується класифікація Стівенса 4-х типів вимірювань: за шкалами відношень, інтервалів, порядковими та номінальними [59].

Диференціальні відносні частоти - це відношення диференціальних абсо­лютних частот Ші до загальної кількості п об'єктів, тобто £ = ші/п.

Інтегральні розподіли ( «накопичені» або «кумулятивні») формуються як доданки попередніх диференціальних частот. Вони визначають сумарні час­тоти для варіанти, що не перевищує значення х,- змінної X.

і

Інтегральні абсолютні частоти ^ ші - це накопичена сума диференціа­льних абсолютних частот від 1-ї доу-ї варіанти.

і

Інтегральні відносні частоти Е] = ^ /і - це накопичена сума диференціа­льних відносних частот від 1-ї доу-ї варіанти.

Варіаційні розподіли у разі інтервальних або відносних типів вимірювань залежать від:

•           характеру досліджуваної змінної - дискретна змінна, чи неперервна;

•           діапазону значень змінної - вузький і невеликий, чи широкий і різно­манітний.

Тому за технологією побудови варіаційні розподіли поділяють на розподіли незгрупованих і згрупованих варіант7. З метою лаконічності домовимося їх нази­вати незгрупованими і згрупованими розподілами. Для незгрупованих розподілів частоти мають відношення до безпосередніх значень варіант з варіативного ря­ду; для згрупованих розподілів - до груп (або інтервалів) значень варіант.

Незгруповані розподіли

Незгруповані розподіли застосовують до емпіричних даних, властивості яких виміряні за інтервальними або відносними шкалами і приймають тільки певні, як правило, дискретні у вузькому діапазоні значення. Процедури роз­рахунку незгрупованих розподілів простіші за розрахунки розподілів згрупо­ваних.

7 Дж. Гласс і Дж. Стенлі називають їх розподілами «згрупованих» і «незгрупованих» частот [17]; Г.Ф. Лакін - розподілами «неінтервальних і інтервальних» варіант [43]; А.Т. Опря розділяє розподіли на «дискретні» та «інтервальні» ряди [48].

Приклад 2.2. Розрахувати диференціальні та інтегральні розподіли вико-

наних студентами завдань за даними табл. 2.1 (обсяг вибірки п =10). Послідовність рішення:

характер емпіричних даних відповідає умовам для розрахунку незгрупова-них розподілів, оскільки діапазон варіант Хі змінної X містить всього 6 дискрет­них значень варіант {0, 1, 2, 3, 4, 5};

значення варіант коливаються від 0 виконаних завдань (мінімальне) до 5 виконаних завдань(максимальне), кількість варіант к=6;

диференціальні абсолютні частоти Ші (див. табл. 2.2) такі:

для Хі =0 частота ші =0 (немає жодного об'єкта з цим значенням змінної);

для х2=1 частота ш2=1 (один об'єкт з цим значенням змінної);

для х3=2 частота ш3=1 (один об'єкт з цим значенням змінної);

для х4=3 частота ш4=2 (два об'єкта з цим значенням змінної) і т.д. Сума всіх абсолютних частот повинна дорівнювати обсягу вибірки:

к          к

£ ші = п, тобто X Ші = ш1 + ш 2 + ... + шк = 0 + 1 + 1 + 2 + 5 + 1 = 10.

¡=1       і=1

Таблиця 2.2

Розподіли кількості виконаних завдань

 

 

 

Кількість виконаних завдань

Частоти:

диференціальні

інтегральні

абсолютні

відносні

абсолютні

відносні

і

Хі

ші

/ = ші /п

і

ш* = ^ ші

¡=1

рі=±/і

¡=1

1

0

0

0,00

0

0,00

2

1

1

0,10

1

0,10

3

2

1

0,10

2

0,20

4

3

2

0,20

4

0,40

5

4

5

0,50

9

0,90

6

5

1

0,10

10

1,00

 

Суми:

10

1,00

 

 

 

• диференціальні відносні частоти /і = ші /п (див. табл. 2.2) такі:

для х1=0 частота ш1= ш1 /п = 0/10 = 0,00 (або 0 %);

для х2=1 частота ш2= ш2 /п = 1/10 = 0,10 (або 10 %);

для х3=2 частота т3= т3 /п = 1/10 = 0,10 (або 10 %);

для х4=3 частота т4= т4 /п = 2/10 = 0,20 (або 20 %) і т.д.

Сума всіх відносних частот має дорівнювати одиниці (або 100 %):


 


]г /. = ]г ші / п = 0,00 + 0,10 + 0,10 + 0,20 + 0,50 + 0,10 = 1,00.

¿=1       ¿=1

і

інтегральні абсолютні частоти ^ті (див. табл. 2.2):


ї=1

1

для х1=0 частота £ ті = т1 = 0;

і=1

для х2=1 частота £ ті = т1 + т2 = 0 +1 = 1;

і=1 3

для х3=2 частота X ті = т1 + т2 + тз = 0 +1 +1 = 2;

і=1 4

- для х4=3 частота Xті = тх + т2 + тз +    = 0 +1 +1 + 2 = 4 і Т.д,

¿=1

Остання інтегральна абсолютна частота дорівнюватиме обсягу вибірки: У ті = т1 + т2 + т3 + т4 + т5 + т6 = 0 +1 +1 + 2 + 5 +1 = 10,

і

• інтегральні відносні частоти Рі =^/і (див. табл. 2.2) такі:

і=1

- для х1=0 частота ^1 = ^ І\ = /1 = 0;

і=1

для х2=1 частота ^ = £ / = /1 + /2 = 0 + 0,10 = 0,10;

для хз=2 частота ^ = £ / = /1 + / + /з = 0 + 0,10 + 0,10 = 0,20;

для Х4=3 частота F4 = £ / = / + /2 + / + /, = 0 + 0,10 + 0,10 + 0,20 = 0,40 і т.д.

і=1

Остання інтегральна відносна частота дорівнюватиме одиниці (або 100 %), оскільки сума всіх диференціальних відносних частот складає 1,00 або 100%:




 


Подпись: /І (X = хі) = <0,00

Х1

= 0;

0,10

Х2

= 1;

0,10

Хз

= 2;

0,20

Х4

= 3;

0,50

Х5

= 4;

0,10

Х6

= 5;

0,00

Х1

= 0;

0,10

Х2

= 1;

0,20

Х3

= 2;

0,40

Х4

= 3;

0,90

Х5

= 4;

1,00

Х6

= 5;


Рис. 2.4. Функція диференціального розподілу

Рис. 2.5. Функція інтегрального розподілу


 

Важливо усвідомити такі основні властивості функцій/ і р :

- диференціальна функція /(X = хі) показує значення частоти/ для змін­ної X, що дорівнює значенню х,- (тобто X = хі);

інтегральна функція F (X < хі) показує значення частоти F для змінної X, що не перевищує значення х,- (X < хі тобтоX або менше, або дорівнює х,);

обидві емпіричні функції є дискретними і пов'язані між собою співвід­ношенням Fj = ^ f t ;

1=1

-           Ft (X < хі) прийнято називати функцією розподілу, a f (X = хі) - функці­єю щільністю розподілу.

Приклад 2.3. Розрахувати статистичні розподіли за вибірковими емпірич­ними даними таблиці рис. 2.4. Послідовність рішення:

у комірках В6 і В7 визначити мінімальне і максимальне значення варі­анти х,- за допомогою функцій MS Excel =МИН(Л2:Е5) і =MAKC(A2:E5);

характер даних відповідає умовам розрахунку незгрупованих розподілів, оскільки діапазон змінної містить всього 7 дискретних значень {0, 1, 2, 3, 4, 5, 6};

 

 

А

со

с

D

Е

1

Емпіричні дані

2

4

6

4

3

4

3

3

4

5

5

3

4

5

4

4

1

5

5

2

6

5

4

4

6

Мінімальне

1

 

 

 

7

Максимальне

6

 

 

 

оо

Кількість

Частоти:

9

виконаних

диференціальні

інтегральні

10

завдань

абсолютні

відносні

абсолютні

відносні

11

Яї,-

fi

 

 

12

0

І

 

 

 

13

1

 

 

 

 

14

2

 

 

 

 

15

3

 

 

 

 

16

4

 

 

 

 

17

5

 

 

 

 

6

 

 

 

 

19

Суми:

 

 

 

Рис. 2.4. Внесення функції =ЧАСТОТА()

•           внести у комірки Л12:А18 значення варіант х,- від 0 до 6 (рис. 2.4);

•           виділити діапазон В12:В18, натиснути клавішу F2 і за допомогою «Майстра функцій» внести у ці комірки функцію MS Excel =ЧАСТОТА();



задати аргументи функції =ЧАСТОТА() у діалоговому вікні (рис. 2.5);


аргументы функции


массив_даннын ІД2:е5 масснв_интервалов |аі2:а1!

у| = -{4;б;4;3;4:3;4;5;5;: \;| = {0:1:2:3:4:5:6}


= -[0:1:1;3:3:5:2:0|-

Вычнсляет распределение значений по интервалам и возвращает вертикальный мaccив^ содержащий на один элеиент больше чей массив интервалов.

массивинтервалов массив интервалов или ссылка на интерваль^ в которых группируются значения из массива данных.

Справка по этой функции

Рис. 2.5. Введення аргументів функції =ЧАСТОТА()

• натиснути разом клавіші CTRL+SHIFT+ENTER і отримати у комірках В12:В18 значення абсолютних диференціальних частот (рис. 2.6);

 

 

А

в

с

о

Е

1

 

Емп

ричні дані

 

 

2

4

6

4

3

4

3

3

4

5

5

3

4

5

4

4

1

5

5

2

6

5

4

4

6

Мінімальне

1

 

 

 

7

Максимальне

6

 

 

 

со

Кількість

Частети:

Э

виконаних

дифереі-

ціальні

інтегр

альні

10

завдань

абсолютні

відносні

абсолютні

відносні

11

 

ж,-

 

 

12

0

0

 

 

 

13

1

1

 

 

 

14

2

1

 

 

 

15

3

3

 

 

 

16

4

8

 

 

 

17

5

5

 

 

 

18

6

2

 

 

 

19

Суми:

 

 

 

Рис. 2.6. Результати розрахунків абсолютних частот

• для розрахунку диференціальних відносних, інтегральних абсолютних і відносних частот внести у комірки С12:Е19 відповідні формули (рис. 2.7);

 

А

в

с

E

1

 

Емпір

ичні дані

 

 

2

4

6

4

3

4

3

3

4

5

5

3

4

5

4

4

1

5

5

2

6

5

4

4

сп

Мінімальне

=МИН(А2:Е5)

 

 

 

7

Максимальне

=МАКС(А2:Е5)

 

 

 

со

Кількість

Частоти:

9

виконаних

диференціальні

інтегральні

10

завдань

абсолютні

відносні

абсолютні

відносні

11

 

ж,-

Л

т"і

Fi

І2~

0

=ЧАСТОТА(А2: Е5; А12:А18)

=В12/ІВЇ19

=В12

=C12

13

1

=ЧАСТОТА(А2: Е5; А12:А18)

=В13/$В$19

=D12+C13

=E12+C13

14

2

=ЧАСТОТА(А2: Е5; А12:А18)

=В14/ІВЇ19

=D13+C14

=E13+C14

15

3

=ЧАСТОТА(А2: Е5; А12:А18)

=В15/ІВЇ19

=D14+C15

=E14+C15

16

4

=ЧАСТОТА(А2: Е5; А12:А18)

=В16/ЇВЇ19

=D15+C16

=E15+C16

17

5

=ЧАСТОТА(А2: Е5; А12:А18)

=В17/ІВЇ19

=D16+C17

=E16+C17

18

6

=ЧАСТОТА(А2: Е5; А12:А18)

=В18/$ВЇ19

=D17+C18

=E17+C18

19

Суми:

=СУММ(В12:В18)

=СУММ(С12:С18)

 

 

Рис. 2.7. Формули для розрахунку незгрупованих частот

• отримати результати табличних розрахунків розподілу частот (рис. 2.8);

 

 

А

в

с

D

Е

1

Емпіричні дані

2

4

6

4

3

4

гп

3

4

5

5

3

4

5

4

4

1

5

сп

2

6

5

4

4

6

Мінімальне

1

 

 

 

7

Максимальне

6

 

 

 

со

Кількість

Частоти:

9

виконаних

диференціальні

інтегральні

10

завдань

абсолютні

відносні

абсолютні

відносні

11

 

ж.

fi

Ж* J

І2~

0

0

0,00

0

0

13

1

1

0,05

0,05

0,05

14

2

1

0,05

0,10

0,10

15

3

3

0,15

0,25

0,25

16

4

8

0,40

0,65

0,65

17

5

5

0,25

0,90

0,90

18

6

2

0,10

1,00

1,00

19

Суми:

20

1,00

 

 

Рис. 2.8. Результати розрахунку розподілу

• побудувати графіки розподілу (рис. 2.9). Відзначимо, що інтегральний розподіл є дискретним і має форму «сходинок», хоча поширені комп'ютерні засоби, наприклад, MS Excel, «малюють» його ламаною лінією.



Властивості розподілів дозволяють зробити важливі висновки. Так, пло­ща під графіком диференціального розподілу має сенс частоти. Так, відносні диференціальні частоти кількості виконаних завдань у діапазоні варіант х,- від 0 до 3 включно, що складають сумарне значення 0,25=0,05+0,05+0,15 (див. заштриховану частину гістограми на рис. 2.10), відповідають інтегральній частоті Р4=0,25. Це значить, що об'єкти з властивостями х,- < 3 складають 25% від загального обсягу вибірки.



1        2       3       4        5       6 -кількість виконаних завдань, У.


Рис. 2.10. Об'єкти з властивостями Хі < 3 складають 25 %

Відносні диференціальні частоти у діапазоні варіант х,- від 3 до 4, що складають сумарне значення 0,55=0,15+0,40 (див. заштриховану частину гі­стограми на рис. 2.11), відповідають різниці інтегральних відносних частот F5=0,65 і F3=0,10, тобто 0,65 - 0,10 = 0,55. Це значить, що об'єкти з властиво­стями 3 < Xj < 4 складають 55 % від загального обсягу вибірки.

Отже у результаті систематизації і обробки первинних вибіркових даних формується важливий показник вибірки - емпіричні розподіли частот: ди­ференціальні та інтегральні, кожний з яких може бути або абсолютним, або відносним. Сума всіх абсолютних частот дорівнює обсягу вибірки, сума всіх відносних частот дорівнює 1 або 100%. Інтегральні (накопичені) розподіли формуються як доданки усіх попередніх диференціальних частот або абсо­лютних, або відносних. Вони дають значення сумарної частоти для варіанти, яка не перевищує значення x,-.

У психолого-педагогічних дослідженнях переважно розраховуються роз­поділи відносних частот, оскільки саме відносні частоти представляють со­бою (це буде доведено нижче) і визначаються як статистичні ймовірності.

Згруповані розподіли

Розподіли згрупованих частот використовуються у разі інтервальних або відносних типів вимірювань, якщо емпіричні дані приймають будь-які дійсні значення в певному інтервалі або кількість варіант близька до обсягу вибірки. У цій ситуації змінні мають бути представлені інтервалами (або класами) значень однакової довжини.

Приклад 2.4. Розрахувати розподіли коефіцієнта інтелекту IQ вибірки об­сягом у 80 осіб за емпіричними даними у балах (див. таблицю рис. 2.12)

Послідовність рішення:

характер емпіричних даних показує, що необхідно розрахувати розпо­діли згрупованих частот;

знайти мінімальне і максимальне значення IQ у комірках C12 і G12 за допомогою функцій MS Excel =МИН(Л2:И11) і =МАКС(Л2:Н11), отримати відповідно IQmin =72 і IQmax =137 (рис. 2.12);


розрахувати кількість класів к за формулою Стерджеса Л=1+3,32-Ьт п , де п - обсяг вибірки. Для цього внести у комірку В13 вираз =ОКРВВЕРХ(1+3,32*ЬОО10(СЧЕТ(А2:И11));1) і отримати К~ 8;

розрахувати розмір класового інтервалу л,=( І(2тах - І(2тіп)/к у комірці Б13 за допомогою виразу =(в12-С12)/Б13. Хоча отримане значення X = 8,125, але з практичної точки зору доцільно розмір класового інтервалу при­йняти X = 10;

розрахувати у комірках А17:023 значення початкової І()„оч і кінцевої !(2кінц границь діапазонів значень І() кратними 10 балам і так, щоб мінімальне значення І()тіп = 72 входило у перший, а максимальне І(2тах = 137 - в останній інтервал (див. рис. 2.12);

виділити діапазон Е17Е23, натиснути клавішу і за допомогою «Майстра функцій» внести у ці комірки функцію =ЧАСТОТА();

задати аргументи функції =ЧАСТОТА(), як показано на рис. 2.13;

Аргументы функции            Г?]["х]

Массив данным І Д2:Н11    ^[ = {120; 104; 102; 96; 12

Массив_интервалов |оі7:023            3 = {30:90:100:110:120

= {6:14:26:16:15:2:1:0}

I Вычисляет распределение значений по интервалаи и возвращает вертикальный массив, содержащий на один элемент больно чем массив интервалов.

Массивинтервалов массив интервалов или ссылка на интервалы, в которых группируются значения из массива данных.

| Справка по этой Функции Значением      |      ОК      |     Отмена   |

Рис. 2.13. Введення аргументів функції =ЧАСТОТА()

• натиснути разом клавіші СТЯЬ+8НІРТ+Ег4ТЕЯ, отримати у комірках Е17:Е23 значення абсолютних диференціальних частот (рис. 2.14);

 

 

 

А

в

с

Е

 

с

н

1

 

 

Результати тестування Ю (80 осіб'

 

 

2

120

104

102

96

121

97

106

93

3

63

115

109

119

96

114

91

92

4

95

112

104

116

85

106

89

102

5

111

85

113

97

115

105

90

94

6

92

95

118

104

94

97

109

99

 

117

97

80

99

86

96

112

102

со

93

124

98

106

137

93

100

113

9

120

112

89

78

83

92

72

97

10

79

80

80

83

87

93

84

87

11

103

100

107

90

88

105

93

105

12

Мінімальне /Сіті

72

 

Максимальне Юшх

137

 

13

К =

!

Л =

8,123

Частоти:

14

Діапазони значень Ю

диференціальні

інтегральні

15

абсоютна

відносна

абсоютна

відносна

16

і

 

< Юі і

 

ІЯ,-

Л

її* і

 

17

1

70

< !Оі і

80

6

 

 

 

18

2

80

< 102 і

90

14

 

 

 

19

3

90

< Юз і

100

26

 

 

 

20

4

100

< га„ ^

110

16

 

 

 

21

5

110

< Ю5 і

120

15

 

 

 

22

6

120

< Юе і

130

2

 

 

 

23

7

130

< ІО? і

140

1

 

 

 

24

 

Суми:

 

80

0

 

 

Рис. 2.14. Результати розрахунку абсолютних частот

• для розрахунку диференціальних відносних, інтегральних абсолютних і відносних частот внести у комірки Р17:И23 відповідні формули (рис. 2.15);

 

 

А

в

с

0

Е

 

 

 

н

14

Діапазони значень ю

диференціальні

інтегральні

15

абсоютна

відносна

абсоютна

відносна

16

і

 

< іоі ^

 

 

л

т*і

 

17

1

70

< юі й

80

=ЧАСТОТА(А2:Н11

Р17:023)

=Е17/ЕЇ24

=Е17

=Р17

2

80

< юг і

90

=ЧАСТОТА(А2:Н11

017:023)

=Е18/ЕЇ24

=Е18+Є17

=Р18+Н17

19

3

90

< юз і

100

=ЧАСТОТА(А2:Н11

017:023)

=Е19/ЕЇ24

=Е1Э+Э18

=Р19+Н18

20

4

100

< юі ї

110

=ЧАСТОТА(А2:Н11

017:023)

=Е20/ЕЇ24

=Е20+Є19

=Р20+Н19

21

5

110

< ю5 і

120

=ЧАСТОТА(А2:Н11

017:023)

=Е21/ЕЇ24

=Е21 +Э20

=Р21 +Н20

22

6

120

< юе і

130

=ЧАСТОТА(А2:Н11

017:023)

=Е22/ЕЇ24

=Е22+Э21

=Р22+Н21

23

7

130

< ю? і

140

=ЧАСТОТА(А2:Н11

017:023)

=Е23/Е$24

=Е23+Э22

=Р23+Н22

24

Суми:

=СУММ(Е17:Е23)

=СУММ(Р17:Р23)

 

Рис. 2.15. Формули розрахунку згрупованих частот

• отримати результати розрахунку згрупованих частот ї<2 (рис. 2.16) і побудувати графіки розподілу (рис. 2.17).

 

 

 

А

в

С

0

Е

 

. с

н

1

 

 

Результати тестування /О (80 осіб'

 

 

2

120

104

102

96

121

97

106

93

3

83

115

109

119

96

114

91

92

4

95

112

104

116

85

106

89

102

5

111

85

113

97

115

105

90

94

о,

92

95

116

104

94

97

109

99

7

117

97

80

99

86

96

112

102

сс

93

124

98

106

137

93

100

113

Э

120

112

89

78

83

92

72

97

10

79

80

80

83

87

93

84

87

11

103

100

107

90

88

105

93

105

12

Мінімальне юшг,

72

 

Максимальне юшх

137

 

13

к =

 

x =

3,125

Частоти:

14

Діапазони значень /С?

диференціальні

інтегральні

15

абсоютна

відносна

абсоютна

відносна

16

 

 

< /<Зі ї

 

Ж;

т*]-

 

17

і

70

< юі і

80

6

0.0750

6

0,0750

18

2

80

< юг і

90

14

0,1750

20

0,2500

3

90

< юз і

100

26

0,3250

46

0,5750

20

4

100

< юі і

110

16

0,2000

62

0,7750

21

5

110

< Ю5 і

120

15

0,1875

77

0,9625

22

6

120

< юв і

130

2

0,0250

79

0,9875

23

7

130

< ю? і

140

1

0,0125

80

1,0000

24

 

Суми:

 

80

1

 

 

Рис. 2.16. Результати розрахунку розподілу результатів тестування ї<2

Графіки диференціального та інтегрального розподілу Щ за інтервалами значень показано на рис. 2.17.


Диференціальний відносний розподіл - щільність розподілу ОД2) - зо­бражений гістограмою. Він дає загальну картину розподілу як усіх категорій разом, так і кожної категорії окремо. Як бачимо з рис. 2.17, цей розподіл має форму, що нагадує теоретичний нормальний розподіл (проте, необхідно ко­ректно довести їхню ідентичність). Максимум розподілу - 32,5% - припадає приблизно на середину графіка на значення 1(2 у 100 балів; 1,25% від загаль­ного обсягу вибірки складає категорія «обдарованих» з 1(2 д° 140 балів і 7,5% - категорія «нижче середнього». Графік розподілу унімодальний і асиметри­чний, щільність концентрується навколо середніх значень.

Інтегральний відносний розподіл ?(І(2) зображений точками. Він дає можливість отримати сумарні показники частот для різних діапазонів І(. На­приклад, з графіка і таблиці рис. 2.16 видно, що особи з 1(2 < 100 (не вище 100 балів) становлять 57,5% від загального обсягу вибірки, а особи з 1(2 > 120 (вище 120 балів) складають лише 3,75% від обсягу вибірки (знаходимо або з таблиці, або з графіка: 100% - 96,25% = 3,75%).

Крім варіаційних (незгрупованих і згрупованих) розподілів у практиці до­сліджень розраховують атрибутивні і ранжирувані розподіли, яки використо­вують для описової характеристики значення так званих «якісних» емпіричних даних, що виміряні за порядковими та номінальними шкалами.

Атрибутивні розподіли

Атрибутивні розподіли використовуються у разі номінальних (категоріа­льних) типів вимірювань властивостей досліджуваних об'єктів.

Приклад 2.5. Розрахувати розподіли осіб за результатами тестування вла­стивостей вищої нервової діяльності (ВНД) 16 осіб (рис. 2.18). Побудувати відповідні графіки розподілу.

Послідовність рішення:

•           вибіркові емпіричні дані внести у стовпчики А:Б;


згідно з типом ВНД кожній особі надати відповідний атрибут хі, на­приклад, «холерик» - 1; «сангвінік» - 2 і т.д. (стовпчики 0:О і Е:Р);

для розрахунку абсолютних частот Ші у комірку в3 внести вираз =СЧЕТЕСЛИ($0$3:$0$18;Р3). Аналогічні вирази внести в комірки 04:в6;

для розрахунку загальної кількості об'єктів п у комірку в7 внести ви­раз =СУММ(03:в6);

для розрахунку відносних частот Шііп у комірку Н3 внести вираз: =в3/$в$7, аналогічні вирази внести у комірки Н4:Н6. У комірку Н7 внести вираз =СУММ(Н3:Н6).


Як бачимо з розподілу осіб за типами ВНД (рис. 2.18), у вибірці маємо 3 особи за типом «холерик» (18,75%), 7 - за типом «сангвінік» (43,75%), 5 -«меланхолік» (31,25%) і 1 - «флегматик» (6,25%).

Для ілюстрації атрибутивних розподілів використовують два найбільш роз­повсюджені типи графіків: гістограму (рис. 2.19) і кругову діаграму (рис. 2.20).



Подпись: ЧастотиРозподіл осіб за типом ВНД

 

Холерик

Сангвінік

Меланхо

Флегмат

3

7

5

1


Рис. 2.19. Гістограма розподілу

Атрибутивні розподіли дають можливість оцінити властивості в абсолют­них і відносних значеннях, наприклад, співвідношення різних типів ВНД, пе­реважний тип ВНД - на графіках це «сангвінік», який складає 43,7% осіб ви­бірки (рис. 2.19 і 2.20).

Ранжировані розподіли

Ранжировані розподіли використовують у разі порядкових (рангових) ти­пів вимірювань, наприклад, визначення рейтингу успішності якоїсь діяльності. Ранжування припускає домовленість про відповідність певного рангу певному значенню емпіричних даних.

Приклад 2.6. Виконати ранжування студентів за результатами тестування (див. стовпчики А:В таблиці рис. 2.21).

Послідовність рішення:

• у комірку С2 внести математичний вираз, який визначить ранг значен­ня комірки В2 серед даних вибірки в діапазоні В$2:В$10:

=СЧЕТ(В$2:В$10) + 1-((СЧЕТ(В$2:В$10) + 1- РАНГ(Б2;В$2:Б$10;

1) - РАНГ(В2;В$2:В$10; 0))/2+РАНГ(В2;В$2:В$10;1)); 32



(не сортировать) студенти результати тестує.

параметры..

® по возрастанию о по убыванию

(*) по возрастанию о по убыванию


Рис. 2.22. Діалогове вікно «Сортування діапазону»

скопіювати аналогічні вирази у комірки С3:С10;

у комірку С11 внести вираз =СУММ(С2:С10), який дасть суму рангів;

упорядкувати дані діапазону А2:С10 за рангом за допомогою команд голо­вного меню MS Excel [Дані -> Сортування] і діалогового вікна (рис. 2.22);

отримати упорядковані стовпчики таблиці за рангом (рис. 2.23);

відобразити рейтинговий список студентів графічно (рис. 2.24).



16

Рейтинги студентів

tv

12   11

8

10

7

|h3o<ogo^

Студенти


Рис. 2.24. Рейтинговий список студентів

Ранжировані розподіли дають можливість наочної візуалізації результатів


досліджень певної властивості серед об'єктів дослідження у напрямах їх збі­льшення або зменшення.

Основними способами представлення емпіричних розподілів є таблич­ний, графічний та аналітичний.

Табличний спосіб представлення розподілів продемонстровано, напри­клад, на рис. 2.16. По-різному називають такі таблиці: таблицею емпіричних частот або табличною формою представлення розподілу. Табличний спосіб є основним розрахунковим методом і передумовою його графічної форми. Разом вони дають цілісне уявлення щодо властивостей вибірки.

Графічний спосіб представлення - це відображення розподілу графіч­ними засобами, серед яких найпоширенішими є гістограма, полігон і ліній­ний графік. На рис. 2.25 - 2.27 показано диференціальний відносний розподіл незгрупованих частот у трьох варіантах. Комбіновані способи представлення, які об'єднують у межах однієї графічної форми різні типи розподілу (дифере­нціальний та інтегральний), можна побачити на рис. 2.17.


Подпись: 0,2

0,0


0,4

0,0


Рис. 2.25.

Гістограма

Рис. 2.27.

Лінійний графік


 

Аналітичний спосіб представлення передбачає використання матема­тичної емпіричної функції розподілу, наприклад, щільності Дх), або розподі­лу Е(х). Так, щільність розподілу з рис. 2.25 - можна представити за допо­могою емпіричної функції:

0.00,

X

= 0;

0.07,

X

= 1;

0.07,

X

= 2;

0.13,

X

= 3;

0.27,

X

= 4;

0.33,

X

= 5;

0.13,

X

= 6.

 

Аналогічно можна представляти й розподіли інтегральних частот. Стати­стичні розподіли є первинною базою, навколо якої об'єднуються основні ме­тоди математичної статистики.

Запитання. Завдання.

Охарактеризуйте основні групи статистичних показників вибірки.

Що таке варіаційний ряд і статистичний розподіл?

Чим відрізняються між собою варіаційні, атрибутивні та ранжирувані розподіли?

Яка різниця між абсолютними і відносними розподілами частот?

Як розраховуються незгруповані і згруповані розподіли частот?

Чим відрізняються диференціальні та інтегральні розподіли частот?

Які типи графіків розподілу частот вважаються найпоширенішими?

Повторіть математичні процедури завдань за прикладами 2.1 - 2.6.

Виконайте лабораторні роботи № 1 і № 2.