3.3. ЗАКОН ВЕЛИКИХ ЧИСЕЛ

16 Повторні випробування

Явища і процеси, що вивчає психологія, - це, як правило, складні події. Тому формування теоретичної бази опису таких подій зручно розглядати на прикладі повторних випробувань. Тестування та іспити студентів можна вважати при деяких умовах прикладом таких випробувань.

16 Іноді пишуть «закони великих чисел», маючи на увазі основні теореми (Бе-рнуллі, Чебишева, центральної граничної теореми та ін.).

З класичного визначення ймовірність - це число, до якого наближається частота появлень бажаної події при збільшенні незалежно виконаних ви­пробовувань. До того ж і ймовірність, і частота виражаються в долях одини­ці, їхні чисельні значення розміщені між нулем і одиницею, хоча, як відомо, частота випадкової величини і її ймовірність не співпадають в ідеалі.

Ймовірність, яку можна вказати до випробувань, називають апріорною. Наприклад, при підкиданні монети наперед відомо, що вона може впасти вгору «гербом» або «цифрою». Тут можливі лише дві події, ймовірності яких (якщо монета ідеальна) однакові: /"(«герб») = /"(«цифра») = 54 = 0,5.

Інша ситуація може мати місце при випробовуваннях, наприклад, впливу нових педагогічних технологій або психологічних методик на окремих осіб (школярів, студентів тощо) або на весь колектив. Результати таких випробу­вань передбачити наперед неможливо. Статистична ймовірність здійснення та­ких подій може бути встановлена тільки на підставі досліду, тобто апостеріорі.

Для практики застосування математичного апарату теорії ймовірностей важливе значення має відповідь на питання про те, чи співпадають апріорні (теоретичні) ймовірності зі статистичними (емпіричними) ймовірностями, представленими у вигляді частоті І якщо так, то при яких умовах?

Даючи принципово позитивну відповідь на це питання, численні досліди і

т

спостереження показали, що частоти випадкових подій типу — наближа-

п

ються до їхніх ймовірностей р у міру збільшення числа випробувань и. На­приклад, якщо одну й ту ж монету підкидати велику кількість разів, то в яко­мусь числі випробувань випаде «герб», а в інших випаде «цифра». Примітно те, що чим більше здійснено випробувань, тим емпірична частота події стає ближчою до її теоретичної ймовірності (для ідеальної монети/>=0,5).

тоти події від її ймовірності

Існують і прямі експериментальні підтвердження того, що частота здійс­нення деяких подій близька до ймовірності, визначеної з теоретичних мірку­вань, наприклад, результати випробувань з підкиданням монети (табл. 3.6). З табл. 3.6 видно, що при збільшені числа випробувань п відхилення час-

р

зменшується. У цьому факті є прояв дії

так званого закону великих чисел: вибіркові характеристики при зростанні числа дослідів наближаються до теоретичних, а це дає можливість оцінюва­ти параметри імовірнісних моделей за даним дослідів.

Таблиця 3.6

Результати випробувань

 

 

Хто проводив випробування

Число випробу­вань

Число подій випадання «гербом»

Частота події

Теоретична ймовірність події

Відхилення частоти від ймовірності

п

т

т п

р

т

            р

п

Бюффон

4 040

2 048

0,5069

0,5000

0,0069

Пірсон:

перше випробування

12 000

6 019

0,5016

0,5000

0,0016

Пірсон:

друге випробування

24 000

12 012

0,5005

0,5000

0,0005

 

Закон великих чисел носить об'єктивний характер і має відповідну емпі­ричну базу. Висновки закону підтверджують, наприклад, досліди Кетле: в урну поміщали 20 білих і 20 чорних куль, потім витягували з неї навмання одну кулю, реєстрували її колір і повертали кулю назад. Кожне випробування повторювали багато разів. Ймовірність появи білої або чорної кулі залишала­ся при цьому постійною, рівною 1/2 (див. табл. 3.7).

Таблиця 3.7

Результати дослідів Кетле

 

 

 

Число вийнятих куль

3 них опинилося

Співвідношення білих і чорних куль

білих

чорних

4

1

3

0,33

16

8

8

1,00

64

28

36

0,78

256

125

131

0,95

1022

526

496

1,06

4096

2066

2030

1,02

 

З табл. 3.7 видно, як із збільшенням числа випробувань співвідношення білих і чорних куль наближається до одиниці.


Закон великих чисел стверджує, що частота — події А буде скільки за-

вгодно близькою до її ймовірності р, якщо число випробувань п необмежено зростає. Можна взяти скільки завгодно мале число є і порівнювати його з різ­ницею між відносною частотою і ймовірністю події. Ймовірність того, що ця різниця перевищить число є, прагнутиме до нуля при прагненні числа випро­бувань п до нескінченності:


Подпись:

Отже, частота події і її імовірність не співпадають, проте різниця між ни­ми зменшується при збільшенні числа випробувань. Це значить, що статис­тичні закономірності виявляються тільки у багаторазових повторних випро­буваннях і кількість таких випробувань п повинна бути значною.

Теорема Бернуллі

Теорема Бернуллі стверджує: якщо т - кількість подій А в п попарно не­залежних випробуваннях, а р є ймовірність настання події А в кожнім з ви­пробувань, то при будь-якому є>0 справедлива нерівність


Подпись:

(3.40)


Ця формула є першим в історії варіантом закону великих чисел і по суті вважається початком теорії ймовірностей як галузі математичної науки. Від­тоді теорії вибіркового методу стають основою математичної статистики.

Теорема Бернуллі дає можливість оцінити кількості незалежних випробу -

вань п при певних умовах їх проведення.

Приклад 3.16. Ймовірність того, що навмання вибраний студент складе залік, дорівнює 90%. Скільки треба перевірити студентів, щоб з імовірністю 80% виявити успішно підготовлених студентів. Похибка при цьому не пови-

нна перевищувати 10%.

Рішення:


Визначимо відповідні до теореми Бернуллі позначення:

р = 0,90 - ймовірність того, що навмання вибраний студент складе залік;

є = 0,10 - похибка процедури перевірки студентів;

р\Т- - р > 0Д01 =0,80 - ймовірність виявлення підготовлених студентів.

Значення ймовірності не перевищити похибку у 10% процедури перевір­ки студентів складає

г.

'< 0,10!.=1 - 0,80 = 0,20.

p

п

При цьому повинна виконуватися нерівність правої частини виразу (3.40)

Р^ < 0,20.

пє

Звідси кількість студентів, яких треба перевірити, визначиться як

p(1 - p) 0,90 • (1 - 0,90) 0,90 • 0,10 0,20 -є2     0,20 • (0,10)2     0,20 • 0,01

Відповідь: для того, щоб з імовірністю 80% виявити успішно підготовле­них студентів з похибкою не вище 10%, треба перевірити більше ніж 45 осіб.

Одним з принципових питань математичної статистики є характер спів­відношення параметра є і кількості незалежних випробуваннях п. Відповідь на це питання також дає закон великих чисел.

Приклад 3.17. Для умов прикладу 3.16 оцінити співвідношення кількості незалежних випробувань п і параметра є для трьох значень є (0,1; 0,05; 0,01).

Рішення:

Результати і формули розрахунку п згідно з теоремою Бернуллі (3.40) для різних значень є представлено в табличній формі на рис. 3.29.

Як бачимо з рис. 3.29 (див. стовпчики D і E), при зменшенні параметра е кількість необхідних незалежних випробувань п зростає пропорційно є2.



Відповідь: чим жорсткіші умови є щодо зменшення різниці між емпірич­ною частотою події та її теоретичною ймовірністю, тим більшої кількості ви­пробувань потребують такі досліди.

Теорема Чебишева

>^ <____. (3.41) пє

Теорема Чебишева свідчить: якщо випадкові величини Хь х2, Хп попа­рно незалежні й існує число С таке, що £>\Х] < С для всіх /' = 1, 2, п, то для будь-якого є>0 справедлива нерівність

Хі + Х2 +...+Хп   М\Хі]+И\Х2]+...+М\Хп]|

п          п

Нерівність (3.41) можна представити інакше


Ііт Р\


І    п    І    п

- Е х, - - 2 м \ х, ]

п ¿=1   п ¿=1

<є\ = 1.            (3.42)


величин — ^ Хі відрізняється від середнього арифметичного математичних

і=1

Отже, ймовірність того, що середнє арифметичне незалежних випадкових п\

1  п

сподівань — ^ М[ХІ ] менш ніж на є, наближається до 1 при зростанні числа

П ¿=1

випадкових величин, для будь-якого є.

Теорема Чебишева є розвитком і узагальненням теореми Бернуллі Для практичних цілей найчастіше використовується такий варіант випро­бувань, коли всі х{ мають однакові показники математичного сподівання М[Хі]=М і дисперсії £>[х]=0. Тоді у якості оцінки математичного сподівання використовується вибіркове середнє арифметичне


хі + X2 + ...+хп


1


п          п ,

звідки математичне сподівання і дисперсія середнього визначаться як


М[ X ] = М

в[ X ] = в Г


1    "

П ¿=1

- Е X

П ¿=1


 

п

п ¿=1

1

1 м ^ ] = - £м [ X, ] = м,

в.

¿=1

2

п

п

1

• ви ]

1=1


Тоді нерівність (3.41) матиме вигляд


р\х - М [ X ]| >£}< в[ х ]

£2


(3.43)


або


Р x - М > є


}< —.


(3.44)


Формула (3.44) означає, що вибіркове середнє x при збільшені числа випробувань (дослідів, спостережень, вимірювань) як завгодно близько за ймовірністю наближається до свого математичного сподівання М[X]:


x-


>М [ X ].


(3.45)


Отже, вираз (3.45) є доказом того, що вибіркове середнє x є спромож­ною оцінкою свого аналога з генеральної сукупності. На цьому важливому висновку побудовано статистичне оцінювання (див. розділ 4).

Приклад 3.18. Оцінити ймовірність того, що середнє випадкової величини відхилиться від свого математичного сподівання на значення не більше ніж на три стандартних відхилення.

Рішення:

Визначимо відповідні до теореми Чебишева позначення: x і М [ x ]- середнє арифметичне величини x і математичне сподівання середнього арифметичного випадкової величини x;

Ж>[ x ] і в[ x ] - стандартне відхилення і дисперсія середнього арифмети­чного випадкової величини x;

є = 3 • SD[X ] - критерій відхилення різниці \х - М[X]|;

Р\\х -М[X]| <є}- ймовірність події, яку треба оцінити з умов задачі.

За теоремою Чебишева маємо р\х - М[X]| > г|< -D[

є2

З урахуванням виразу SD[X] = -\ІЩХ] і значення є =3 • SD[X] права час­тина дорівнюватиме

D[X ]       D[X]           D[X ]     1        і—      —і     )   1

—1—- =          !-=_— =          1--=-- = -, тобто Р\Х - M[X| >є\<-

є2      (3 • SD[ X ])2    9 • D[ X ]   9   у          1     '   9

З теореми Чебишева можна записати

Р^Х -   <є) = 1 - р\х - M[X] >г}< -9.

Тоді ймовірність події, яку треба оцінити, визначиться через нерівність

р\х -М[X]| <є)> 1 -= -9 * 0,8917

Відповідь: ймовірність того, що середнє випадкової величини відхилиться від свого математичного сподівання на значення не більше ніж у три станда­ртних відхилення, складає приблизно 0,89 або біля 89%.

З теорем Бернуллі і Чебишева як з конкретних форм закону великих чи­сел випливає той факт, що вибіркові характеристики при зростанні числа ви­пробувань наближаються до теоретичних, що дає можливість оцінювати па­раметри імовірнісних моделей за емпіричними даними.

Центральна гранична теорема

Розглянемо два варіанта центральної граничної теореми.

1. Центральна гранична теорема для однаково розподілених доданків -теорема Ліндеберга-Леві.

17 Визначена оцінка іноді є заниженою, наприклад, для нормального розподі­лу вона складає біля 0,997 (за так званим закон трьох сигм, див. розділ 3.4).

Для незалежних однаково розподілених випадкових величин Х1, Х2, Хп з математичними сподіваннями ЩХ{] = Ц і дисперсіями 0[ХІ] = а2 (/' = 1, 2, п) можна записати

М[Х1 + Х2 + ... + Хп] = М[Х1 ] + М[Х2] + .. .+Л/[Хп] = и/г,       (3.46)

Б[Х1 + Х2 + ... + Хп] = Б[Х1] + £>[Х2] + ...+£>[Хп] = па2 .         (3.47)

Визначимо випадкову величину ип як

Х1 + Х2 + ... + Хп - ЩХ,] - И[Х2] -... - М[Х„ ]

З урахування виразів (3.46) і (3.47) випадкова величина ип виглядатиме як
ип = Х1 + Х2 + >+ Хп ~.      (3.48)

Для величини ип математичне сподівання Щип] = 0, дисперсія £>[ип] = 1. Тоді при п—*» для будь-якого числа х існує границя

Іітр{Х1 + Х2 + >+ Хп -^ < хі = Ф(х),          (3.49)

(Ту! п  )

де Ф(х) - функція стандартного нормального розподілу

x

ф( х) =\(р(і)йі, (3.50)

-ос

де <р(І) - щільність стандартного нормального розподілу

1    - '-

ср(і) = -=е  2.  (3.51)

п                     

Якщо враховувати, що Х1 + Х2 + „. + Хп = ^ Хі = пХ, то змінну ип ї

¿=1

пХ — пи    Х —иг-   .„

на записати як           ип =    ;=— =  ліп       (3.52)

і границя (3.48) приймає більш знайому форма запису


Подпись: Ііт Р\(Х-» г   >

л/п < х


N (0,1),            (3.53)


де N(0,1) - нормальний розподіл з нульовим математичним сподіванням і стандартним відхиленням, рівним одиниці.

У деяких задачах не завжди виконується умова існування однаково роз­поділених доданків. Сутність цих умов полягає в тому, що жодний з доданків не повинний бути домінуючим, внесок кожного доданка в середнє арифмети­чне має бути дуже малим у порівнянні з усією сумою.

2. Центральна гранична теорема для неоднаково розподілених доданків - теорема Ляпунова.

Для незалежних неоднаково розподілених випадкових величин Х\, Х2, Хп з математичними сподіваннями А/[Х] = /г,- і дисперсіями Ю[Х] = а,2 Ф0 (/' = 1, 2,    п) випадкова величини ип матиме вигляд


X, + Х2 + ... + X

12        п


(3.54)


і=1

Е X

Тоді при п—*» для будь-якого числа х існує границя

(           \


Ііш Р\

п—>сс


X і + X2 + ... + Хп


< х


= Ф( х),     (3.55)


і=1

1


Е X


де Ф(х) - функція стандартного нормального розподілу.

У разі незалежних однаково розподілених випадкових доданків маємо


Е X


: Ю[Хг + Х2 + „. + Хп ] = па1 і теорема Ля-


1=1

пунова переходить у теорему Ліндеберга-Леві (3.49).

Сенс центральної граничної теореми такий: якщо обсяг вибірки п є «до­статньо великим», то незалежно від форми розподілу параметра /г генераль­ної сукупності вибіркове середнє X має розподіл, близький до нормального. Отже, оцінку генерального середнього /г за його вибірковим значенням X можна виконувати на основі нормального розподілу. Схема дослідження може бути такою:

•           вибираємо випадковим методом п об'єктів X], Х2, ...,Хп з генеральної сукупності (для практичних цілей п повинно бути не менше 30, тобто п>30);

—       1   п

•           розраховуємо вибіркове середнє X = —^Xі;

п ,=1    '


• виконуємо статистичне оцінювання і формулюємо висновки на основі нормального розподілу (див., наприклад, розділ 5.4).

Центральна гранична теорема - це клас теорем теорії ймовірностей, що затверджують, що сума великої кількості незалежних (або слабко залежних) випадкових величин має розподіл, близький до нормального.

Дуже важливо те, як діють ті причини, з яких складається сукупний ре­зультат вимірювань або спостережень: якщо діють аддитивно (тобто шляхом додавання), то величина x має приблизно нормальний розподіл; якщо муль-типлікативно (тобто дії окремих причин перемножуються), то розподіл x є близьким не до нормального, а до так званого логарифмічно нормального, тобто не x, а Іі^У має приблизно нормальний розподіл. Якщо ж немає підстав стверджувати, що діє один із цих двох механізмів формування підсумкового результату, то про розподіл випадкової величини x нічого певного сказати не можна.

Запитання. Завдання.

Які Ви знаєте прямі експериментальні підтвердження того, що частота здійснення деяких подій близька до ймовірності.

В чому є прояв дії так званого закону великих чисел?

Прокоментуйте результати дослідів Кетле.

Сформулюйте і поясніть теорему Бернуллі.

Сформулюйте і поясніть теорему Чебишева. Чим вона відрізняється від теореми Бернуллі?

Сформулюйте і поясніть центральну граничну теорему для однаково розподілених доданків (теорему Ліндеберга-Леві).

Сформулюйте і поясніть теорему Ляпунова.

Повторіть математичні процедури завдань за прикладами 3.16 - 3.18.