1. ПРЕДМЕТ МАТЕМАТИЧНОЇ СТАТИСТИКИ

Основні завдання та методи математичної статистики

Математична статистика - це сучасна галузь математичної науки, яка займається статистичним описом результатів експериментів і спостережень, а також побудовою математичних моделей, що містять поняття ймовірності. Теоретичною базою математичної статистики служить теорія ймовірностей.

В структурі математичної статистики традиційно виділяють два основні розділи: описова статистика і статистичні висновки (рис. 1.1).

Математична статистика


Описова статистика


Статистичні висновки


 


Статистика випадкової вибірки


Статистичне оцінювання


 


Кореляційно-ре гресійний аналі з

Перевірка статистичних гіпотез


 

Рис. 1.1. Основні розділи математичної статистики

Описова статистика використовується для:

узагальнення показників однієї змінної (статистика випадкової вибірки);

виявлення взаємозв'язків між двома і більше змінними (кореляційно-регресійний аналіз).

Описова статистика дає можливість отримати нову інформацію, швидше зрозуміти і всебічно оцінити її, тобто виконує наукову функцію опису об'єктів дослідження, чим і виправдовує свою назву. Методи описової статистики по­кликані перетворити сукупність окремих емпіричних даних на систему наоч­них для сприйняття форм і чисел: розподіли частот; показники тенденцій, ва­ріативності, зв'язку. Цими методами розраховуються статистики випадкової вибірки, які служать підставою для здійснення статистичних висновків.

Статистичні висновки надають можливість:

оцінити точність, надійність і ефективність вибіркових статистик, ви­явити похибки, які виникають у процесі статистичних досліджень (статисти­чне оцінювання);

узагальнити параметри генеральної сукупності, отримані на підставі вибіркових статистик (перевірка статистичних гіпотез).

Головна мета наукових досліджень - це отримання нового знання про вели­кі класи явищ, осіб або подій, які прийнято називати генеральною сукупністю.

Генеральна сукупність - це повна сукупність об'єктів дослідження, вибір­ка - її частина, яка сформована певним науково обгрунтованим способом2.

Термін «генеральна сукупність» використовується тоді, коли йдеться про велику, але кінцеву сукупність досліджуваних об'єктів. Наприклад, про су­купність абітурієнтів України у 2009 році або сукупність дітей дошкільного віку міста Рівне. Генеральні сукупності можуть сягати значних обсягів, бути скінченими і нескінченими. На практиці, як правило, мають справу зі скінче­ними сукупностями. І якщо відношення обсягу генеральної сукупності до об­сягу вибірки складає більш, ніж 100, то, за словами Гласса і Стенлі методи оцінювання для скінчених і нескінчених сукупностей дають у сутності одна­кові результати [17, С. 218]. Генеральною сукупністю можна називати і повну сукупність значень якоїсь ознаки. Приналежність вибірки до генеральної су­купності є головною підставою для оцінки характеристик генеральної сукуп­ності за характеристиками вибірки.

Основна ідея математичної статистики базується на переконанні про те, що повне вивчення всіх об'єктів генеральної сукупності в більшості наукових завдань або практично неможливе, або економічно недоцільне, оскільки вима­гає багато часу і значних матеріальних витрат. Тому в математичній статисти­ці застосовується вибірковий підхід, принцип якого показано на схемі рис. 1.2.

Наприклад, за технологією формування розрізняють вибірки рандомізовані (прості та систематичні), стратифіковані, кластерні (див. розділ 4).


із генеральної сукупності, властивості якої підлягають дослідженню, певними методами формують вибірку - типову але обмежену кількість об'­єктів, до яких застосовують дослідницькі методи;

в результаті методів спостережень, експериментальних дій і вимірю­вань над об'єктами вибірки отримують емпіричні дані;

обробка емпіричних даних за допомогою методів описової статис­тики дає показники вибірки, які називаються статистиками - як і назва ди­сципліни, до речі;

застосовуючи методи статистичних висновків до статистик, отри­мують параметри, які характеризують властивості генеральної сукупності.

3 Рандомізована вибірка (від анг. random - випадковий) - це репрезентативна вибі­рка, яка сформована за стратегією випадкових випробувань.

Приклад 1.1. З метою оцінки стабільності рівня знань (змінна X) проведе­но тестування рандомізованої вибірки3 студентів обсягом n. Тести містили по m завдань, кожне з яких оцінювалося за системою балів: «виконано»» - 1, «не виконано» - 0. Чи залишилися середні поточні досягнення студентів X

на рівні минулих років /г? Послідовність рішення:

висунути змістовну гіпотезу типу: «якщо поточні результати тестуван­ня не відрізнятимуться від минулих, то можна вважати рівень знань студен­тів незмінним, а навчальний процес - стабільним»;

сформулювати адекватну статистичну гіпотезу, наприклад, нуль-гіпотезу Н0 про те, що «поточний середній бал X статистично не відрізня­ється від середнього показника минулих років /г », тобто Н0: X =/г, проти відповідної альтернативної гіпотези      X Ф^;

побудувати емпіричні розподіли досліджуваної змінної x;

розрахувати вибіркові статистики, наприклад, середнє, дисперсію і т.д.;

визначити (при необхідності) кореляційні зв'язки, наприклад, між змін­ною x та іншими показниками, побудувати лінії регресії;

перевірити відповідність емпіричного розподілу нормальному законові;

оцінити значення точкових показників та довірчий інтервал парамет­рів, наприклад, середнього;

визначити критерій для перевірки статистичних гіпотез;

виконати перевірку статистичних гіпотез на основі вибраних критеріїв;

сформулювати рішення щодо статистичної нуль-гіпотези на певному рівні значущості;

перейти від рішення про прийняття або відхилення статистичної нуль-гіпотези до інтерпретації висновків щодо гіпотези змістовної;

сформулювати змістовні висновки.

Отже, якщо узагальнити перераховані вище процедури, застосування ста­тистичних методів складається з трьох основних блоків:

перехід від об'єкта реальності до абстрактної математико-статистичної схеми, тобто побудова імовірнісної моделі явища, процесу, властивості;

проведення розрахункових дій власно математичними засобами в рам­ках імовірнісної моделі за результатами вимірювань, спостережень, експери­менту і формулювання статистичних висновків;

- інтерпретація статистичних висновків щодо реальної ситуації й ухва­лення відповідного рішення.

Статистичні методи обробки й інтерпретації даних спираються на теорію ймовірностей. Теорія ймовірностей є основою методів математичної статис­тики. Без використання фундаментальних понять і законів теорії ймовірнос­тей неможливе узагальнення висновків математичної статистики, а значить і обгрунтованого їх використання для наукових і практичних цілей.

Так, завданням описової статистики є перетворення сукупності вибірко­вих даних на систему показників - статистик - розподілів частот, мір центральної тенденції і мінливості, коефіцієнтів зв'язку тощо. Проте, стати­стики є характеристиками, по суті, конкретної вибірки. Звичайно, можна роз­раховувати вибіркові розподіли, вибіркові середні, дисперсії і т. ін., але поді­бний «аналіз даних» має обмежену науково-пізнавальну цінність. «Механіч­не» перенесення будь-яких висновків, зроблених на основі таких показників, на інші сукупності не є коректним.

Для того, щоб мати можливість перенесення вибіркових показників або на інші, або на більш поширені сукупності, необхідно мати математично об­грунтовані положення щодо відповідності і спроможності вибіркових харак­теристик характеристиками цих поширених так званих генеральних сукупно­стей. Такі положення базуються на теоретичних підходах і схемах, пов'язаних з імовірнісними моделях реальності, наприклад, на аксіоматич­ному підході, на законі великих чисел і т.д. Тільки з їхньою допомогою мож­на переносити властивості, які встановлено за результатами аналізу обмеже­ної емпіричної інформації, або на інші, або на поширені сукупності. Отже, побудова, закони функціонування, використання імовірнісних моделей, що є предметом математичної галузі під назвою «теорія ймовірностей», стає суттю статистичних методів.

Таким чином, в математичній статистиці використовуються два парале­льних рядка показників: перший рядок, що має відношення до практики (це


вибіркові показники) і другий, що базується на теорії (це показники імовірні­сної моделі). Наприклад, емпіричним частотам, що визначені на вибірці, від­повідають поняття теоретичної ймовірності; вибірковому середньому (прак­тика) відповідає математичне очікування (теорія) і т.д. Причому, в дослі­дженнях вибіркові характеристики, як правило, є первинними. Вони розрахо­вуються на основі спостережень, вимірювань, дослідів, після чого проходять статистичне оцінювання спроможності та ефективності, перевірку статисти­чних гіпотез згідно з метою досліджень і врешті приймаються з певною ймо­вірністю як показники властивостей досліджуваних сукупностей.

Запитання. Завдання.

Охарактеризуйте основні розділи математичної статистики.

В чому полягає основна ідея математичної статистики?

Охарактеризуйте співвідношення генеральної і вибіркової сукупностей.

Поясніть схему застосування методів математичної статистики.

Укажіть перелік основних завдань математичної статистики.

З яких основних блоків складається застосування статистичних мето­дів? Охарактеризуйте їх.

Розкрийте зв'язок математичної статистики з теорією ймовірностей.