This page is hosted for free by zzz.com.ua, if you are owner of this page, you can remove this message and gain access to many additional features by upgrading your hosting to PRO or VIP for just 32.50 UAH.
Do you want to support owner of this site? Click here and donate to his account some amount, he will be able to use it to pay for any of our services, including removing this ad.

С.П.Іглін

Порівняння двох вибірок

Вступ

Ця сторінка призначена для студентів, що вивчають курс теорії ймовірностей та математичної статистики. За її допомогою ви засвоїте тему "Порівняння двох вибірок". Безпосередньо зі сторінки ви зможете обробити реальні дані, наприклад, виконати своє ІДЗ, навіть якщо у вас немає на комп’ютері MATLAB. Якщо ж у вас є MATLAB, перейдіть на цю сторінку: там у вас є можливість втрутитися у сценарій (програму) обчислень. А на цій сторінці порівняння двох вибірок здійснюється за стандартним сценарієм, який зазвичай використовується у ВНЗ при вивченні курсу теорії ймовірностей та математичної статистики.

Для правильної роботи з цією сторінкою ваш браузер повинен підтримувати сценарії Java Script. Увімкніть їх, якщо вони вимкнені.

Постановка задачі

Загальна постановка цієї задачі така. Є дві незалежні генеральні сукупності X та Y, які вважаються нормальними. З них отримані вибірки об’ємами відповідно nx та ny. Усі дослідження вважаються незалежними. Треба порівняти ці вибірки та зробити висновок про рівність або нерівність генеральних математичних сподівань та дисперсій.

Введення вхідних даних

Нехай проведено декілька (багато) вимірювань випадкових величин X та Y. Позначимо їх xi та yi. Будемо вважати, що всі числа записані у звичайному текстовому форматі. Для розділення цілої та дрібної частин використовуємо десятичну точку. Між числами залишаємо хоча б один пробіл. При необхідності можна перед числом проставити знак плюс або мінус. Допускається також експоненційна форма запису чисел, тобто числа виду −1.52345E−0002 чи −1.52345e−0002, що треба розуміти як −1.52345×10−2. Декілька зразків правильного оформлення файлів вхідних даних можна завантажити звідсіля (zip-архів, 4kb, звичайні текстові файли). Для початку їх можна використати як тестові приклади, а потім взяти свої дані.

Завантажимо порівнювані масиви. Занесіть ваші числа в області введення, що знаходяться нижче. Числа можна записувати у будь-якому порядку. На будь-якому рядку може бути будь-яка кількість чисел, відокремлених хоча б одним пробілом. Не ставте між числами нияких інших розділювачів, кріме пробілів: ані ком, ані крапок з комами тощо. Ще в одну область введення занесіть довірчу ймовірність p. Це повинно бути одне число в межах від 0 до 1. Після запису всіх чисел в області введення натисніть кнопку "Рахувати". Ваші числа будуть введені введені на сторінку та переформатовані в одновимірні масиви. Будуть знайдені об’єми вибірок nx та ny, вибіркові математичні сподівання  ~mx та ~my, вибіркові дисперсії ~Dx та ~Dy. Вони обчислюються за формулами:

так само для величини Y. Ці результати виводяться на сторінку. Щоб результати розрахунків були коректними, мінімальна кількість чисел у кожній вибірці на цій сторінці обмежена 10.

Сюди введіть вибірку з генеральної сукупності X:


Сюди введіть вибірку з генеральної сукупності Y:


Сюди введіть довірчу ймовірність p:


Перевірте, чи всі числа введені. Скріпт сторінки не відслідковує помилки, він просто відкидає нечислові дані та пропускає їх. Тому порівняйте кількість введених чисел з тим, що має бути. Якщо все правильно, йдемо далі.

Порівняння двох вибірок

Почнемо з порівняння дисперсій, тому що задача порівняння математичних сподівань розв’язується у різний спосіб у залежності від того, порівняні дисперсії чи не порівняні.

Для перевірки 0-гіпотези про рівність генеральних дисперсій використовується F-критерій Фішера. На рівні значущості q 0-гіпотезу можна прийняти, якщо відношення вибіркових дисперсій знаходиться у квантильних границях:

Виконання співвідношення (3) свідчить про те, що можна прийняти 0-гіпотезу. Якщо отримане на практиці відношення вибіркових дисперсій виходить за ліву границю цього інтервала, то треба прийняти альтернативну гіпотезу Dx<Dy. А вихід відношення вибіркових дисперсій за праву границю (3) − це область альтернативної гіпотези Dx>Dy.

Порівняння двох математичних сподівань

Якщо генеральні дисперсії порівняні (має місце 0-гіпотеза для дисперсій Dx=Dy), то для перевірки 0-гіпотези для математичних сподівань mx=my можна застосувати t-критерій Стьюдента. Для цього перевіряємо виконання умови:

де f = fx+fy − загальна кількість ступенів волі; формула - 1kb ~D − середньозважена вибіркова дисперсія:

Якщо (4) виконується, то на рівні значущості q можна прийняти 0-гіпотезу про рівність генеральних математичних сподівань. Порушення (4) у леву сторону свідчить про слушність альтернативної гіпотези mx<my, а порушення правої нерівності − про слушність альтернативної гіпотези mx>my.

Розглянемо тепер випадок, коли вибіркові дисперсії ~Dx та ~Dy розрізняються значно: їхнє відношення не потрапляє у довірчий інтервал (3) на рівні значущості q. У цьому випадку точних критеріїв немає, і різні автори пропонують свої підходи. Один з можливих критеріїв запропонований в [1]. Ось його алгоритм.

  1. Обчислюємо допоміжні величини:
  1. Знаходимо величину τ:
  1. Перевіряємо виконання нерівності:

Якщо вона виконується, 0-гіпотезу можна прийняти на рівні значущості q. Порушення лівої нерівності (8) вимагає прийняти альтернативну гіпотезу mx<my; а порушення правої нерівності − альтернативну гіпотезу mx>my.

Список літератури

  1. Пустыльник Е. И. Статистические методы анализа и обработки наблюдений. − М.: Наука, 1968.