Статистичні критерії згоди

Матеріал з Вікі-знання або навчання 2.0 в ТНТУ
Перейти до: навігація, пошук
Blue check.png Дана стаття являється неперевіреним навчальним завданням.
Студент: Івасюк Т. А.
Викладач: Назаревич О. Б.
Термін до: 09 березня 2011

До вказаного терміну стаття не повинна редагуватися іншими учасниками проекту. Після завершення терміну виконання будь-який учасник може вільно редагувати дану статтю і витерти дане попередження, що вводиться за допомогою шаблону.



{{{img}}}
Імя Тарас
Прізвище Івасюк
По-батькові Анатолійович
Факультет ФІС
Група СН-51
Залікова книжка СН-10-055








Зміст

Статистичні критерії згоди

До перевірки тієї чи іншої статистичної гіпотези доціль¬но підходити з різних теоретичних позицій. Кожна позиція грунтується на розподілі первинних або обчислених даних, які відрізняються від нормального розподілу. Це зумовлено обмеженим числом вимірювань або додатковими умовами при обробці дослідних даних. Характеристикою кожного розподілу є набір чисел, заздалегідь протабульованих. При перевірці гіпотези з дослідних даних складається число за тим же правилом, що й наведені в таблиці числа, і порівнюється з табличним числом. Гіпотеза визнається або відхиляється залежно від згоди дослідних і табличних чисел, тому останні називаються критеріями згоди. Як і в інших галузях науки, наприклад в теорії подібності, статистичні критерії — величини звичайно безрозмірні. Нехай х — нормально розподілена випадкова змінна. При відомому СКВ висувається нуль-гіпотеза LaTeX: M(x)=m_0 або LaTeX: M(x)-m_0=0, тобто середнє значення, або математичне сподівання М(х), генеральної сукупності, оцінюване на основі випадкової вибірки, не відрізняється від заданого значення LaTeX: m_o. Альтернативна гіпотеза LaTeX: H_A протилежна нуль-гіпотезі, тобто LaTeX: M(x)\ne m_0 або LaTeX: M(x)-m_0\ne 0. Як критерій ви¬користовується відношення різниці порівнюваних величин LaTeX: \bar{x}-m_0 до статистичної помилки LaTeX: S/\sqrt N розрахункової величини LaTeX: \bar x:

LaTeX: Z=\frac{\bar{x}-m_o}{S} \sqrt{N}

де N — обсяг вибірки; LaTeX: \bar{x} — оцінка математичного сподівання М(х) генеральної сукупності.

Статистична помилка

Статистична помилка, або помилка репрезентативності (відтворюваності)— це відхилення даного вибіркового показника від його справжнього значення в генеральній сукупності. Для вибіркового середнього це значення в LaTeX: \sqrt{N} разів менше, ніж СКВ S. Згідно з теорією статистичної обробки обмеженого числа дослідних даних імовірність значення Z розподілена за законом Стьюдента:

LaTeX: p(Z)=\frac{1}{\sqrt{\pi (N-1)}}\frac{G(\frac{N}{2})}{G(\frac{N-1}{2})}(1+\frac{Z^2}{N-1})^{N-2}

де G — гама-функція, табличні значення якої можна знайти в довідниках з математики або статистики. Залежно від параметрів вибірки значення Z відрізняється від нуля, як міра відхилення вважається абсолютне значення |Z|. За прийнятим рівнем значущості LaTeX: \alpha можна визначити таке критичне значення LaTeX: Z_kp, що при вірній нуль-гіпотезі справедлива нерівність LaTeX: |Z|\ge Z_kp тобто LaTeX: p(|Z|\ge Z_kp)=\alpha.

Якщо число Z обчислене за вибіркою, задовольняє нерівність LaTeX: |Z|<Z_kp то вважатимемо, що відхилення Z від 0 можна розглядати як випадкове. Тоді говорять, що нуль-гіпотеза не відхиляється на основі вибірки або немає підстав для її відхилення.

Якщо LaTeX: |Z|\ge Z_kp, то при справедливій нуль-гіпотезі таке відхилення можливе але малоімовірне. Тоді вважають більш імовірним, що нуль-гіпотеза невірна, і її відхиляють. При аналізі рішень слід мати на увазі обидва можливі типи помилок. Співвідношення імовірностей LaTeX: \alpha i LaTeX: \beta проілюстровано на рис.1, де наведено графіки розподілу імовірностей при

Рисунок.1.jpg

порівнянні арифметичних середніх, здобутих з двох вибірок: лівий зображає нуль-гіпотезу LaTeX: H_0, правий альтернативну гіпотезу LaTeX: H_A. Залежно від значення обчисленого на підставі вибіркових даних Z і його положення по відношенню до LaTeX: Z_kp можливі два рішення: якщо значення її дорівнює або перевищує LaTeX: Z_kp, то нуль-гіпотеза відхиляється і визнається альтернативна гіпотеза; якщо LaTeX: Z<Z_kp, то немає підстав для відхилення LaTeX: H_0 тобто вона підтверджується .

При одному й тому ж розташуванні графіків розподілу імовірностей зі зменшенням імовірності помилки LaTeX: \alpha значення LaTeX: \beta зростає. Імовірність LaTeX: \beta визнати невірну нуль-гіпотезу залежить, зокрема, від:

обсягу вибірки (чим більша вибірка, тим надійніше при даному рівні значущості LaTeX: \alpha буде встановлена аналізована відмінність між статистичними характеристиками);

ступеня відмінності між цими характеристиками;

потужності критерію.

Потужність критерію

Потужність критерію - це імовірність відхилити нульову гіпотезу LaTeX: H_0, коли вірна гіпотеза LaTeX: H_A, тобто LaTeX: p=1-\beta. Чим менша при заданому LaTeX: \alpha імовірність LaTeX: \beta, тим краще критерій розділяє гіпотези LaTeX: H_0 та LaTeX: H_A.

Критерій називається потужним, коли він порівняно з іншими можливими критеріями при заданому LaTeX: \alpha показує вищу дискримінуючу здатність, тобто здатність до розділення гіпотез. За потужністю, критерії згоди діляться на дві великі групи: параметричні та непараметричні. До параметричних належать критерії, побудовані за допомогою основних параметрів (числових оцінок) вибіркової сукупності М та \sigma або LaTeX: \bar x та S. Ці критерії застосовуються лише тоді, коли генеральна сукупність, з якої взято одну або кілька вибірок, розподілена нормально, і за умови рівності основних параметрів, тобто LaTeX: \bar x_1 - \bar x_2 та LaTeX: S_1-S_2.

Непараметричні критерії згоди є функціями лише змінних даної сукупності (вибірки) з їх частотами і не потребують знання типу розподілу генеральної сукупності. Тому їх застосовують при перевірці властивостей гіпотетичного розподілу. Параметричні критерії мають сильнішу дискримінуючу (роздільну) здатність, більшу потужність порівняно з непараметричними. Коли досліджувана сукупність розподіляється за нормальним законом або не дуже відхиляється від нього, слід надавати перевагу таким критеріям.

Потужність критерію збільшується при збільшенні обсягу вибірки. Якщо ж обсяг вибірки малий і збільшити його не вдається, то треба брати невисокий рівень значущості, оскільки і мала вибірка, і високий рівень значущості призводить до небажаного зменшення потужності критерію. Слід пам'ятати про те, що при зворотному переході до вищого рівня значущості обчислене значення Z може з області відхилення нульової гіпотези перейти в область її визнання. Наприклад, якщо Z було справа від LaTeX: Z_kp, то з підвищенням LaTeX: \gamma воно може з'явитися зліва від LaTeX: Z_kp (див. рисунок 1).

При плануванні та реалізації експериментів задаються імовірністю тільки помилки першого роду. Далі, рекомендуючи той чи інший критерій згоди, вибиратимемо найпотужніший з можливих критеріїв, тобто будемо враховувати також помилки другого роду. Слід пам'ятати, що, задаючись занадто високим рівнем значущості, ми знижуємо LaTeX: \alpha і разом з тим підвищуємо LaTeX: \beta тому бажано обмежуватися 5%-м рівнем значущості.


Ступінь вільності

Поняття статистичного критерію тісно пов'язане з поняттям ступеня вільності. Для більшості критеріїв ступінь вільності є аргументом. Величина N—1, що стоїть у знаменнику формул для обчислення СКВ, є числом ступенів вільності. Під числом ступенів вільності розуміють число змінних, значення яких задаються довільно. Іншими словами, це є загальне число змінних мінус число лінійних зв'язків, накладених на систему, що вивчається. Так, при розрахунку СКВ за N експериментальними даними Існує лише один зв'язок (обмеження), обумовлений розрахунком середнього арифметичного, тобто число ступенів вільності f=N-1.

Дійсно, якщо за вибіркою з п'яти даних LaTeX: x_1, x_2, ..., x_5 утворено середнє LaTeX: \bar{x}=20, то чотири значення LaTeX: x_i можуть бути якими завгодно, наприклад 10, 15, 21, 16 або 19, 25, 13, ЗО, але одне — LaTeX: x_5 у першому випадку має бути LaTeX: x_5=20*5-(10 + 15 + 21 + 16) = 38, а в другому LaTeX: x_5 = 20*5-(19 + 25 + 13 + ЗО) = 13.

Отже, під числом ступенів вільності будемо розуміти різницю між числом дослідів та числом характеристик, які визначаються за утвореними даними незалежно одне від одного.



Список використаних джерел

1. Математичне планування експериментів в АПК / В. О. Аністратенко, В. Г. Федоров.-К.:Вища школа,1993.-374с.

Особисті інструменти
Google AdSense
реклама