Ako hodnotiť štatistickú významnosť?
Na vyhodnotenie štatistickej významnosti začnite výpočtom štandardnej odchýlky pre vaše 2 skupiny vzoriek. Potom pomocou štandardnej odchýlky pre každú skupinu vypočítajte rozptyl medzi týmito dvoma skupinami. Ďalej zapojte odchýlku do vzorca pre t-skóre a vypočítajte t-skóre pre vaše údaje. Akonáhle nájdete t-skóre, určte stupne voľnosti svojich vzorových skupín súčtom celkového počtu vzoriek z každej skupiny a odčítaním 2. Nakoniec v tabuľke vyhľadajte svoje stupne voľnosti a t-skóre. štatistickú významnosť. Ak chcete získať ďalšie rady, ako vypočítať štandardné odchýlky, pokračujte v čítaní článku!
Testovanie hypotéz sa riadi štatistickou analýzou. Štatistická významnosť sa vypočíta pomocou hodnoty p, ktorá vám povie pravdepodobnosť pozorovania vášho výsledku za predpokladu, že určité tvrdenie (nulová hypotéza) je pravdivé. Ak je táto hodnota p nižšia ako nastavená hladina významnosti (zvyčajne 0,05), experimentátor môže predpokladať, že nulová hypotéza je nepravdivá, a prijať alternatívnu hypotézu. Pomocou jednoduchého t-testu môžete vypočítať hodnotu p a určiť významnosť medzi dvoma rôznymi skupinami súboru údajov.
Časť 1 z 3: Nastavenie experimentu
- 1Definujte svoje hypotézy. Prvým krokom pri hodnotení štatistickej významnosti je definovanie otázky, na ktorú chcete odpovedať, a vyslovenie vašej hypotézy. Hypotéza je tvrdením o vašich experimentálnych údajoch a rozdieloch, ktoré sa môžu vyskytnúť v populácii. Pre každý experiment existuje nulová aj alternatívna hypotéza. Spravidla budete porovnávať dve skupiny, aby ste zistili, či sú rovnaké alebo odlišné.
- Nulová hypotéza (H 0) vo všeobecnosti uvádza, že medzi vašimi dvoma súbormi údajov nie je žiadny rozdiel. Napríklad: Študenti, ktorí si prečítajú látku pred vyučovaním, nedostanú lepšie konečné známky.
- Alternatívna hypotéza (H a) je opakom nulovej hypotézy a je tvrdením, ktoré sa pokúšate podporiť svojimi experimentálnymi údajmi. Napríklad: Študenti, ktorí si prečítajú materiál pred vyučovaním, získajú lepšie konečné známky.
- 2Nastavte úroveň významnosti a určte, aké neobvyklé musia byť vaše údaje, aby ich bolo možné považovať za významné. Hladina významnosti (nazývaná aj alfa) je prahová hodnota, ktorú nastavíte na stanovenie významnosti. Ak je vaša hodnota p menšia alebo rovná nastavenej hladine významnosti, údaje sa považujú za štatisticky významné.
- Úroveň významnosti (alebo alfa) je spravidla stanovená na 0,05, čo znamená, že pravdepodobnosť náhodného pozorovania rozdielov pozorovaných vo vašich údajoch je iba 5%.
- Vyššia úroveň spoľahlivosti (a teda nižšia hodnota p) znamená, že výsledky sú významnejšie.
- Ak chcete vo svojich údajoch dosiahnuť väčšiu dôveru, nastavte hodnotu p na nižšiu hodnotu 0,01. Pri detekcii chýb vo výrobkoch sa vo výrobe spravidla používajú nižšie hodnoty p. Je veľmi dôležité mať vysokú dôveru, že každá časť bude fungovať presne tak, ako má.
- Pre väčšinu experimentov založených na hypotézach je prijateľná hladina významnosti 0,05.
- 3Rozhodnite sa použiť test s jedným alebo dvoma chvostmi. Jeden z predpokladov t-testu je, že vaše údaje sú distribuované normálne. Normálne rozdelenie dát tvorí krivku zvončeka s väčšinou vzoriek, ktoré spadajú do stredu. T-test je matematický test, ktorý má zistiť, či sa vaše údaje nachádzajú v „chvostoch“ krivky mimo normálneho rozdelenia, buď nad, alebo pod.
- Jednostranný test je silnejší ako dvojstranný, pretože skúma potenciál vzťahu v jednom smere (napríklad nad kontrolnou skupinou), zatiaľ čo dvojstranný test skúma potenciál vzťahu v oboch smeroch (napríklad nad alebo pod kontrolnou skupinou).
- Ak si nie ste istí, či budú vaše údaje nad alebo pod kontrolnou skupinou, použite dvojstranný test. To vám umožní testovať významnosť v oboch smeroch.
- Ak viete, akým smerom sa majú údaje smerovať, použite jednostranný test. V uvedenom prípade očakávate, že sa známky študenta zlepšia; preto použijete jednostranný test.
- 4Stanovte veľkosť vzorky pomocou výkonovej analýzy. Sila testu je pravdepodobnosť pozorovania očakávaného výsledku vzhľadom na konkrétnu veľkosť vzorky. Spoločný prah pre výkon (alebo β) je 80%. Analýza výkonu môže byť bez niektorých predbežných údajov trochu zložitá, pretože potrebujete informácie o svojich očakávaných priemeroch medzi každou skupinou a ich štandardných odchýlkach. Pomocou online kalkulačky analýzy výkonu určte optimálnu veľkosť vzorky pre svoje údaje.
- Vedci zvyčajne robia malú pilotnú štúdiu, aby informovali o svojej silovej analýze a určili veľkosť vzorky potrebnú na väčšiu komplexnú štúdiu.
- Ak nemáte prostriedky na vykonanie komplexnej pilotnej štúdie, urobte niekoľko odhadov možných spôsobov na základe prečítania literatúry a štúdií, ktoré mohli vykonať iní jednotlivci. To vám poskytne dobré miesto pre veľkosť vzorky.
Časť 2 z 3: výpočet štandardnej odchýlky
- 1Definujte vzorec pre štandardnú odchýlku. Štandardná odchýlka je mierou rozloženia vašich údajov. Poskytuje vám informácie o tom, ako podobné sú jednotlivé údajové body vo vašej vzorke, čo vám pomôže určiť, či sú údaje významné. Na prvý pohľad sa môže rovnica zdať trochu komplikovaná, ale tieto kroky vás prevedú procesom výpočtu. Vzorec je s = √∑ ((x i - µ) 2 /(N - 1)).
- s je štandardná odchýlka.
- ∑ znamená, že budete sumarizovať všetky zozbierané hodnoty vzoriek.
- x i predstavuje každú jednotlivú hodnotu z vašich údajov.
- µ je priemer (alebo priemer) vašich údajov pre každú skupinu.
- N je celkový počet vzoriek.
- 2Priemerujte vzorky v každej skupine. Na výpočet štandardnej odchýlky musíte najskôr vziať priemer vzoriek v jednotlivých skupinách. Priemer je označený gréckym písmenom mu alebo µ. Za týmto účelom jednoducho pridajte každú vzorku dohromady a potom vydelte celkovým počtom vzoriek.
- Ak napríklad chceme nájsť priemernú známku skupiny, ktorá si prečítala látku pred vyučovaním, pozrime sa na niektoré údaje. Pre jednoduchosť použijeme súbor údajov 5 bodov: 90, 91, 85, 83 a 94.
- Pridajte všetky vzorky dohromady: 90 + 91 + 85 + 83 + 94 = 443.
- Rozdeľte súčet číslom vzorky, N = 5: 440,6 = 88,6.
- Priemerný prospech v tejto skupine je 88,6.
- 3Odpočítajte každú vzorku od priemeru. Ďalšia časť výpočtu zahŕňa (x i - µ) časť rovnice. Od vypočítaného priemeru odčítate každú vzorku. V našom prípade skončíte s piatimi odčítaniami.
- (90 - 88,6), (91 - 88,6), (85 - 88,6), (83 - 88,6) a (94 - 88,6).
- Tieto vypočítané čísla sú teraz 1,4, 2,4, -3,6, -5,6 a 5,4.
- 4Každé z týchto čísel dajte do štvorca a sčítajte ich. Každé z nových čísel, ktoré ste práve vypočítali, bude teraz umocnené na druhú. Tento krok sa tiež postará o všetky negatívne znaky. Ak máte po tomto kroku alebo na konci výpočtu záporné znamienko, možno ste na tento krok zabudli.
- V našom príklade teraz pracujeme s 1,96, 5,76, 12,96, 31,36 a 29,16.
- Sčítaním týchto štvorcov dohromady získate: 1,96 + 5,76 + 12,96 + 31,36 + 29,16 = 81,2.
- 5Rozdelte celkovým počtom vzoriek mínus 1. Vzorec delí N - 1, pretože opravuje skutočnosť, že ste nepočítali celú populáciu; odoberáte vzorku populácie všetkých študentov na odhad.
- Odčítajte: N - 1 = 5 - 1 = 4
- Rozdelenie: 81,0,5 = 20,3
- 6Vezmite druhú odmocninu. Keď sa vydelíte číslom vzorky mínus jedna, vezmite druhú odmocninu z tohto konečného čísla. Toto je posledný krok pri výpočte štandardnej odchýlky. Existujú štatistické programy, ktoré tento výpočet urobia za vás po zadaní nespracovaných údajov.
- V našom prípade je štandardná odchýlka konečných ročníkov študentov, ktorí čítajú pred vyučovaním, nasledovná: s = √20,3 = 4,51.
Časť 3 z 3: určovanie významnosti
- 1Vypočítajte rozptyl medzi vašimi 2 skupinami vzoriek. Do tohto bodu sa príklad zaoberal iba 1 zo vzorových skupín. Ak sa pokúšate porovnať 2 skupiny, budete mať zrejme údaje z oboch. Vypočítajte štandardnú odchýlku druhej skupiny vzoriek a použite ju na výpočet rozptylu medzi 2 experimentálnymi skupinami. Vzorec pre odchýlku je s d = √ ((s 1 /N 1) + (s 2 /N 2)).
- s d je rozptyl medzi vašimi skupinami.
- s 1 je štandardná odchýlka skupiny 1 a N 1 je veľkosť vzorky skupiny 1.
- s 2 je štandardná odchýlka skupiny 2 a N 2 je veľkosť vzorky skupiny 2.
- V našom prípade povedzme, že údaje zo skupiny 2 (študenti, ktorí pred triedou nečítali) mali veľkosť vzorky 5 a štandardnú odchýlku 5,81. Rozdiel je:
- s d = √ ((s 1) 2 /N 1) + ((s 2) 2 /N 2))
- s d = √ ((((4,51) 2 /5) + ((5,81) 2 /5)) = √ ((20,30,8) + (33,71,2)) = √ (4,07 + 6, 75) = √10,82 = 3,29.
- 2Vypočítajte t-skóre vašich údajov. T-skóre vám umožňuje previesť vaše údaje do podoby, ktorá vám umožní ich porovnanie s inými údajmi. T-skóre vám umožní vykonať t-test, ktorý vám umožní vypočítať pravdepodobnosť, že sa dve skupiny navzájom výrazne líšia. Vzorec pre T-skóre: t = (μ 1 - μ 2) / s d.
- µ 1 je priemer z prvej skupiny.
- µ 2 je priemer druhej skupiny.
- s d je rozptyl medzi vašimi vzorkami.
- Vyšší priemer použite ako µ 1, aby ste nemali zápornú hodnotu t.
- V našom prípade povedzme, že priemer vzorky pre skupinu 2 (tí, ktorí nečítali) bol 80. T -skóre je: t = (µ 1 - µ 2)/s d = (88,6 - 80)/ 3,29 = 2,61.
- 3Určte stupne voľnosti vzorky. Pri použití t-skóre je počet stupňov voľnosti určený pomocou veľkosti vzorky. Sčítajte počet vzoriek z každej skupiny a potom odpočítajte dve. V našom prípade sú stupne voľnosti (df) 8, pretože v prvej skupine je päť vzoriek a v druhej skupine päť vzoriek ((5 + 5) - 2 = 8).
- 4Na vyhodnotenie významnosti použite v tabuľke. Tabuľku t-skóre a stupňov voľnosti nájdete v štandardnej štatistickej knihe alebo online. Pozrite sa na riadok obsahujúci stupne voľnosti vašich údajov a nájdite hodnotu p, ktorá zodpovedá vášmu skóre t.
- Pri 8 df a t-skóre 2,61 sa hodnota p pre jednostranný test pohybuje medzi 0,01 a 0,025. Pretože sme nastavili svoju úroveň významnosti na hodnotu 0,05 alebo nižšiu, naše údaje sú štatisticky významné. Na základe týchto údajov odmietame nulovú hypotézu a akceptujeme alternatívnu hypotézu: študenti, ktorí si prečítajú látku pred hodinou, získajú lepšie konečné známky.
- 5Zvážte následnú štúdiu. Mnoho vedcov robí malú pilotnú štúdiu s niekoľkými meraniami, ktoré im majú pomôcť pochopiť, ako navrhnúť väčšiu štúdiu. Vykonanie ďalšej štúdie s viacerými meraniami vám pomôže zvýšiť dôveru vo svoj záver.
- Následná štúdia vám môže pomôcť určiť, či niektorý z vašich záverov obsahoval chybu typu I (pozorovanie rozdielu, keď neexistuje, alebo falošné odmietnutie nulovej hypotézy) alebo chybu typu II (nedodržanie rozdielu, ak existuje jedno alebo falošné prijatie nulovej hypotézy).
- Štatistika je rozsiahla a komplikovaná oblasť. Absolvujte kurz strednej a vysokej školy (alebo mimo neho) o štatistických záveroch, ktoré vám pomôžu porozumieť štatistickej významnosti.
- Táto analýza je špecifická pre t-test na testovanie rozdielov medzi 2 normálne rozloženými populáciami. V závislosti od zložitosti súboru údajov ste museli použiť iný štatistický test.
Otázky a odpovede
- Môžete vysvetliť stupeň voľnosti, ako ste prišli k počtu rozsahov hodnôt P a ako sú prepojené s poslednými krokmi?Stupne voľnosti sú počet vzoriek vo vašej populácii mínus jeden. Mínus je od vás, že na výpočet priemeru používate jeden stupeň voľnosti.
- Aký je rozdiel medzi ANOVA a t-testom? Mám kategorické skupiny pre hmotnosť a výšku a chcem porovnať údaje v každej skupine a zistiť, či to má nejaký význam.Na porovnanie priemerov IBA 2 populácií sa používa t-test. Ak chcete porovnať priemer viac ako 2 populácií, použijete ANOVA.
- Prečo kladiete dôraz na svoju S1 vo vašom prípade rozptylu, ale nie pri vysvetľovaní vzorca?Skutočný vzorec zo zdroja, pre ktorý uvádza odchýlku, je odmocnina. To ma privádza k názoru, že notácia bez odmocniny je jednoducho omyl autora.
- Kedy vedie statika k odmietnutiu teórie?
- Ako urobíte záver o vedeckej teórii pomocou iba prostriedkov, a nie štatistiky?
- Bola by štandardná chyba rovnaká alebo odlišná pre viac ľudí, ktorí vykonávajú rovnaký test?
- Ako môžem posúdiť štatistickú významnosť, pokiaľ ide o pohlavia?
- Aký drastický význam má 12 chýb v 989000 otázkach?
Komentáre (1)
- Som vývojár softvéru SQL, ktorý robí optimalizáciu rýchlosti v softvéri klienta a meral som metriky „pred“ vs. „po“. Áno, zlepšil som rýchlosť. Je to zvýšenie významné? Váš článok mi v tejto otázke pomohol. Ďakujem!