Ako porovnať dve proporcie?

Keď budete vedieť porovnávať proporcie, budete schopní na tieto otázky odpovedať.

Porovnanie dvoch proporcií je často potrebné na zistenie, či sa navzájom výrazne líšia. Predpokladajme napríklad, že robíte randomizovanú kontrolnú štúdiu so 40 ľuďmi, z ktorých polovica bola zaradená na liečbu a druhá polovica bola zaradená do skupiny s placebom. 140 z experimentálnej skupiny sa zlepšilo, zatiaľ čo 12,50 z kontrolnej skupiny sa tiež zlepšilo. Líšia sa tieto dve proporcie navzájom? Je liečba účinná? Keď budete vedieť porovnávať proporcie, budete schopní na tieto otázky odpovedať.

Kroky

1
Nastavte nulovú hypotézu a alternatívnu hypotézu. Nulová hypotéza ( H0 {\ Displaystyle H_ {0}} $H_ {0}$ ) vždy obsahuje rovnosť a je tou, ktorú sa pokúšate vyvrátiť. Alternatívna (výskumná) hypotéza nikdy neobsahuje rovnosť a je to tá, ktorú sa pokúšate potvrdiť. Tieto dve hypotézy sú uvedené tak, že sa navzájom vylučujú a súhrnne sú vyčerpávajúce. Vzájomne sa vylučujúce znamená, že ak je jedno pravdivé, druhé musí byť nepravdivé a naopak. Kolektívne vyčerpávajúci znamená, že musí nastať aspoň jeden z výsledkov. Vaše hypotézy sú formulované podľa toho, či sú 1- alebo 2-chvostové:
- Jednostranný: Výskumná otázka: Je jeden podiel väčší ako druhý? Vaše hypotézy by boli uvedené nasledovne: ${\ begin {cases} h_ {0}: {\ hat {p}} _ {1} \ leq {\ hat {p}} _ {2} \\ h_ {a}: {\ hat {p}} _ {1}> {\ hat {p}} _ {2} \ end {cases}}$ . Jednosmerný používajte, ak vás zaujíma rozdiel iba v jednom smere. Napríklad v tomto prípade nás zaujíma iba to, či liečba funguje, to znamená, že podiel je v liečebnej skupine väčší. Ak liečebnú skupinu ${\ begin {cases} h_ {0}: {\ hat {p}} _ {1} \ leq {\ hat {p}} _ {2} \\ h_ {a}: {\ hat {p}} _ {1}> {\ hat {p}} _ {2} \ end {cases}}$ ako 1 a kontrolnú skupinu ako 2, hypotézy sú ${H0: p^1≤p^2Ha: p^1> p^2 {\ displaystyle {\ begin {cases} H_ {0}: {\ hat {p}} _ {1} \ leq {\ hat {p}} _ {2} \\ H_ {a}: {\ hat {p}} _ {1}> {\ hat {p}} _ {2} \ end {cases}}}$ .
- Dvojstranný: Výskumná otázka: Je podiel vzorky odlišný od hypotetického podielu populácie? Vaše hypotézy by boli vyjadrené nasledovne: {H0: p^= p0Ha: p^≠ p0 {\ displaystyle {\ begin {cases} H_ {0}: {\ hat {p}} = p_ {0} \\ H_ { a}: {\ hat {p}} \ neq p_ {0} \ end {cases}}} ${\ begin {cases} h_ {0}: {\ hat {p}} = p_ {0} \\ h_ {a}: {\ hat {p}} \ neq p_ {0} \ end {cases}}$ .
  - Ak nie je a priori dôvod domnievať sa, že akýkoľvek rozdiel je jednosmerný, dáva sa prednosť dvojstrannému testu, pretože ide o prísnejší test.
2

Nastavte vhodnú úroveň významnosti ( $\ alfa$ alias „alfa“). Podľa definície je hladina alfa pravdepodobnosťou odmietnutia nulovej hypotézy, ak je nulová hypotéza pravdivá. Alpha je najčastejšie nastavená na 0,05, hoci namiesto toho je možné použiť akékoľvek iné hodnoty (medzi 0 a 1, výlučne). Medzi ďalšie bežne používané hodnoty alfa patria 0,01 a 0,10.

Vypočítajte dva pomery vzorky.
3

Vypočítajte dva pomery vzorky. Podiel je počet „úspechov“ vydelený celkovou vzorkou v skupine. V tomto prípade ${\ begin {cases} {\ hat {p}} _ {1} = {\ frac {18} {20}} = 0,9 \\ {\ hat {p}} _ {2} = {\ frac { 15} {20}} = 0,75 \ end {prípadov}}$ .
4

Vypočítajte celkový podiel vzorky. Celkový podiel vzorky, ${\ hat {p}}$ , je celkový počet „úspechov“ vydelený celkovou vzorkou medzi všetkými skupinami. Vzorec je ${\ hat {p}} = {\ frac {n_ {1} {\ hat {p}} _ {1}+n_ {2} {\ hat {p}} _ {2}} {n_ {1}+ n_ {2}}}$ , kde $N_ {1}$ a $N_ {2}$ sú vzorové veľkosti pre skupiny 1, respektíve 2. V tomto prípade ${\ hat {p}} = {\ frac {18+15} {20+20}} = 0,825$ .
5

Vypočítajte štandardnú chybu rozdielu. Štandardné chyba, SE, sa vypočíta ako ${\ sqrt {{\ hat {p}} (1-{\ hat {p}}) \ left ({\ frac {1} {n_ {1}}}+{\ frac {1} {n_ {2} }}\správny)}}$ . V tomto prípade $Se = {\ sqrt {0,825 (1-0,825) \ left ({\ frac {1} {20}}+{\ frac {1} {20}} \ right)}} = 0,120156$ .

V tomto prípade, ak by sme chceli detekovať pomerný rozdiel 0,15, potrebovali by sme veľkosť vzorky najmenej n.
6

Vypočítajte štatistiku testu, z. Vzorec je $Z = {\ frac {{\ hat {p}} _ {1}-{\ hat {p}} _ {2}} {se}}$ . V tomto prípade $Z = {\ frac {0,9-0,75} {0,120156}} = 1 248$ .
7
Skonvertujte štatistiku testu na hodnotu p. p-hodnota je pravdepodobnosť, že náhodne vybraná vzorka z n bude mať štatistiku vzorky najmenej tak odlišnú od získanej. p-hodnota je oblasť chvosta pod normálnou krivkou v smere alternatívnej hypotézy. Ak sa napríklad použije pravostranný test, hodnota p je oblasť s pravým okrajom alebo oblasť napravo od hodnoty z. Ak sa použije test s dvoma chvostmi, hodnota p je plocha v oboch chvostoch. P-hodnotu je možné nájsť jednou z niekoľkých metód:
- Tabuľka pravdepodobnosti normálneho rozdelenia z. Príklady možno nájsť na internete, napríklad tento. Je dôležité prečítať si popis tabuľky a všimnúť si, aká pravdepodobnosť je v tabuľke uvedená. Niektoré tabuľky uvádzajú kumulatívnu (ľavú stranu) oblasť, iné uvádzajú oblasť pravého chvosta, ďalšie uvádzajú iba oblasť od priemeru po kladnú hodnotu z.
- Excel. Funkcia Excel = norm.s.dist (z, kumulatívne). Kumulatívne nahraďte číselnú hodnotu za a „true“. Tento vzorec programu Excel poskytuje kumulatívnu plochu naľavo od danej hodnoty z. Ak potrebujete správnu oblasť chvosta, odčítajte od 1.
  - V tomto prípade potrebujeme oblasť pravého chvosta, takže hodnota p = 1- NORM.S.DIST (1 248, TRUE) = 0,106.
- Kalkulačka prístrojov Texas Instrument, ako napríklad TI-83 alebo TI-84.
- Online kalkulačky normálnej distribúcie, ako je táto.
8

Rozhodnite sa medzi nulovou hypotézou alebo alternatívnou hypotézou. Ak je $P _ {{hodnota}} <\ alpha$ , odmietnite $H_ {0}$ . V opačnom prípade neodmietnite $H_ {0}$ . V tomto prípade, keďže $P _ {{hodnota}} = 0,106$ je väčšia ako $\ alfa = 0,05$ , experimentátor nedokáže odmietnuť $H_ {0}$ .

V tomto prípade je rozdiel v týchto dvoch pomeroch síce, ale nebol štatisticky významný vzhľadom na celkovú veľkosť vzorky 40.
9

Uveďte záver o výskumnej otázke. V tomto prípade experimentátor neodmietne nulovú hypotézu a nemá dostatočné dôkazy na podporu tvrdenia, že liečba je účinná. Podiel ľudí, ktorí sa zlepšili v liečbe, 90%, sa výrazne nelíši od podielu ľudí, ktorí sa zlepšili na placebe, 75%.
10
Vypočítajte interval spoľahlivosti pre percentuálny rozdiel. Vzorec je Rozdiel ± Z ∗ SE {\ displaystyle {\ text {Difference}} \ pm Z*SE} ${\ text {rozdiel}} \ pm z*se$ .
- Vyberte si úroveň dôvery. Najčastejšie sa používa 95%, čo zodpovedá $\ alfa = 0,05$ .
- Určte z-skóre zodpovedajúce hladine alfa. Vzorec programu Excel je = norm.s.inv (1 - alfa / 2). Pre $\ alfa = 0,05$ Displaystyle $\ alpha = 0,05}$ máme z = norm.s.inv (1-0,02,5) = 1,96.
- Spodnú hranicu intervalu spoľahlivosti vypočítajte ako ${\ text {rozdiel}}-z*se$ . V tomto prípade je dolná hranica $0,15-1,96*0,120156 = -0,086$ .
- Vypočítajte hornú hranicu intervalu spoľahlivosti ako ${\ text {rozdiel}}-z*se$ . V tomto prípade je dolná hranica $0,15+1,96*0,120156 = 0,386$ .
- 95% interval spoľahlivosti pre rozdiel $0,150 \ pm 0,236$ v pomere $0,150 ± 0,236 {\ Displaystyle 0,150 \ pm 0,236}$ alebo -0,086 až 0,386.
- Interpretujte výsledok. V tomto prípade sme si na 95% istí, že skutočný pomerný rozdiel je -0,086 až 0,386. Pretože tento rozsah obsahuje 0, neexistuje dostatok dôkazov o tom, že tieto dve proporcie sú odlišné.

Tipy

Môžete určiť minimálnu veľkosť vzorky potrebnú na zistenie rozdielu v proporciách. V tomto prípade je rozdiel v týchto dvoch pomeroch 0,90−0,75 = 0,15 {\ Displaystyle 0,90-0,75 = 0,15} $0,90-0,75 = 0,15$ , ale nebol štatisticky významný vzhľadom na celkovú veľkosť vzorky 40. Aká veľkosť vzorky je potrebná na zistenie rozdielu?
- Pre významný rozdiel musí byť hodnota p menšia ako $\ alfa = 0,05$ .
- Štatistika z zodpovedajúca $P _ {{hodnota}} = 0,05$ je 1,96. To sa dá v Exceli vypočítať ako = NORM.S.INV (1-0,02,5).
- Zapojte to do vzorca pre štatistiku z: $1,96 = {\ frac {p_ {1} -p_ {2}} {se}} = {\ frac {p_ {1} -p_ {2}} {{\ sqrt {p (1-p) \ left ({\ frac {1} {n_ {1}}}+{\ frac {1} {n_ {2}}} \ right)}}}} = {\ frac {p_ {1} -p_ {2}} {{\ sqrt {{\ frac {4p (1-p)} {n}}}}}}$ , za predpokladu, že $N_ {1} = n_ {2} = {\ frac {n} {2}}$ . Takže $P_ {1} -p_ {2} = 1,96 {\ sqrt {{\ frac {4p (1-p)} {n}}}} = {\ frac {3,92 {\ sqrt {p (1- p)}}} {{\ sqrt {n}}}}$ . Takže $N = {\ frac {15,3664p (1-p)} {(p_ {1} -p_ {2})^{2}}}$ je minimálna potrebná veľkosť vzorky.
- Všimnite si toho, že prvá derivácia $P (1-p)$ je $1-2 str$ a rovná sa 0, keď $P = 0,5$ $Displaystyle$ $p = 0,5 }$ , zatiaľ čo druhá derivácia $P (1-p)$ je -2. Z tohto dôvodu, $P = 0,5$ predstavuje maximálne funkcie $P (1-p)$ . Ak teda nevieme, čo je $P$ , použitím $P = 0,5$ zaistíme, že n bude dostatočne veľké na akúkoľvek možnú hodnotu p. Takže $N = {\ frac {3,8416} {(p_ {1} -p_ {2})^{2}}}$ je minimálna potrebná veľkosť vzorky zistiť odchýlku podiel $P_ {1} -p_ {2}$ . V tomto prípade, ak by sme chceli zistiť pomerný rozdiel 0,15, potrebovali by sme veľkosť vzorky n najmenej 3 ${\ frac {3,8416} {0,15^{2}}} = 171$ .

Prečítajte si tiež: Ako navrhnúť priméry PCR?

Ako porovnať dve proporcie?

Kroky

Tipy

Otázky a odpovede

Prečítajte si tiež: