Ako nájsť korelačný koeficient?

Ak chcete nájsť korelačný koeficient ručne, najskôr vložte svoje dátové páry do tabuľky s jedným riadkom označeným „X“ a druhým „Y.“ Potom vypočítajte priemer X súčtom všetkých hodnôt X a delením počtom hodnôt. Rovnakým spôsobom vypočítajte priemer pre Y. Ďalej pomocou vzorca pre štandardnú odchýlku vypočítajte pre X aj Y. Nakoniec použite priemer a štandardné odchýlky a počet párov v súbore údajov ako vstupy do vzorca korelačného koeficientu a vyriešte výslednú rovnicu. Ak sa chcete dozvedieť, ako nájsť korelačný koeficient pomocou online kalkulačky alebo vlastnej grafickej kalkulačky, čítajte ďalej!

Korelačný koeficient sa niekedy nazýva „korelačný koeficient Pearsonovho súčinu v momente“ na počesť
Korelačný koeficient sa niekedy nazýva „korelačný koeficient Pearsonovho súčinu v momente“ na počesť jeho vývojára Karla Pearsona.

Korelačný koeficient, označovaný ako r alebo ρ, je mierou lineárnej korelácie (vzťah, pokiaľ ide o silu a smer) medzi dvoma premennými. Pohybuje sa od -1 do +1, pričom znamienka plus a mínus predstavujú pozitívnu a negatívnu koreláciu. Ak je korelačný koeficient presne -1, vzťah medzi týmito dvoma premennými je perfektne záporný; ak je korelačný koeficient presne +1, potom je vzťah perfektne pozitívny. V opačnom prípade môžu mať dve premenné pozitívnu koreláciu, negatívnu koreláciu alebo žiadnu koreláciu. Koreláciu môžete vypočítať ručne, pomocou niekoľkých bezplatných korelačných kalkulačiek dostupných online alebo pomocou štatistických funkcií dobrej grafickej kalkulačky.

Metóda 1 zo 4: Ručné zistenie korelačného koeficientu

  1. 1
    Zhromaždite svoje údaje. Ak chcete začať efektívny výpočet korelácie, najskôr si prečítajte svoje dátové páry. Je užitočné umiestniť ich na stôl, vertikálne alebo horizontálne. Označte každý riadok alebo stĺpec x a y.
    • Predpokladajme napríklad, že máte štyri páry údajov pre x a y. Váš stôl môže vyzerať takto:
      • x || r
      • 1 || 1
      • 2 || 3
      • 4 || 5
      • 5 || 7
  2. 2
    Vypočítajte priemer x. Aby ste mohli vypočítať priemer, musíte sčítať všetky hodnoty x a potom vydeliť počtom hodnôt.
    • Použitím vyššie uvedeného príkladu si všimnite, že máte štyri hodnoty pre x. Na výpočet priemeru pridajte všetky hodnoty uvedené pre x a potom vydelte 4. Váš výpočet by vyzeral takto:
    • μx = (1+2+4+5)/4 {\ displaystyle \ mu _ {x} = (1+2+4+5)/4}
    • μx = 10,5 {\ displaystyle \ mu _ {x} = 10,5}
    • μx = 3 {\ Displaystyle \ mu _ {x} = 3}
  3. 3
    Nájdite priemer y. Ak chcete nájsť priemer y, postupujte podľa rovnakých krokov, sčítajte všetky hodnoty y dohromady a potom vydelte počtom hodnôt.
    • Vo vyššie uvedenom príklade máte tiež štyri hodnoty pre y. Sčítajte všetky tieto hodnoty a potom vydelte 4. Vaše výpočty by vyzerali takto:
    • μy = (1+3+5+7)/4 {\ Displaystyle \ mu _ {y} = (1+3+5+7)/4}
    • μy = 11,5 {\ displaystyle \ mu _ {y} = 11,5}
    • μy = 4 {\ Displaystyle \ mu _ {y} = 4}
  4. 4
    Určte štandardnú odchýlku x. Akonáhle budete mať svoje prostriedky, môžete vypočítať štandardnú odchýlku. Na tento účel použite vzorec:
    • σx = 1n − 1Σ (x − μx) 2 {\ displaystyle \ sigma _ {x} = {\ sqrt {{\ frac {1} {n-1}} \ Sigma (x- \ mu _ {x})^ {2}}}}
    • So vzorovými údajmi by vaše výpočty mali vyzerať takto:
    • σx = 14−1 ∗ ((1−3) 2+ (2−3) 2+ (4−3) 2+ (5−3) 2) {\ Displaystyle \ sigma _ {x} = {\ sqrt {{ \ frac {1} {4-1}}*((1-3)^{2}+(2-3)^{2}+(4-3)^{2}+(5-3)^{ 2})}}}
    • σx = 13 ∗ (4+1+1+4) {\ displaystyle \ sigma _ {x} = {\ sqrt {{\ frac {1} {3}}*(4+1+1+4)}}}}
    • σx = 13 ∗ (10) {\ displaystyle \ sigma _ {x} = {\ sqrt {{\ frac {1} {3}}*(10)}}}
    • σx = 103 {\ displaystyle \ sigma _ {x} = {\ sqrt {\ frac {10} {3}}}}
    • σx = 1,83 {\ displaystyle \ sigma _ {x} = 1,83}
  5. 5
    Vypočítajte štandardnú odchýlku y. Rovnakými základnými krokmi nájdite štandardnú odchýlku y. Budete používať rovnaký vzorec s použitím dátových bodov y.
    • So vzorovými údajmi by vaše výpočty mali vyzerať takto:
    • σy = 14−1 ∗ ((1−4) 2+ (3−4) 2+ (5−4) 2+ (7−4) 2) {\ Displaystyle \ sigma _ {y} = {\ sqrt {{ \ frac {1} {4-1}}*((1-4)^{2}+(3-4)^{2}+(5-4)^{2}+(7-4)^{ 2})}}}
    • σy = 13 ∗ (9+1+1+9) {\ displaystyle \ sigma _ {y} = {\ sqrt {{\ frac {1} {3}}*(9+1+1+9)}}}}
    • σy = 13 ∗ (20) {\ displaystyle \ sigma _ {y} = {\ sqrt {{\ frac {1} {3}}*(20)}}}
    • σy = 203 {\ displaystyle \ sigma _ {y} = {\ sqrt {\ frac {20} {3}}}}
    • σy = 2,58 {\ displaystyle \ sigma _ {y} = 2,58}
  6. 6
    Prezrite si základný vzorec na nájdenie korelačného koeficientu. Vzorec na výpočet korelačného koeficientu používa priemer, štandardné odchýlky a počet párov vo vašom súbore údajov (reprezentovaný n). Samotný korelačný koeficient je reprezentovaný malým písmenom r alebo malým gréckym písmenom rho, ρ. V tomto článku použijete vzorec známy ako Pearsonov korelačný koeficient, ktorý je uvedený nižšie:
    • ρ = (1n − 1) Σ (x − μxσx) ∗ (y − μyσy) {\ Displaystyle \ rho = \ left ({\ frac {1} {n-1}} \ right) \ Sigma \ left ({\ frac {x- \ mu _ {x}} {\ sigma _ {x}}} \ right)*\ left ({\ frac {y- \ mu _ {y}} {\ sigma _ {y}}} \ správny)}
    • Môžete si všimnúť mierne odchýlky vo vzorci, tu alebo v iných textoch. Niektorí napríklad budú používať grécky zápis s rho a sigma, zatiaľ čo iní budú používať r a s. Niektoré texty môžu zobrazovať mierne odlišné vzorce; ale budú matematicky ekvivalentné tomuto.
  7. 7
    Nájdite korelačný koeficient. Teraz máte k dispozícii prostriedky a štandardné odchýlky pre svoje premenné, takže môžete pristúpiť k použitiu vzorca korelačného koeficientu. Nezabudnite, že n predstavuje počet hodnôt, ktoré máte. Ostatné relevantné informácie ste už vypracovali vo vyššie uvedených krokoch.
    • Pomocou vzorových údajov by ste zadali svoje údaje do vzorca korelačného koeficientu a vypočítali by ste nasledovne:
    • ρ = (1n − 1) Σ (x − μxσx) ∗ (y − μyσy) {\ Displaystyle \ rho = \ left ({\ frac {1} {n-1}} \ right) \ Sigma \ left ({\ frac {x- \ mu _ {x}} {\ sigma _ {x}}} \ right)*\ left ({\ frac {y- \ mu _ {y}} {\ sigma _ {y}}} \ správny)}
    • ρ = (13) ∗ {\ displaystyle \ rho = \ left ({\ frac {1} {3}} \ right)*} [ (1−31,83) ∗ (1−42,58)+(2− 31,83) ∗ (3−42,58) {\ displaystyle \ left ({\ frac {1-3} {1,83}} \ right)*\ left ({\ frac {1-4} {2, 58}} \ right) +\ left ({\ frac {2-3} {1,83}} \ right)*\ left ({\ frac {3-4} {2,58}} \ right)}
      + (4−31,83) ∗ (5−42,58) +(5−31,83) ∗ (7−42,58) {\ displaystyle +\ left ({\ frac {4-3} {1,83 }} \ right)*\ left ({\ frac {5-4} {2,58}} \ right)+\ left ({\ frac {5-3} {1,83}} \ right)*\ left ({\ frac {7-4} {2,58}} \ right)} ]
    • ρ = (13) ∗ (6+1+1+64,721) {\ displaystyle \ rho = \ left ({\ frac {1} {3}} \ right)*\ left ({\ frac {6+1+1 +6} {4,721}} \ right)}
    • ρ = (13) ∗ 2,965 {\ displaystyle \ rho = \ left ({\ frac {1} {3}} \ right)*2,965}
    • ρ = (2,9653) {\ displaystyle \ rho = \ left ({\ frac {2,965} {3}} \ right)}
    • ρ = 0,988 {\ displaystyle \ rho = 0,988}
  8. 8
    Interpretujte svoj výsledok. Pre tento súbor údajov je korelačný koeficient 0,988. Toto číslo vám hovorí o dvoch veciach. Pozrite sa na znamienko čísla a veľkosť čísla.
    • Pretože je korelačný koeficient kladný, môžete povedať, že existuje pozitívna korelácia medzi údajmi x a údajmi y. To znamená, že so zvyšovaním hodnôt x očakávate, že sa budú zvyšovať aj hodnoty y.
    • Pretože korelačný koeficient je veľmi blízko +1, údaje x a údaje y sú veľmi úzko prepojené. Ak by ste tieto body nakreslili do grafu, videli by ste, že tvoria veľmi dobrú aproximáciu priamky.
Korelačný koeficient je jediné číslo
Korelačný koeficient je jediné číslo, ktoré môžete vypočítať pre akékoľvek dve sady dátových bodov.

Metóda 2 zo 4: použitie online korelačných kalkulačiek

  1. 1
    Hľadaj na internete korelačné kalkulačky. Meranie korelácie je pre štatistikov celkom štandardný výpočet. Výpočet môže byť veľmi únavný, ak ho robíte ručne pre veľké množiny údajov. Výsledkom je, že mnoho zdrojov sprístupnilo online kalkulačky korelácií. Použite akýkoľvek vyhľadávací nástroj a zadajte hľadaný výraz „kalkulačka korelácií“.
  2. 2
    Zadajte svoje údaje. Starostlivo si prečítajte pokyny na webových stránkach, aby ste správne zadali svoje údaje. Je dôležité, aby boli vaše dátové páry udržiavané v poriadku, inak vygenerujete nesprávny výsledok korelácie. Rôzne webové stránky používajú na zadávanie údajov rôzne formáty.
  3. 3
    Vypočítajte si svoje výsledky. Tieto výpočtové weby sú obľúbené, pretože po zadaní údajov spravidla stačí kliknúť na tlačidlo „Vypočítať“ a výsledok sa zobrazí automaticky.
Pretože je korelačný koeficient kladný
Pretože je korelačný koeficient kladný, môžete povedať, že existuje pozitívna korelácia medzi údajmi x a údajmi y.

Metóda 3 zo 4: Použitie grafických kalkulačiek

  1. 1
    Zadajte svoje údaje. Pomocou ručnej grafickej kalkulačky zadajte funkciu štatistiky kalkulačky a potom zvoľte príkaz „Upraviť“.
    • Každá kalkulačka bude mať mierne odlišné kľúčové príkazy. Tento článok poskytne konkrétne pokyny pre Texas Instruments TI-86.
    • Do funkcie Stat vstúpte stlačením [2.] -Stat (nad klávesom +), potom kliknite na F2-Upraviť.
  2. 2
    Vymažte všetky staré uložené údaje. Väčšina kalkulačiek bude uchovávať štatistické údaje, kým nie sú vymazané. Aby ste sa uistili, že si nemýlite staré údaje s novými, najskôr by ste mali vymazať všetky predtým uložené informácie.
    • Pomocou klávesov so šípkami posuňte kurzor na zvýraznenie nadpisu „xStat“. Potom stlačte Vymazať a Enter. To by malo vymazať všetky hodnoty v stĺpci xStat.
    • Pomocou klávesov so šípkami zvýraznite nadpis yStat. Stlačením Vymazať a Enter vyprázdnite údaje aj z tohto stĺpca.
  3. 3
    Zadajte hodnoty údajov. Pomocou klávesov so šípkami presuňte kurzor na prvé miesto pod hlavičkou xStat. Zadajte prvú hodnotu údajov a potom stlačte kláves Enter. V spodnej časti obrazovky by ste mali vidieť medzeru „xStat (1) = _,“ pričom hodnota vyplní prázdne miesto. Keď stlačíte kláves Enter, údaje vyplnia tabuľku, kurzor sa presunie na nasledujúci riadok a riadok v spodnej časti obrazovky by mal teraz znieť „xStat (2) = _“.
    • Pokračujte v zadávaní všetkých hodnôt x-údajov.
    • Po dokončení údajov x sa pomocou klávesov so šípkami presuňte do stĺpca yStat a zadajte hodnoty údajov y.
    • Po zadaní všetkých údajov kliknutím na položku Ukončiť vymažete obrazovku a opustíte ponuku Štatistiky.
  4. 4
    Vypočítajte štatistiku lineárnej regresie. Korelačný koeficient je mierou toho, ako dobre sa údaje aproximujú s priamkou. Štatistická kalkulačka grafov dokáže veľmi rýchlo vypočítať najvhodnejšiu líniu a korelačný koeficient.
    • Zadajte funkciu Stat a potom kliknite na tlačidlo Calc. Na TI-86 je to [2.] [Stat] [F1].
    • Vyberte výpočty lineárnej regresie. Na TI-86 je to [F3], ktorý je označený ako „LinR“. Na grafickej obrazovke by potom mal blikajúci kurzor zobraziť riadok „LinR _“.
    • Teraz musíte zadať názvy dvoch premenných, ktoré chcete vypočítať. Ide o xStat a yStat.
      • Na TI-86 vyberte zoznam mien stlačením [2.] [Zoznam] [F3].
      • V spodnom riadku obrazovky by sa teraz mali zobrazovať dostupné premenné. Vyberte [xStat] (pravdepodobne je to tlačidlo F1 alebo F2), potom zadajte čiarku a potom [yStat].
      • Údaje vypočítajte stlačením klávesu Enter.
  5. 5
    Interpretujte svoje výsledky. Keď stlačíte Enter, kalkulačka okamžite vypočíta nasledujúce informácie pre údaje, ktoré ste zadali:
    • y = a+bx {\ displaystyle y = a+bx} : Toto je všeobecný vzorec pre priamku. Namiesto známeho „y = mx+b“ je to však uvedené v opačnom poradí.
    • a = {\ displaystyle a =} . Toto je hodnota priesečníka y najvhodnejšej čiary.
    • b = {\ displaystyle b =} . Toto je sklon najlepšie vyhovujúcej čiary.
    • corr = {\ displaystyle {\ text {corr}} =} . Toto je korelačný koeficient.
    • n = {\ displaystyle n =} . Toto je počet párov údajov, ktoré boli použité pri výpočte.

Metóda 4 zo 4: preskúmanie základov

  1. 1
    Pochopte koncept korelácie. Korelácia sa týka štatistického vzťahu medzi dvoma veličinami. Korelačný koeficient je jediné číslo, ktoré môžete vypočítať pre akékoľvek dve sady dátových bodov. Číslo bude vždy niečo medzi -1 a +1 a naznačuje, ako úzko medzi sebou tieto dva súbory údajov sú.
    • Ak by ste napríklad merali výšky a vek detí do veku približne 12 rokov, očakávali by ste, že nájdete silnú pozitívnu koreláciu. Ako deti starnú, zvyknú sa zvyšovať.
    • Príkladom negatívnej korelácie by mohli byť údaje porovnávajúce čas človeka strávený cvičením golfových odpalov a jeho golfové skóre. Ako sa prax zvyšuje, skóre by sa malo znižovať.
    • Nakoniec by ste očakávali veľmi malú koreláciu, napríklad pozitívnu alebo negatívnu, napríklad medzi veľkosťou obuvi človeka a skóre SAT.
  2. 2
    Vedieť nájsť priemer. Aritmetický priemer alebo „priemer“ sady údajov sa vypočíta sčítaním všetkých hodnôt údajov a potom vydelením počtom hodnôt v súbore. Keď nájdete korelačný koeficient pre svoje údaje, budete musieť vypočítať priemer z každého súboru údajov.
    • Priemer premennej je označený premennou s vodorovnou čiarou nad ňou. Toto sa často označuje ako „x-bar“ alebo „y-bar“ pre súbory údajov x a y. Alternatívne môže byť priemer označený malým gréckym písmenom mu, μ. Na označenie priemeru dátových bodov x môžete napríklad napísať μ x alebo μ (x).
    • Ak máte napríklad množinu dátových bodov x (12 566 910), priemer týchto údajov sa vypočíta takto:
      • μx = (1+2+5+6+9+10)/6 {\ displaystyle \ mu _ {x} = (1+2+5+6+9+10)/6}
      • μx = 30,5 {\ displaystyle \ mu _ {x} = 30,5}
      • μx = 5,5 {\ displaystyle \ mu _ {x} = 5,5}
  3. 3
    Všimnite si dôležitosti štandardnej odchýlky. V štatistikách štandardná odchýlka meria odchýlky a ukazuje, ako sú čísla rozložené vo vzťahu k priemeru. Skupina čísel s nízkou štandardnou odchýlkou je zhromaždená pomerne tesne. Skupina čísel s vysokou štandardnou odchýlkou je veľmi rozptýlená.
    • Symbolicky je štandardná odchýlka vyjadrená buď malým písmenom s alebo malým gréckym písmenom sigma, σ. Štandardná odchýlka x dát je teda zapísaná buď ako s x alebo σ x.
  4. 4
    Rozpoznať súhrnný zápis. Operátor súčtu je jedným z najbežnejších operátorov v matematike a označuje súčet hodnôt. Reprezentuje ho veľké grécke písmeno, sigma alebo ∑.
    • Ak máte napríklad množinu dátových bodov x (12 566 910), potom ∑x znamená:
      • 1+2+5+6+9+10 = 33.
Korelačný koeficient vyšší ako 0,8 (pozitívny alebo negatívny) vo všeobecnosti predstavuje silnú koreláciu
Korelačný koeficient vyšší ako 0,8 (pozitívny alebo negatívny) vo všeobecnosti predstavuje silnú koreláciu; korelačný koeficient nižší ako 0,5 (opäť buď pozitívny alebo negatívny) predstavuje slabý.

Tipy

  • Korelačný koeficient sa niekedy nazýva „korelačný koeficient Pearsonovho súčinu v momente“ na počesť jeho vývojára Karla Pearsona.
  • Korelačný koeficient vyšší ako 0,8 (pozitívny alebo negatívny) vo všeobecnosti predstavuje silnú koreláciu; korelačný koeficient nižší ako 0,5 (opäť buď pozitívny alebo negatívny) predstavuje slabý.

Varovania

  • Korelácia ukazuje, že tieto dve sady údajov sú nejakým spôsobom prepojené. Dávajte si však pozor, aby ste to nevykladali ako príčinnú súvislosť. Ak napríklad porovnáte veľkosti obuvi ľudí a ich výšku, pravdepodobne nájdete silnú pozitívnu koreláciu. Vyšší ľudia majú spravidla väčšie nohy. To však neznamená, že rast do výšky spôsobuje, že vaše nohy rastú, alebo že veľké nohy spôsobujú, že vy rastiete. Jednoducho sa stávajú spolu.

Otázky a odpovede

  • Dostanete nasledujúce informácie o dvoch premenných x a y: priemer (x) = 315 a priemer (y) = 1103. Rozptyl (x) = 59 a rozptyl (y) = 156. Kovariancia (x, y) = -54. Vypočítajte koeficient korelácie medzi X a Y. Vypočítajte svoju odpoveď na dve desatinné miesta.
    Táto otázka vyvoláva vyššiu úroveň štatistiky, ako sa zaoberá tento článok. Korelačný koeficient je možné vypočítať z priemerov, rozptylu a kovariancie bez toho, aby sme na začiatku skutočne mali pôvodné dátové body. Vzťah je korelačný koeficient = kovariancia / ((štandardná odchýlka (x) * (štandardná odchýlka (y)). Štandardná odchýlka je druhá odmocnina rozptylu. Takže s vašimi údajmi sa to zjednoduší na Corr. Coeff. = -54/sqrt (59) sqrt (156) = -0,56.
Nezodpovedané otázky
  • Aký je rozdiel medzi koeficientom a gradientom korelácie?

Súvisiace články
  1. Ako vypočítať percentuálnu chybu?
  2. Ako vypočítať kumulatívnu frekvenciu?
  3. Ako vypočítať skóre Z?
  4. Ako vypočítať horný kvartil?
  5. Ako urobiť pomer?
  6. Ako nájsť strednú hodnotu množiny čísel?
FacebookTwitterInstagramPinterestLinkedInGoogle+YoutubeRedditDribbbleBehanceGithubCodePenWhatsappEmail