Ako vypočítať kovarianciu?

Ak chcete vypočítať kovarianciu, začnite odčítaním priemeru bodov x údajov od každého bodu x. Potom zopakujte s bodmi y. Ďalej vynásobte výsledky pre každý xy pár dátových bodov a sčítajte všetky produkty dohromady. Nakoniec vydelte toto číslo celkovým počtom párov údajov mínus 1, aby ste získali kovarianciu. Ak sa chcete dozvedieť, ako vypočítať kovarianciu pomocou tabuľky programu Excel, posuňte sa nadol!

Ak chcete vypočítať kovarianciu
Ak chcete vypočítať kovarianciu, začnite odčítaním priemeru bodov x údajov od každého bodu x.

Covariance je štatistický výpočet, ktorý vám pomôže pochopiť, ako spolu súvisia dva súbory údajov. Predpokladajme napríklad, že antropológovia študujú výšky a hmotnosti populácie ľudí v nejakej kultúre. Pre každú osobu v štúdii môže byť výška a hmotnosť reprezentovaná (x, y) dátovým párom. Tieto hodnoty je možné použiť so štandardným vzorcom na výpočet vzťahu kovariancie. Tento článok najskôr vysvetlí výpočty, ktoré slúžia na nájdenie kovariancie súboru údajov. Potom sa bude zaoberať dvoma ďalšími automatizovanými spôsobmi, ako nájsť výsledok.

Metóda 1 zo 4: Ručný výpočet kovariancie so štandardným vzorcom

  1. 1
    Naučte sa štandardný kovariančný vzorec a jeho časti. Štandardný vzorec na výpočet kovariancie je Σ (xi − xavg) (yi − yavg)/(n − 1) {\ Displaystyle \ Sigma (x_ {i} -x _ {\ text {avg}}) (y_ {i}- y _ {\ text {avg}})/(n-1)} . Ak chcete použiť tento vzorec, musíte porozumieť významu premenných a symbolov:
    • Σ {\ Displaystyle \ Sigma} - Tento symbol je grécke písmeno „sigma“. V matematických funkciách to znamená sčítať sériu toho, čo nasleduje. V tomto vzorci znamienko means znamená, že vypočítate hodnoty, ktoré nasledujú v čitateľovi zlomku, a všetky ich spočítate pred delením menovateľom.
    • xi {\ displaystyle x_ {i}} - Táto premenná sa číta ako „x sub i.“ Dolný index i predstavuje počítadlo. To znamená, že vykonáte výpočet pre každú hodnotu x, ktorú máte vo svojom súbore údajov.
    • xavg {\ displaystyle x_ {avg}} - „Priemer“ znamená, že x (priemer) je priemerná hodnota všetkých vašich x dátových bodov. Priemer je niekedy tiež zapísaný ako x s krátkou vodorovnou čiarou. V tomto štýle sa premenná číta ako „x-bar“, ale stále to znamená priemer množiny údajov.
    • yi {\ displaystyle y_ {i}} - Táto premenná sa číta ako „y sub i.“ Dolný index i predstavuje počítadlo. To znamená, že vykonáte výpočet pre každú hodnotu y, ktorú máte vo svojom súbore údajov.
    • yavg {\ displaystyle y_ {avg}} - „Priemer“ znamená, že y (priemer) je priemerná hodnota všetkých vašich dátových bodov y. Priemer je niekedy tiež zapísaný akoáno a je naň vyznačená krátka vodorovná čiara. V tomto štýle sa premenná číta ako „y-bar“, ale stále to znamená priemer množiny údajov.
    • n {\ displaystyle n} - Táto premenná predstavuje počet položiek vo vašej množine údajov. Nezabudnite, že v prípade problému kovariancie sa jedna „položka“ skladá z hodnoty x a hodnoty y. Hodnota n je počet párov dátových bodov, nie jednotlivé čísla.
  2. 2
    Nastavte tabuľku údajov. Predtým, ako začnete pracovať, je užitočné zozbierať vaše údaje. Mali by ste vytvoriť tabuľku, ktorá sa skladá z piatich stĺpcov. Každý stĺpec by ste mali označiť nasledovne:
    • x {\ Displaystyle x} - tento stĺpec vyplňte hodnotami svojich x údajových bodov.
    • y {\ Displaystyle y} - tento stĺpec vyplňte hodnotami svojich údajových bodov y. Dávajte pozor, aby ste hodnoty y zarovnali so zodpovedajúcimi hodnotami x. Pri probléme kovariancie je dôležité poradie dátových bodov a párovanie x a y.
    • (Xi − xavg) {\ displaystyle (x_ {i} -x _ {\ text {avg}})}} - Tento stĺpec nechajte na začiatku prázdny. Potom, čo vypočítate priemer x-dátových bodov, ho naplníte údajmi.
    • (yi − yavg) {\ displaystyle (y_ {i} -y _ {\ text {avg}})}} - Tento stĺpec nechajte na začiatku prázdny. Potom, čo vypočítate priemer bodov y údajov, ho naplníte údajmi.
    • Produkt {\ displaystyle {\ text {Product}}} - tento posledný stĺpec nechajte tiež prázdny. Budete ho napĺňať za pochodu.
  3. 3
    Vypočítajte priemer x-dátových bodov. Tento súbor vzorových údajov obsahuje 9 čísel. Ak chcete nájsť priemer, sčítajte ich a rozdeľte súčet číslom 9. To vám poskytne výsledok 1+3+2+5+8+7+12+2+4 = 44. Keď delíme 9, priemer je 4,89. Toto je hodnota, ktorú použijete ako x (avg) pre nasledujúce výpočty.
  4. 4
    Vypočítajte priemer dátových bodov y. Podobne by stĺpec y mal pozostávať z 9 dátových bodov, ktoré sa zhodujú s bodmi x. Zistite ich priemer. Pre tento súbor vzorových údajov to bude 8+6+9+4+3+3+2+7+7 = 49. Rozdelením tejto sumy na 9 získate priemer 5,44. Na nasledujúce výpočty použijete 5,44 ako hodnotu y (avg).
    Tieto hodnoty je možné použiť so štandardným vzorcom na výpočet vzťahu kovariancie
    Tieto hodnoty je možné použiť so štandardným vzorcom na výpočet vzťahu kovariancie.
  5. 5
    Vypočítajte hodnoty (xi-xavg) {\ displaystyle (x_ {i} -x _ {\ text {avg}}))} . Pre každú položku v stĺpci x musíte nájsť rozdiel medzi týmto číslom a priemernou hodnotou. Pre tento ukážkový problém to znamená odčítať 4,89 z každého bodu x údajov. Ak je pôvodný údajový bod menší ako priemer, váš výsledok bude negatívny. Ak je pôvodný údajový bod väčší ako priemer, váš výsledok bude pozitívny. Uistite sa, že sledujete negatívne znaky.
    • Napríklad prvý údajový bod v stĺpci x je 1. Hodnota, ktorá sa má zadať do prvého riadka stĺpca (xi − xavg) {\ displaystyle (x_ {i} -x _ {\ text {avg}}))}, je 1-4,89, čo je -3,89.
    • Opakujte postup pre každý dátový bod. Preto bude druhý riadok 3-4,89, čo je -1,89. Tretí riadok bude 2-4,89 alebo -2,89. Pokračujte v procese pre všetky dátové body. Deväť čísel v tomto stĺpci by malo byť -3,89, -1,89, -2,89, 0,11, 3,11, 2,11, 7,11, -2,89, -0,89.
  6. 6
    Vypočítajte hodnoty (yi − yavg) {\ displaystyle (y_ {i} -y _ {\ text {avg}}))} . V tomto stĺpci budete vykonávať podobné odčítania pomocou dátových bodov y a priemeru y. Ak je pôvodný údajový bod menší ako priemer, váš výsledok bude negatívny. Ak je pôvodný údajový bod väčší ako priemer, váš výsledok bude pozitívny. Uistite sa, že sledujete negatívne znaky.
    • V prvom riadku teda bude váš výpočet 8-5,44, čo je 2,56.
    • Druhý riadok bude 6-5,44, čo je 0,56.
    • Pokračujte v týchto odčítaniach až na koniec zoznamu údajov. Keď skončíte, deväť hodnôt v tomto stĺpci by malo byť 2,56, 0,56, 3,56, -1,44, -2,44, -2,44, -3,44, 1,56, 1, 56.
  7. 7
    Vypočítajte produkty pre každý riadok údajov. Riadky posledného stĺpca vyplníte vynásobením čísiel, ktoré ste vypočítali v dvoch predchádzajúcich stĺpcoch (xi − xavg) {\ displaystyle (x_ {i} -x _ {\ text {avg}})} a (yi −yavg) {\ displaystyle (y_ {i} -y _ {\ text {avg}})} . Dávajte pozor, aby ste pracovali riadok po riadku a vynásobte dve čísla pre zodpovedajúce údajové body. Sledujte všetky negatívne znaky, ako idete.
    • V prvom riadku tejto vzorky údajov je (xi − xavg) {\ displaystyle (x_ {i} -x _ {\ text {avg}})}}, ktoré ste vypočítali, -3,89 a (yi − yavg) {\ displaystyle (y_ {i} -y _ {\ text {avg}})}} hodnota je 2,56. Súčin týchto dvoch čísel je -3,89*2,56 = -9,96.
    • V druhom rade vynásobíte dve čísla -1,88*0,56 = -1,06.
    • Pokračujte v násobení riadkov po riadkoch až do konca množiny údajov. Keď skončíte, deväť hodnôt v tomto stĺpci by malo byť -9,96, -1,06, -10,29, -0,16, -7,59, -5,15, -24,46, -4, 51, -1,39.
  8. 8
    Nájdite súčet hodnôt v poslednom stĺpci. Tu vstupuje do hry symbol.. Po vykonaní všetkých výpočtov, ktoré ste doteraz urobili, výsledky pridáte. Pre tento súbor vzorových údajov by ste v poslednom stĺpci mali mať deväť hodnôt. Sčítajte týchto deväť čísel. Dávajte pozor, či je každé číslo kladné alebo záporné.
    • Pre tento súbor vzorových údajov by mal byť súčet -64,57. Napíšte tento súčet do medzery v spodnej časti stĺpca. Toto predstavuje hodnotu čitateľa štandardného kovariančného vzorca.
  9. 9
    Vypočítajte menovateľa pre kovariančný vzorec. Čitateľ pre štandardný kovariančný vzorec je hodnota, ktorú ste práve dokončili pri výpočte. Menovateľ je reprezentovaný (n-1), čo je iba o jeden menej ako je počet párov údajov vo vašom súbore údajov.
    • Pre tento vzorový problém existuje deväť párov údajov, takže n je 9. Hodnota (n-1) je teda 8.
  10. 10
    Vydeľte čitateľa menovateľom. Posledným krokom pri výpočte kovariancie je rozdelenie čitateľa, Σ (xi − xavg) (yi − yavg) {\ displaystyle \ Sigma (x_ {i} -x _ {\ text {avg}}) (y_ {i}- y _ {\ texte {avg}})} vašej menovateľa, (n-1), {\ displaystyle (n-1)} . Kvocient je kovariancia vašich údajov.
    • Pre tento súbor vzorových údajov je tento výpočet -64,50,88, čo dáva výsledok -8,07.

Metóda 2 zo 4: Použitie excelovej tabuľky na výpočet kovariancie

  1. 1
    Všimnite si opakujúcich sa výpočtov. Covariance je výpočet, ktorý by ste mali vykonať niekoľkokrát ručne, aby ste porozumeli významu výsledku. Ak však budete pri interpretácii údajov rutinne používať hodnoty kovariancie, budete chcieť nájsť rýchlejší a automatizovanejší spôsob získavania výsledkov. Už by ste si mali všimnúť, že pre náš relatívne malý súbor údajov iba s deviatimi pármi údajov výpočty zahŕňali nájdenie dvoch priemerov, vykonanie osemnástich jednotlivých odčítaní, deväť oddelených násobení, jedno sčítanie a konečné rozdelenie. To je 31 relatívne malých výpočtov na nájdenie jedného riešenia. Cestou riskujete vypustenie negatívnych znakov alebo nesprávne skopírujete svoje výsledky, čím zničíte výsledok.
    Čo môžete vidieť na lineárnom vzhľade dátových bodov
    Vysoké číslo naznačuje, že kovariancia je dosť silná, čo môžete vidieť na lineárnom vzhľade dátových bodov.
  2. 2
    Vytvorte tabuľku na výpočet kovariancie. Ak vám vyhovuje používanie Excelu (alebo nejakej inej tabuľky s schopnosťami výpočtu), môžete jednoducho nastaviť tabuľku na nájdenie kovariancie. Nadpisy piatich stĺpcov označte ako pre ručné výpočty: x, y, (x (i) -x (avg)), (y (i) -y (avg)) a produkt.
    • Na zjednodušenie označovania by ste tretí stĺpec mohli nazývať „x rozdiel“ a štvrtý stĺpec „y rozdiel“, pokiaľ si pamätáte význam údajov.
    • Ak tabuľku začnete v ľavom hornom rohu tabuľky, bunka A1 bude menovkou x, pričom ostatné štítky prejdú do bunky E1.
  3. 3
    Vyplňte údajové body. Zadajte hodnoty údajov do dvoch stĺpcov označených x a y. Nezabudnite, že na poradí dátových bodov záleží, preto musíte každé y spárovať so zodpovedajúcou hodnotou x.
    • Vaše hodnoty x začnú v bunke A2 a budú pokračovať nadol pre toľko dátových bodov, koľko potrebujete.
    • Vaše hodnoty y začnú v bunke B2 a budú pokračovať nadol pre toľko dátových bodov, koľko potrebujete.
  4. 4
    Zistite priemer hodnôt x a y. Excel vám priemery vypočíta veľmi rýchlo. Do prvej prázdnej bunky pod každým stĺpcom údajov zadajte vzorec = AVG (A2: A__). Vyplňte prázdne miesto číslom bunky, ktorá zodpovedá vášmu poslednému údajovému bodu.
    • Ak máte napríklad 100 dátových bodov, vyplnia bunky A2 až A101, takže zadáte = AVG (A2: A101).
    • Pre údaje y zadajte vzorec = AVG (B2: B101).
    • Nezabudnite, že v Exceli začínate vzorec znakom =.
  5. 5
    Zadajte vzorec pre stĺpec (x (i) -x (avg)). Do bunky C2 budete musieť zadať vzorec na výpočet prvého odčítania. Tento vzorec bude = A2 -__. Prázdne miesto vyplníte adresou bunky, ktorá obsahuje priemer vašich x údajov.
    • V prípade príkladu 100 dátových bodov by bol priemer v bunke A103, takže váš vzorec bude = A2-A103.
  6. 6
    Zopakujte vzorec pre dátové body (y (i) -y (avg)). Podľa rovnakého príkladu by to prešlo do bunky D2. Vzorec bude = B2-B103.
  7. 7
    Zadajte vzorec pre stĺpec „výrobok“. V piatom stĺpci do bunky E2 budete musieť zadať vzorec na výpočet súčinu dvoch predchádzajúcich buniek. To by jednoducho bolo = C2*D2.
  8. 8
    Skopírujte vzorce nadol a vyplňte tabuľku. Zatiaľ ste naprogramovali iba prvý pár dátových bodov v riadku 2. Pomocou myši zvýraznite bunky C2, D2 a E2. Potom umiestnite kurzor na malé pole v pravom dolnom rohu, kým sa nezobrazí znak plus. Kliknite na tlačidlo myši, podržte ho a potiahnutím myši nadol rozbaľte zvýraznené pole a vyplňte celú tabuľku s údajmi. Tento krok automaticky skopíruje tri vzorce z buniek C2, D2 a E2 do celej tabuľky. Tabuľka by sa mala automaticky zobraziť so všetkými výpočtami.
    Programovacích spoločností alebo iných zdrojov vytvorilo webové stránky
    Niekoľko škôl, programovacích spoločností alebo iných zdrojov vytvorilo webové stránky, ktoré vám veľmi ľahko vypočítajú hodnoty kovariancie.
  9. 9
    Naprogramujte súčet posledného stĺpca. V stĺpci „Produkt“ musíte nájsť súčet položiek. Do prázdnej bunky bezprostredne pod posledný údajový bod v tomto stĺpci zadajte vzorec = súčet (E2: E__). Vyplňte prázdne miesto adresou bunky posledného dátového bodu.
    • V prípade 100 dátových bodov tento vzorec prejde do bunky E103. Zadáte = súčet (E2: E102).
  10. 10
    Nájdite kovarianciu. Môžete nechať Excel vykonať konečný výpočet aj za vás. Posledný výpočet v bunke E103 v našom prípade predstavuje čitateľa kovariančného vzorca. Hneď pod touto bunkou môžete zadať vzorec = E103/__. Vyplňte prázdne miesto počtom dátových bodov, ktoré máte. V našom prípade to bude 100. Výsledkom bude kovariancia vašich údajov.

Metóda 3 zo 4: Použitie kovariančných kalkulačiek webových stránok

  1. 1
    Hľadaj na internete kalkulátory kovariancie. Niekoľko škôl, programovacích spoločností alebo iných zdrojov vytvorilo webové stránky, ktoré vám veľmi ľahko vypočítajú hodnoty kovariancie. V ľubovoľnom vyhľadávacom nástroji zadajte hľadaný výraz „kalkulačka kovariancie“.
  2. 2
    Zadajte svoje údaje. Pozorne si prečítajte pokyny na webovej stránke, aby ste sa uistili, že zadávate údaje správne. Je dôležité, aby boli vaše dátové páry udržiavané v poriadku, inak vygenerujete nesprávny výsledok kovariancie. Rôzne webové stránky majú rôzny štýl zadávania údajov.
    • Napríklad na webovej stránke http://ncalculators.com/statistics/covariance-calculator.htm je horizontálne pole na zadávanie hodnôt x a druhé horizontálne pole na zadávanie hodnôt y. Dostanete pokyn na zadanie výrazov oddelených iba čiarkami. Množina údajov x, ktorá bola vypočítaná skôr v tomto článku, by teda bola zadaná ako 13,25,87,122,4. Sada údajov y by bola 86,94,33,27,7.
    • Na inom webe https://thecalculator.co/math/Covariance-Calculator-705.html sa zobrazí výzva na zadanie údajov x do prvého poľa. Údaje sa zadávajú zvisle s jednou položkou na riadok. Záznam na tomto webe by preto vyzeral takto:
    • 1
    • 3
    • 2
    • 5
    • 8
    • 7
    • 12
    • 2
    • 4
  3. 3
    Vypočítajte si svoje výsledky. Lákadlom týchto výpočtových webov je, že po zadaní údajov spravidla stačí kliknúť na tlačidlo „Vypočítať“ a výsledky sa zobrazia automaticky. Väčšina webov vám poskytne predbežné výpočty hodnôt x (avg), y (avg) a n.

Metóda 4 zo 4: interpretácia výsledkov kovariancie

  1. 1
    Hľadaj pozitívny alebo negatívny vzťah. Kovariancia je jeden štatistický údaj, ktorý predstavuje vzťah jedného súboru údajov k druhému. V príklade uvedenom v úvode sa meria výška a hmotnosť. Očakávali by ste, že ako jednotlivci rastú, bude sa zvyšovať aj ich hmotnosť, čo povedie k pozitívnej kovariancii. Ako ďalší príklad predpokladajme, že sa zhromažďujú údaje predstavujúce počet hodín, počas ktorých sa niekto venuje golfu, a skóre, ktoré môže zarobiť. V takom prípade by ste očakávali zápornú kovarianciu, čo znamená, že ako sa počet cvičných hodín zvyšuje, golfové skóre sa bude znižovať. (V golfe je lepšie nižšie skóre.)
    • Vezmite do úvahy súbor vzorových údajov, ktorý bol vypočítaný vyššie. Výsledná kovariancia je -8,07. Záporné znamienko tu znamená, že keď sa hodnoty x zvyšujú, hodnoty y budú mať tendenciu klesať. V skutočnosti môžete vidieť, že je to pravda, keď sa pozriete na niekoľko hodnôt. Napríklad hodnoty x 1 a 2 zodpovedajú hodnotám y 7, 8 a 9. Hodnoty x 8 a 12 sú spárované s hodnotami y 3 a 2.
  2. 2
    Interpretujte veľkosť kovariancie. Ak je číslo skóre kovariancie veľké, buď veľké kladné číslo, alebo veľké záporné číslo, potom to môžete interpretovať tak, že tieto dva údajové prvky sú veľmi silne prepojené, či už kladne alebo záporne.
    • V prípade súboru vzorových údajov je kovariancia -8,07 dosť veľká. Všimnite si, že hodnoty údajov sa pohybujú od 1 do 12, takže 8 je dosť vysoké číslo. To naznačuje silné spojenie medzi množinami údajov x a y.
    Ako vypočítať kovarianciu pomocou tabuľky programu Excel
    Ak sa chcete dozvedieť, ako vypočítať kovarianciu pomocou tabuľky programu Excel, posuňte sa nadol!
  3. 3
    Pochopte nedostatok vzťahu. Ak skončíte s kovarianciou rovnou alebo veľmi blízkou 0, môžete usúdiť, že dátové body sú relatívne nesúvisiace. To znamená, že zvýšenie jednej hodnoty môže, ale nemusí viesť k zvýšeniu druhej hodnoty. Tieto dva pojmy sú takmer náhodne spojené.
    • Predpokladajme napríklad, že porovnávate veľkosti obuvi so skóre SAT. Pretože existuje toľko faktorov, ktoré ovplyvňujú SAT skóre študenta, očakávali by sme skóre kovariancie blízko 0. To by naznačovalo takmer žiadnu súvislosť medzi týmito dvoma hodnotami.
  4. 4
    Zobrazte vzťah graficky. Aby ste kovarianciu pochopili vizuálne, môžete svoje dátové body vykresliť do súradnicovej roviny xy. Keď to urobíte, mali by ste pomerne ľahko vidieť, že body, aj keď nie sú v presne priamke, majú tendenciu vytvárať zhluk, ktorý sa blíži diagonálnej čiare od ľavého horného rohu k dolnému pravému. Toto je popis negatívnej kovariancie. Všimnite si tiež, že hodnota kovariancie je -8,07. V porovnaní s dátovými bodmi je to dosť veľké číslo. Vysoké číslo naznačuje, že kovariancia je dosť silná, čo môžete vidieť na lineárnom vzhľade dátových bodov.

Varovania

  • Covariance má v štatistikách obmedzené použitie. Často je to krok k výpočtu korelačných koeficientov alebo iných výrazov. Dávajte si pozor na prílišné interpretovanie na základe skóre kovariancie.

Komentáre (8)

  • shanelle90
    Páčil sa mi prístup krok za krokom spájajúci sa s každým vzorcom. Dodalo mi to väčšiu dôveru v riešenie kovariančných otázok.
  • corkerybuddy
    Je to pekný článok. Chcel som oprášiť vedomostnú základňu z čias vysokej školy. Vďaka.
  • elsiewood
    Tento článok mi pomohol pochopiť, ako vypočítať kovarianciu v Pythone.
  • claudrodriguez
    Veľmi ľahko pochopiteľné.
  • antoncerna
    Oceňujem prístup krok za krokom, ktorý bol veľmi jednoduchý.
  • ashtyn28
    Toto bolo skvelé osvieženie!
  • natasa74
    Pomohlo mi to vypočítať kovarianciu sami.
  • tpowell
    Pomohlo mi to tým, že bolo všetko super jednoduché.
Súvisiace články
  1. Ako používať relatívne doložky v angličtine?
  2. Ako nájsť inverziu kvadratickej funkcie?
  3. Ako zmeniť zmiešané čísla na nesprávne zlomky?
  4. Ako vypracovať zlomok sumy?
  5. Ako vyriešiť akýkoľvek problém s fyzikou?
  6. Ako vyriešiť desatinné exponenty?
FacebookTwitterInstagramPinterestLinkedInGoogle+YoutubeRedditDribbbleBehanceGithubCodePenWhatsappEmail