Ako čítať histogramy?
Ak si chcete prečítať histogram, začnite pohľadom na vodorovnú os (nazývanú os x), aby ste zistili, ako sú údaje zoskupené. Potom sa pozrite na zvislú os, ktorá sa nazýva os y, a zistite, ako často sa údaje vyskytujú. Napríklad histogram o výškach nadhadzovačov v profesionálnom bejzbale zobrazí os x s výškami hráčov a os y s počtom hráčov, ktorí sú týmito výškami. Ak si chcete prečítať histogram, vyberte výšku na osi x a podľa hornej časti lišty na os y zistíte, koľko džbánov bolo v tejto histórii profesionálnej bejzbalu. Ak sa chcete dozvedieť, ako nakresliť histogram, posuňte sa nadol!
Ak ste sa podieľajú na sledovanie štatistík a pri pohľade na akomkoľvek druhu technických údajov, budete musieť byť schopní čítať histogram. Histogram je špecifická vizuálna reprezentácia údajov, zvyčajne graf využívajúci stĺpce bez medzier na vyjadrenie počtu incidentov v odlišnej skupine alebo skupine vzoriek. Pre začiatočníkov, ktorí potrebujú pochopiť, čo je súčasťou histogramu a ako ho interpretovať, je tu niekoľko základných krokov.
Časť 1 z 2: čítanie histogramov
- 1Rozpoznajte rozdiel medzi stĺpcovým grafom a histogramom. Stĺpcové grafy a histogramy sú podobné, ale s niektorými veľmi špecifickými rozdielmi. A stĺpcový graf skupiny čísla do kategórií, zatiaľ čo čísla histogramy skupiny do rozsahov. Histogramy sa spravidla používajú na zobrazenie výsledkov súvislého súboru údajov, ako je výška, hmotnosť, čas atď.
- Stĺpcový graf má medzery medzi mrežami, zatiaľ čo histogram nie je.
- Histogram často zobrazuje frekvenciu výskytu udalosti v definovanom rozsahu. Ukazuje vám, koľkokrát sa taká udalosť stane.
- 2Prečítajte si osi grafu. Os x je vodorovná os a os y je zvislá os. Obe vám poskytnú základné informácie o čítaní histogramu. Mnoho histogramov zobrazuje výsledky frekvencie výskytu a budú mať frekvenciu indikujúcu os y. Os x vám oznámi rozsahy, do ktorých boli údaje zoskupené.
- Napríklad histogram s podrobnosťami o frekvencii výšok nadhadzovačov v profesionálnom bejzbale bude mať os x výšky a os y frekvencie.
- 3Identifikujte použité rozsahy. Údaje sú zoskupené do rozsahov alebo zásobníkov na vykreslenie grafov. Výber správnej veľkosti zásobníka je dôležitý pre získanie grafu, ktorý vám pomôže interpretovať vaše výsledky. Chcete vybrať rozsahy, ktoré nie sú príliš široké ani príliš konkrétne, a umožňujú vám v údajoch vidieť základný vzor frekvencie.
- Priemerná výška profesionálneho baseballového nadhadzovača je napríklad 6'2", ale samozrejme budú existovať výnimky. Pretože rozsahy výšky budú pravdepodobne medzi 5'6" a strednými 6'6", koše by sa mali líšiť iba podľa asi palec alebo dva.
- Ďalšia poznámka k rozsahom: úplne prvá skupina sa môže pohybovať od 5'6" do 5'8", ale nezahŕňa 5'8". Každá skupina zahŕňa všetko až do začiatku ďalšej skupiny.
- 4V hornej časti panela odčítajte frekvenciu danej skupiny. Ak chcete vedieť, koľkokrát sa udalosť vyskytla v rámci určitého rozsahu, stačí sa pozrieť na hornú časť pruhu a v tomto bode odčítať hodnotu na osi y.
- Napríklad pri pohľade na histogram je počet hráčov v rozsahu 6'0" až tesne pod 6'2" 50.
Časť 2 z 2: grafy s histogramom
- 1Zhromaždite údaje, ktoré chcete vykresliť. Ak chcete zhromaždiť údaje o frekvencii niečoho, potom je vhodné, ako sa na svoje údaje pozrieť, grafy v histograme. Či už sa pozeráte na počet predaných kópií konkrétnej knihy alebo na rozloženie hmotnosti kráv na farme, histogramy sú jednoduchým spôsobom, ako získať široký obraz o celkovom vzore distribúcie údajov.
- 2Vyberte si koše na sortiment. Pri vykresľovaní údajov sa musíte najskôr rozhodnúť, ako ich chcete rozdeliť do rozsahov. Chcete si vybrať koše, ktoré vám poskytnú dobrú reprezentáciu, a nechcete, aby boli príliš široké alebo príliš konkrétne.
- Povedzme napríklad, že ste mali 10 údajových bodov o hmotnosti kráv na vašej farme: 1150, 1400, 1100, 1600, 1800, 1550, 1750, 1350, 1400 a 1300. Tieto hmotnosti sa líšia o stovky libier, takže tiež chcete, aby sa vaše koše líšili o stovky libier.
- Nastavte koše každých 91 kg, od 499 kg až po 862 kg.
- 1100-1300, 1300-1500, 1500-1700, 1700-1900 pre celkom 4 zásobníky.
- 3Oddeľte údaje do priehradiek. Keď ste si vybrali svoje zásobníky, musíte si objednať a zoradiť údaje do týchto zásobníkov. Začnite tým, že všetky svoje hodnoty umiestnite vzostupne. Potom nakreslite čiaru pri delení zásobníkov. Spočítajte počet hodnôt, ktoré spadajú do každého koša. Toto číslo je frekvencia každého rozsahu.
- Pamätajte si, že ak je hodnota rovnaká ako hranica koša, spadne do koša vpravo.
- Povedzme napríklad, že ste mali 10 údajových bodov o hmotnosti kráv na vašej farme: 1150, 1400, 1100, 1600, 1800, 1550, 1650, 1350, 1400 a 1300.
- Zoradenie je vzostupne: 1100, 1150, 1300, 1350, 1400, 1400, 1550, 1600, 1650, 1800
- Rozdelte ich do zásobníkov: 1100, 1150 | 1300, 1350, 1400, 1400 | 1550, 1600, 1650 | 1800
- Spočítajte frekvencie: Kôš 1: 2, Kôš 2: 4, Kôš 3: 3, Kôš 4: 1
- 4Vytvorte graf histogramu. Histogram môžete zostaviť ručne z údajov, ktoré ste zoradili, alebo môžete použiť program, ako je Excel alebo iný štatistický program. Ak chcete kresliť ručne, jednoducho nakreslite os x a y a na každej z nich nastavte mierku. Os x bude nastavená pomocou už vybratých zásobníkov a mierka osi y je nastavená údajmi o frekvencii. Nakreslite stĺpce pre každý kôš, ktoré idú až k hodnote frekvencie priradenej k zásobníku. Vyfarbite ich a uistite sa, že sa všetky tyče navzájom dotýkajú.
- V prípade hmotnosti kráv sa napríklad os x bude pohybovať od 1100 do 1900 v prírastkoch po 200; mierka osi y sa bude pohybovať od 1 do 4 v prírastkoch po 1.
- Prvý zásobník, 1100-1300, má frekvenciu 2, nakreslite teda pruh do 2 a zafarbite ho. Priamo vedľa prvého pruhu nakreslite druhý pruh pre druhý zásobník s frekvenciou 4. Tretí bar stúpne na 3 a konečný pruh na 1.
- 5Označte obe osi. Žiadny graf nie je úplný bez označených osí. Urobte ich veľkými a odvážnymi, aby vynikli. Zaistite, aby štítky presne zodpovedali prezentovaným údajom. Os y bude označená frekvenciou, zatiaľ čo označenie osi x bude závisieť od typu zhromaždených údajov.
- Napríklad os x bude označená ako „Hmotnosť kráv v librách“ a os y bude označená ako „Frekvencia“.
Otázky a odpovede
- Ako zistím, ktorá miera stredu je pre distribúciu najvhodnejšia?Predpokladám, že hovoríte o mierach centrálnej tendencie. Od najlepšieho po najhorší, pokiaľ ide o neumožnenie odľahlých údajov ovplyvniť presnosť údajov - medián, priemer, režim.