1/6
Looks like no tags are added yet.
Name | Mastery | Learn | Test | Matching | Spaced | Call with Kai |
|---|
No analytics yet
Send a link to your students to track their progress
Co je to histogram?
Histogram je základní graf pro zobrazení rozdělení četnosti spojité proměnné.
Oproti barplotu se jeho sloupce dotýkají a je určen pro intervaly/čísla na ose, barplot je určen pro kategorie
Jak funguje histogram?
Funguje tak, že osu x rozdělí do binů (intervalů), výška sloupce pak ukazuje, kolik hodnot do daného binu spadá.
U diskrétních proměnných zobrazuje četnosti jednotlivých hodnot
U spojitých (nebo diskrétních s velkým počtem hodnot) proměnných ukazuje četnosti intervalů hodnot
Jak parametry mění histogram?
Histogram nemusí být pořád stejný - histogram pro jedny a ty samé data může vypadat jinak, pokud se tyto parametry změní.
Jaké parametry histogram má?
Šířka intervalu/Bin width h
Offset/počátek
Popiš šířku intervalu/Bin width:
Jedná se o smoothing parametr
Příliš nízké h (úzké sloupce)
histogram je zubatý, zobrazuje šum a nedůležité výkyvy
Ztrácíme přehled o celkovém tvaru.
Příliš velké h (široké sloupce)
Histogram bude krabicový, vyhladí důležité detaily
Může skrýt i bimodalitu (dva vrcholy vedle sebe se spojí do jednoho)
Popiš offset/počátek:
Určuje, kde začíná první interval (na 0 nebo na 0,5?)
Problém s citlivostí na posun
U malých souborů dat může posunutí počátku intervalů změnit tvar grafu
Posunutí hranic intervalů se může z unimodálního grafu stát bimodální
Určení správné šířky intervalu:
Strugessovo pravidlo říká, že pro data s normálním rozdělením platí: k = 1 + 3,3 * log10 n
K je počátek intervalu
n je počet pozorování
Interpretace vzorečku → čím více dat, tím více intervalů může mít