15. Histogram a jeho citlivost na volbu offsetu a šířky okna

0.0(0)
Studied by 1 person
call kaiCall Kai
learnLearn
examPractice Test
spaced repetitionSpaced Repetition
heart puzzleMatch
flashcardsFlashcards
GameKnowt Play
Card Sorting

1/6

encourage image

There's no tags or description

Looks like no tags are added yet.

Last updated 10:04 AM on 2/3/26
Name
Mastery
Learn
Test
Matching
Spaced
Call with Kai

No analytics yet

Send a link to your students to track their progress

7 Terms

1
New cards

Co je to histogram?

Histogram je základní graf pro zobrazení rozdělení četnosti spojité proměnné.

Oproti barplotu se jeho sloupce dotýkají a je určen pro intervaly/čísla na ose, barplot je určen pro kategorie

2
New cards

Jak funguje histogram?

Funguje tak, že osu x rozdělí do binů (intervalů), výška sloupce pak ukazuje, kolik hodnot do daného binu spadá.

  • U diskrétních proměnných zobrazuje četnosti jednotlivých hodnot

  • U spojitých (nebo diskrétních s velkým počtem hodnot) proměnných ukazuje četnosti intervalů hodnot

3
New cards

Jak parametry mění histogram?

Histogram nemusí být pořád stejný - histogram pro jedny a ty samé data může vypadat jinak, pokud se tyto parametry změní.

4
New cards

Jaké parametry histogram má?

  1. Šířka intervalu/Bin width h

  2. Offset/počátek

5
New cards

Popiš šířku intervalu/Bin width:

Jedná se o smoothing parametr

  • Příliš nízké h (úzké sloupce)

    • histogram je zubatý, zobrazuje šum a nedůležité výkyvy

    • Ztrácíme přehled o celkovém tvaru.

  • Příliš velké h (široké sloupce)

    • Histogram bude krabicový, vyhladí důležité detaily

    • Může skrýt i bimodalitu (dva vrcholy vedle sebe se spojí do jednoho)

6
New cards

Popiš offset/počátek:

Určuje, kde začíná první interval (na 0 nebo na 0,5?)

  • Problém s citlivostí na posun

    • U malých souborů dat může posunutí počátku intervalů změnit tvar grafu

      • Posunutí hranic intervalů se může z unimodálního grafu stát bimodální

7
New cards

Určení správné šířky intervalu:

Strugessovo pravidlo říká, že pro data s normálním rozdělením platí: k = 1 + 3,3 * log10 n

  • K je počátek intervalu

  • n je počet pozorování

  • Interpretace vzorečku → čím více dat, tím více intervalů může mít