1/98
Looks like no tags are added yet.
Name | Mastery | Learn | Test | Matching | Spaced |
---|
No study sessions yet.
Definice populace
Je to soubor všech jedinců definován svým výčtem nebo stanovením svých společných vlastností
soubor všech jedinců, kteří jsou dáni svými společnými vlastnostmi
Populace vs výběr
Populace - všichni jedinci společných vlastností
Výběr - určitý výběr skupiny jedinců z populace
Dělení znaků ( proměnných) , které sledujeme na prvcích výběru
Kvalitativní a kvantitativní
Vyjmenujte alespoň tři typy výběrů
selektivní, náhodný, reprezentativní, záměrný, skupinový
Dělení kvantitativních znaků - příklady
Diskrétní - proměnná nabývá jen určitých hodnot - počet narozených dětí
Spojité - proměnná nabývá jakýchkoliv hodnot - výška a hmotnost, z nich spočítáme BMI
Dělení kvalitativních znaků - příklady
Nominální - proměnná tvořená více kategoremi -typy úrazů - pracovní, sportovní…
Dichotomická - pouze 2 hodnoty -pohlaví - muž X žena
Ordinální - kategorie seřazeny vzestupně/ sestupně - bolest - mírná, velká…
Jaké rozeznáváme četnosti?
absolutní, relativní
K čemu nám slouží absolutní četnosti?
k porovnání našich výsledků s výsledky jiných autorů
ke srovnání s vlastními výsledky zjištěnými za jiných podmínek
porovnáváme naše hodnoty se stanovenou normou
Vyjmenujte tři typy relativních ukazatelů četnosti
intenzitní, extenzitní, znázorňující ( indexy)
Co jsou to intenzitní ( četnostní ) ukazatele - jak je spočteme?
Slouží k porovnání výskytu určitého jevu v odlišných souborech , které nejsou stejně velké
Nemocnost na 1000 obyvatel = N/Ns x 1000
N - počet onemocnění ve sledovaném období
Ns - střední počet ( stav) obyvatel
Co jsou to extenzitní ukazatele ( ukazatele struktury? )
vyjadřují část v celku
jsou relativní
v %, promile
Co jsou to znázorňující ukazatele ( indexy? )
Popisují výskyt jevu v časových řádech, slouží k porovnání vývoje v čase
Popište rozdíl mezi indexy s pevným základem a indexy řetězovými
pevné - používáme stejný základ, první hodnotu, jedno období
řetězové - základ z číselné řady je předchozí hodnota ( t -1)
Jakých chyb se můžeme při používání procent?
počítání procent z malých hodnot
používání tam, kde to nemá smysl
neuvedení velikosti souboru
Popište rozdíl mezi prevalencí a incidencí
Prevalence - počet všech nemocných v určitou dobu
Incidence - počet všech nově vzniklých nemocných ve zvoleném časovém období
Jak spočteme mortalitu?
Podíl počtu zemřelých v populaci v daném časovém období ku celé populaci
Co popisují míry polohy?
Kde na číselné ose leží popisované hodnoty
Co popisují míry variability?
Těsnost uspořádání prvků kolem průměru
Jak spočteme aritmetický průměr?
Součet všech sledovaných hodnot vyděleno jejich počtem
Co je to medián?
Hodnota, která dělí výběr seřazení dle velikosti na 2 stejné poloviny, pokud je lichý, je to prostřední hodnota
prostřední hodnota ze seřazené posloupnosti hodnot
Dělí řadu vzestupně seřazených hodnot na dvě stejné poloviny
Co je to modus?
Hodnota nejčastěji se vyskytující v statistickém souboru , značíme M0
Proč nazýváme medián robustním odhadem aritmetického průměru?
je nepřesný, neříká nic o skutečné poloze hodnot
náchylný na extrémní hodnoty , méně citlivý
Kdy je vhodnější použití mediánu a kdy aritmetického průměru?
Pokud je velký rozptyl mezi hodnotami, je lepší MEDIÁN
Co je to kvantil?
míra polohy oddělení pravděpodobnosti náhodné veličiny
P% kvantil je hodnota, pod kterou leží p% souboru
Jak spočteme rozptyl?
VIZ SOUBOR OD ELI - VZOREC
Jak spočteme směrodatnou odchylku?
VIZ SOUBOR OD ELI - VZOREC
Jak spočteme rozpětí?
VIZ SOUBOR OD ELI - VZOREC
Co nám říká o rozdělení dat šikmost?
Jak souměrné jsou hodnoty kolem aritmetického průměru
Co nám říká o rozdělení dat špičatost?
V jaké četnosti se vyskytují extrémní hodnoty ( příliš velké/malé)
Napište postup při testování hypotéz
Vyslovíme nulovou a alternativní hypotézu
Volba testové statistiky
Stanovení hladiny významnosti
Výpočet hodnoty testovaného kritéria
Nalezení kritické hodnoty
Porovnání vypočtené hodnoty s kritickou hodnotou
Rozhodneme, zda zamítneme nulovou hypotézu ve prospěch alternativní hypotézy nebo nulovou nezamítnout
Parametrické vs. neparametrické testy
Parametrické - vyžadují normalitu sledovaných veličin
Neparametrické - nevyžadují normalitu, vyžadují menší část informace
Nulová vs. alternativní hypotéza
Nulová - hypotéza, kterou chceme zamítnout
Alternativní - hypotéza, kterou předpokládáme, že potvrdí naše studie
Chyba I a II druhu
Chyba I - nesprávné zamítnutí nulové hypotézy
Chyba II - nesprávné nezamítnutí nulové hypotézy
Jaký je vztah chyby I druhu a hladiny významnosti?
Hladina významnosti je pravděpodobnost, že nastane chyba I druhu
Jaký je vztah hladiny významnosti a intervalu spolehlivosti?
Interval spolehlivosti je dán hladinou významnosti
Co je to interval spolehlivosti?
Pravděpodobnost, že správně zamítneme nulovou hypotézu
Kvantitativní indikátor statistické významnosti
Co je to síla testu?
Pravděpodobnost jevu doplňkového k chybě II druhu, nulová hypotéza neplatí a zamítnu ji
Naděje, s jakou test zjistí, že testovaná H0 neplatí a platí Ha
Jaký je vztah síly testu a chyby II druhu?
Čím vyšší je síla testu, tím nižší je pravděpodobnost chyby II druhu
Čím nižší je síla testu, tím vyšší je pravděpodobnost chyby II druhu
Co je to výběrová chyba ?
Chyba vzniklá v důsledku neprovedení šetření na celé populaci, ale jen na jejím výběru
Dvoustranný vs Jednostranný test
Liší se formací alternativní hypotézy
2stranný - pokud mě zajímá pouze platí/neplatí
1stranný - pokud chci vědět směr rozdílu větší/menší
Kdy musíme při testování hypotéz použít místo normálního rozložení t-rozložení?
Provádíme - li test o střední hodnotě s neznámým rozptylem
Vyjmenujte parametrické testy hypotéz o poloze 1 souboru
U - test, T- test
Vyjmenujte neparametrické testy hypotéz o poloze 1 souboru
Mediánový test
Vyjmenujte aspoň tři testy hypotéz o rozložení:
Kolmogorův - smirnonův test
Lillieforsova verze K-S testu
Shapiro - wilkův test
Jak postupujeme u testů hypotéz o rozložení?
Definujeme empirickou funkci, proti ní funkci teoretickou
Spočteme rozdíl, ze kterého určíme, zda naše veličiny pochází z daného rozložení
Pokud výběr nepochází z daného rozložení, zamítneme nulovou hypotézu ve prospěch alternativní hypotézy
Jak definujeme emprickou funkci u testů hypotéz o rozožení
VIZ SOUBOR OD ELI
Npište testovací kritérium Kolmogrovova- Smirnova
Maximální vzdálenost mezi empirickou a teoretickou funkcí
Jaký je rozdíl mezi Shapiro - Wilkovým testem na straně jedné a Kolmogorovovým - Smirnovovým testem a Lillieforsovou verzí K - S testu na straně druhé?
S - W test je pouze pro normální rozložení
L. verze K-S testu - je pro jakékoliv rozložení
Vyjmenujte parametrické testy při testování hypotéz o parametrech 2 nezávislých výběrů
T - test
Vyjmenujte neparametrické testy při testování hypotéz o parametrech 2 nezávislých výběrů
K - S test
Mann- whitneyho U - test
Napište postup Mann - Whitneyho U - testu
Seřazení hodnot dle velikosti
Označíme si, ze kterého výběru toto pozorování pochází
Spočteme testovací statistiky
Najdeme v tabulkách kritické hodnoty pro hladiny významnosti
pokud je naše hodnota menší než kritická, zamítneme nulovou hypotézu
Napište nulovou hypotézi Mann - whitneyho U testu
H0 : P (xi větší než yi) - ½
H0 - rozdělení hodnot v první skupině je stejné jako rozdělení hodnot v druhé skupině
Vyjmenujte parametrické testy při testování hypotéz o parametrech 2 závislých výběrů
T - test
znaménkový test
Wilcoxonův test
Který ze dvou uvedených testů využívá více informací - znamnénkový nebo Wilcoxonův test?
Wilcoxonův
Uveďte název statistické metody pro testování hypotéz o parametrech 3 a více výběrů
ANOVA - analýza rozptylu
Napište nulovou a alternativní hypotézu ANOVY
H0 - všechny výběry pochází ze stejné normálně rozložené základní populace
Ha - výběry nepochází ze stejné populace - průměry se vzájemně statisticky liší
Jaké je testovací kritérium ANOVY?
Podíl rozptylu mezi skupinami a rozptylu uvnitř skupin
toto kritérium srovnáváme s kvantily F - rozdělení
F rozložení - F = Sv2/Sr2 =Sv/k-1 : Sr/n - k
Proč je testovací kritérium ANOVY založeno na F rozložení?
Testovací kritérium je dáno podílem veličin , které vzniknou jako součet druhých mocnin normálně rozdělených veličin a podělením příslušnými počty stupňů volnosti vzniklého rozdělení x2
F = U1/d1 : U2/d2
F - rozložení definuji jako podíl dvou x2 - rozložení
Jaký vliv na velikost hodnoty F rozložení má rozdíl průměrů?
čím větší je rozdíl mezi průměry skupin, tím větší je F = větší pravděpodobnost zamítnutí nulové hypotézy
Jaký vliv má na velikost hodnoty F rozložení variabilita uvnitř výběrů?
čím menší je směrodatná odchylka, tím větší je F = větší pravděpodobnost zamítnutí H0
Jaký vliv na velikost hodnoty F - rozložení má rozsah výběrů?
při nárůstu prvků se F zvětšuje = roste pravděpodobnost zamítnutí H0 , Sv se nemění
Proč musíme použít u ANOVY simultánní testování?
dochází k inflaci hladiny významnosti
při postupném použití t - testů narůstá chyba II druhu
Vyjmenujte alespoň tři metody simultánního testování
LSD metoda, metoda Scheffeho , x2 test
Co je výsledkem - co nalezneme použitím simultánního testování?
Nalezneme všechny páry skupin , které se mezi sebou významně statisticky liší
Jak se jmenuje neparametrická hodnota pro testování hypotéz o parametrech 3 a více výběrů ?
Kruskal - wallisúv test
Popište princip a postup použití neparametrické ANOVY
Chceme se přesvědčit , že naměřené náhodné veličiny se liší polohou
1) vyslovení nulové hypotézy, všechny výběry dám do jednoho souboru+ seřadím dle velikosti + přiřadím pořadová čísla
2) pokud H0 platí, je průměrné pořadí ve skupině stejné
3) pokud je kritická hodota vyznamně větší - nulovou hypotézu zamítneme
Jaký je cíl korelační analýzy?
nalezení lineárního vztahu mezi dvěma kvantitativními veličinami , proměnnými
Vyjmenujte úskalí korelační analýzy
homogenita, výskyt extrémně vzdálených hodnot, skryté asociace, matematické vztahy
Napište vzoreček pro Pearsonův korelační koeficient
VIZ SOUBOR OD ELI, ale na to jí sere pes, to je delší než tejden před výplatou
Jaké hodnoty může dosáhnout korelační koeficient?
interval -1, 0, 1
Jak posuzujeme korelační koeficient podle jeho velikosti
čím menší je koeficient, tím je těsnost lineární závislosti menší
Vyjmenujte neparametrické korelanční koeficienty
Spearkmanův, Kendallův, Goodman - Kruskalův
Který z neparametrických korelačních koeficientů nejlépe popisuje vztah mezi dvěma sledovanými veličinami?
Kendallův k. koeficient
Co je to parciální korelační koeficient?
odhalí skryté asociace
vyjadřuje vztah mezi dvěma lineárními proměnnými
K čemu slouží analýza kontingenčních tabulek?
k hledání vztahu mezi 2 kvalitativními proměnnými
Vyjmenujte 2 základní hypotézy, které testujeme v kontingenčních tabulkách
homogenity, nezávislosti
Napište vzoreček pro výpočet relativního rizika
VIZ ELI SOUBOR
Napište vzoreček pro výpočet poměru šancí
VIZ ELI SOUBOR
Jaké jsou výhody a nevýhody použití RR a OR ( poměru šancí) ?
OR - interpretuje poměr šance , NE celou šanci , obtížná interpretace
RR - nezajímá mě pravděpodobnost jevu, pouze podíl
Kdy je vhodné použití OR a kdy RR vzhledem k prospektivní a retrospektivní studii?
RR - prospektivní studie
OR - retrospektivní
Jaký je cíl regresní analýzy?
poskytnout číselné míry vztahu mezi 2 veličinami
vytvoření regresního modelu, který slouží k predikci výstupní proměnné
testovat různé hypotézy o zkoumaném regresnim vztahu
Jakých hodnot může nabývat vstupní proměnná v regresní analýze?
spojité, kategoriální - různé hodnoty
spojitá proměnná - číselná
Jakých hodnot můžou nabývat vstupní - vsvětlující proměnné v regresní analýze ?
spojité, číselné
Která z proměnných výstupní ( závislá), vstupní ( vysvětlující) je náhodná a která nenáhodná?
vstupní - určitá, nenáhodná
výstupní - náhodná
Jaký je rozdíl mezi regresní a korelační analýzou?
regresní - vysvětlující proměnná není náhodná, poskytuje míry vztahu mezi 2 veličinami, hledání vztahu
Korelační - hledá lineární asociace mezi 2 proměnnými , obě proměnné jsou náhodnými proměnnými
Pomocí jaké metody určíme nejlepší přímku v lineární regresní analýze?
metoda nejmenších čtverců reziduí
Na čem je založena metoda nejmenších čtverců? - co potebujeme minimalizovat
na součtu čtverců reziduí
určit regresní přímku takovou, aby minimalizovala součet čtverců reziduí, určit regresní parametry
Co je to koeficient determinace?
jak dobrý je regresní model
porovnává velikost kolísání a variace v datech
v jakém rozemzí hodnot se může pohybovat koeficient determinace?
0 - 1
Pokud se koeficient determinace R na druhou = 1, co to znamená ?
Všechny body přesně leží na přímce definující můj výběr
Pokud se koeficient determinace R na druhou = 0, co to znamená?
model nepřináší více info než model naivní
co je to naivní model v regresní analýze
Pokud máme lineární model, musíme použít naivní model- nahrazujeme pozorované body aritmetickým průměrem
Čemu je rovná druhá odmocnina koeficientu determinace R na druhou, tedy vlastně R?
korelačnímu koeficientu
K čemu slouží reziduální analýza v regresní analýze?
ověřuje vlastnosti chyb regresního modelu
pomáhá odhalit vlivné body
posouzení prediktivní schopnosti našeho regresního modelu
Jaké podmínky musí splnit rezidua, abychom mohli říct, že námi vytvořený model má význam pro predikci?
nezávislost, normalita,linearita, homoscedasticita
Když zjistíme , že rezidua nesplnila podmínky reziduální analýzy- co to znamená a co musíme udělat?
náš model není vhodný k predikci, trasnformuji ovlivňující proměnné
3 možné tranformace vstupní proměnné u regresní analýzy v případě, kdy nejsou splněny podmínky reziduální analýzy
log(Y), 1/Y, odmocnina z Y
Co definujeme znakem?
věk, pohlaví, bydliště, spádová oblast = všichni