Informatika je hnusíček

0.0(0)

Studied by 0 people

Learn

Practice Test

Spaced Repetition

Match

Flashcards

Card Sorting

1/98

There's no tags or description

Looks like no tags are added yet.

Study Analytics

Name	Mastery	Learn	Test	Matching	Spaced

No study sessions yet.

99 Terms

New cards

Definice populace

Je to soubor všech jedinců definován svým výčtem nebo stanovením svých společných vlastností

soubor všech jedinců, kteří jsou dáni svými společnými vlastnostmi

New cards

Populace vs výběr

Populace - všichni jedinci společných vlastností

Výběr - určitý výběr skupiny jedinců z populace

New cards

Dělení znaků ( proměnných) , které sledujeme na prvcích výběru

Kvalitativní a kvantitativní

New cards

Vyjmenujte alespoň tři typy výběrů

selektivní, náhodný, reprezentativní, záměrný, skupinový

New cards

Dělení kvantitativních znaků - příklady

Diskrétní - proměnná nabývá jen určitých hodnot - počet narozených dětí

Spojité - proměnná nabývá jakýchkoliv hodnot - výška a hmotnost, z nich spočítáme BMI

New cards

Dělení kvalitativních znaků - příklady

Nominální - proměnná tvořená více kategoremi -typy úrazů - pracovní, sportovní…

Dichotomická - pouze 2 hodnoty -pohlaví - muž X žena

Ordinální - kategorie seřazeny vzestupně/ sestupně - bolest - mírná, velká…

New cards

Jaké rozeznáváme četnosti?

absolutní, relativní

New cards

K čemu nám slouží absolutní četnosti?

k porovnání našich výsledků s výsledky jiných autorů

ke srovnání s vlastními výsledky zjištěnými za jiných podmínek

porovnáváme naše hodnoty se stanovenou normou

New cards

Vyjmenujte tři typy relativních ukazatelů četnosti

intenzitní, extenzitní, znázorňující ( indexy)

New cards

Co jsou to intenzitní ( četnostní ) ukazatele - jak je spočteme?

Slouží k porovnání výskytu určitého jevu v odlišných souborech , které nejsou stejně velké

Nemocnost na 1000 obyvatel = N/Ns x 1000

N - počet onemocnění ve sledovaném období

Ns - střední počet ( stav) obyvatel

New cards

Co jsou to extenzitní ukazatele ( ukazatele struktury? )

vyjadřují část v celku

jsou relativní

v %, promile

New cards

Co jsou to znázorňující ukazatele ( indexy? )

Popisují výskyt jevu v časových řádech, slouží k porovnání vývoje v čase

New cards

Popište rozdíl mezi indexy s pevným základem a indexy řetězovými

pevné - používáme stejný základ, první hodnotu, jedno období

řetězové - základ z číselné řady je předchozí hodnota ( t -1)

New cards

Jakých chyb se můžeme při používání procent?

počítání procent z malých hodnot

používání tam, kde to nemá smysl

neuvedení velikosti souboru

New cards

Popište rozdíl mezi prevalencí a incidencí

Prevalence - počet všech nemocných v určitou dobu

Incidence - počet všech nově vzniklých nemocných ve zvoleném časovém období

New cards

Jak spočteme mortalitu?

Podíl počtu zemřelých v populaci v daném časovém období ku celé populaci

New cards

Co popisují míry polohy?

Kde na číselné ose leží popisované hodnoty

New cards

Co popisují míry variability?

Těsnost uspořádání prvků kolem průměru

New cards

Jak spočteme aritmetický průměr?

Součet všech sledovaných hodnot vyděleno jejich počtem

New cards

Co je to medián?

Hodnota, která dělí výběr seřazení dle velikosti na 2 stejné poloviny, pokud je lichý, je to prostřední hodnota

prostřední hodnota ze seřazené posloupnosti hodnot

Dělí řadu vzestupně seřazených hodnot na dvě stejné poloviny

New cards

Co je to modus?

Hodnota nejčastěji se vyskytující v statistickém souboru , značíme M0

New cards

Proč nazýváme medián robustním odhadem aritmetického průměru?

je nepřesný, neříká nic o skutečné poloze hodnot

náchylný na extrémní hodnoty , méně citlivý

New cards

Kdy je vhodnější použití mediánu a kdy aritmetického průměru?

Pokud je velký rozptyl mezi hodnotami, je lepší MEDIÁN

New cards

Co je to kvantil?

míra polohy oddělení pravděpodobnosti náhodné veličiny

P% kvantil je hodnota, pod kterou leží p% souboru

New cards

Jak spočteme rozptyl?

VIZ SOUBOR OD ELI - VZOREC

New cards

Jak spočteme směrodatnou odchylku?

VIZ SOUBOR OD ELI - VZOREC

New cards

Jak spočteme rozpětí?

VIZ SOUBOR OD ELI - VZOREC

New cards

Co nám říká o rozdělení dat šikmost?

Jak souměrné jsou hodnoty kolem aritmetického průměru

New cards

Co nám říká o rozdělení dat špičatost?

V jaké četnosti se vyskytují extrémní hodnoty ( příliš velké/malé)

New cards

Napište postup při testování hypotéz

Vyslovíme nulovou a alternativní hypotézu

Volba testové statistiky

Stanovení hladiny významnosti

Výpočet hodnoty testovaného kritéria

Nalezení kritické hodnoty

Porovnání vypočtené hodnoty s kritickou hodnotou

Rozhodneme, zda zamítneme nulovou hypotézu ve prospěch alternativní hypotézy nebo nulovou nezamítnout

New cards

Parametrické vs. neparametrické testy

Parametrické - vyžadují normalitu sledovaných veličin

Neparametrické - nevyžadují normalitu, vyžadují menší část informace

New cards

Nulová vs. alternativní hypotéza

Nulová - hypotéza, kterou chceme zamítnout

Alternativní - hypotéza, kterou předpokládáme, že potvrdí naše studie

New cards

Chyba I a II druhu

Chyba I - nesprávné zamítnutí nulové hypotézy

Chyba II - nesprávné nezamítnutí nulové hypotézy

New cards

Jaký je vztah chyby I druhu a hladiny významnosti?

Hladina významnosti je pravděpodobnost, že nastane chyba I druhu

New cards

Jaký je vztah hladiny významnosti a intervalu spolehlivosti?

Interval spolehlivosti je dán hladinou významnosti

New cards

Co je to interval spolehlivosti?

Pravděpodobnost, že správně zamítneme nulovou hypotézu

Kvantitativní indikátor statistické významnosti

New cards

Co je to síla testu?

Pravděpodobnost jevu doplňkového k chybě II druhu, nulová hypotéza neplatí a zamítnu ji

Naděje, s jakou test zjistí, že testovaná H0 neplatí a platí Ha

New cards

Jaký je vztah síly testu a chyby II druhu?

Čím vyšší je síla testu, tím nižší je pravděpodobnost chyby II druhu

Čím nižší je síla testu, tím vyšší je pravděpodobnost chyby II druhu

New cards

Co je to výběrová chyba ?

Chyba vzniklá v důsledku neprovedení šetření na celé populaci, ale jen na jejím výběru

New cards

Dvoustranný vs Jednostranný test

Liší se formací alternativní hypotézy

2stranný - pokud mě zajímá pouze platí/neplatí

1stranný - pokud chci vědět směr rozdílu větší/menší

New cards

Kdy musíme při testování hypotéz použít místo normálního rozložení t-rozložení?

Provádíme - li test o střední hodnotě s neznámým rozptylem

New cards

Vyjmenujte parametrické testy hypotéz o poloze 1 souboru

U - test, T- test

New cards

Vyjmenujte neparametrické testy hypotéz o poloze 1 souboru

Mediánový test

New cards

Vyjmenujte aspoň tři testy hypotéz o rozložení:

Kolmogorův - smirnonův test

Lillieforsova verze K-S testu

Shapiro - wilkův test

New cards

Jak postupujeme u testů hypotéz o rozložení?

Definujeme empirickou funkci, proti ní funkci teoretickou

Spočteme rozdíl, ze kterého určíme, zda naše veličiny pochází z daného rozložení

Pokud výběr nepochází z daného rozložení, zamítneme nulovou hypotézu ve prospěch alternativní hypotézy

New cards

Jak definujeme emprickou funkci u testů hypotéz o rozožení

VIZ SOUBOR OD ELI

New cards

Npište testovací kritérium Kolmogrovova- Smirnova

Maximální vzdálenost mezi empirickou a teoretickou funkcí

New cards

Jaký je rozdíl mezi Shapiro - Wilkovým testem na straně jedné a Kolmogorovovým - Smirnovovým testem a Lillieforsovou verzí K - S testu na straně druhé?

S - W test je pouze pro normální rozložení

L. verze K-S testu - je pro jakékoliv rozložení

New cards

Vyjmenujte parametrické testy při testování hypotéz o parametrech 2 nezávislých výběrů

T - test

New cards

Vyjmenujte neparametrické testy při testování hypotéz o parametrech 2 nezávislých výběrů

K - S test

Mann- whitneyho U - test

New cards

Napište postup Mann - Whitneyho U - testu

Seřazení hodnot dle velikosti

Označíme si, ze kterého výběru toto pozorování pochází

Spočteme testovací statistiky

Najdeme v tabulkách kritické hodnoty pro hladiny významnosti

pokud je naše hodnota menší než kritická, zamítneme nulovou hypotézu

New cards

Napište nulovou hypotézi Mann - whitneyho U testu

H0 : P (xi větší než yi) - ½

H0 - rozdělení hodnot v první skupině je stejné jako rozdělení hodnot v druhé skupině

New cards

Vyjmenujte parametrické testy při testování hypotéz o parametrech 2 závislých výběrů

T - test

znaménkový test

Wilcoxonův test

New cards

Který ze dvou uvedených testů využívá více informací - znamnénkový nebo Wilcoxonův test?

Wilcoxonův

New cards

Uveďte název statistické metody pro testování hypotéz o parametrech 3 a více výběrů

ANOVA - analýza rozptylu

New cards

Napište nulovou a alternativní hypotézu ANOVY

H0 - všechny výběry pochází ze stejné normálně rozložené základní populace

Ha - výběry nepochází ze stejné populace - průměry se vzájemně statisticky liší

New cards

Jaké je testovací kritérium ANOVY?

Podíl rozptylu mezi skupinami a rozptylu uvnitř skupin

toto kritérium srovnáváme s kvantily F - rozdělení

F rozložení - F = Sv2/Sr2 =Sv/k-1 : Sr/n - k

New cards

Proč je testovací kritérium ANOVY založeno na F rozložení?

Testovací kritérium je dáno podílem veličin , které vzniknou jako součet druhých mocnin normálně rozdělených veličin a podělením příslušnými počty stupňů volnosti vzniklého rozdělení x2

F = U1/d1 : U2/d2

F - rozložení definuji jako podíl dvou x2 - rozložení

New cards

Jaký vliv na velikost hodnoty F rozložení má rozdíl průměrů?

čím větší je rozdíl mezi průměry skupin, tím větší je F = větší pravděpodobnost zamítnutí nulové hypotézy

New cards

Jaký vliv má na velikost hodnoty F rozložení variabilita uvnitř výběrů?

čím menší je směrodatná odchylka, tím větší je F = větší pravděpodobnost zamítnutí H0

New cards

Jaký vliv na velikost hodnoty F - rozložení má rozsah výběrů?

při nárůstu prvků se F zvětšuje = roste pravděpodobnost zamítnutí H0 , Sv se nemění

New cards

Proč musíme použít u ANOVY simultánní testování?

dochází k inflaci hladiny významnosti

při postupném použití t - testů narůstá chyba II druhu

New cards

Vyjmenujte alespoň tři metody simultánního testování

LSD metoda, metoda Scheffeho , x2 test

New cards

Co je výsledkem - co nalezneme použitím simultánního testování?

Nalezneme všechny páry skupin , které se mezi sebou významně statisticky liší

New cards

Jak se jmenuje neparametrická hodnota pro testování hypotéz o parametrech 3 a více výběrů ?

Kruskal - wallisúv test

New cards

Popište princip a postup použití neparametrické ANOVY

Chceme se přesvědčit , že naměřené náhodné veličiny se liší polohou

1) vyslovení nulové hypotézy, všechny výběry dám do jednoho souboru+ seřadím dle velikosti + přiřadím pořadová čísla

2) pokud H0 platí, je průměrné pořadí ve skupině stejné

3) pokud je kritická hodota vyznamně větší - nulovou hypotézu zamítneme

New cards

Jaký je cíl korelační analýzy?

nalezení lineárního vztahu mezi dvěma kvantitativními veličinami , proměnnými

New cards

Vyjmenujte úskalí korelační analýzy

homogenita, výskyt extrémně vzdálených hodnot, skryté asociace, matematické vztahy

New cards

Napište vzoreček pro Pearsonův korelační koeficient

VIZ SOUBOR OD ELI, ale na to jí sere pes, to je delší než tejden před výplatou

New cards

Jaké hodnoty může dosáhnout korelační koeficient?

interval -1, 0, 1

New cards

Jak posuzujeme korelační koeficient podle jeho velikosti

čím menší je koeficient, tím je těsnost lineární závislosti menší

New cards

Vyjmenujte neparametrické korelanční koeficienty

Spearkmanův, Kendallův, Goodman - Kruskalův

New cards

Který z neparametrických korelačních koeficientů nejlépe popisuje vztah mezi dvěma sledovanými veličinami?

Kendallův k. koeficient

New cards

Co je to parciální korelační koeficient?

odhalí skryté asociace

vyjadřuje vztah mezi dvěma lineárními proměnnými

New cards

K čemu slouží analýza kontingenčních tabulek?

k hledání vztahu mezi 2 kvalitativními proměnnými

New cards

Vyjmenujte 2 základní hypotézy, které testujeme v kontingenčních tabulkách

homogenity, nezávislosti

New cards

Napište vzoreček pro výpočet relativního rizika

VIZ ELI SOUBOR

New cards

Napište vzoreček pro výpočet poměru šancí

VIZ ELI SOUBOR

New cards

Jaké jsou výhody a nevýhody použití RR a OR ( poměru šancí) ?

OR - interpretuje poměr šance , NE celou šanci , obtížná interpretace

RR - nezajímá mě pravděpodobnost jevu, pouze podíl

New cards

Kdy je vhodné použití OR a kdy RR vzhledem k prospektivní a retrospektivní studii?

RR - prospektivní studie

OR - retrospektivní

New cards

Jaký je cíl regresní analýzy?

poskytnout číselné míry vztahu mezi 2 veličinami

vytvoření regresního modelu, který slouží k predikci výstupní proměnné

testovat různé hypotézy o zkoumaném regresnim vztahu

New cards

Jakých hodnot může nabývat vstupní proměnná v regresní analýze?

spojité, kategoriální - různé hodnoty

spojitá proměnná - číselná

New cards

Jakých hodnot můžou nabývat vstupní - vsvětlující proměnné v regresní analýze ?

spojité, číselné

New cards

Která z proměnných výstupní ( závislá), vstupní ( vysvětlující) je náhodná a která nenáhodná?

vstupní - určitá, nenáhodná

výstupní - náhodná

New cards

Jaký je rozdíl mezi regresní a korelační analýzou?

regresní - vysvětlující proměnná není náhodná, poskytuje míry vztahu mezi 2 veličinami, hledání vztahu

Korelační - hledá lineární asociace mezi 2 proměnnými , obě proměnné jsou náhodnými proměnnými

New cards

Pomocí jaké metody určíme nejlepší přímku v lineární regresní analýze?

metoda nejmenších čtverců reziduí

New cards

Na čem je založena metoda nejmenších čtverců? - co potebujeme minimalizovat

na součtu čtverců reziduí

určit regresní přímku takovou, aby minimalizovala součet čtverců reziduí, určit regresní parametry

New cards

Co je to koeficient determinace?

jak dobrý je regresní model

porovnává velikost kolísání a variace v datech

New cards

v jakém rozemzí hodnot se může pohybovat koeficient determinace?

0 - 1

New cards

Pokud se koeficient determinace R na druhou = 1, co to znamená ?

Všechny body přesně leží na přímce definující můj výběr

New cards

Pokud se koeficient determinace R na druhou = 0, co to znamená?

model nepřináší více info než model naivní

New cards

co je to naivní model v regresní analýze

Pokud máme lineární model, musíme použít naivní model- nahrazujeme pozorované body aritmetickým průměrem

New cards

Čemu je rovná druhá odmocnina koeficientu determinace R na druhou, tedy vlastně R?

korelačnímu koeficientu

New cards

K čemu slouží reziduální analýza v regresní analýze?

ověřuje vlastnosti chyb regresního modelu

pomáhá odhalit vlivné body

posouzení prediktivní schopnosti našeho regresního modelu

New cards

Jaké podmínky musí splnit rezidua, abychom mohli říct, že námi vytvořený model má význam pro predikci?

nezávislost, normalita,linearita, homoscedasticita

New cards

Když zjistíme , že rezidua nesplnila podmínky reziduální analýzy- co to znamená a co musíme udělat?

náš model není vhodný k predikci, trasnformuji ovlivňující proměnné

New cards

3 možné tranformace vstupní proměnné u regresní analýzy v případě, kdy nejsou splněny podmínky reziduální analýzy

log(Y), 1/Y, odmocnina z Y

New cards

Co definujeme znakem?

věk, pohlaví, bydliště, spádová oblast = všichni

New cards