Informatika je hnusíček

0.0(0)
studied byStudied by 0 people
learnLearn
examPractice Test
spaced repetitionSpaced Repetition
heart puzzleMatch
flashcardsFlashcards
Card Sorting

1/98

encourage image

There's no tags or description

Looks like no tags are added yet.

Study Analytics
Name
Mastery
Learn
Test
Matching
Spaced

No study sessions yet.

99 Terms

1
New cards

Definice populace

Je to soubor všech jedinců definován svým výčtem nebo stanovením svých společných vlastností

soubor všech jedinců, kteří jsou dáni svými společnými vlastnostmi

2
New cards

Populace vs výběr

Populace - všichni jedinci společných vlastností

Výběr - určitý výběr skupiny jedinců z populace

3
New cards

Dělení znaků ( proměnných) , které sledujeme na prvcích výběru

Kvalitativní a kvantitativní

4
New cards

Vyjmenujte alespoň tři typy výběrů

selektivní, náhodný, reprezentativní, záměrný, skupinový

5
New cards

Dělení kvantitativních znaků - příklady

Diskrétní - proměnná nabývá jen určitých hodnot - počet narozených dětí

Spojité - proměnná nabývá jakýchkoliv hodnot - výška a hmotnost, z nich spočítáme BMI

6
New cards

Dělení kvalitativních znaků - příklady

Nominální - proměnná tvořená více kategoremi -typy úrazů - pracovní, sportovní…

Dichotomická - pouze 2 hodnoty -pohlaví - muž X žena

Ordinální - kategorie seřazeny vzestupně/ sestupně - bolest - mírná, velká…

7
New cards

Jaké rozeznáváme četnosti?

absolutní, relativní

8
New cards

K čemu nám slouží absolutní četnosti?

k porovnání našich výsledků s výsledky jiných autorů

ke srovnání s vlastními výsledky zjištěnými za jiných podmínek

porovnáváme naše hodnoty se stanovenou normou

9
New cards

Vyjmenujte tři typy relativních ukazatelů četnosti

intenzitní, extenzitní, znázorňující ( indexy)

10
New cards

Co jsou to intenzitní ( četnostní ) ukazatele - jak je spočteme?

Slouží k porovnání výskytu určitého jevu v odlišných souborech , které nejsou stejně velké

Nemocnost na 1000 obyvatel = N/Ns x 1000

N - počet onemocnění ve sledovaném období

Ns - střední počet ( stav) obyvatel

11
New cards

Co jsou to extenzitní ukazatele ( ukazatele struktury? )

vyjadřují část v celku

jsou relativní

v %, promile

12
New cards

Co jsou to znázorňující ukazatele ( indexy? )

Popisují výskyt jevu v časových řádech, slouží k porovnání vývoje v čase

13
New cards

Popište rozdíl mezi indexy s pevným základem a indexy řetězovými

pevné - používáme stejný základ, první hodnotu, jedno období

řetězové - základ z číselné řady je předchozí hodnota ( t -1)

14
New cards

Jakých chyb se můžeme při používání procent?

počítání procent z malých hodnot

používání tam, kde to nemá smysl

neuvedení velikosti souboru

15
New cards

Popište rozdíl mezi prevalencí a incidencí

Prevalence - počet všech nemocných v určitou dobu

Incidence - počet všech nově vzniklých nemocných ve zvoleném časovém období

16
New cards

Jak spočteme mortalitu?

Podíl počtu zemřelých v populaci v daném časovém období ku celé populaci

17
New cards

Co popisují míry polohy?

Kde na číselné ose leží popisované hodnoty

18
New cards

Co popisují míry variability?

Těsnost uspořádání prvků kolem průměru

19
New cards

Jak spočteme aritmetický průměr?

Součet všech sledovaných hodnot vyděleno jejich počtem

20
New cards

Co je to medián?

Hodnota, která dělí výběr seřazení dle velikosti na 2 stejné poloviny, pokud je lichý, je to prostřední hodnota

prostřední hodnota ze seřazené posloupnosti hodnot

Dělí řadu vzestupně seřazených hodnot na dvě stejné poloviny

21
New cards

Co je to modus?

Hodnota nejčastěji se vyskytující v statistickém souboru , značíme M0

22
New cards

Proč nazýváme medián robustním odhadem aritmetického průměru?

je nepřesný, neříká nic o skutečné poloze hodnot

náchylný na extrémní hodnoty , méně citlivý

23
New cards

Kdy je vhodnější použití mediánu a kdy aritmetického průměru?

Pokud je velký rozptyl mezi hodnotami, je lepší MEDIÁN

24
New cards

Co je to kvantil?

míra polohy oddělení pravděpodobnosti náhodné veličiny

P% kvantil je hodnota, pod kterou leží p% souboru

25
New cards

Jak spočteme rozptyl?

VIZ SOUBOR OD ELI - VZOREC

26
New cards

Jak spočteme směrodatnou odchylku?

VIZ SOUBOR OD ELI - VZOREC

27
New cards

Jak spočteme rozpětí?

VIZ SOUBOR OD ELI - VZOREC

28
New cards

Co nám říká o rozdělení dat šikmost?

Jak souměrné jsou hodnoty kolem aritmetického průměru

29
New cards

Co nám říká o rozdělení dat špičatost?

V jaké četnosti se vyskytují extrémní hodnoty ( příliš velké/malé)

30
New cards

Napište postup při testování hypotéz

Vyslovíme nulovou a alternativní hypotézu

Volba testové statistiky

Stanovení hladiny významnosti

Výpočet hodnoty testovaného kritéria

Nalezení kritické hodnoty

Porovnání vypočtené hodnoty s kritickou hodnotou

Rozhodneme, zda zamítneme nulovou hypotézu ve prospěch alternativní hypotézy nebo nulovou nezamítnout

31
New cards

Parametrické vs. neparametrické testy

Parametrické - vyžadují normalitu sledovaných veličin

Neparametrické - nevyžadují normalitu, vyžadují menší část informace

32
New cards

Nulová vs. alternativní hypotéza

Nulová - hypotéza, kterou chceme zamítnout

Alternativní - hypotéza, kterou předpokládáme, že potvrdí naše studie

33
New cards

Chyba I a II druhu

Chyba I - nesprávné zamítnutí nulové hypotézy

Chyba II - nesprávné nezamítnutí nulové hypotézy

34
New cards

Jaký je vztah chyby I druhu a hladiny významnosti?

Hladina významnosti je pravděpodobnost, že nastane chyba I druhu

35
New cards

Jaký je vztah hladiny významnosti a intervalu spolehlivosti?

Interval spolehlivosti je dán hladinou významnosti

36
New cards

Co je to interval spolehlivosti?

Pravděpodobnost, že správně zamítneme nulovou hypotézu

Kvantitativní indikátor statistické významnosti

37
New cards

Co je to síla testu?

Pravděpodobnost jevu doplňkového k chybě II druhu, nulová hypotéza neplatí a zamítnu ji

Naděje, s jakou test zjistí, že testovaná H0 neplatí a platí Ha

38
New cards

Jaký je vztah síly testu a chyby II druhu?

Čím vyšší je síla testu, tím nižší je pravděpodobnost chyby II druhu

Čím nižší je síla testu, tím vyšší je pravděpodobnost chyby II druhu

39
New cards

Co je to výběrová chyba ?

Chyba vzniklá v důsledku neprovedení šetření na celé populaci, ale jen na jejím výběru

40
New cards

Dvoustranný vs Jednostranný test

Liší se formací alternativní hypotézy

2stranný - pokud mě zajímá pouze platí/neplatí

1stranný - pokud chci vědět směr rozdílu větší/menší

41
New cards

Kdy musíme při testování hypotéz použít místo normálního rozložení t-rozložení?

Provádíme - li test o střední hodnotě s neznámým rozptylem

42
New cards

Vyjmenujte parametrické testy hypotéz o poloze 1 souboru

U - test, T- test

43
New cards

Vyjmenujte neparametrické testy hypotéz o poloze 1 souboru

Mediánový test

44
New cards

Vyjmenujte aspoň tři testy hypotéz o rozložení:

Kolmogorův - smirnonův test

Lillieforsova verze K-S testu

Shapiro - wilkův test

45
New cards

Jak postupujeme u testů hypotéz o rozložení?

Definujeme empirickou funkci, proti ní funkci teoretickou

Spočteme rozdíl, ze kterého určíme, zda naše veličiny pochází z daného rozložení

Pokud výběr nepochází z daného rozložení, zamítneme nulovou hypotézu ve prospěch alternativní hypotézy

46
New cards

Jak definujeme emprickou funkci u testů hypotéz o rozožení

VIZ SOUBOR OD ELI

47
New cards

Npište testovací kritérium Kolmogrovova- Smirnova

Maximální vzdálenost mezi empirickou a teoretickou funkcí

48
New cards

Jaký je rozdíl mezi Shapiro - Wilkovým testem na straně jedné a Kolmogorovovým - Smirnovovým testem a Lillieforsovou verzí K - S testu na straně druhé?

S - W test je pouze pro normální rozložení

L. verze K-S testu - je pro jakékoliv rozložení

49
New cards

Vyjmenujte parametrické testy při testování hypotéz o parametrech 2 nezávislých výběrů

T - test

50
New cards

Vyjmenujte neparametrické testy při testování hypotéz o parametrech 2 nezávislých výběrů

K - S test

Mann- whitneyho U - test

51
New cards

Napište postup Mann - Whitneyho U - testu

Seřazení hodnot dle velikosti

Označíme si, ze kterého výběru toto pozorování pochází

Spočteme testovací statistiky

Najdeme v tabulkách kritické hodnoty pro hladiny významnosti

pokud je naše hodnota menší než kritická, zamítneme nulovou hypotézu

52
New cards

Napište nulovou hypotézi Mann - whitneyho U testu

H0 : P (xi větší než yi) - ½

H0 - rozdělení hodnot v první skupině je stejné jako rozdělení hodnot v druhé skupině

53
New cards

Vyjmenujte parametrické testy při testování hypotéz o parametrech 2 závislých výběrů

T - test

znaménkový test

Wilcoxonův test

54
New cards

Který ze dvou uvedených testů využívá více informací - znamnénkový nebo Wilcoxonův test?

Wilcoxonův

55
New cards

Uveďte název statistické metody pro testování hypotéz o parametrech 3 a více výběrů

ANOVA - analýza rozptylu

56
New cards

Napište nulovou a alternativní hypotézu ANOVY

H0 - všechny výběry pochází ze stejné normálně rozložené základní populace

Ha - výběry nepochází ze stejné populace - průměry se vzájemně statisticky liší

57
New cards

Jaké je testovací kritérium ANOVY?

Podíl rozptylu mezi skupinami a rozptylu uvnitř skupin

toto kritérium srovnáváme s kvantily F - rozdělení

F rozložení - F = Sv2/Sr2 =Sv/k-1 : Sr/n - k

58
New cards

Proč je testovací kritérium ANOVY založeno na F rozložení?

Testovací kritérium je dáno podílem veličin , které vzniknou jako součet druhých mocnin normálně rozdělených veličin a podělením příslušnými počty stupňů volnosti vzniklého rozdělení x2

F = U1/d1 : U2/d2

F - rozložení definuji jako podíl dvou x2 - rozložení

59
New cards

Jaký vliv na velikost hodnoty F rozložení má rozdíl průměrů?

čím větší je rozdíl mezi průměry skupin, tím větší je F = větší pravděpodobnost zamítnutí nulové hypotézy

60
New cards

Jaký vliv má na velikost hodnoty F rozložení variabilita uvnitř výběrů?

čím menší je směrodatná odchylka, tím větší je F = větší pravděpodobnost zamítnutí H0

61
New cards

Jaký vliv na velikost hodnoty F - rozložení má rozsah výběrů?

při nárůstu prvků se F zvětšuje = roste pravděpodobnost zamítnutí H0 , Sv se nemění

62
New cards

Proč musíme použít u ANOVY simultánní testování?

dochází k inflaci hladiny významnosti

při postupném použití t - testů narůstá chyba II druhu

63
New cards

Vyjmenujte alespoň tři metody simultánního testování

LSD metoda, metoda Scheffeho , x2 test

64
New cards

Co je výsledkem - co nalezneme použitím simultánního testování?

Nalezneme všechny páry skupin , které se mezi sebou významně statisticky liší

65
New cards

Jak se jmenuje neparametrická hodnota pro testování hypotéz o parametrech 3 a více výběrů ?

Kruskal - wallisúv test

66
New cards

Popište princip a postup použití neparametrické ANOVY

Chceme se přesvědčit , že naměřené náhodné veličiny se liší polohou

1) vyslovení nulové hypotézy, všechny výběry dám do jednoho souboru+ seřadím dle velikosti + přiřadím pořadová čísla

2) pokud H0 platí, je průměrné pořadí ve skupině stejné

3) pokud je kritická hodota vyznamně větší - nulovou hypotézu zamítneme

67
New cards

Jaký je cíl korelační analýzy?

nalezení lineárního vztahu mezi dvěma kvantitativními veličinami , proměnnými

68
New cards

Vyjmenujte úskalí korelační analýzy

homogenita, výskyt extrémně vzdálených hodnot, skryté asociace, matematické vztahy

69
New cards

Napište vzoreček pro Pearsonův korelační koeficient

VIZ SOUBOR OD ELI, ale na to jí sere pes, to je delší než tejden před výplatou

70
New cards

Jaké hodnoty může dosáhnout korelační koeficient?

interval -1, 0, 1

71
New cards

Jak posuzujeme korelační koeficient podle jeho velikosti

čím menší je koeficient, tím je těsnost lineární závislosti menší

72
New cards

Vyjmenujte neparametrické korelanční koeficienty

Spearkmanův, Kendallův, Goodman - Kruskalův

73
New cards

Který z neparametrických korelačních koeficientů nejlépe popisuje vztah mezi dvěma sledovanými veličinami?

Kendallův k. koeficient

74
New cards

Co je to parciální korelační koeficient?

odhalí skryté asociace

vyjadřuje vztah mezi dvěma lineárními proměnnými

75
New cards

K čemu slouží analýza kontingenčních tabulek?

k hledání vztahu mezi 2 kvalitativními proměnnými

76
New cards

Vyjmenujte 2 základní hypotézy, které testujeme v kontingenčních tabulkách

homogenity, nezávislosti

77
New cards

Napište vzoreček pro výpočet relativního rizika

VIZ ELI SOUBOR

78
New cards

Napište vzoreček pro výpočet poměru šancí

VIZ ELI SOUBOR

79
New cards

Jaké jsou výhody a nevýhody použití RR a OR ( poměru šancí) ?

OR - interpretuje poměr šance , NE celou šanci , obtížná interpretace

RR - nezajímá mě pravděpodobnost jevu, pouze podíl

80
New cards

Kdy je vhodné použití OR a kdy RR vzhledem k prospektivní a retrospektivní studii?

RR - prospektivní studie

OR - retrospektivní

81
New cards

Jaký je cíl regresní analýzy?

poskytnout číselné míry vztahu mezi 2 veličinami

vytvoření regresního modelu, který slouží k predikci výstupní proměnné

testovat různé hypotézy o zkoumaném regresnim vztahu

82
New cards

Jakých hodnot může nabývat vstupní proměnná v regresní analýze?

spojité, kategoriální - různé hodnoty

spojitá proměnná - číselná

83
New cards

Jakých hodnot můžou nabývat vstupní - vsvětlující proměnné v regresní analýze ?

spojité, číselné

84
New cards

Která z proměnných výstupní ( závislá), vstupní ( vysvětlující) je náhodná a která nenáhodná?

vstupní - určitá, nenáhodná

výstupní - náhodná

85
New cards

Jaký je rozdíl mezi regresní a korelační analýzou?

regresní - vysvětlující proměnná není náhodná, poskytuje míry vztahu mezi 2 veličinami, hledání vztahu

Korelační - hledá lineární asociace mezi 2 proměnnými , obě proměnné jsou náhodnými proměnnými

86
New cards

Pomocí jaké metody určíme nejlepší přímku v lineární regresní analýze?

metoda nejmenších čtverců reziduí

87
New cards

Na čem je založena metoda nejmenších čtverců? - co potebujeme minimalizovat

na součtu čtverců reziduí

určit regresní přímku takovou, aby minimalizovala součet čtverců reziduí, určit regresní parametry

88
New cards

Co je to koeficient determinace?

jak dobrý je regresní model

porovnává velikost kolísání a variace v datech

89
New cards

v jakém rozemzí hodnot se může pohybovat koeficient determinace?

0 - 1

90
New cards

Pokud se koeficient determinace R na druhou = 1, co to znamená ?

Všechny body přesně leží na přímce definující můj výběr

91
New cards

Pokud se koeficient determinace R na druhou = 0, co to znamená?

model nepřináší více info než model naivní

92
New cards

co je to naivní model v regresní analýze

Pokud máme lineární model, musíme použít naivní model- nahrazujeme pozorované body aritmetickým průměrem

93
New cards

Čemu je rovná druhá odmocnina koeficientu determinace R na druhou, tedy vlastně R?

korelačnímu koeficientu

94
New cards

K čemu slouží reziduální analýza v regresní analýze?

ověřuje vlastnosti chyb regresního modelu

pomáhá odhalit vlivné body

posouzení prediktivní schopnosti našeho regresního modelu

95
New cards

Jaké podmínky musí splnit rezidua, abychom mohli říct, že námi vytvořený model má význam pro predikci?

nezávislost, normalita,linearita, homoscedasticita

96
New cards

Když zjistíme , že rezidua nesplnila podmínky reziduální analýzy- co to znamená a co musíme udělat?

náš model není vhodný k predikci, trasnformuji ovlivňující proměnné

97
New cards

3 možné tranformace vstupní proměnné u regresní analýzy v případě, kdy nejsou splněny podmínky reziduální analýzy

log(Y), 1/Y, odmocnina z Y

98
New cards

Co definujeme znakem?

věk, pohlaví, bydliště, spádová oblast = všichni

99
New cards