1/24
Deze flashcards helpen bij het begrijpen van alle belangrijke termen en concepten die in de les zijn behandeld over hypothesetests in statistiek.
Name | Mastery | Learn | Test | Matching | Spaced |
|---|
No study sessions yet.
Hypothese
Een veronderstelling die getest wordt door middel van statistische methoden.
Nulhypothese (H0)
De hypothese die veronderstelt dat er geen effect of verschil is (beweert het tegenovergestelde)
Alternatieve hypothese (HA)
De hypothese die we verwachten of willen aantonen.
Significantieniveau (α)
De kans op een Type I fout, meestal ingesteld op 0.05.
Type I fout
Het onterecht verwerpen van de nulhypothese wanneer deze waar is.
Type II fout
Het onterecht accepteren van de nulhypothese wanneer deze vals is.
p-waarde
De kans om als de nulhypothese waar is, uitkomsten te verkrijgen die even extreem of extremer zijn dan de observatie die we hebben waargenomen.
Steekproefgemiddelde (X̄)
Het gemiddelde van de waarden in een steekproef.
Steekproefvariantie (s²)
Een maat voor de spreiding van de steekproefwaarden.
Rechtseenzijdige toets
Een hypothesetest waarbij de alternatieve hypothese een grotere waarde voorstelt.
Linkseenzijdige toets
Een hypothesetest waarbij de alternatieve hypothese een kleinere waarde voorstelt.
Tweezijdige toets
Een hypothesetest waarbij de alternatieve hypothese zowel een grotere als een kleinere waarde kan voorstellen.
Kritisch punt (k.p.)
De grenswaarde waarbij de nulhypothese wordt verworpen.
Toetsingsgrootheid
De waarde die wordt gebruikt om de nulhypothese te testen.
Normaalverdeling
Een continue kansverdeling die symmetrisch is en de klokvormige curve volgt.
Gekoppelde metingen
objecten in de 2 groepen, zijn dezelfde of hebben een verband met elkaar (afhankelijk)
Onafhankelijke metingen
objecten in de 2 groepen zijn onafhankelijken (hypothesen herschrijven) → verschil van 2 gemiddelden bij dezelfde objecten: zijn deze normaal verdeeld: gepaarde T-test
2-steekproeven-T-test
In tegenstelling tot bij gekoppelde metingen wordt hier niet gekeken naar het gemiddelde van het verschil, maar naar het verschil van de 2 gemiddelden.
Voorwaarden:
n1, n2 zijn beide groter dan 30
Indien kleiner: normaal verdeeld zijn
t.test
Deze test wordt gebruikt bij continue gegevens (1 steekproef of gepaarde metingen)
Voorwaarden: n>=30 of populatie normaal verdeeld
Manueel oplossen met de t-verdeling. In R oplossen met t.test
wilcox.test
Bij continue gegeven bij 1 steekproef of bij gepaarde metingen.
Voorwaarden= n>=30 of populatie normaal verdeeld → voorwaarden niet voldaan
Manueel: signed-rank test (enkel als n>=16)
R: wilcox.test (1 variabele of paired = TRUE)
Hypothesetest met 2 steekproeven (continue gegevens)
Voorwaarden: min(𝑛1, 𝑛2) ≥ 30 of beide populaties normaal verdeeld
Voldaan: test is enkel uit te voeren in R via t.test (paired=FALSE)
Voer eerst var.test uit voor gelijkheid van varianties
1) Bij gelijkheid van varianties (var.equal=TRUE): 2-sample t-test
2) Bij ongelijkheid van varianties (var.equal=FALSE): Welch 2-sample t-test
Nietvoldaan:rank-sumtest enkel uit te voeren in R: wilcox.test(paired=FALSE)
1 steekproef: proportie-test (binaire gegevens)
Voorwaarden: 𝑛𝜋0 ≥ 5 en 𝑛(1 − 𝜋0) ≥ 5
Voldaan:
Manueel: gebruik normale verdeling R: prop.test
Niet voldaan: test is alleen uit te voeren in R (binom.test)
2 steekproeven: proportie-test (binaire gegevens)
Voorwaarden: min(𝑛1, 𝑛2)p≥ 5 en min(𝑛1, 𝑛2)(1 − p ) ≥ 5
Voldaan:
Manueel: gebruik normale verdeling
R: prop.test
Niet voldaan: test is alleen uit te voeren in R (fisher.test)
1 steekproef of gepaarde metingen (ordinale gegevens)
SIGN TEST
Gebruikt weinig informatie: A beter dan B of B beter dan A
Manueel: gebruik normale verdeling (enkel als 𝑛 ≥ 30)
R: SIGN.test
SIGNED-RANK TEST
Gebruikt ook gradatie: hoeveel is A beter dan B of B beter dan A?
R:wilcox.test(1variabeleof paired=TRUE)
2 steekproeven (ordinale gegevens)
RANK-SUM TEST
Enkel uit te voeren in R: wilcox.test (paired=FALSE)