Send a link to your students to track their progress
137 Terms
1
New cards
Statistische modellen
geven een wiskundige formalisering voor het conceptueel model in de vorm van een vergelijking, bestaande uit variabelen (geoperationaliseerde concepten) en parameters
2
New cards
Populatie
de groep waarover je iets wil weten – alle onderzoekseenheden met een bepaald gemeenschappelijk kenmerk
3
New cards
parameter
De waarde voor een bepaald kenmerk in de populatie
4
New cards
Steekproef
elke deelverzameling van de populatie
5
New cards
een statistiek
De waarde voor een bepaald kenmerk in de steekproef
6
New cards
een variabele
een representatie van een kenmerk van een onderzoekseenheid
7
New cards
nominale meetniveau
tellen, percentages berekenen
8
New cards
ordinale meetniveau
tellen, percentages berekenen en hoger/lager aangeven
9
New cards
interval meetniveau
tellen, percentages berekenen en hoger/lager aangeven, gemiddelde en spreiding
10
New cards
ratio meetniveau
tellen, percentages berekenen en hoger/lager aangeven, gemiddelde, spreiding en het berekenen an verhoudingen
11
New cards
Frequenties
Hoe vaak komt een bepaalde waarde voor.
12
New cards
centrummaten
Zeggen iets over het punt waar de meeste waarden geclusterd zijn (het midden of het centrum van je dataset)
13
New cards
spreidingsmaten
Geven informatie over de afstand tussen datapunten (vb. hoe verspreid zijn de data rond het gemiddelde). • Deviatie, variantie, standaardafwijking,..
14
New cards
absolute frequentie
Hoe vaak een bepaalde waarde in absolute aantallen voorkomt
15
New cards
relatieve frequentie of proportie
De aantallen in vergelijking met het totale aantal
formule: absolute freq/totale n
16
New cards
Cumulatieve frequentie
het aantal waarnemingen 'dat je tot dan toe hebt gehad‘ (de som van de frequenties op een bepaald punt)
17
New cards
modus
De waarneming die het meest voorkomt in een reeks is de modus. Met andere woorden, de waarneming met de hoogste frequentie
18
New cards
mediaan
middelste getal in de waarnemingen als je die getallen op volgorde zet. 50% van de waarnemingen bevindt zich onder de mediaan en 50% er boven
19
New cards
gemiddelde
de som van de waarnemingen delen door het aantal waarnemingen
20
New cards
Deviatie
Het verschil tussen een score en het gemiddelde
21
New cards
totale deviatie
De som van alle deviaties
22
New cards
variantie
geeft de gemiddelde afwijking van alle waarnemingen t.o.v. het gemiddelde weer (gemiddelde sum of squares)
23
New cards
standaardafwijking
Vierkantswortel van de variantie, maat voor de spreiding van de getallen rondom het gemiddelde
24
New cards
Gausscurve
normaalverdeling, Curve = klokvormig en symmetrisch (oppervlakten links en rechts van gemiddelde zijn gelijk). Ongeveer 68% van de waarnemingen ligt binnen 1 standaarddeviatie van het gemiddelde. Ongeveer 95% van de waarnemingen ligt binnen 2 standaarddeviaties (68-95-99,7- regel
25
New cards
skewness
scheefheid
26
New cards
kurtosis
boogvorm/welving
27
New cards
Pearson’s correlatiecoëfficient (r)
Maat voor de sterkte en richting van een lineair verband tussen twee variabelen
28
New cards
Lineaire regressieanalyse
zegt iets over de voorspelbaarheid van de av door één of meerdere ov
29
New cards
Schijnverband
Een statistische relatie tussen variabelen X en Y betekent niet steeds dat er in de realiteit ook een echt verband is. Het is mogelijk dat een derde variabele (Z) de indruk wekt dat er tussen X en Y een verband bestaat.
30
New cards
Central Limit Theorem (CLT)
Garandeert ons dat bij een degelijke steekproefgrootte (n > 40) de steekproefverdeling van een statistiek bij benadering normaal verdeeld is rond de populatieparameter.
31
New cards
Hypothesetoetsen
Statistische basis voor een erg groot deel van de kwantitatief-empirische wetenschappelijke literatuur
32
New cards
onderzoekshypothese
uitspraak over populatie waarin (meestal) niet expliciet wordt verwezen naar een statistiek
33
New cards
nulhypothese
een uitspraak over de populatie die één referentiewaarde bevat = waarde die refereert naar een bepaalde populatieparameter (vb. gemiddelde)& testbaar of, beter gezegd, falsifieerbaar is
34
New cards
Theoretische kansverdeling
linkt waarden van steekproefstatistiek aan kansen via een teststatistiek
35
New cards
Type-I-fout (false positive)
We beslissen om de nulhypothese te verwerpen, hoewel de nulhypothese in de realiteit waar is. Door je nulhypothese foutief te verwerpen geef je onterecht evidentie aan je alternatieve hypothese
36
New cards
family-wise error rates
1- α de kans dat je de nulhypothese niet verwerpt als de nulhypothese waar is: kans op géén Type-I of specificiteit. Controleert en beperkt de kans op het foutief verwerpen van ten minste één H0 in de gehele set van test , om zo de algehele betrouwbaarheid van de resultaten de waarborgen
37
New cards
Bonferroni
correctie voor multiple testing; het significantieniveau dat je wil hanteren in elke test gedeeld door het aantal tests dat je in totaal doet
38
New cards
fishing expeditions/p-hacking
Verzamelnaam voor allerhande technieken die onderzoekers hanteren om de kans op een statistisch significant resultaat te vergroten (ook al is er in de populatie geen sprake van een significante samenhang tussen de variabelen waarin men is geïnteresseerd)
39
New cards
Type-II fout
We verwerpen de nulhypothese niet, hoewel de nulhypothese eigenlijk fout is.
40
New cards
power
de kans dat we de nulhypothese verwerpen als de nulhypothese fout is
41
New cards
effectgrootte
het verschil tussen geobserveerde waarde van de steekproefstatistiek en de referentiewaarde
42
New cards
effect size
(Gestandaardiseerde) descriptieve statistiek voor de grootte van een effect/verschil/verband…
43
New cards
b1
regressiecoëfficiënt; Voor elke eenheidsstijging in 𝑥1𝑖
stijgt/daalt 𝑦𝑖 met 𝑏1
44
New cards
b0
intercept; : De constante geeft de schatting weer op de AV indien alle overige voorspellers een nulscore hebben. In termen van een 2D-coördinatenstelsel is dit dus het Y-coördinaat waar de regressielijn de Y-as snijdt
45
New cards
errors
residuelen
46
New cards
Ordinary Least Squares Method (OLS)
We trekken de rechte door de puntenwolk waarvoor de som van de gekwadrateerde afstanden van de ingeschatte lijn tot de observaties y het kleinst is
47
New cards
model fit
Hoe goed komt het model overeen met de geobserveerde data?
48
New cards
Sum of squares of the residual
Som van de gekwadrateerde afstanden van elke inschatting ÿ van het model mét 𝑥1 ten opzichte van de observaties y, onverklaarde variantie
49
New cards
Sum of squares of the model
Som van de gekwadrateerde afstanden van elke inschatting ÿ van het model mét 𝑥1 ten opzichte van het meest rudimentaire model ÿ, Variantie in y verklaard door het model
50
New cards
R Square
Determinatiecoëfficiënt; proportie variantie in 𝑦 verklaard door het model; SSM/SST
51
New cards
correlatie
een gestandaardiseerde vorm van de covariantie, maakt géén theoretisch onderscheid tussen predictor en afhankelijke variabele
52
New cards
covariantie
geeft aan in welke mate twee variabelen ‘gezamenlijke variëren’
53
New cards
Pearson’s r
Correlatiecoëfficiënt
54
New cards
Adjusted R square
geeft weer wat de R2 waarde zou zijn in de populatie
55
New cards
confounding
variabele die een externe invloed hebben op output van het model
56
New cards
suppression effects (onderschatting)
een vermindering van de correlatie tussen twee variabelen door de invloed van een derde variabele die niet is opgenomen in he model maar wel samenhangt met y
57
New cards
β
“Voor elke stijging van één standaarddeviatie in x, stijgt/daalt y met 𝛽 standaarddeviaties”
58
New cards
R²-change
Hoeveel variantie die variabelen toevoegen aan het nieuwe model extra verklaren tov voorgaand model.
59
New cards
Theoretische kansverdeling
linkt waarden van steekproefstatistiek aan kansen via een teststatistiek
60
New cards
Adjusted predicted value
We bekijken hoe de verwachte waarde voor een bepaalde persoon ^yi verschilt als we een regressielijn trekken zonder die persoon in de analyse, en mét die persoon in de analyse. Als er veel verschil is tussen de waarden voor ^yi, heeft die case een grote impact op de vorm van de regressielijn.
61
New cards
Deleted residual
Verschil tussen geschatte vs geobserveerde waarde
62
New cards
Studentized deleted residual
Deleted residual gedeeld door zijn standaardfout (gestandaardiseerd, dus vergelijkbaar over analyses heen)
63
New cards
Cook’s Distance
Algemene impact van een bepaalde case op de capaciteit van het model om alle cases te voorspellen (>1 = mogelijks probleem)
64
New cards
DFBeta
Verschil tussen de waarden voor regressiecoëfficiënt bi met en zonder de case
65
New cards
Standardized DFBeta
Gestandaardiseerde versie. Voordeel: verglijkbaar over modellen. Vuistregel voor cut-off: 1 of 2.
66
New cards
multicillineariteit
Zijn de onafhankelijke variabelen te sterk met elkaar gecorreleerd?
67
New cards
homoscedacsticity
voor elke variabele met de variantie van de residuelen constant zijn
68
New cards
lineariteit
Als je een relatie lineair probeert te modelleren, moet de relatie uiteraard eerst lineair zijn.
69
New cards
additiviteit
Het gecombineerde ‘effect’ van alle predictoren moet je kunnen beschrijven door ze op te tellen.
70
New cards
Moderatie
s de sterkte en/of richting van het verband tussen 𝑥 en 𝑦 afhankelijk van 𝑚?
71
New cards
Mediatie
is 𝑚 de tussenliggende verklaring voor het verband tussen 𝑥 en 𝑦?
72
New cards
Exp(B)
de ratio van de odds (op y=1) voor en na een eenheidsstijging in de geassocieerde x
73
New cards
likelihood
De kans dat je gegeven data (y) observeert als je aanneemt dat je model (i.e., de regressielijn) waar is
74
New cards
Maximum Likelihood Estimation
een model opstellen waarbij we zoveel mogelijk observaties juist categoriseren
75
New cards
Deviance
of -2LogLikelihood. Geeft de error tusssen model en data weer bij logistische regressie. Maximum Likelihood schatting zoekt de set parameters waarvoor de deviance minimaal is.
76
New cards
Omnibus test
of (Likelihood Ratio Test). Chi-kwadraattest voor verschillen in Deviance tussen modellen te evalueren. Geeft aan of het verschil in loglikelihood tussen 2 modellen significant is.
77
New cards
Goodness-of-fit test
gaan na in welke mate de verwachte kansen op y=1 op basis van het model afwijken van de geobserveerde kansen op y=1 in de data.
78
New cards
Pseudo R2
Nagelkerke R Square, model fit
79
New cards
Hosmer and Lemeshow Test
Test voor afwijkingen tussen verwachte kansen door model en geobserveerde kansen in de data. Nulhypothese is dat er géén afwijking is.
80
New cards
t-test
om het verschil tussen de twee groepsgemiddelden rechtstreeks te evalueren
81
New cards
sum of squares model (SSm)
fouten die we minder maken dankzij OV, tussenvariantie
82
New cards
Sum of squares Residuel (SSr)
fouten die we toch nog maken ondanks de info van de ov (within group variance), binnenvariantie
83
New cards
Sum of squares total (SSt)
totale variantie tov. algemene gemiddelde dat we willen verklaren.
84
New cards
contrasten
twee specifieke groepsgemiddeldes met elkaar vergelijken
85
New cards
Post-hoc test
alle groepen/condities met elkaar vergelijken en kijken welke siginificant zijn
86
New cards
ANCOVA
wil nagaan of de gemiddelden tussen groepen significant van elkaar verschillen; De invloed van de OV op de AV onderzoeken, nadat we de invloed van de covariaat hebben weggenomen
87
New cards
covariaat
Controle variabele, maakt geen deel uit van het experiment maar wordt toegevoegd om within variantie zo klein mog te houden voor een zuiver mog effect van OV op AV
88
New cards
Within participant sum of squareq (SSw)
variantie berekenen van de waarden op de AV binnen dezelfde persoon in x condities & dit omzetten naar SS
89
New cards
standard error
de standaardafwijking van de steekproefverdeling van die statistiek
90
New cards
p-waarde
De kans dat we een teststatistiek observeren **die minstens even extreem is als de geobserveerde teststatistiek** (in onze studie) als we aannemen dat de populatieparameter gelijk is aan de referentiewaarde”
91
New cards
statische significantie
de kans dat we onder de H0 een teststatistiek observeren die min. zo extreem is als de teststatistiek in onze steekproef
92
New cards
forced entry
alle variabelen in één keer toevoegen bij een meervoudige lineaire regressie
93
New cards
Hierarchical/blockwise Entry
OV’s block per block toevoegen bij een meervoudige lineaire regressieanalyse
94
New cards
simple slopes analysis
opvolganalyse via analyse van regressiecoëfficiënt van x in de voorspelling op y op bepaalde waarden van de moderator
95
New cards
Johnson-Neyman regions of significance
opvolganalyse, alle mogelijke waarden van de moderator analyseren ipv enkele
96
New cards
Anderson-Rubin
factor scores: ongecorreleerd en gestandaardiseerd = beste methorde bij OS
97
New cards
Barlett’s test of sphericity
test de nulhypothese dat de correlatiematrix een identity matrix is
98
New cards
betrouwbaarheid
Hoe consistent meet ons meetinstrument het onderliggende construct
* doorheen de tijd * consistentie tussen de items die het meetinstrument vormen
99
New cards
Cohen’s d
Gestandaardiseerd verschil tussen twee groepsgemiddeldes ( het verschil tussen 2 gem. in termen van standaarddeviaties)
100
New cards
Communaliteit
Na extraheren factoren, aandeel verklaarde variantie in een variabele door alle factoren samen (totale variantie-unieke variantie)