1/71
Looks like no tags are added yet.
Name | Mastery | Learn | Test | Matching | Spaced |
|---|
No study sessions yet.
Populatie
alle individuen die een onderzoeker wil analyseren en waarover hij conclusies wil trekken, wel kostbaar
Steekproef
een groep individuen uit de geselecteerde populatie
Sampling design
het proces waarbij de steekproef wordt getrokken uit de populatie waarin de onderzoeker geïnteresseerd is
Simple random sampling
alle deelnemers in de populatie hebben een gelijke kans om in de steekproef opgenomen te worden
Stratified sampling
de populatie wordt ingedeeld in strata, uit elk stratum wordt een volledig willekeurige steekproef getrokken
Convenience sampling
deelnemers die direct beschikbaar en binnen handbereik zijn, de steekproef wordt niet willekeurig getrokken
Beschrijvende statistiek
de waargenomen gegevens in de steekproef worden beschreven en samengevat, men wilt begrijpen hoe gegevens zijn georganiseerd en gestructureerd
Gemiddelde
de som van de waarden delen door een reeks getallen
Mediaan
de middelste waarde die de gegevens opsplitst in de laagste en hoogste 50%
Modus
de score die het vaakst voorkomt
Spreidingsmaten
de mate van spreiding van de gegevens rond het gemiddelde, dit om te begrijpen hoe dicht of ver de waargenomen waarde van het gemiddelde ligt
Variantie
maatstaf voor de spreiding van waarden
Standaarddeviatie
gestandaardiseerde maatstaf voor de spreiding van waarden, wortel van de variantie
Inferentiële statistiek
er worden conclusies getrokken over het fenomeen dat in de steekproef is waargenomen voor de gehele populatie
Significantieniveau
de waarde van alfa, hiermee kan men de kritieke waarde bepalen
Kritieke waarde
de 5% meest extreme gemiddelden die kunnen worden gevonden als H0 waar is → als de p-waarde buiten deze waarde valt is er onvoldoende bewijs H0 te verwerpen
T-waarde
een waarde die kijkt of een verschil tussen twee gemiddelden betekent dat er echt iets aan de hand is, of dat het gewoon toeval kan zijn
P-waarde
de waarschijnlijkheid van de gegevens die in de steekproef worden gevonden, gegeven dat H0 waar is
Betrouwbaarheidsinterval schatting
bij een 95% interval zou in 95% van de gevallen de werkelijke waarde binnen het interval vallen → hoe groter de steekproef, hoe kleiner het interval
Categorische variabelen
variabelen die kunnen worden onderverdeeld in verschillende categorieën of afzonderlijke groepen, ze zijn gebaseerd op kwalitatieve eigenschappen
Kwantitatieve variabelen
variabelen die worden gemeten op een schaal of continuüm
Experimenteel design
de onderzoeker manipuleert één variabele om het effect ervan op een andere variabele te onderzoeken, de manipulatie is twee of meer interventies die door de onderzoeker worden uitgevoerd
Quasi-experiment
een experimenteel design zonder willekeurige steekproeven, deelnemers worden gegroepeerd op basis van een kenmerk→ hoge externe validiteit en lage interne validiteit
Correlationeel design
de onderzoeker onderzoekt variabelen zonder manipulatie en kijkt naar eventuele verbanden
Pearson’s r coëfficiënt
de maatstaf voor de lineaire relatie tussen twee kwantitatieve variabelen
Standaardfout
de variantie in steekproefwaarden van r als je steeds nieuwe steekproeven van N uit dezelfde populatie zou blijven trekken
Power
de kans dat H0 correct wordt verworpen als H1 waar is
Type 1-fout
het ten onrechte verwerpen van H0 op basis van een significant statistisch resultaat, terwijl de nulhypothese in werkelijkheid waar is
Cross-validatie
het verdelen van de dataset in twee helften en de analyse van de eerste dataset vergelijken met de analyse van de tweede dataset → wanneer er geen effecten worden gevonden in de tweede set, is er sprake van een type 1-fout
Replicatie
het herhalen van dezelfde procedure van een onderzoek om te kijken of dezelfde resultaten zich voordoen
Bonferroni-correctie
hoe meer statistische tests worden uitgevoerd, hoe lager de orginele alfa-waarde wordt → het oorspronkelijke alfaniveau wordt gedeeld door het aantal tests en wordt dus lager
Gekwadrateerde correlatie
de maatstaf voor de gemeenschappelijke variantie tussen X en Y, deze variantie geeft aan hoe goed je de ene variabele kunt voorspellen met behulp van de andere variabele, uitgaande van een lineair verband tussen beide
Indirect verband
X kan Z veroorzaken en Z veroorzaakt Y of vice versa
Spurieus verband
Z kan zowel X als Y veroorzaken
Multiple R-square
de totale variantie van Y dat je lineair kan voorspellen uit X, dit is de voorspelde variantie/de totale variantie
Z-scores
het aantal standaarddeviaties dat een score afwijkt van het gemiddelde
b
variabelen hebben een betekenisvolle meeteenheid
B
variabelen geen betekenisvolle meeteenheid hebben, elke waarde die niet zinvol kan worden beschreven in een toename of afname van een eenheid
F-test
een test die wordt gebruikt om te testen of de onafhankelijke variabele(n) een significant deel van de variantie van de afhankelijke variabele kunnen verklaren
SSregression
hoeveel de voorspelde scores afwijken van het gemiddelde
SSresidu
hoeveel de individuele scores afwijken van de voorspelde scores, dit wordt niet voorspeld door middel van X
Multipele regressie
onderzoekt hypothesen over de invloed van meerdere onafhankelijke variabelen op een enkele kwantitatieve afhankelijke variabele
Confounder
een variabele die een effect heeft op de afhankelijke variabele en die ook gerelateerd is aan of varieert met de andere onafhankelijke variabele, waarin je primair geïnteresseerd bent
Controlevariabelen
variabelen waarin je niet primair geïnteresseerd bent, maar je wilt wel rekening houden met de mogelijke invloed van deze variabelen op de primaire relatie die je interesseert
Mediatieanalyse
controle of het effect van X op Y via een andere variabele verloopt
Homoscedasticiteit
de verdeling van Y, gegeven X, is hetzelfde voor elke X
Verklaarde variantie
de mate van variantie in Y die wordt verklaard/voorspeld door X1 en X2
Onverklaarde variantie
de mate van variantie in Y die niet wordt verklaard/voorspeld door X1 en X2 → 1 - verklaarde variantie
Semi-partiële correlatie
de unieke variantie die wordt verklaard door X1, terwijl X2 constant wordt gehouden → vergeet niet te kwadrateren
Partiële correlatie
de variantie die wordt verklaard door X1, gecontroleerd voor X2 → deze wordt dus niet meegenomen en kan worden gezien als een effectgrootte
Zero-order correlatie
de variantie die wordt verklaard door X1, waarbij X2 wordt meegenomen
Statistische significantie
geeft aan of het statistische effect of verband die in de steekproef is gevonden, zodanig groot is dat ‘toeval’ uitgesloten kan worden
Praktische significantie
geeft aan of de correlatie in de praktijk belangrijk of relevant is → effect-size maten
Adjusted r
de aangepaste schatting van de verklaarde variantie die rekening houdt met het feit dat de r-square zelf overschat wordt, daarom is de adjusted r altijd lager dan de r-square
Geneste modellen
modellen met een eenvoudig model waarbij steeds meer predictoren worden toegevoegd → alle predictoren van het kleinere model komen ook voor in het grotere model, het grotere model zal altijd beter verklaren
Hiërarchische regressieanalyse
stapsgewijze toevoeging van clusters van variabelen aan het model
Nulmodel
een model die geen predictoren bevat, intercept en r-square zijn altijd nul
Dummy variabelen
variabelen die alleen de waarden 0 of 1 kan aannemen, wordt gebruikt wanneer categorische variabelen als predictoren aan het model worden toegevoegd
Interactie
de sterkte van de relatie tussen twee variabelen is afhankelijk van een derde variabelen → ook wel moderatie genoemd
X2 als moderator
beïnvloedt de richting of sterkte van de relatie tussen Y en X1, de helling die Y voorspelt op basis van X1 verschilt afhankelijk van de scores op de variabele X2
X2 als mediator
verklaart de relatie tussen Y en X1
Probing
de procedure die wordt gebruikt om effectvragen te beantwoorden, het wordt uitgevoerd wanneer er een significant interactie-effect tussen variabelen is
Multicollineariteit
wanneer de correlatie tussen onafhankelijke variabelen zeer hoog is, dus wanneer de predictoren veel gemeenschappelijke variantie hebben → moeilijk om unieke bijdrage te bepalen
Variance inflation factor
een veelgebruikte maatstaf voor multicollineariteit → collinearity statistics
Problematische multicollineariteit
de absolute correlatie tussen een predictor en ten minste één van de andere predictoren is 0
Binaire logistische regressie
een manier die wordt gebruikt om gegevens te analyseren waarvan de afhankelijke variabele binair of een dichotome categorische variabele is
Wald-test
een statistische hypothesetest die wordt gebruikt om te bepalen of de parameters van een model statistisch verschillen van bepaalde veronderstelde waarden
Pseudo r-kwadraatmaten
ruwe maten die aangeven hoe goed een model verschillen in de afhankelijke variabelen verklaart
Classificatietabel
gebruikt wanneer we willen bepalen hoe goed onze voorspellingen in de steekproef zijn
Cox & Snell
heeft als nadeel dat het nooit 1 kan worden: 0 < Cox & Snell < 1
Block test
of het toevoegen van predictoren de voorspelling significant verbetert
Nagelkerke R-kwadraat
kan wel de waarde van 1 aannemen en is ook altijd hoger dan Cox & Snell