1/35
Looks like no tags are added yet.
Name | Mastery | Learn | Test | Matching | Spaced |
|---|
No study sessions yet.
Populatie
vertegenwoordigt alle individuen die een onderzoeker wil analyseren en waarover hij conclusies wil trekken.
Steekproef
vertegenwoordigt een groep individuen die uit de populatie is geselecteerd.
3 verschillende manieren om een steekproef te trekken
simple random sampling
stratified sampling
Convenience sampling
simple random sampling
alle deelnemers in de populatie hebben een gelijke kans om in de steekproef opgenomen te worden.
Stratified sampling
populatie wordt opgedeeld in strata
uit elke stratum wordt een volledig willekeurige steekproef getrokken.
Wordt gebruikt wanneer een onderzoeker zeker wilt weten dat elke/bepaalde groep gelijk word vertegenwoordigt in de steekproef.
convenience sampling
steekproef bestaat uit mensen die direct beschikbaar en binnen handbereik zijn. NIET willekeurig.
Waar word beschrijvende statistiek voor gebruikt?
Wordt gebruikt om waargenomen gegevens in de steekproef te beschrijven en samen te vatten. Hoe worden de waargenomen gegevens georganiseerd?
centrummaten en spreidingsmaten
3 meestgebruikte centrummaten
Gemiddelde
Mediaan: middelste waarde
Modus: score die het vaakst voorkomt
2 meestgebruikte spreidingsmaten
Variantie: spreiding van waarden
Standaarddeviatie: gestandaardiseerde maatstaf voor de spreiding van waarden
Waar word inferentiële statistiek voor gebruikt?
wordt gebruikt om conclusies te trekken over het fenomeen dat in de steekproef is waargenomen voor de gehele populatie.
2 methoden: null hypothesis significance testing en betrouwbaarheidsinterval schatting
null hypothesis significance testing
toetsen van de nulhypothese en de alternatieve hypothese aan de hand van een significantieniveau (p-waarde)
betrouwbaarheidsinterval schatting
Bij een betrouwbaarheidsinterval van 95%: als er meerdere steekproefen zijn genomen, zou het 95% betrouwbaarheidsinterval in 95% van de gevallen ook de werkelijke waarde bevatten.
hoe groter de steekproef → hoe meer informatie en nauwkeurige metingen → hoe kleiner het betrouwbaarheidsinterval
Categorische variabelen
variabelen die kunnen worden onderverdeeld in verschillende categorieën. Gebaseerd op kwalitatieve eigenschappen.
kwantitatieve variabelen
niet-vaste groepen, mensen worden gemeten op een continuüm/schaal.
Experimenteel design
onderzoeker manipuleert 1 variabele om het effect daarvan op een andere variabele te meten
manipulatie omvat 2 of meer interventies
bevat, (on)afhankelijke variabelen en een controle
maakt gebruik van random sampling, matched samples en repeated measures.
Quasi-experiment
lijkt op experimenteel design, maar maakt geen gebruik van willekeurige sampling
niet mogelijk om alle variabelen constant te houden
niet mogelijk om rekening met alle confounds te houden
interne validiteit is niet sterk, externe validiteit wel
Correlationeel design
onafhankelijke variabelen worden niet gemanipuleerd
geen causale conclusies mogelijk
voorwaarden voor pearson’s r
onafhankelijk gekozen X en Y (simple random sampling)
X en Y zijn lineair gerelateerd aan elkaar
geen extreme bivariate outliers
Power
de kans dat de nulhypothese correct wordt verworpen (wanneer H1 waar is)
wordt groter bij een grote steekproef
type 1 fout
ten onrechte verwerpen van de nulhypothese op basis van een significant statistisch resultaat, terwijl de nulhypothese in werkelijkheid waar is.
hoe moet je het risico op een type 1 fout beperken?
crossvalidatie: split de dataset op in twee → vergelijk beide analyses met elkaar → geen effect gevonden in tweede set? type 1 fout
replicatie: herhaal dezelfde procedure van een onderzoek
Bonferroni-correctie: oorspronkelijke significantieniveau (\(alpha) delen door het aantal uitgevoerde vergelijkingen. → alfaniveau wordt aangepast en vergeleken met de p-waarde
Gekwadrateerde correlatie (r²)
gemeenschappelijke variantie tussen X en Y
Hoe goed kun je de ene variabele voorspellen mbv de andere variabele? (uitgaande van een lineair verband)
indirect verband
X → Z → Y
X kan Z veroorzaken, Z veroorzaakt Y (Z = mediator)
Spurieus verband
Z → Y
Z → X
Z kan zowel X als Y veroorzaken (er is dus geen verband tussen X en Y).
onderdelen van een eenvoudige lineaire regressie functie
Y’: voorspelde waarde van Y, gegeven X
b0: intercept; vertegenwoordigt de voorspelde waarde van Y wanneer iemand 0 scoort op X (constante)
b1: regressiecoëfficient; verandering in Y’ wanneer X met één eenheid verandert
b0 en b1 worden ook wel parameters genoemd, omdat we ze schatten
Z-scores
geven aan hoeveel standaarddeviaties een score afwijkt van het gemiddelde
wordt gebruikt wanneer de interpretatie van de ruwe score niet zo betekenisvol of duidelijk is.
gemiddelde van 0, SD en variantie van 1
lineair regressiemodel voor Z-scores
de gestandariseerde βbeta variëren van -1 tot 1
heeft geen intercept
uitgedrukt in standaarddeviaties
kan gebruikt worden om effectgroottes van verschillende predictoren binnen één studie te vergelijken
F-test
wordt gebruikt om te testen of de onafhankelijke variabele(n) een significant deel van de variantie van de afhankelijke variabele kunnen verklaren.
Notatie: F(dfregression, dfresidual) = output
Sum of Squares
SStotal geeft aan hoeveel scores van de afhankelijke variabele afwijken van het gemiddelde
vergelijkbaar met R²
SSregression geeft aan hoeveel de voorspelde scores afwijken van het gemiddelde
SSresidu geeft aan hoeveel de individuele scores afwijken van de voorspelde scores
Dit deel van de variantie kan niet verklaard worden door X (voorspellingsfout)
Waarom is het nuttig om meerdere onafhankelijke variabelen in je lineaire regressie analyse te hebben?
Controle: statistisch controleren voor het effect van storende variabelen
Theorie: biedt een beter begrip van complexe psychologische eigenschappen
Voorspellen: maakt een betere voorspelling van uitkomsten mogelijk
confounder
een variabele die een effect heeft op de afhankelijke variabele (Y) en die ook gerelateerd is aan/varieert met de andere onafhankelijke variabele, waarin je primair geïnteresseerd bent.
Controlevariabelen
variabelen waarin je niet primair geïnteresseerd bent, maar waarmee je wel rekening wilt houden met een mogelijke invloed van deze variabelen op de primaire relatie.
partiële effecten: er is rekening gehouden met andere predictoren
aannames bij het uitvoeren van een multipele regressie
deelnemers zijn onafhankelijk van elkaar gekozen (simple random sampling)
Er is sprake van een lineaire relatie
er zijn geen extreme bivariate outliers
normaal verdeeld
homoscedasticiteit: de verdeling van Y, gegeven X, is hetzelfde voor elke X.
Er is geen interactie tussen X1 en X2
(gekwadrateerde) zero-order correlatie
“gewone” correlatie; van alle variantie in Y, hoeveel % wordt verklaard door X1 in totaal?
er wordt geen rekening gehouden met andere predictoren, dus gedeelde variantie tussen X1 en X2 worden beschouwd als een onderdeel van X1

(gekwadrateerde) semi-partiële correlatie
hoeveel van de totale variantie in Y wordt uniek verklaard door X1?
de correlatie waarin het stuk overlappende variantie tussen X1 en X2 niet is opgenomen.
Voornamelijk relevant wanneer je wilt weten wat er met de verklaarde variantie gebeurt als X1/ andere predictor wordt weggelaten

(gekwadrateerde) partiële correlaties
gecontroleerd voor X2 (constant houden), hoeveel % van de overgebleven variantie in Y wordt uniek verklaard door de overgebleven variantie van X1?
X2 wordt volledig verwijderd uit zowel X1 als Y → dit in tegenstelling tot de semi-partiële correlatie, waar X2 alleen uit X1 wordt verwijderd
