Statistiek 3 voor Pedagogen – Uitgebreide Bulletpoint-Notities
Hoorcollege 1 – Intro & Kernbegrippen
- Definitie statistiek
- “Wetenschap van het verzamelen, ordenen en interpreteren van numerieke feiten.”
- Methoden-trias: onderzoek ontwerp → beschrijving → conclusies.
- Toepassingsaspecten
– Steekproeftrekking, representativiteit, keuze analyse, meetniveaus (NOIR), experimenteel vs. niet-experimenteel. - Praktijkvoorbeeld regressie naar het gemiddelde
– Extreme scores worden bij hertest minder extreem ⇒ kan illusie van therapie-effect geven. - Herhalingsblok
– Beschrijvend vs. inferentieel, centrale limietstelling, t-test / ANOVA / regressie. - Beschrijvende statistiek
– Centrale tendens (gemiddelde, modus, mediaan)
– Spreiding (SD, variantie, IQR)
– Positie (percentiel, kwartiel). - Inferentiële statistiek
– Doel: populatieuitspraken op basis van n.
– Steekproeffout vs. steekproef-bias vs. antwoord-/non-response-bias. - Verdelingen
– Populatieverdeling, steekproefverdeling, steekproevenverdeling.
– Centrale limiet: \sigma_M=\sigma/\sqrt{N}. - Kansverdelingen & teststatistieken
– Normaal/z, Student t, \chi^2, Fisher F. - Hypothesetest in 5 stappen
- Assumpties 2. H0 / Ha 3. Teststatistiek 4. p-waarde 5. Conclusie.
– Type I ( \alpha ) ↔ Type II ( \beta ) trade-off.
- Drie basistests
– 2-groep t, multi-groep ANOVA, lineaire regressie.
Q&A Week 1 & Werkgroep 1
- Voorbeeld tv-engagement m/v
– Controle Levene voor gelijke variantie; significante t. - Equivalentie t – ANOVA – OLS
– Dummy: b0 = controlegemiddelde, b1 = verschil. - Multipele regressie
– Model \hat y=a+b1x1+b2x2.
– Lurking variabelen; SS{total}=SS{reg}+SS_{res}.
Hoorcollege 2 – One-way ANOVA
- Assumpties: normaal Y, homogene varianties, onafhankelijkheid.
- Model: Y{ij}=\mu+\alphai+e_{ij}.
- F-ratio: F=\dfrac{MS{bg}}{MS{wg}} met df (k-1,\,N-k).
- Post-hoc vs. contrasten
– Tukey HSD HSD=q{crit}\sqrt{MS{wg}/n}.
– Bonferroni \alpha' = \alpha/m. - Type I fout ↑ bij meervoudig toetsen
– Familiewise error 1-(1-\alpha)^m.
Hoorcollege 3 – Factoriële ANOVA
- Opzet: kwant. Y, ≥2 kwalitatieve X’en (factor A × B).
- Te toetsen:
– Hoofdeffect A: FA=MSA/MS_{within}
– Hoofdeffect B: idem
– Interactie A\times B. - Orthogonaliteit
– Onafhankelijke factoren ⇒ unieke SS-decompositie; bij onbalans Type I/III SS-keuze cruciaal. - Effectgrootten: \eta^2=SS{effect}/SS{total}, partial \eta^2=SS{effect}/(SS{effect}+SS_{error}).
- Assumpties & diagnose: outliers, homoscedasticiteit (Levene), normaliteit residuen.
Hoorcollege 4 – Dummy-, Meervoudige Regressie & ANCOVA
- Dummy-codering vs. effect-codering.
- Interactie in regressie (= moderatie): voeg X1X2 toe.
- ANCOVA: kwant. covariaat Xc + factor A ⇒ parallelle lijnen (geen A\times Xc).
– Type I vs. III SS verdeling.
– Effectmaten: \eta^2{adj}=SS{A,adj}/SS_{total}. - Lords / Simpsons paradox: keuze model beïnvloedt conclusie; causaliteit vergt RCT.
- Moderatie
– Impact slope b1 afhankelijk van moderator M.
– Test: vergelijking R^2{zonder\,int} vs. R^2_{met\,int}. - Mediatie (Baron–Kenny)
- c: Y op X 2. a: M op X 3. b,c': Y op X & M.
– Indirect effect ab, totaal c=c'+ab.
– Volledig vs. gedeeltelijk vs. onderdrukking.
- Assumpties: temporale volgorde, geen gemiste confounders; bij voorkeur bootstrap CI’s.
Hoorcollege 6 – MANOVA & Repeated Measures
- MANOVA doel: vergelijken van groeppatronen op p gecorreleerde Y’s.
– Teststatistieken: Wilks \Lambda (klein = effect).
– Assumpties: multivariate normaliteit, lineaire relaties, gelijke covariancematrices (Box M), geen multicollineariteit. - Voordelen t.o.v. meerdere ANOVA’s
– Enkelvoudig \alpha-niveau, rekening met Y-correlaties, detecteert patronen. - Effectmaten: \eta^2=1-\Lambda; partial \eta^2=1-\Lambda^{1/s}.
- Herhaalde metingen
– Sfericiteit (\epsilon): gelijke varianties van verschillen; Mauchly test; correcties (Greenhouse–Geisser, Huynh–Feldt).
– Carry-over & ordereffects; minder N nodig maar extra assumpties.
Contrasten (simpel & complex)
- Simpel: paarsgewijs, gewichten bijv. (+1,-1).
- Complex: combineer groepen, somme gewichten = 0, orthogonaliteit indien \sum cic'i=0.
Outliers, Leverage & Invloedrijke punten
- Definities
– Outlier: Y extreem; Leverage: X extreem; Invloedrijk: wijziging fit (Cook’s D). - Aanpak: controleren, vervangen, transformeren, robuuste analyse.
Boek Warner – Kernpunten
- Hfst 5 (t-toets): assumpties, effectgrootte (Cohen d, r_{pb}), power afhankelijk van n,\alpha,\text{ES}.
- Hfst 6 (One-way ANOVA): SS-decompositie, noodzaak post-hoc/contrast, interpretatie h ^2.
- Hfst 9 (Bivariate regressie): onderscheid b vs. \beta, t- vs. F-test (equivalent bij 1 predictor).
- Hfst 13 (Factorieel): interacties, celgemiddelden, geneste vs. gekruiste factoren, extensies (>2 factoren).
- Hfst 15 (Moderatie): detectie via interactie, centeren, aandacht voor bereik X’s.
- Hfst 16 (Mediatie): padanalyse, SEM, belang temporele orde.
- Hfst 19 (MANOVA): onderscheidende functies, interpretatie Wilks, univariate follow-ups.
- Hfst 22 (Repeated Measures): ordeningseffecten, keuze tussen veranderingscore, ANCOVA, MANOVA.
Ethiek & Praktische Implicaties
- Onjuiste interpretatie regressie naar gemiddelde kan pseudo-effect therapie suggereren.
- Multipel testen zonder correctie vergroot vals-positief risico ⇒ transparante pre-registratie aanbevolen.
- Covariaat toevoegen ≠ causaliteit; design (RCT) blijft goudstandaard.
- SE_{proportie}=\sqrt{\dfrac{\pi(1-\pi)}{n}}
- SS{total}=\sum(Y-\bar Y)^2=SS{between}+SS_{within}
- R^2=\dfrac{SS{reg}}{SS{total}} ; F=\dfrac{(R^2/k)}{((1-R^2)/(N-k-1))}
- q=\dfrac{|\bar Xa-\bar Xb|}{\sqrt{MS{within}/n}} ; HSD=q{crit}\sqrt{MS_{within}/n}
Stappenplannen (kort)
- ANOVA: inspecteer data & assumpties → omnibus F → Levene → post-hoc/contrast.
- Factorieel: check interactie eerst; indien sig → visualiseer/simple effects; zo niet → hoofdeffecten.
- ANCOVA: parallel slopes testen → Type III SS → aangepaste gemiddelden → post-hoc.
- Moderatie: stap-gewijs model (blok 1 zonder, blok 2 met interactie) → ΔR^2 & interpretatie.
- Mediatie: drie regressies → bootstrap CI’s voor ab → classificatie (geen/vol/partieel).
- MANOVA: inspecteer lineariteit/outliers → Box M → Wilks Λ → univariate ANOVA’s → post-hoc.