CK

Statistiek 3 voor Pedagogen – Uitgebreide Bulletpoint-Notities

Hoorcollege 1 – Intro & Kernbegrippen

  • Definitie statistiek
    • “Wetenschap van het verzamelen, ordenen en interpreteren van numerieke feiten.”
    • Methoden-trias: onderzoek ontwerp → beschrijving → conclusies.
  • Toepassings­aspecten
    – Steekproeftrekking, representativiteit, keuze analyse, meet­niveaus (NOIR), experimenteel vs. niet-experimenteel.
  • Praktijkvoorbeeld regressie naar het gemiddelde
    – Extreme scores worden bij hertest minder extreem ⇒ kan illusie van therapie-effect geven.
  • Herhalings­blok
    – Beschrijvend vs. inferentieel, centrale limiet­stelling, t-test / ANOVA / regressie.
  • Beschrijvende statistiek
    – Centrale tendens (gemiddelde, modus, mediaan)
    – Spreiding (SD, variantie, IQR)
    – Positie (percentiel, kwartiel).
  • Inferentiële statistiek
    – Doel: populatie­uitspraken op basis van n.
    – Steekproef­fout vs. steekproef-bias vs. antwoord-/non-response-bias.
  • Verdelingen
    – Populatie­verdeling, steekproef­verdeling, steekproeven­verdeling.
    – Centrale limiet: \sigma_M=\sigma/\sqrt{N}.
  • Kans­verdelingen & test­statistieken
    – Normaal/z, Student t, \chi^2, Fisher F.
  • Hypothese­test in 5 stappen
    1. Assumpties 2. H0 / Ha 3. Teststatistiek 4. p-waarde 5. Conclusie.
      – Type I ( \alpha ) ↔ Type II ( \beta ) trade-off.
  • Drie basis­tests
    – 2-groep t, multi-groep ANOVA, lineaire regressie.

Q&A Week 1 & Werkgroep 1

  • Voorbeeld tv-engagement m/v
    – Controle Levene voor gelijke variantie; significante t.
  • Equivalentie t – ANOVA – OLS
    – Dummy: b0 = controle­gemiddelde, b1 = verschil.
  • Multipele regressie
    – Model \hat y=a+b1x1+b2x2.
    – Lurking variabelen; SS{total}=SS{reg}+SS_{res}.

Hoorcollege 2 – One-way ANOVA

  • Assumpties: normaal Y, homogene varianties, onafhankelijkheid.
  • Model: Y{ij}=\mu+\alphai+e_{ij}.
  • F-ratio: F=\dfrac{MS{bg}}{MS{wg}} met df (k-1,\,N-k).
  • Post-hoc vs. contrasten
    – Tukey HSD HSD=q{crit}\sqrt{MS{wg}/n}.
    – Bonferroni \alpha' = \alpha/m.
  • Type I fout ↑ bij meervoudig toetsen
    – Familie­wise error 1-(1-\alpha)^m.

Hoorcollege 3 – Factoriële ANOVA

  • Opzet: kwant. Y, ≥2 kwalitatieve X’en (factor A × B).
  • Te toetsen:
    – Hoofd­effect A: FA=MSA/MS_{within}
    – Hoofd­effect B: idem
    – Interactie A\times B.
  • Orthogonaliteit
    – Onafhankelijke factoren ⇒ unieke SS-decompositie; bij onbalans Type I/III SS-keuze cruciaal.
  • Effectgrootten: \eta^2=SS{effect}/SS{total}, partial \eta^2=SS{effect}/(SS{effect}+SS_{error}).
  • Assumpties & diagnose: outliers, homoscedasticiteit (Levene), normaliteit residuen.

Hoorcollege 4 – Dummy-, Meervoudige Regressie & ANCOVA

  • Dummy-codering vs. effect-codering.
  • Interactie in regressie (= moderatie): voeg X1X2 toe.
  • ANCOVA: kwant. covariaat Xc + factor A ⇒ parallelle lijnen (geen A\times Xc).
    – Type I vs. III SS verdeling.
    – Effectmaten: \eta^2{adj}=SS{A,adj}/SS_{total}.
  • Lords / Simpsons paradox: keuze model beïnvloedt conclusie; causaliteit vergt RCT.

Hoorcollege 5 – Moderatie & Mediatie

  • Moderatie
    – Impact slope b1 afhankelijk van moderator M. – Test: vergelijking R^2{zonder\,int} vs. R^2_{met\,int}.
  • Mediatie (Baron–Kenny)
    1. c: Y op X 2. a: M op X 3. b,c': Y op X & M.
      – Indirect effect ab, totaal c=c'+ab.
      – Volledig vs. gedeeltelijk vs. onderdrukking.
  • Assumpties: temporale volgorde, geen gemiste confounders; bij voorkeur bootstrap CI’s.

Hoorcollege 6 – MANOVA & Repeated Measures

  • MANOVA doel: vergelijken van groep­patronen op p gecorreleerde Y’s.
    – Teststatistieken: Wilks \Lambda (klein = effect).
    – Assumpties: multivariate normaliteit, lineaire relaties, gelijke covariance­matrices (Box M), geen multi­collineariteit.
  • Voordelen t.o.v. meerdere ANOVA’s
    – Enkelvoudig \alpha-niveau, rekening met Y-correlaties, detecteert patronen.
  • Effectmaten: \eta^2=1-\Lambda; partial \eta^2=1-\Lambda^{1/s}.
  • Herhaalde metingen
    – Sfericiteit (\epsilon): gelijke varianties van verschillen; Mauchly test; correcties (Greenhouse–Geisser, Huynh–Feldt).
    – Carry-over & order­effects; minder N nodig maar extra assumpties.

Contrasten (simpel & complex)

  • Simpel: paars­gewijs, gewichten bijv. (+1,-1).
  • Complex: combineer groepen, somme gewichten = 0, orthogonaliteit indien \sum cic'i=0.

Outliers, Leverage & Invloedrijke punten

  • Definities
    – Outlier: Y extreem; Leverage: X extreem; Invloedrijk: wijziging fit (Cook’s D).
  • Aanpak: controleren, vervangen, transformeren, robuuste analyse.

Boek Warner – Kernpunten

  • Hfst 5 (t-toets): assumpties, effect­grootte (Cohen d, r_{pb}), power afhankelijk van n,\alpha,\text{ES}.
  • Hfst 6 (One-way ANOVA): SS-decompositie, noodzaak post-hoc/contrast, interpretatie h ^2.
  • Hfst 9 (Bivariate regressie): onderscheid b vs. \beta, t- vs. F-test (equivalent bij 1 predictor).
  • Hfst 13 (Factorieel): interacties, cel­gemiddelden, geneste vs. gekruiste factoren, extensies (>2 factoren).
  • Hfst 15 (Moderatie): detectie via interactie, centeren, aandacht voor bereik X’s.
  • Hfst 16 (Mediatie): pad­analyse, SEM, belang temporele orde.
  • Hfst 19 (MANOVA): onderscheidende functies, interpretatie Wilks, univariate follow-ups.
  • Hfst 22 (Repeated Measures): ordenings­effecten, keuze tussen verandering­score, ANCOVA, MANOVA.

Ethiek & Praktische Implicaties

  • Onjuiste interpretatie regressie naar gemiddelde kan pseudo-effect therapie suggereren.
  • Multipel testen zonder correctie vergroot vals-positief risico ⇒ transparante pre-registratie aanbevolen.
  • Covariaat toevoegen ≠ causaliteit; design (RCT) blijft goud­standaard.

Veelgebruikte Formules (selectie)

  • SE_{proportie}=\sqrt{\dfrac{\pi(1-\pi)}{n}}
  • SS{total}=\sum(Y-\bar Y)^2=SS{between}+SS_{within}
  • R^2=\dfrac{SS{reg}}{SS{total}} ; F=\dfrac{(R^2/k)}{((1-R^2)/(N-k-1))}
  • q=\dfrac{|\bar Xa-\bar Xb|}{\sqrt{MS{within}/n}} ; HSD=q{crit}\sqrt{MS_{within}/n}

Stappenplannen (kort)

  • ANOVA: inspecteer data & assumpties → omnibus F → Levene → post-hoc/contrast.
  • Factorieel: check interactie eerst; indien sig → visualiseer/simple effects; zo niet → hoofd­effecten.
  • ANCOVA: parallel slopes testen → Type III SS → aangepaste gemiddelden → post-hoc.
  • Moderatie: stap-gewijs model (blok 1 zonder, blok 2 met interactie) → ΔR^2 & interpretatie.
  • Mediatie: drie regressies → bootstrap CI’s voor ab → classificatie (geen/vol/partieel).
  • MANOVA: inspecteer lineariteit/outliers → Box M → Wilks Λ → univariate ANOVA’s → post-hoc.