CK

Statistiek 3 – Factorial ANOVA (Week 3)

Structuur van het hoorcollege (week 3)

  • Overkoepelend thema: Factorial ANOVA (twee-weg ANOVA) en randvoorwaarden.
  • Aansluiting bij eerdere weken: een één-weg ANOVA (1 kwantitatieve Y, 1 kwalitatieve X) wordt uitgebreid naar ≥ 2 factoren.
  • Standaard workflow (t/m week 2)
    • Controle → Levene H0: \sigma1^2 = … = \sigma_g^2
    • Kolmogorov/Shapiro → normaliteit residuen.
    • Overall F-test → post-hoc Tukey/Bonferroni of a-priori contrasten.
    • Verdieping via (F)AN(C)OVA en regressie.

Van regressie naar (Factorial) ANOVA

  • Simple regression: 1 kwantitatieve Y, 1 kwantitatieve X.
  • Één-weg ANOVA: 1 kwantitatieve Y, 1 kwalitatieve X.
  • Factorial ANOVA (twee-weg)
    • 1 kwantitatieve Y, 2 kwalitatieve X’en (factor A met a niveaus, factor B met b niveaus).
    • Zelfde aannames als één-weg ANOVA + orthogonaliteit (geen confounding tussen A en B).

Hypothesen en bijbehorende F-ratio’s

  • Hoofd­effect A: H0: \mu{A1}=\mu{A2}=\dots FA = \frac{MSA}{MS{within}},\; df=(a-1,\;N-ab)
  • Hoofd­effect B: H0: \mu{B1}=\mu{B2}=\dots FB = \frac{MSB}{MS{within}},\; df=(b-1,\;N-ab)
  • Interactie A×B: H0:\;\text{geen }A\times B F{A\times B}=\frac{MS{A\times B}}{MS{within}},\; df=((a-1)(b-1),\;N-ab)
  • Alle F-ratio’s volgen een F-verdeling met bovengenoemde vrijheids­graden.

Modelformulering (verwachte waarde + residu)

  • Volledige model: Y{kij}=\mu+\alphai+\betaj+(\alpha\beta){ij}+\varepsilon_{kij}
    • \mu = overall gemiddelde.
    • \alpha_i = effect factor A (niveau i).
    • \beta_j = effect factor B (niveau j).
    • (\alpha\beta)_{ij} = interactie-effect.
    • \varepsilon_{kij}\sim\mathcal N(0,\sigma^2).
  • Zonder interactie vereenvoudigt tot Y{kij}=\mu+\alphai+\betaj+\varepsilon{kij}.

Interpretatie van interacties

  • Kruisende lijnen in een profile plot → significant A×B.
  • Parallelle lijnen → uitsluitend hoofd­effecten.
  • Voorbeeld (stress × sociale steun): buffering-hypothese toont interactie; direct-effect-hypothese niet.

Rapportagevereisten

  • Voor elke cel: \bar Y\,,SD\,,n.
  • \eta^2 of partial \etap^2 per effect: \etap^2 = \frac{SS{effect}}{SS{effect}+SS_{error}}.
  • 95 %-C.I.’s voor gemiddelden en contrasten.

One-way vs Two-way ANOVA

  • Twee afzonderlijke één-weg ANOVA’s missen het interactie-effect en reduceren power wanneer factoren samenhangen.

Orthogonaliteit en (on)gebalanceerde designs

  • Orthogonaal: gelijke of proportioneel gebalan­ceerde n’s per cel → SS-partities (A, B, A×B, within) zijn onafhankelijk.
  • Niet-orthogonaal (unbalanced): volgordegevoelige SS-typen
    • Type III (simultaan): SS(A|B,AB), SS(B|A,AB), SS(AB|A,B).
    • Type I (stepwise): resultaten variëren bij eerst A dan B of omgekeerd.
    • Voorbeeld: totaal SS verschilt (383.033 vs 390.306).
  • Gewogen vs ongewogen marginale middelen
    • Gewogen: ieder celgemiddelde gewogen met zijn n → realistischer bij echte frequentie­verschillen.
    • Ongewogen: elk celgemiddelde even zwaar → gebruik als n-verschillen toevallig zijn.

Meervoudig toetsen & familie­wijde foutkans

  • 3 hypothesen ⇒ P(\text{≥1 fout}) = 1-(1-0.05)^3 = 0.141 (14 %).
  • Mogelijke remedies
    • Omnibus F-test vóór aparte toetsen.
    • Bonferroni/Tukey-correcties.
    • FDR-procedures of preregistratie.

Diagnostische checks vóór analyse

  • Outliers (boxplot, 3σ-regel)
    • Acties: corrigeren, verwijderen, transformeren, robuuste analyse.
  • Normaliteit residuen
    • Kolmogorov-Smirnov / Shapiro-Wilk per cel.
  • Homogeniteit variaties
    • Levene-test; bij heteroscedastiek: transformatie, robuuste ANOVA, gewogen regressie.

SPSS-voorbeeld: interesse in politiek

  • Design: Y = politieke interesse; A = gender; B = opleidings­niveau.
  • Moderator-concept: gender modereert effect opleiding.
  • Geen uitbijters; residuen normaal; Levene p=.061 → oké.
  • Resultaat
    • Interactie: F(2,52)=7.315,\;p=.002,\;\eta_p^2=.220.
    • Daarom worden simple main effects geanalyseerd (Bonferroni \alpha=.025).
    • Voor zowel mannen als vrouwen is opleiding significant (vrouwen F=62.96, mannen F=132.493).
    • Gedetailleerde paar­gewijze vergelijkingen en 95 %-C.I.’s gerapporteerd (zie transcript).

Simple-effects & syntax (SPSS)

  • Mogelijkheid om met /EMMEANS … COMPARE direct simple effects én Bonferroni te verkrijgen.
  • Voorbeeldscript toont zowel type III SS, interactieplots als effectgroottes.

Vergelijking met multiple regression

  • Coderen van twee categorische variabelen en hun productterm is mogelijk maar minder passend
    • ANOVA vereist geen interval­schaling; regressie wel.

Samenvattend stappenplan (week 1 – 4)

  • Checks (outliers, Levene, normaliteit).
  • Eén-weg: overall F → post-hoc/contrast.
  • Twee-weg: hoofd­effecten + interactie, orthogonaliteit check.
  • Interpretatie
    • Eerst interactie; zo ja → simple effects.
  • Uitbreidingen: FANOVA, ANCOVA (kwantitatieve covariaat).

Literatuur & zelfstudie

  • Agresti (2018) H12 §4-7 of Warner (2013) H13.
  • Canvas: formatieve quiz week 3 en discussiepagina.