Statistiek 3 – Factorial ANOVA (Week 3)
Structuur van het hoorcollege (week 3)
- Overkoepelend thema: Factorial ANOVA (twee-weg ANOVA) en randvoorwaarden.
- Aansluiting bij eerdere weken: een één-weg ANOVA (1 kwantitatieve Y, 1 kwalitatieve X) wordt uitgebreid naar ≥ 2 factoren.
- Standaard workflow (t/m week 2)
- Controle → Levene H0: \sigma1^2 = … = \sigma_g^2
- Kolmogorov/Shapiro → normaliteit residuen.
- Overall F-test → post-hoc Tukey/Bonferroni of a-priori contrasten.
- Verdieping via (F)AN(C)OVA en regressie.
Van regressie naar (Factorial) ANOVA
- Simple regression: 1 kwantitatieve Y, 1 kwantitatieve X.
- Één-weg ANOVA: 1 kwantitatieve Y, 1 kwalitatieve X.
- Factorial ANOVA (twee-weg)
- 1 kwantitatieve Y, 2 kwalitatieve X’en (factor A met a niveaus, factor B met b niveaus).
- Zelfde aannames als één-weg ANOVA + orthogonaliteit (geen confounding tussen A en B).
Hypothesen en bijbehorende F-ratio’s
- Hoofdeffect A: H0: \mu{A1}=\mu{A2}=\dots
FA = \frac{MSA}{MS{within}},\; df=(a-1,\;N-ab)
- Hoofdeffect B: H0: \mu{B1}=\mu{B2}=\dots
FB = \frac{MSB}{MS{within}},\; df=(b-1,\;N-ab)
- Interactie A×B: H0:\;\text{geen }A\times B
F{A\times B}=\frac{MS{A\times B}}{MS{within}},\; df=((a-1)(b-1),\;N-ab)
- Alle F-ratio’s volgen een F-verdeling met bovengenoemde vrijheidsgraden.
- Volledige model: Y{kij}=\mu+\alphai+\betaj+(\alpha\beta){ij}+\varepsilon_{kij}
- \mu = overall gemiddelde.
- \alpha_i = effect factor A (niveau i).
- \beta_j = effect factor B (niveau j).
- (\alpha\beta)_{ij} = interactie-effect.
- \varepsilon_{kij}\sim\mathcal N(0,\sigma^2).
- Zonder interactie vereenvoudigt tot Y{kij}=\mu+\alphai+\betaj+\varepsilon{kij}.
Interpretatie van interacties
- Kruisende lijnen in een profile plot → significant A×B.
- Parallelle lijnen → uitsluitend hoofdeffecten.
- Voorbeeld (stress × sociale steun): buffering-hypothese toont interactie; direct-effect-hypothese niet.
Rapportagevereisten
- Voor elke cel: \bar Y\,,SD\,,n.
- \eta^2 of partial \etap^2 per effect:
\etap^2 = \frac{SS{effect}}{SS{effect}+SS_{error}}.
- 95 %-C.I.’s voor gemiddelden en contrasten.
One-way vs Two-way ANOVA
- Twee afzonderlijke één-weg ANOVA’s missen het interactie-effect en reduceren power wanneer factoren samenhangen.
Orthogonaliteit en (on)gebalanceerde designs
- Orthogonaal: gelijke of proportioneel gebalanceerde n’s per cel → SS-partities (A, B, A×B, within) zijn onafhankelijk.
- Niet-orthogonaal (unbalanced): volgordegevoelige SS-typen
- Type III (simultaan): SS(A|B,AB), SS(B|A,AB), SS(AB|A,B).
- Type I (stepwise): resultaten variëren bij eerst A dan B of omgekeerd.
- Voorbeeld: totaal SS verschilt (383.033 vs 390.306).
- Gewogen vs ongewogen marginale middelen
- Gewogen: ieder celgemiddelde gewogen met zijn n → realistischer bij echte frequentieverschillen.
- Ongewogen: elk celgemiddelde even zwaar → gebruik als n-verschillen toevallig zijn.
Meervoudig toetsen & familiewijde foutkans
- 3 hypothesen ⇒ P(\text{≥1 fout}) = 1-(1-0.05)^3 = 0.141 (14 %).
- Mogelijke remedies
- Omnibus F-test vóór aparte toetsen.
- Bonferroni/Tukey-correcties.
- FDR-procedures of preregistratie.
Diagnostische checks vóór analyse
- Outliers (boxplot, 3σ-regel)
- Acties: corrigeren, verwijderen, transformeren, robuuste analyse.
- Normaliteit residuen
- Kolmogorov-Smirnov / Shapiro-Wilk per cel.
- Homogeniteit variaties
- Levene-test; bij heteroscedastiek: transformatie, robuuste ANOVA, gewogen regressie.
SPSS-voorbeeld: interesse in politiek
- Design: Y = politieke interesse; A = gender; B = opleidingsniveau.
- Moderator-concept: gender modereert effect opleiding.
- Geen uitbijters; residuen normaal; Levene p=.061 → oké.
- Resultaat
- Interactie: F(2,52)=7.315,\;p=.002,\;\eta_p^2=.220.
- Daarom worden simple main effects geanalyseerd (Bonferroni \alpha=.025).
- Voor zowel mannen als vrouwen is opleiding significant (vrouwen F=62.96, mannen F=132.493).
- Gedetailleerde paargewijze vergelijkingen en 95 %-C.I.’s gerapporteerd (zie transcript).
Simple-effects & syntax (SPSS)
- Mogelijkheid om met
/EMMEANS … COMPARE
direct simple effects én Bonferroni te verkrijgen. - Voorbeeldscript toont zowel type III SS, interactieplots als effectgroottes.
Vergelijking met multiple regression
- Coderen van twee categorische variabelen en hun productterm is mogelijk maar minder passend
- ANOVA vereist geen intervalschaling; regressie wel.
Samenvattend stappenplan (week 1 – 4)
- Checks (outliers, Levene, normaliteit).
- Eén-weg: overall F → post-hoc/contrast.
- Twee-weg: hoofdeffecten + interactie, orthogonaliteit check.
- Interpretatie
- Eerst interactie; zo ja → simple effects.
- Uitbreidingen: FANOVA, ANCOVA (kwantitatieve covariaat).
Literatuur & zelfstudie
- Agresti (2018) H12 §4-7 of Warner (2013) H13.
- Canvas: formatieve quiz week 3 en discussiepagina.