Theme 2 theorie methoden & statistiek

0.0(0)
studied byStudied by 0 people
0.0(0)
full-widthCall Kai
learnLearn
examPractice Test
spaced repetitionSpaced Repetition
heart puzzleMatch
flashcardsFlashcards
GameKnowt Play
Card Sorting

1/63

encourage image

There's no tags or description

Looks like no tags are added yet.

Study Analytics
Name
Mastery
Learn
Test
Matching
Spaced

No study sessions yet.

64 Terms

1
New cards

Wat is data?

numerieke feiten
bijv. getal of codering van een categorie (1 = man, 2 = vrouw)

2
New cards

Wat kan statistiek met data?

Statistiek omvat verzameling, organisatie en interpretatie van data
→ door patronen te herkennen in variabele data kan een fenomeen beschreven, begrepen en voorspeld worden

3
New cards

Wat zijn de verschillende onderdelen uit een dataset?

  • Cases of units

  • Variabele

  • Label

4
New cards

Case of unit

subjecten (mensen) of objecten waar onderzoek naar is gedaan / die worden beschreven door data

5
New cards

Variabele

kenmerk of karakteristiek van case

6
New cards

Label

specifieke variabele: unieke identificatie van een case
→ alle cases hebben een andere score, bijv. burgerservicenummer

7
New cards

Categorische of kwalitatieve variabele

Variabele die een case plaatst in een groep/categorie waarde, aangeduid met namen/labels of een identificerend nummer
bijv. studie, leeftijdsgroep, plaats, geslacht, oogkleur, religie

8
New cards

Kwantitatieve variabele

Waarde van variabele gebruikt bepaalde meeteenheid die numeriek uitgedrukt kan worden
→ het is hierbij logisch en waardevol om met waardes te rekenen (bijv. het berekenen van een gemiddelde, optellen van waardes, omzetting van frequentie naar rate (=mate))
vb. leegtijd, aantal kinderen in gezin, IQ-score

9
New cards

Discrete variabele

kan geen tussenliggende waardes aannemen (vaak in vast bereik)
vb. 0, 1, 2 of 3 kinderen

→ vorm van kwantitatieve variabele

10
New cards

Continue variabele

kan altijd nieuwe tussenliggende waardes aannemen (door toevoeging decimalen)
→ in praktijk vaak omgezet naar discrete variabele door afronding of gebruik van eenheden
vb. tijd, bloeddruk

→ vorm van kwantitatieve variabele

11
New cards

Onafhankelijke variabele

aangenomen oorzaak van een causale relatie tussen variabelen

12
New cards

Afhankelijke variabele

aangenomen gevolg van een causale relatie tussen variabelen

13
New cards

Experimenteel onderzoek

manipulatie, variatie of selectie van variabele(n) om invloed op uitkomst(en) te onderzoeken
→ soms onethisch of praktisch onmogelijk, wordt dan enkel gemeten in beschrijvend onderzoek

14
New cards

Beschrijvend onderzoek

onderzoek waar variabele enkel worden gemeten (en niet gemanipuleerd) om verbanden tussen variabelen te onderzoeken

15
New cards

Mediator variabele

verstrekt een causale verbinding in opeenvolging van onafhankelijke tot afhankelijke variabele
bijv. telefoongesprek à afleiding à verminderde autorijprestaties

<p>verstrekt een causale verbinding in opeenvolging van onafhankelijke tot afhankelijke variabele<br><strong>bijv. </strong><span style="font-family: Aptos, sans-serif; line-height: 107%;"><span>telefoongesprek </span></span><span style="line-height: 107%;"><span>à</span></span><span style="font-family: Aptos, sans-serif; line-height: 107%;"><span> afleiding </span></span><span style="line-height: 107%;"><span>à</span></span><span style="font-family: Aptos, sans-serif; line-height: 107%;"><span> verminderde autorijprestaties</span></span></p>
16
New cards

Moderator variable

beïnvloedt kracht en richting tussen onafhankelijke en afhankelijke variabele
bijv. mate van verkeer bepaalt relatie tussen bellen & rijprestaties

<p>beïnvloedt kracht en richting tussen onafhankelijke en afhankelijke variabele<br><strong>bijv. </strong><span style="font-family: Aptos, sans-serif; line-height: 107%;"><span>mate van verkeer bepaalt relatie tussen bellen &amp; rijprestaties</span></span></p>
17
New cards

Situationele variabele

karakteristiek dat verschilt tussen omgevingen of stimuli
bijv. temperatuur, geluid, aanwezigheid van anderen

18
New cards

Subject variabele

persoonlijk karakteristiek dat verschilt tussen individuen
bijv. IQ, gewicht, geslacht, gemoedstoestand

19
New cards

Observatie

ander woord voor data (of waardes van variabelen) van een case

20
New cards

Wat zijn de belangrijkste vragen m.b.t. een dataset?

  • Wie: welke cases beschrijft/onderzoekt de data? Hoeveel cases bevat een dataset?

  • Wat is er gemeten? (aantal variabelen, definitie en waardes van variabelen, meetniveau/eenheid)

  • Waarom/met welk doel is dataset verzameld?
    vb. antwoord op specifieke vraag? Trekken van conclusies over andere cases? Is data geschikt?

21
New cards

Hypothetisch construct

niet-waarneembaar, onderliggend karakteristiek afgeleid van meetbaar gedrag of reactie in psychologisch onderzoek

22
New cards

Conceptuele definitie

definitie variabele/concept van interesse
verschilt per individu/onderzoek
vb. definitie van stress of intelligentie

23
New cards

Operationele definitie

definitie variabele a.d.h.v. gebruikte procedures om variabele te meten/manipuleren
→ maakt abstract concept tast-, waarneem- en meetbaar; duidelijk voor reproductie
vb. scores van vragenlijst, gedragsobservaties, fysiologische metingen, manipulatie van omgeving, rubric schoolopdracht

24
New cards

Nominaal meetniveau

categorisch; categorieën hebben geen rangorde, meeteenheid of nulpunt
→ toont enkel absolute, kwalitatieve verschillen/overeenkomsten tussen cases
bijv. sekse

25
New cards

Ordinaal meetniveau

categorisch; categorieën hebben rangorde, maar geen informatie over grootte van relatieve verschillen (meeteenheid) of nulpunt
bijv. socioeconomische status (laag-middel-hoog)

26
New cards

Kun je rekenen met een categorische variabele?

Ja, je kunt de mediaan, frequentie en percentage bepalen

27
New cards

Interval meetniveau

kwantitatief; waardes hebben volgorde en gelijke afstanden in verschillen (meeteenheid), maar een arbitrair, niet vast nulpunt
→ afstand tussen 1 en 2 is hetzelfde als afstand tussen 3 en 4
bijv. cijfers op een bloktoets, temperatuur, intelligentie (IQ)

28
New cards

Ratio meetniveau

kwantitatief; waardes hebben volgorde, meeteenheid en absoluut nulpunt = absentie/ontbreken van attribuut of factor
→ een waarde kan x keer zoveel hoger of lager zijn
bijv. aantal correct beantwoorde vragen op een bloktoets, gewicht, snelheid

29
New cards

Wat wordt er bedoeld met een gestandaardiseerde procedure van dataverzameling?

elke meting wordt gedaan onder zo gelijk mogelijke condities

30
New cards

Nauwkeurigheid (accuracy)

mate waarin meetmethode resultaten oplevert die overeenkomen met/gekalibreerd zijn tegen bekende standaard
moeilijk te bepalen voor psychologische variabelen omdat bekende standaarden niet bestaan

31
New cards

Systematische fout of bias

consistente mate van fout bij elke meting, vermindert nauwkeurigheid

32
New cards

Betrouwbaarheid (reliability)

consistentie van meetmethode onder gelijke condities

<p><span style="font-family: Aptos, sans-serif; line-height: 107%;"><span>consistentie van meetmethode onder gelijke condities</span></span></p>
33
New cards

Random measurement error

willekeurige variaties gedurende meting waardoor verkregen resultaten afwijken van daadwerkelijke waarde
bijv. tijdelijke fluctuaties in persoonlijke karakteristieken, omgeving van meting of meetinstrument

34
New cards

Hoe kun je betrouwbaarheid bepalen?

  • Test-Retest Reliability = zelfde meting bij zelfde deelnemer onder zelfde condities op minstens twee afzonderlijke momenten

  • Internal Reliability = bepaling inter-relaties van onderdelen binnen meting
    scores van items op vragenlijst die zelfde attribuut meten moeten correleren

    • Split-half reliability = items worden gesplitst in twee subsets, waarna correlatie tussen subsets wordt bepaald

    • Cronbach’s alpha = statistiek die reflecteert hoe sterk indiivudele items correleren met elkaar

  •    Interobserver (interrater) reliability = mate waarop onafhankelijke waarnemers overeenkomen in observaties
    meet betrouwbaarheid van waarnemer/gebruiker, niet die van de meetmethode!

35
New cards

Wat houdt validiteit (validity) in? Wat is de relatie van betrouwbaarheid tot validiteit?

  • Conclusies moeten volgens logische redenering gebaseerd kunnen worden op meetmethode (en daarvan verkregen resultaten)
     bijvpersoonlijkheidstesten, diagnostische testen voor persoonlijkheidsstoornissen

  • Hoge betrouwbaarheid is noodzakelijk, maar niet voldoende

<ul><li><p>Conclusies&nbsp;<span style="font-family: Aptos, sans-serif; line-height: 107%;"><span>moeten volgens logische redenering gebaseerd kunnen worden op meetmethode (en daarvan verkregen resultaten)</span></span><br><span style="font-family: Aptos, sans-serif; line-height: 107%;"><span>→</span><strong><span>&nbsp;bijv</span></strong><span>.&nbsp;</span></span>persoonlijkheidstesten, diagnostische testen voor persoonlijkheidsstoornissen</p></li><li><p><span style="font-family: Aptos, sans-serif; line-height: 107%;"><span>Hoge betrouwbaarheid is noodzakelijk, maar niet voldoende</span></span></p></li></ul><p></p>
36
New cards

Face validity

mate waarop onderdelen van test redelijk lijken
 oppervlakkig & niet wetenschappelijk; zegt weinig over daadwerkelijke validiteit

37
New cards

Content validity

mate waarop onderdelen van test representatief zijn voor alle mogelijke onderdelen van te meten construct
bijv. statistiektentamen bevat alle behandelde thema’s

38
New cards

Criterion validity

aantoning van relatie tussen meetresultaten en uitkomsten (= criteria):

  • Predictive validity = meetresultaat voorspelt toekomstig criterium
    → longitudinale bepaling

  • Concurrent validity = relatie tussen op zelfde moment bepaalde meetresultaat en criterium

39
New cards

Construct validity

aantoning dat gemeten/gemanipuleerde constructen in meetmethode daadwerkelijk constructen van interesse zijn
→ meest theoretische soort van validiteit, wordt bepaald door content & criterion validity, en…

  • Convergent validity = scores van verschillende meetmethoden die hetzelfde construct meten moeten overeenkomen/correleren

  • Discriminant validity = scores van verschillende meetmethoden die verschillende constructen meten moeten zo min mogelijk correleren

40
New cards

Distributie van een variabele

variatie of verspreiding van waardes van een variabele tussen verschillende cases

41
New cards

Wat doet exploratory data analysis?

beschrijft belangrijkste kenmerken van data, vaak voor predictive analysis (= maken van voorspellingen voor toekomst) door:

  • onderzoek naar individuele variabelen en samenhang

  • weergeving van verspreiding van variabele m.b.v. grafische weergaven en numerieke samenvattingen

42
New cards

Wat doen grafische weergaven?

Geven per variabele aan

  • welke waardes voorkomen

  • hoe vaak deze waardes voorkomen

  • of waardes een bepaald patroon volgen
    → geeft veel informatie over vorm van verdeling

43
New cards

Wat zijn de grafische weergaven voor kwalitatieve variabelen met nominale of ordinale meetniveaus?

  • Taartdiagram: percentage/proportie

  • Staartdiagram: telling/frequentie of percentage/proportie

<ul><li><p><strong>Taartdiagram</strong>: percentage/proportie</p></li><li><p><strong>Staartdiagram</strong>: telling/frequentie of percentage/proportie</p></li></ul><p></p>
44
New cards

Wat zijn de grafische weergaven voor kwantitatieve variabelen met interval of ratio meetniveaus?

  • Histogram: kwantatieve waarde als klasse (logische groep met bereik) op X-as, telling op Y-as
    → geschikt voor grote datasets

  • Stemplot of steelbladdiagram: weergave van reeks door stam (bijv. honderd- of tiental) en blad (eenheid); toont pieken
    → vooral handig bij kleine datasets met positieve waardes

45
New cards

Hoe kan je een stemplot / steelbladdiagram aanpassen?

  • splitsen van waardes als bladeren te groot worden
    (0-4 en 5-9)

  • trimmen of afronden van waardes bij teveel stammen
    → verwijdert laatste getallen

46
New cards

Wat is een back-to-back stemplot?

Stemplot met bladeren aan beide kanten met gedeelde stam
→ maakt vergelijking van gerelateerde distributies mogelijk

47
New cards

Hoe kan je het algehele patroon een grafische weergave beschrijven?

  • Middelpunt: verdeelt observaties in twee helften

  • Vorm

    • Aantal pieken of modes
      bijv. unimodaal, bimodaal of mulitmodaal

    • Symmetrie

      • Symmetrisch: centraal middelpunt met twee gelijke helften

      • Left-skewed of right-skewed: meerderehid van scores zit aan hogere of lagere kant van variabele
        → verdeling heeft langere linker- of rechterstaart

  • Spreiding: grootste en kleine waardes
    → extreme waardes liggen in staarten van verdeling

48
New cards

Hoe kun je de afwijking van een patroon beschrijven?

Dit zijn outliers of uitbijters = observaties die losstaan van patroon
→ probeer deze te verklaren en te corrigeren

49
New cards

Time plot

Plotten van observaties die over langere periode zijn verzameld met

  • tijd op X-as

  • observatie op Y-as

50
New cards

Wat doen numerieke samenvattingen?

Geven specifieke infromatie over het centrum en de spreiding van variabelen met behulp van cijfers

51
New cards

Wat zijn de centrummaten?

  • Modus = meest voorkomende score (kan meerdere waardes aannemen)
    → bruikbaar bij alle meetniveaus

  • Mediaan M = middelste score; 50% is lager en 50% hoger
    → enkel bruikbaar bij rangorde, vrij resistent/robuust

  • Gemiddelde score (arithmetic mean)
    → niet resistent of robuust (beïnvloedbaar door extreme waardes en veranderingen in klein aantal observaties); enkel bruikbaar bij kwantitatieve variabelen

52
New cards

Wat zijn spreidingsmaten?

  • Percentiel p = waarde met p% van observaties daaronder

    • Onderste kwartiel (Q1) = 25e percentiel
      → mediaan onderste helft data

    • Mediaan (Q2) = 50e percentiel

    • Bovenste kwartiel (Q3) = 75e percentiel
      → mediaan bovenste helft data

  • Variantie s2 = maat waarin scores rond gemiddelde verspreid zijn

  • Standaarddeviatie s = geeft spreiding o.b.v. variantie in originele meeteenheid en voor normaalverdelingen
    → enkel waardevol wanneer centrummaat gemiddelde is; sterk beïnvloed door outliers

53
New cards

Five number summary

  • laagste waarde

  • Q1

  • mediaan (Q2)

  • Q3

  • hoogste waarde

→ nuttig voor beschrijving van skewed distributions

54
New cards

Boxplot, interkwartiel range en variaties

visuele weergave van five number summary

Interkwartiel range (IQR) wordt gebruikt om outliers te bepalen, wordt weergegeven met whiskers

  • Modified boxplot: lengte van whiskers zijn aangepast (modified) aan eerste/laatste waarde die geen outlier is
    outliers zijn individueel geplot

  • Side-by-side boxplot: vergelijking van boxplots van meerdere groepen in één grafiek

55
New cards

Wat is het gevolg van lineaire transformatie met xnieuw = a + bx van waardes voor centrum en spreiding?

  • Vermenigvuldiging met b beïnvloedt ook centrum- en spreidingsmaten
     dus zowel mediaan, gemiddelde, IQR en s

  • Optellen van a beïnvloedt enkel centrummaten (en géén spreiding)
     dus enkel mediaan en gemiddelde, géén IQR en s

56
New cards

Kansdichtheidsfunctie (density curve)

histogram waarover een smooth curve is gemodelleerd (wiskundig model van kwantitatieve verdeling; negeert kleine onregelmatigheden)

57
New cards

Wat zijn de kenmerken van een kansdichtheidsfunctie? (5)

  • Beschrijft patroon van verdeling

  • Bevindt zich altijd boven horizontale as

  • Heeft altijd een oppervlakte van 1
    geeft de proportie van de observaties aan

  • Mediaan bevindt zich op punt wat oppervlakte precies halveert

  • Gemiddelde bevindt zich op balanspunt
    t.o.v. mediaan meer richting staart bij skewed distributions

58
New cards

Normaalverdeling N

ideale symmetrische, unimodale kansdichtheidsfunctie in vorm van bel

59
New cards

Hoe worden de vorm en functie van een normaalverdeling N bepaald?

vorm en functie worden bepaald door µ en σ, wordt ook vaak afgekort tot N(µ, σ)

  • Gemiddelde van normaalverdeling = µ
    verschuift normaalverdeling langs horizontale as; gelijk aan mediaan

  • Standaarddeviatie van normaalverdeling = σ
    verhoging zorgt voor hogere spreiding; bevindt zich op verandering van curvature

60
New cards

Wat zijn de belangrijke statistische eigenschappen van een normaalverdeling?

  • Geeft vaak-redelijk goede beschrijving van echte data

  • Geven vaak goede benaderingen van resultaten die verkregen worden op basis van kans

  • Veel statische conclusies gelden ook voor andere ± symmetrische verdelingen

  • 68-95-99.7 rule:

    • ± 68% van alle observaties vallen tussen σ en µ

    • ± 95% van alle observaties vallen tussen 2σ en µ

    • ± 99,7% van alle observaties vallen tussen 3σ en µ

61
New cards

Wat is standaardisatie van observaties en het nut hiervan?

  • Het omzetten van een waarde in een z-score

  • Maakt vergelijking tussen afwijking/standaarddeviatie van gemiddelde en kansen mogelijk

    • Afwijking boven gemiddelde = positieve Z-score

    • Afwijking onder gemiddelde = negatieve Z-score

62
New cards

Wat is een standaard normaalverdeling?

normaalverdeling N(0,1) variabele met µ = 0 en σ = 1
→ hierbij horen z-scores

63
New cards

Cumulatieve proportie

proportie van observaties in verdeling onder of op gegeven waarde
 oppervlak aan linkerkant van gegeven waarde; berekend m.b.v. software of tabel (standaard normale cumulatieve proportie)

64
New cards

Normal quantile plot functie en stappenplan

bepaling of verdeling normaal is of niet

  1. Orden observaties van klein naar groot

  2. Bereken welk percentiel van de data elk punt omvat

  3. Gebruik Normale berekeningen om de z-scores van percentielen te berekenen
    = Normal scores

  4. Plot datapunten van x tegen normale scores
    bij Normale verdeling van data zullen punten op een rechte lijn liggen; bij duidelijke afwijkingen is data dus niet normaal verdeeld