1/256
Looks like no tags are added yet.
Name | Mastery | Learn | Test | Matching | Spaced |
---|
No study sessions yet.
Aselecte steekproef
Respondenten worden random geselecteerd uit de populatie.
Representatief
Kenmerken van de populatie komen terug in de steekproef.
Externe validiteit
Mate waarin onderzoeksresultaten generaliseerbaar zijn naar de bredere populatie.
Gestructureerde aselecte steekproef
Populatie verdeeld in subpopulaties om verschillen te analyseren.
Clustersteekproef
Hele clusters worden geselecteerd in plaats van individuen.
Non-responsefout
Niet alle geselecteerde respondenten doen mee aan het onderzoek.
Item-nonresponse
Respondenten beantwoorden specifieke vragen in de vragenlijst niet.
Betrouwbaarheidanalyse
Evaluatie van de consistentie van resultaten over verschillende items.
Cronbachs alpha
Maat voor interne consistentie, waarbij 0 slecht en 1 goed is.
Dekkingsfout
Niet iedereen uit de populatie is opgenomen in het steekproefkader.
Steekproeffout
Verschil tussen steekproefresultaten en echte populatiekenmerken.
Goodness-of-fit
Maat voor hoe goed een model de data past, uitgedrukt als R^2.
Dummyvariabele
Variabele die categorische data omzet in numerieke gegevens (vaak 0 of 1).
Multicollineariteit
Voorspellers in een regressiemodel zijn sterk met elkaar gecorreleerd.
Hypothesetoetsen
Statistische methode om de geldigheid van een hypothese te testen.
T-waarde
Statistische waarde om hypothesen te toetsen in een regressiemodel (voor individuele predictoren).
F-waarde
Maat gebruikt in ANOVA om variantie tussen groepen te vergelijken; in regressie voor algehele model significantie.
Verschil tussen getrapte steekproef & clustersteekproef
Cluster: hele clusters geselecteerd. Getrapt: binnen geselecteerde clusters wordt nog een steekproef getrokken.
Typen aselecte steekproeven
Enkelvoudige aselecte steekproef 2. Gestratificeerde aselecte steekproef 3. Systematische steekproef 4. Clustersteekproef 5. Getrapte steekproef
Meetbaar maken van abstracte kenmerken (persoonlijkheid)
Gebruik indicatoren en bereken een somscore of gemiddelde.
Wanneer is item-rest correlatie laag?
Als een item niet goed samenhangt met de andere items in de schaal.
Stappen om schaalscore te maken
Definieer het construct. 2. Ontwikkel/selecteer items. 3. Test betrouwbaarheid en validiteit. 4. Combineer items tot een score.
Verklaart een predictor (of meerdere) variantie in de afhankelijke variabele?
Getoetst met F-toets (model) of t-toets (individuele predictor); mate aangegeven door R^2.
Welke toets gebruik je als je will weten of een specifieke onafhankelijke variabele een voorspeller van de afhankelijke variabele?
Getoetst met een t-toets voor de regressiecoëfficiënt van die variabele.
Verschil toetsingscoëfficiënt ANOVA en regressiecoëfficiënten
De F-waarde in ANOVA/regressie test algehele significantie. De t-waarde bij regressiecoëfficiënten test individuele predictor significantie.
Interpretatie r-waarde (correlatiecoëfficiënt)
Dicht bij 0: zwakke/geen lineaire relatie. Dicht bij +1 of -1: sterke positieve/negatieve lineaire relatie.
Richtingscoëfficiënt vs. regressiecoëfficiënt
richting = slope, regression = coefficients (so w correlationeel they’re the same thing)
Interpretatie van de richtingscoëfficiënt
Hoeveel de afhankelijke variabele (Y) verandert als de onafhankelijke variabele (X) met één eenheid toeneemt, andere predictoren constant houdend.
Dummyvariabele maken (bij meerdere categorieën)
Bij k categorieën maak je k-1 dummyvariabelen. Eén categorie wordt de referentiecategorie (0).
Variabelen zonder ratio/interval in regressie
Zet ze om in dummyvariabelen.
Reden voor betere hogere verklaarde variantie
Hogere R^2 betekent dat het model een groter deel van de variabiliteit in de afhankelijke variabele verklaart, dus een beter model.
Voordelen van R^2
Geeft aan welk percentage van de variabiliteit in de afhankelijke variabele door de onafhankelijke variabelen wordt verklaard. Makkelijk te interpreteren.
Verschil twee hypothesetoetsen in multipele regressie
F-toets (hele model): toets of minstens één predictor significant bijdraagt. 2. t-toetsen (individuele predictoren): toets de significantie van elke predictor afzonderlijk.
Wanneer is multicollineariteit serieus met tolerance?
Tolerance-waarde is kleiner dan 0.1 (< 0.1).
Wanneer is multicollineariteit serieus met VIF?
VIF-waarde is groter dan 10 (> 10).
6de stap van invloed per een predictor
Interpreteer de betekenisvolle bijdrage van de predictor na controleren van significantie, effectgrootte en richting.
Wanneer gebruik je een t-score vs. f-score?
t-score voor enkelvoudige parameters (individuele regressiecoëfficiënt). f-score voor meerdere parameters of varianties (algehele model of >2 groepen ANOVA).
Wat te doen als predictor geen significant effect heeft op de afhankelijke variabele?
Overweeg verwijdering, onderzoek confounders, interacties, of schending van aannames.
Populatie
De volledige groep die je wilt onderzoeken.
Steekproef
Een kleinere, representatieve groep uit de populatie.
Beschrijvende statistiek
Statistische methode waarbij je gegevens van de hele populatie hebt en directe uitspraken doet.
Inferentiële statistiek
steekproef zegt iets over de populatie
Tweezijdige hypothese
Hypothese die onderzoekt of er een verschil of verband is in beide richtingen.
Eenzijdige hypothese
Hypothese die onderzoekt of er een specifiek verschil of verband is in één richting.
P-waarde
De kans op een resultaat zoals of extremer dan het geobserveerde, als de nulhypothese waar is.
Nulhypothese
Stelling dat er geen samenhang of verschil is, alles blijft zoals het is.
Alternatieve hypothese
Hypothese die verandering, samenhang, verschil of effect aangeeft.
Toetsingsgrootheid
Getal dat wordt gebruikt om te bepalen of je de nulhypothese verwerpt of niet.
Significantieniveau (alpha)
De grens waarbij je beslist of een resultaat toeval is. Meestal is dit 0,05.
Als de p-waarde kleiner is dan alpha, verwerp je de nulhypothese.
Effectgrootte
Sterkte van de relatie, zoals weergegeven door de correlatiecoëfficiënt.
Standaardfout
De standaardafwijking van de steekproevenverdeling, geeft aan hoeveel een steekproefgemiddelde kan verschillen van het werkelijke populatiegemiddelde
Correlatiecoëfficiënt
Getal dat de sterkte en richting van een relatie tussen variabelen aangeeft.
Steekproeffout
verschil tussen het steekproefresultaat en het werkelijke resultaat in de hele populatie, door toeval in de steekproef
Dekkingsfout
Fout als het sampling frame niet overeenkomt met de populatie.
Non-response fout
Fout die optreedt wanneer respondenten niet deelnemen aan het onderzoek.
Waarom wordt de nulhypothese bij eenzijdige toetsing sneller verworpen?
Omdat je alleen kijkt naar één kant van de verdeling, is de grens voor verwerpen makkelijker te bereiken dan bij tweezijdig toetsen.
Wat is het effect van tweezijdige toetsing op het verwerpen van de nulhypothese?
Bij tweezijdige toetsing wordt de kritieke regio verdeeld over twee staarten, wat betekent dat de geobserveerde waarde verder moet afwijken om als significant te worden bevonden.
Wat is het primaire uitgangspunt voor hypothesetoetsen?
Het uitgangspunt voor hypothesetoetsen is de nulhypothese (H_0).
Wat stelt de nulhypothese (H_0) in hypothesetoetsen?
De nulhypothese (H_0) stelt dat er geen effect, geen verschil of geen verband is in de populatie.
Wanneer kies je een eenzijdige hypothese?
De keuze hangt af van de onderzoeksvraag, als er een specifieke richting van het effect of verband wordt verwacht (bijv. 'groter dan', 'kleiner dan'),
Wanneer kies je een tweezijdige hypothese?
Als je alleen wilt weten of er een verschil of verband is, zonder specifieke richting, kies je een tweezijdige hypothese.
Hoe kan je de steekproeffout in de correlatie zo klein mogelijk maken?
steekproefgrootte vergroten.
Wat is het effect van een grotere steekproefgrootte op de correlatieschatting?
Een grotere steekproef leidt tot een kleinere standaardfout en dus tot een nauwkeurigere schatting van de populatiecorrelatie.
Welke concepten van hypothesetoetsing zijn belangrijk voor onderbouwde beslissingen?
Een goed begrip van nul- en alternatieve hypotheses, significantieniveau, p-waarde en effectgrootte stelt je in staat om weloverwogen beslissingen te nemen over de opzet van het onderzoek en de interpretatie van resultaten.
Wat helpen eenzijdige versus tweezijdige toetsen beoordelen?
Ze helpen bepalen welke richting van een effect of verschil je onderzoekt en hoe streng je je hypothese toetst:
Wat zijn de belangrijkste afhankelijkheden van de p-waarde?
grootte van de steekproef + grootte van het effect
Waarom hangt de p-waarde af van de standaardafwijking?
Hoe meer spreiding in de data, hoe moeilijker het is om een duidelijk effect te zien. Daardoor wordt de p-waarde hoger.
Wanneer worden Griekse letters gebruikt in de statistiek?
Griekse letters (zoals \mu voor populatiegemiddelde, \sigma voor populatiestandaardafwijking, \rho voor populatiecorrelatie) worden gebruikt om parameters van de populatie aan te duiden.
Wanneer worden Latijnse letters gebruikt in de statistiek?
Latijnse letters (zoals \bar{x} voor steekproefgemiddelde, s voor steekproefstandaardafwijking, r voor steekproefcorrelatie) worden gebruikt voor steekproefstatistieken.
Welke initialele factoren bepalen de keuze van de statistische toets? (NHST stap 1: Toetskeuze)
S – Soort variabelen (meetniveau)
O – Onderzoeksvraag
A – Aantal variabelen en groepen
Waarom is het cruciaal om assumpties te controleren vóór een statistische toets? (NHST stap 2: Assumpties controleren)
anders is het niet geldig
Wat zijn de gevolgen als assumpties worden geschonden bij statistische toetsen? (NHST stap 2: Assumpties controleren)
de resultaten toets zijn onbetrouwbaar + conclusies onjuist.
Wat is het doel van de toetsingsgrootheid in NHST? (NHST stap 3: Toetsingsgrootheid en p-waarde bepalen)
Het laat zien hoe sterk het resultaat afwijkt van wat je zou verwachten als de nulhypothese klopt.
p-waarde
geeft de kans aan om zo'n extreem of extremer resultaat te vinden als de nulhypothese waar is —> beslist verwerpen of niet
Hoe trek je een conclusie over de nulhypothese? (NHST stap 4: Conclusie over de nulhypothese trekken)
Vergelijk de p-waarde met het significantieniveau (α):
Is de p-waarde kleiner dan α? → Verwerp de nulhypothese.
Is de p-waarde groter dan α? → Behoud de nulhypothese.
Wanneer verwerp je de nulhypothese en wanneer niet op basis van de p-waarde en Significantieniveau?
Waarom is een inhoudelijke conclusie belangrijk na hypothesetoetsing? (NHST stap 5: Inhoudelijke conclusie en effectgrootte bepalen)
vertaalt de statistische bevindingen naar de onderzoeksvraag en de populatie.
Wat zegt de effectgrootte over de populatie? (NHST stap 5: Inhoudelijke conclusie en effectgrootte bepalen)
De effectgrootte laat zien hoe sterk en belangrijk het gevonden effect is voor de populatie.
Nulhypothese (H₀)
De hypothese dat er geen verschil of effect is.
Significantieniveau (α)
De kans om de nulhypothese onterecht te verwerpen, vaak 0.05.
Assumpties
Voorwaarden voor het testen van een hypothese, zoals lineariteit en homoscedasticiteit.
Homogene spreiding (Homoscedasticiteit)
Variabiliteit van residuen is constant over alle waarden van de voorspeller.
R (correlatie)
De relatie tussen voorspelde en echte uitkomsten; 'goedheid' van voorspellingen.
R² (verklaarde variantie)
Het deel van de variantie in de afhankelijke variabele dat door het model wordt verklaard.
RMSE (Root Mean Squared Error)
De gemiddelde fout van het model bij voorspellen, ook standaardschattingsfout.
Richtingscoëfficiënt (slope)
Aantal eenheden dat "Y" verandert als "X" met één eenheid toeneemt.
Multicollineariteit
Sterke samenhang tussen voorspellende variabelen, beïnvloedt schattingsnauwkeurigheid.
Residuen
Verschillen tussen waargenomen en voorspelde waarden.
Toetsingsgrootheid
Waarde die de afwijking van de steekproevenverdeling van de nulhypothese aangeeft.
T-toets
Statistische toets om verschil tussen groepsgemiddelden te bepalen.
Eenzijdige p-waarde
Kans op afwijking van de nulhypothese in één specifieke richting.
Least squares criterium
Methode om de 'best passende' lijn te vinden door de som van gekwadrateerde residuen (\sum e_i^2) te minimaliseren.
JASP
Software voor gegevensanalyse en statistische toetsen.
Effectgrootte
Statistische maat voor de sterkte van een relatie of effect.
Schaalmaat
Meetniveau van variabelen (nominaal, ordinaal, interval, ratio).
Predictor
Onafhankelijke variabele die een afhankelijke variabele voorspelt.
Standaardschattingsfout (Standard Error of the Estimate)
De gemiddelde fout die het model maakt bij voorspellen, ook de gemiddelde schattingsfout. Equivalent aan RMSE.
Welke vragen stel je bij het analyseren van een spreidingsdiagram?
Richting (positief/negatief)? 2. Sterkte (zwak/sterk)? 3. Lineair/kromlijnig? 4. Uitschieters/invloedrijke punten? 5. Vorm/patroon van de puntenwolk?
Hoe bepaal je of een uitschieter te veel invloed heeft in een regressieanalyse?
Analyseer residuen, 'leverage' (punten ver op de X-as) of bereken Cook's Distance.
Wat is het verschil tussen correlatie (R) en de effectiviteit van relatieve voorspelling (R^2) in een regressiemodel?
Correlatie (R) beschrijft de sterkte en richting van lineaire samenhang. R^2 geeft het proportionele deel van de variantie aan dat het model verklaart.