Kwantitatieve data-analyse begrippen

0.0(0)

Studied by 2 people

Call Kai

Learn

Practice Test

Spaced Repetition

Match

Flashcards

Knowt Play

Card Sorting

1/136

Earn XP

Description and Tags

Statistics

Hypothesis Testing: Proportions & Means

University/Undergrad

Last updated 1:05 PM on 8/13/23

Name	Mastery	Learn	Test	Matching	Spaced	Call with Kai

No analytics yet

Send a link to your students to track their progress

137 Terms

New cards

Statistische modellen

geven een wiskundige formalisering voor het conceptueel model in de vorm van een vergelijking, bestaande uit variabelen (geoperationaliseerde concepten) en parameters

New cards

Populatie

de groep waarover je iets wil weten – alle onderzoekseenheden met een bepaald gemeenschappelijk kenmerk

New cards

parameter

De waarde voor een bepaald kenmerk in de populatie

New cards

Steekproef

elke deelverzameling van de populatie

New cards

een statistiek

De waarde voor een bepaald kenmerk in de steekproef

New cards

een variabele

een representatie van een kenmerk van een onderzoekseenheid

New cards

nominale meetniveau

tellen, percentages berekenen

New cards

ordinale meetniveau

tellen, percentages berekenen en hoger/lager aangeven

New cards

interval meetniveau

tellen, percentages berekenen en hoger/lager aangeven, gemiddelde en spreiding

New cards

ratio meetniveau

tellen, percentages berekenen en hoger/lager aangeven, gemiddelde, spreiding en het berekenen an verhoudingen

New cards

Frequenties

Hoe vaak komt een bepaalde waarde voor.

New cards

centrummaten

Zeggen iets over het punt waar de meeste waarden geclusterd zijn (het midden of het centrum van je dataset)

New cards

spreidingsmaten

Geven informatie over de afstand tussen datapunten (vb. hoe verspreid zijn de data rond het gemiddelde). • Deviatie, variantie, standaardafwijking,..

New cards

absolute frequentie

Hoe vaak een bepaalde waarde in absolute aantallen voorkomt

New cards

relatieve frequentie of proportie

De aantallen in vergelijking met het totale aantal

formule: absolute freq/totale n

New cards

Cumulatieve frequentie

het aantal waarnemingen 'dat je tot dan toe hebt gehad‘ (de som van de frequenties op een bepaald punt)

New cards

modus

De waarneming die het meest voorkomt in een reeks is de modus. Met andere woorden, de waarneming met de hoogste frequentie

New cards

mediaan

middelste getal in de waarnemingen als je die getallen op volgorde zet. 50% van de waarnemingen bevindt zich onder de mediaan en 50% er boven

New cards

gemiddelde

de som van de waarnemingen delen door het aantal waarnemingen

New cards

Deviatie

Het verschil tussen een score en het gemiddelde

New cards

totale deviatie

De som van alle deviaties

New cards

variantie

geeft de gemiddelde afwijking van alle waarnemingen t.o.v. het gemiddelde weer (gemiddelde sum of squares)

New cards

standaardafwijking

Vierkantswortel van de variantie, maat voor de spreiding van de getallen rondom het gemiddelde

New cards

Gausscurve

normaalverdeling, Curve = klokvormig en symmetrisch (oppervlakten links en rechts van gemiddelde zijn gelijk). Ongeveer 68% van de waarnemingen ligt binnen 1 standaarddeviatie van het gemiddelde. Ongeveer 95% van de waarnemingen ligt binnen 2 standaarddeviaties (68-95-99,7- regel

New cards

skewness

scheefheid

New cards

kurtosis

boogvorm/welving

New cards

Pearson’s correlatiecoëfficient (r)

Maat voor de sterkte en richting van een lineair verband tussen twee variabelen

New cards

Lineaire regressieanalyse

zegt iets over de voorspelbaarheid van de av door één of meerdere ov

New cards

Schijnverband

Een statistische relatie tussen variabelen X en Y betekent niet steeds dat er in de realiteit ook een echt verband is. Het is mogelijk dat een derde variabele (Z) de indruk wekt dat er tussen X en Y een verband bestaat.

New cards

Central Limit Theorem (CLT)

Garandeert ons dat bij een degelijke steekproefgrootte (n > 40) de steekproefverdeling van een statistiek bij benadering normaal verdeeld is rond de populatieparameter.

New cards

Hypothesetoetsen

Statistische basis voor een erg groot deel van de kwantitatief-empirische wetenschappelijke literatuur

New cards

onderzoekshypothese

uitspraak over populatie waarin (meestal) niet expliciet wordt verwezen naar een statistiek

New cards

nulhypothese

een uitspraak over de populatie die één referentiewaarde bevat = waarde die refereert naar een bepaalde populatieparameter (vb. gemiddelde)& testbaar of, beter gezegd, falsifieerbaar is

New cards

Theoretische kansverdeling

linkt waarden van steekproefstatistiek aan kansen via een teststatistiek

New cards

Type-I-fout (false positive)

We beslissen om de nulhypothese te verwerpen, hoewel de nulhypothese in de realiteit waar is. Door je nulhypothese foutief te verwerpen geef je onterecht evidentie aan je alternatieve hypothese

New cards

family-wise error rates

1- α de kans dat je de nulhypothese niet verwerpt als de nulhypothese waar is: kans op géén Type-I of specificiteit. Controleert en beperkt de kans op het foutief verwerpen van ten minste één H0 in de gehele set van test , om zo de algehele betrouwbaarheid van de resultaten de waarborgen

New cards

Bonferroni

correctie voor multiple testing; het significantieniveau dat je wil hanteren in elke test gedeeld door het aantal tests dat je in totaal doet

New cards

fishing expeditions/p-hacking

Verzamelnaam voor allerhande technieken die onderzoekers hanteren om de kans op een statistisch significant resultaat te vergroten (ook al is er in de populatie geen sprake van een significante samenhang tussen de variabelen waarin men is geïnteresseerd)

New cards

Type-II fout

We verwerpen de nulhypothese niet, hoewel de nulhypothese eigenlijk fout is.

New cards

power

de kans dat we de nulhypothese verwerpen als de nulhypothese fout is

New cards

effectgrootte

het verschil tussen geobserveerde waarde van de steekproefstatistiek en de referentiewaarde

New cards

effect size

(Gestandaardiseerde) descriptieve statistiek voor de grootte van een effect/verschil/verband…

New cards

regressiecoëfficiënt; Voor elke eenheidsstijging in 𝑥1𝑖

stijgt/daalt 𝑦𝑖 met 𝑏1

New cards

intercept; : De constante geeft de schatting weer op de AV indien alle overige voorspellers een nulscore hebben. In termen van een 2D-coördinatenstelsel is dit dus het Y-coördinaat waar de regressielijn de Y-as snijdt

New cards

errors

residuelen

New cards

Ordinary Least Squares Method (OLS)

We trekken de rechte door de puntenwolk waarvoor de som van de gekwadrateerde afstanden van de ingeschatte lijn tot de observaties y het kleinst is

New cards

model fit

Hoe goed komt het model overeen met de geobserveerde data?

New cards

Sum of squares of the residual

Som van de gekwadrateerde afstanden van elke inschatting ÿ van het model mét 𝑥1 ten opzichte van de observaties y, onverklaarde variantie

New cards

Sum of squares of the model

Som van de gekwadrateerde afstanden van elke inschatting ÿ van het model mét 𝑥1 ten opzichte van het meest rudimentaire model ÿ, Variantie in y verklaard door het model

New cards

R Square

Determinatiecoëfficiënt; proportie variantie in 𝑦 verklaard door het model; SSM/SST

New cards

correlatie

een gestandaardiseerde vorm van de covariantie, maakt géén theoretisch onderscheid tussen predictor en afhankelijke variabele

New cards

covariantie

geeft aan in welke mate twee variabelen ‘gezamenlijke variëren’

New cards

Pearson’s r

Correlatiecoëfficiënt

New cards

Adjusted R square

geeft weer wat de R2 waarde zou zijn in de populatie

New cards

confounding

variabele die een externe invloed hebben op output van het model

New cards

suppression effects (onderschatting)

een vermindering van de correlatie tussen twee variabelen door de invloed van een derde variabele die niet is opgenomen in he model maar wel samenhangt met y

New cards

“Voor elke stijging van één standaarddeviatie in x, stijgt/daalt y met 𝛽 standaarddeviaties”

New cards

R²-change

Hoeveel variantie die variabelen toevoegen aan het nieuwe model extra verklaren tov voorgaand model.

New cards

Theoretische kansverdeling

linkt waarden van steekproefstatistiek aan kansen via een teststatistiek

New cards

Adjusted predicted value

We bekijken hoe de verwachte waarde voor een bepaalde persoon ^yi verschilt als we een regressielijn trekken zonder die persoon in de analyse, en mét die persoon in de analyse. Als er veel verschil is tussen de waarden voor ^yi, heeft die case een grote impact op de vorm van de regressielijn.

New cards

Deleted residual

Verschil tussen geschatte vs geobserveerde waarde

New cards

Studentized deleted residual

Deleted residual gedeeld door zijn standaardfout (gestandaardiseerd, dus vergelijkbaar over analyses heen)

New cards

Cook’s Distance

Algemene impact van een bepaalde case op de capaciteit van het model om alle cases te voorspellen (>1 = mogelijks probleem)

New cards

DFBeta

Verschil tussen de waarden voor regressiecoëfficiënt bi met en zonder de case

New cards

Standardized DFBeta

Gestandaardiseerde versie. Voordeel: verglijkbaar over modellen. Vuistregel voor cut-off: 1 of 2.

New cards

multicillineariteit

Zijn de onafhankelijke variabelen te sterk met elkaar gecorreleerd?

New cards

homoscedacsticity

voor elke variabele met de variantie van de residuelen constant zijn

New cards

lineariteit

Als je een relatie lineair probeert te modelleren, moet de relatie uiteraard eerst lineair zijn.

New cards

additiviteit

Het gecombineerde ‘effect’ van alle predictoren moet je kunnen beschrijven door ze op te tellen.

New cards

Moderatie

s de sterkte en/of richting van het verband tussen 𝑥 en 𝑦 afhankelijk van 𝑚?

New cards

Mediatie

is 𝑚 de tussenliggende verklaring voor het verband tussen 𝑥 en 𝑦?

New cards

Exp(B)

de ratio van de odds (op y=1) voor en na een eenheidsstijging in de geassocieerde x

New cards

likelihood

De kans dat je gegeven data (y) observeert als je aanneemt dat je model (i.e., de regressielijn) waar is

New cards

Maximum Likelihood Estimation

een model opstellen waarbij we zoveel mogelijk observaties juist categoriseren

New cards

Deviance

of -2LogLikelihood. Geeft de error tusssen model en data weer bij logistische regressie. Maximum Likelihood schatting zoekt de set parameters waarvoor de deviance minimaal is.

New cards

Omnibus test

of (Likelihood Ratio Test). Chi-kwadraattest voor verschillen in Deviance tussen modellen te evalueren. Geeft aan of het verschil in loglikelihood tussen 2 modellen significant is.

New cards

Goodness-of-fit test

gaan na in welke mate de verwachte kansen op y=1 op basis van het model afwijken van de geobserveerde kansen op y=1 in de data.

New cards

Pseudo R2

Nagelkerke R Square, model fit

New cards

Hosmer and Lemeshow Test

Test voor afwijkingen tussen verwachte kansen door model en geobserveerde kansen in de data. Nulhypothese is dat er géén afwijking is.

New cards

t-test

om het verschil tussen de twee groepsgemiddelden rechtstreeks te evalueren

New cards

sum of squares model (SSm)

fouten die we minder maken dankzij OV, tussenvariantie

New cards

Sum of squares Residuel (SSr)

fouten die we toch nog maken ondanks de info van de ov (within group variance), binnenvariantie

New cards

Sum of squares total (SSt)

totale variantie tov. algemene gemiddelde dat we willen verklaren.

New cards

contrasten

twee specifieke groepsgemiddeldes met elkaar vergelijken

New cards

Post-hoc test

alle groepen/condities met elkaar vergelijken en kijken welke siginificant zijn

New cards

ANCOVA

wil nagaan of de gemiddelden tussen groepen significant van elkaar verschillen; De invloed van de OV op de AV onderzoeken, nadat we de invloed van de covariaat hebben weggenomen

New cards

covariaat

Controle variabele, maakt geen deel uit van het experiment maar wordt toegevoegd om within variantie zo klein mog te houden voor een zuiver mog effect van OV op AV

New cards

Within participant sum of squareq (SSw)

variantie berekenen van de waarden op de AV binnen dezelfde persoon in x condities & dit omzetten naar SS

New cards

standard error

de standaardafwijking van de steekproefverdeling van die statistiek

New cards

p-waarde

De kans dat we een teststatistiek observeren **die minstens even extreem is als de geobserveerde teststatistiek** (in onze studie) als we aannemen dat de populatieparameter gelijk is aan de referentiewaarde”

New cards

statische significantie

de kans dat we onder de H0 een teststatistiek observeren die min. zo extreem is als de teststatistiek in onze steekproef

New cards

forced entry

alle variabelen in één keer toevoegen bij een meervoudige lineaire regressie

New cards

Hierarchical/blockwise Entry

OV’s block per block toevoegen bij een meervoudige lineaire regressieanalyse

New cards

simple slopes analysis

opvolganalyse via analyse van regressiecoëfficiënt van x in de voorspelling op y op bepaalde waarden van de moderator