Blok 6 'Introductie Statistische Methoden voor Data-analyse' Week 2 | Quizlet

0.0(0)

Studied by 0 people

Call Kai

Learn

Practice Test

Spaced Repetition

Match

Flashcards

Knowt Play

Card Sorting

1/43

There's no tags or description

Looks like no tags are added yet.

Last updated 8:13 PM on 6/30/26

Name	Mastery	Learn	Test	Matching	Spaced	Call with Kai	Chat

No analytics yet

Send a link to your students to track their progress

44 Terms

New cards

Risico (probability) vs. odds

- Stel je bent met zes mensen en je gaat lootjes trekken. Hoe groot is de kans en de oods dat je en bepaald persoon trekt?

- Risico (probability) --> 1 op 5

- Odds --> de kans dit dit gebeurt / de kans dit dit niet gebeurt = (1/5) / (4/5) = 1 op 4

New cards

Interpretatie odds

Voor elke keer dat je eindigt met die bepaald persoon, zijn er vier keren dat je niet met die persoon eindigt.

New cards

Wat kun je bij een case-control study niet berekenen?

Het relatieve risico, er kan namelijk geen schatting worden gemaakt van de prevalentie / incidentie.

New cards

Attributief risico

- Risico verschil

- Risk 1 (ziek, wel exposed) - Risk 2 (ziek, niet exposed)

New cards

Interpretatie attributief risico (AR = 0,10)

Blootgesteld worden aan de risicofactor doet het risico op de ziekte met 10% toenemen (additive scale).

New cards

Relatief risico

- Risico 1 (ziek, blootgesteld) / Risico 2 (ziek, niet blootgesteld)

- Mits tabel goed staat: a(a+b) / c(c+d)

New cards

Interpretatie relatief risico (RR = 1,5)

- Iemand die is blootgesteld aan de risicofactor krijgt met 1,5x meer waarschijnlijkheid de ziekte.

- OF: Blootgesteld worden aan de risicofactor doet de kans op ziekte met 50% toenemen.

New cards

Odds ratio

- Odds 1 / Odds 2

- Mits tabel goed staat: (A x D) / (B x C)

New cards

Interpretatie odds ratio (OR = 1,71)

- De odds voor iemand die is blootgesteld aan de risicofactor om de ziekte te krijgen is 1,71x de odds van iemand die niet is blootgesteld aan de risicofactor.

- OF: De odds voor het krijgen van de ziekte neemt 71% toe, wanneer iemand is blootgesteld aan de risicofactor.

New cards

Case control study (patiënt-controle design)

Mensen selecteren die de ziekte hebben, mensen selecteren die de ziekte niet hebben en vervolgens vragen naar exposure (zeldzame ziektes).

New cards

Aan de hand waarvan wordt bij een case control design de odds ratio berekend?

Aan de hand van prevalenties van de exposure.

New cards

Hoe verhouden het relatief risico en de odds ratio zich tot elkaar bij zeldzame ziekte?

Zeldzame ziektes (minder dan 5%) --> OR = (ongeveer) RR

New cards

Wanneer wordt de chi-kwadraattest gebruikt?

- Als zowel de X- als de Y-variabele categorisch (nominaal / ordinaal) zijn.

- Je gaat er vanuit dat de variabelen onafhankelijk zijn (geen relatie)

New cards

Wat is de chi-kwadraattest voor een test?

Een non-parametrische test --> doet geen aannames over de verdeling van gegevens in de populatie (lijkt er wel op).

New cards

Onder welke voorwaarden kunnen X en Y twee of meer niveaus hebben?

Op voorwaarde dat de groepen gevormd door X onafhankelijk zijn van elkaar (maar één groep per individu)

New cards

Chi-kwadraattest

- Is afhankelijk van een grote steekproef

- Gebruikt een theoretische kansverdeling --> Chi-kwadraat distributie

- Chi-kwadraat is een similarity value

New cards

Stappen Chi-kwadraattest

1. Maak op basis van de geobserveerde tabel een expected tabel (onder de assumptie dat H0 waar is).

--> rijtotaal x kolomtotaal / totaal

--> de kans dat iemand in een cel valt x n

2 Vergelijk de verwachtte waarden, als de nullhypothese waar is, met behulp van de teststatistiek chi, door de formule in te vullen)

-->SOMalle cellen (O - E)^2 / E

New cards

Wat wil je vergelijken met een chi-kwadraattest?

Risico 1 (ziek, blootgesteld) in vergelijking met risico 2 (ziek, niet blootgesteld)

New cards

Wat zegt de chi-kwadraattest wel / niet?

- Wel: Of er een relatie is

- Niet: richting en sterkte van de relatie

New cards

Sampling distributie

- Theoretische set van alle mogelijke X(bar (estimates / sample means) die we zouden kunnen krijgen. Hierbij is de n altijd hetzelfde.

- m.a.w. als we de true mean van een populatie weten, hoe waarschijnlijk is het dat bepaalde steekproefgemiddelden naar voren komen wanneer we data verzamelen.

- Helpt bij inferentie

New cards

Inferentie

Uitspraken doen over de populatie op basis van de steekproef.

New cards

Central limit theorem

Als de individuen uit de populatie die getrokken zijn voor de steekproef onafhankelijk zijn EN als de grootte van de steekproef (n) maar groot genoeg is (∞) OF de distributie van de individuen bij benadering normaal verdeeld is, dan zal de sampling distributie ook normaal verdeeld zijn.

New cards

Standaard error

- Vertelt dat, hoewel we verwachten dat het steekproefgemiddelde gelijk is aan het populatiegemiddelde, dit niet zo zal zijn. Het zal een beetje erboven of eronder zitten.

- De standaard error geeft een idee hoe ver of eigenlijk hoe dichtbij een steekproefgemiddelde (estimate) gemiddeld zal afwijken van het populatiegemiddelde.

New cards

Wat gebeurt er met de standaard error als n toeneemt?

Als n groter wordt, wordt de standaard error kleiner. Het steekproefgemiddelde komt dus dichter bij de true mean te liggen.

New cards

Wat is de verdeling van X(bar) bij een samplingdistributie?

X(bar) varieert volgens de normaalverdeling.

New cards

Sampling error (variatie) als gevolg van sampling

- Verschillende steekproeven van dezelfde populatie zullen verschillende residuen geven.

- Sampling error is altijd aanwezig.

New cards

Confidence interval

- Een range waarvan we redelijk zeker zijn dat de populatieparameter (mean) erbinnen ligt.

- Geeft aan hoe nauwkeurig onze estimate waarschijnlijk is.

New cards

Waarvan hangt de breedte (width) van een betrouwbaarheidsinterval af?

- Variatie binnen de populatie --> als er weinig variatie is in de populatie, zal er ook weinig variatie zijn in de steekproef en zal het betrouwbaarheidsinterval smal zijn (en andersom).

- Steekproefgrootte --> kleiner steekproef betekent minder informatie en meer verschil tussen de steekproeven, wat leidt tot een groter betrouwbaarheidsinterval (en andersom).

New cards

Wat weet je bij een sampling distributie volgens de 68-95-99.7% regel?

Ongeveer 95% van de sample means die we zouden kunnen krijgen zullen zich bevinden binnen twee standaarddeviatie van de mean.

New cards

Waarom is het nuttig om te weten dat 95% van de sample means zich bevindt binnen twee standaarddeviatie van de mean?

- In ongeveer 95% van de gevallen zal X(bar) binnen ± 2 SD van µ liggen.

- Dit betekent ook dat in 95% van de gevallen µ binnen ± 2 SD van X(bar) zal liggen.

New cards

Wanneer gebruik je de kritisch waarde t in plaats van z?

Als je standaarddeviatie van de populatie mean niet weet.

New cards

Interpretatie betrouwbaarheidsinterval

- We zijn 95% CONFIDENT dat het interval de true (populatie) mean bevat.

- Normaliter trek je namelijk maar één steekproef. We weten hierbij niet welke steekproef we hebben getrokken en wat dus ons betrouwbaarheidsinterval is. Bij betrouwbaarheidsintervallen van bepaalde steekproeven is de kans 100% dat de populatie mean erbinnen valt, bij andere is de kans 0%. Daarom zeg je niet kans maar confidence.

New cards

Normal based betrouwbaarheidsintervallen

- Hierbij wordt de mate van confidence gespecificeerd (bijv. 95%).

- Hoe zekerder we willen zijn, hoe groter het betrouwbaarheidsinterval.

- Hoe groter de t-waarde, hoe groter het betrouwbaarheidsinterval.

New cards

Welke summary statistieken gebruik je bij welke soorten variabelen?

- Continue variabelen --> mean, mediaan

- Categorische variabelen --> risico of odds (per groep samenvatten)

New cards

Kruistabel

Combinatie frequentietabellen

New cards

Hoe verhouden het relatieve risico en de odds ratio zich tot elkaar?

- RR > 1 als OR > 1

- RR < 1 als OR < 1

- RR = 1 als OR = 1

New cards

Waarom maken we gebruik van chi-kwadraat om samen te vatten (en niet alleen RR en OR)?

RR en OR zijn alleen mogelijk bij een 2x2 kruistabel.

New cards

Interpretatie chi-kwadraat

- Hoe dichter bij 0, hoe meer support voor onafhankelijkheid (geen relatie).

- Hoe verder weg van 0, hoe meer support voor afhankelijkheid (wel relatie).

New cards

Wanneer is de steekproef groot genoeg?

Bij n > 25 / 30 --> dan is de sampling distributie normaal verdeeld.

New cards

Parameter

De waarde van een variabele die de populatie kenmerkt.

New cards

Statistiek

De waarde van een variabele die de steekproef kenmerkt.

New cards

Kenmerken t-distributie

- Symmetrisch (wel lagere piek en langere staarten dan z-distributie)

- Centered on 0

- Hangt af van de steekproef

New cards

Waarom gebruiken we een betrouwbaarheidsinterval?

X(bar) is een goede point estimate, maar door gebruik te maken van een cofidence interval, kun je met meer zekerheid zeggen dat het interval de true mean bevat.

New cards

Hoe verhouden de populatie mean en de mean van de sampling distributie zich tot elkaar?

Ze zijn gelijk.