1/43
Looks like no tags are added yet.
Name | Mastery | Learn | Test | Matching | Spaced | Call with Kai | Chat |
|---|
No analytics yet
Send a link to your students to track their progress
Risico (probability) vs. odds
- Stel je bent met zes mensen en je gaat lootjes trekken. Hoe groot is de kans en de oods dat je en bepaald persoon trekt?
- Risico (probability) --> 1 op 5
- Odds --> de kans dit dit gebeurt / de kans dit dit niet gebeurt = (1/5) / (4/5) = 1 op 4
Interpretatie odds
Voor elke keer dat je eindigt met die bepaald persoon, zijn er vier keren dat je niet met die persoon eindigt.
Wat kun je bij een case-control study niet berekenen?
Het relatieve risico, er kan namelijk geen schatting worden gemaakt van de prevalentie / incidentie.
Attributief risico
- Risico verschil
- Risk 1 (ziek, wel exposed) - Risk 2 (ziek, niet exposed)
Interpretatie attributief risico (AR = 0,10)
Blootgesteld worden aan de risicofactor doet het risico op de ziekte met 10% toenemen (additive scale).
Relatief risico
- Risico 1 (ziek, blootgesteld) / Risico 2 (ziek, niet blootgesteld)
- Mits tabel goed staat: a(a+b) / c(c+d)
Interpretatie relatief risico (RR = 1,5)
- Iemand die is blootgesteld aan de risicofactor krijgt met 1,5x meer waarschijnlijkheid de ziekte.
- OF: Blootgesteld worden aan de risicofactor doet de kans op ziekte met 50% toenemen.
Odds ratio
- Odds 1 / Odds 2
- Mits tabel goed staat: (A x D) / (B x C)
Interpretatie odds ratio (OR = 1,71)
- De odds voor iemand die is blootgesteld aan de risicofactor om de ziekte te krijgen is 1,71x de odds van iemand die niet is blootgesteld aan de risicofactor.
- OF: De odds voor het krijgen van de ziekte neemt 71% toe, wanneer iemand is blootgesteld aan de risicofactor.
Case control study (patiënt-controle design)
Mensen selecteren die de ziekte hebben, mensen selecteren die de ziekte niet hebben en vervolgens vragen naar exposure (zeldzame ziektes).
Aan de hand waarvan wordt bij een case control design de odds ratio berekend?
Aan de hand van prevalenties van de exposure.
Hoe verhouden het relatief risico en de odds ratio zich tot elkaar bij zeldzame ziekte?
Zeldzame ziektes (minder dan 5%) --> OR = (ongeveer) RR
Wanneer wordt de chi-kwadraattest gebruikt?
- Als zowel de X- als de Y-variabele categorisch (nominaal / ordinaal) zijn.
- Je gaat er vanuit dat de variabelen onafhankelijk zijn (geen relatie)
Wat is de chi-kwadraattest voor een test?
Een non-parametrische test --> doet geen aannames over de verdeling van gegevens in de populatie (lijkt er wel op).
Onder welke voorwaarden kunnen X en Y twee of meer niveaus hebben?
Op voorwaarde dat de groepen gevormd door X onafhankelijk zijn van elkaar (maar één groep per individu)
Chi-kwadraattest
- Is afhankelijk van een grote steekproef
- Gebruikt een theoretische kansverdeling --> Chi-kwadraat distributie
- Chi-kwadraat is een similarity value
Stappen Chi-kwadraattest
1. Maak op basis van de geobserveerde tabel een expected tabel (onder de assumptie dat H0 waar is).
--> rijtotaal x kolomtotaal / totaal
--> de kans dat iemand in een cel valt x n
2 Vergelijk de verwachtte waarden, als de nullhypothese waar is, met behulp van de teststatistiek chi, door de formule in te vullen)
-->SOMalle cellen (O - E)^2 / E
Wat wil je vergelijken met een chi-kwadraattest?
Risico 1 (ziek, blootgesteld) in vergelijking met risico 2 (ziek, niet blootgesteld)
Wat zegt de chi-kwadraattest wel / niet?
- Wel: Of er een relatie is
- Niet: richting en sterkte van de relatie
Sampling distributie
- Theoretische set van alle mogelijke X(bar (estimates / sample means) die we zouden kunnen krijgen. Hierbij is de n altijd hetzelfde.
- m.a.w. als we de true mean van een populatie weten, hoe waarschijnlijk is het dat bepaalde steekproefgemiddelden naar voren komen wanneer we data verzamelen.
- Helpt bij inferentie
Inferentie
Uitspraken doen over de populatie op basis van de steekproef.
Central limit theorem
Als de individuen uit de populatie die getrokken zijn voor de steekproef onafhankelijk zijn EN als de grootte van de steekproef (n) maar groot genoeg is (∞) OF de distributie van de individuen bij benadering normaal verdeeld is, dan zal de sampling distributie ook normaal verdeeld zijn.
Standaard error
- Vertelt dat, hoewel we verwachten dat het steekproefgemiddelde gelijk is aan het populatiegemiddelde, dit niet zo zal zijn. Het zal een beetje erboven of eronder zitten.
- De standaard error geeft een idee hoe ver of eigenlijk hoe dichtbij een steekproefgemiddelde (estimate) gemiddeld zal afwijken van het populatiegemiddelde.
Wat gebeurt er met de standaard error als n toeneemt?
Als n groter wordt, wordt de standaard error kleiner. Het steekproefgemiddelde komt dus dichter bij de true mean te liggen.
Wat is de verdeling van X(bar) bij een samplingdistributie?
X(bar) varieert volgens de normaalverdeling.
Sampling error (variatie) als gevolg van sampling
- Verschillende steekproeven van dezelfde populatie zullen verschillende residuen geven.
- Sampling error is altijd aanwezig.
Confidence interval
- Een range waarvan we redelijk zeker zijn dat de populatieparameter (mean) erbinnen ligt.
- Geeft aan hoe nauwkeurig onze estimate waarschijnlijk is.
Waarvan hangt de breedte (width) van een betrouwbaarheidsinterval af?
- Variatie binnen de populatie --> als er weinig variatie is in de populatie, zal er ook weinig variatie zijn in de steekproef en zal het betrouwbaarheidsinterval smal zijn (en andersom).
- Steekproefgrootte --> kleiner steekproef betekent minder informatie en meer verschil tussen de steekproeven, wat leidt tot een groter betrouwbaarheidsinterval (en andersom).
Wat weet je bij een sampling distributie volgens de 68-95-99.7% regel?
Ongeveer 95% van de sample means die we zouden kunnen krijgen zullen zich bevinden binnen twee standaarddeviatie van de mean.
Waarom is het nuttig om te weten dat 95% van de sample means zich bevindt binnen twee standaarddeviatie van de mean?
- In ongeveer 95% van de gevallen zal X(bar) binnen ± 2 SD van µ liggen.
- Dit betekent ook dat in 95% van de gevallen µ binnen ± 2 SD van X(bar) zal liggen.
Wanneer gebruik je de kritisch waarde t in plaats van z?
Als je standaarddeviatie van de populatie mean niet weet.
Interpretatie betrouwbaarheidsinterval
- We zijn 95% CONFIDENT dat het interval de true (populatie) mean bevat.
- Normaliter trek je namelijk maar één steekproef. We weten hierbij niet welke steekproef we hebben getrokken en wat dus ons betrouwbaarheidsinterval is. Bij betrouwbaarheidsintervallen van bepaalde steekproeven is de kans 100% dat de populatie mean erbinnen valt, bij andere is de kans 0%. Daarom zeg je niet kans maar confidence.
Normal based betrouwbaarheidsintervallen
- Hierbij wordt de mate van confidence gespecificeerd (bijv. 95%).
- Hoe zekerder we willen zijn, hoe groter het betrouwbaarheidsinterval.
- Hoe groter de t-waarde, hoe groter het betrouwbaarheidsinterval.
Welke summary statistieken gebruik je bij welke soorten variabelen?
- Continue variabelen --> mean, mediaan
- Categorische variabelen --> risico of odds (per groep samenvatten)
Kruistabel
Combinatie frequentietabellen
Hoe verhouden het relatieve risico en de odds ratio zich tot elkaar?
- RR > 1 als OR > 1
- RR < 1 als OR < 1
- RR = 1 als OR = 1
Waarom maken we gebruik van chi-kwadraat om samen te vatten (en niet alleen RR en OR)?
RR en OR zijn alleen mogelijk bij een 2x2 kruistabel.
Interpretatie chi-kwadraat
- Hoe dichter bij 0, hoe meer support voor onafhankelijkheid (geen relatie).
- Hoe verder weg van 0, hoe meer support voor afhankelijkheid (wel relatie).
Wanneer is de steekproef groot genoeg?
Bij n > 25 / 30 --> dan is de sampling distributie normaal verdeeld.
Parameter
De waarde van een variabele die de populatie kenmerkt.
Statistiek
De waarde van een variabele die de steekproef kenmerkt.
Kenmerken t-distributie
- Symmetrisch (wel lagere piek en langere staarten dan z-distributie)
- Centered on 0
- Hangt af van de steekproef
Waarom gebruiken we een betrouwbaarheidsinterval?
X(bar) is een goede point estimate, maar door gebruik te maken van een cofidence interval, kun je met meer zekerheid zeggen dat het interval de true mean bevat.
Hoe verhouden de populatie mean en de mean van de sampling distributie zich tot elkaar?
Ze zijn gelijk.