H5: Interferentie en markovketen Monte Carlo

0.0(0)

Studied by 0 people

Call Kai

Learn

Practice Test

Spaced Repetition

Match

Flashcards

Knowt Play

Card Sorting

1/17

Earn XP

Description and Tags

modsim

Last updated 5:12 PM on 6/20/26

Name	Mastery	Learn	Test	Matching	Spaced	Call with Kai

No analytics yet

Send a link to your students to track their progress

18 Terms

New cards

Wat houdt de Bayesiaanse denkwijze in om een parameter te schatten?

De Bayesiaanse denkwijze gebruikt waarschijnlijkheden om onzekerheid over parameters te modelleren. In plaats van één vaste waarde te berekenen, updatet het je voorkennis over een parameter op basis van nieuw geobserveerde data met behulp van de regel van Bayes.

New cards

Wat zijn de 4 distributies die een rol spelen bij het Bayesiaans updaten?

Prior: Initiële schatting/kennis vóór observatie.
Likelihood: Waarschijnlijkheid van de data gegeven de parameter.
Posterior: De geüpdatete schatting na het zien van de data.
Evidence (modelbewijs): Hoe waarschijnlijk het model de data genereert over alle mogelijke parameterwaarden (normalisatieconstante).

New cards

Leg het verschil uit tussen MLE (Maximum Likelihood Estimation) en MAP (Maximum A Posteriori).

MLE: Schat de parameter die de waargenomen data het meest waarschijnlijk maakt (0*_ML = argmaxP(D|0)) en negeert de prior.

MAP: Schat de parameter die de posterior het meest waarschijnlijk maakt (0*_ML = argmaxP(D|0)P(0)) en combineert dus de prior en de likelihood.

New cards

Wat is het verschil tussen een informatieve, zwak informatieve en diffuse/niet-informatieve prior?

Informatief: Bevat sterke voorkennis, maar kan zorgen voor bias.

Zwak informatief: Erkent een deel voorkennis, met minder kans op bias.

Diffuus / niet-informatief: Minimale voorkennis; de schatting wordt volledig datagedreven (bijv. een uniforme prior).

New cards

Waarom werken we in de Bayesiaanse statistiek vaak met ongenormaliseerde distributies en wat is de rol van de normalisatieconstante?

De normalisatieconstante (evidence) is vaak extreem moeilijk direct te berekenen. Omdat relatieve waarschijnlijkheden belangrijker zijn dan absolute waarden, werken we vaak met de ongenormaliseerde vorm (prior x likelihood).

De constante zelf zorgt er puur voor dat de posterior netjes tot 1 integreert.

New cards

Hoe werkt Rejection Sampling in het kort?

Je wilt samplen uit een moeilijke doeldistributie p(x). Je kiest een makkelijke voorstelverdeling q(x) die (na vermenigvuldiging met een constante M) volledig boven p(x) ligt. Je trekt samples uit q(x) en accepteert of verwerpt ze op basis van de kansverhouding tussen p(x) en Mq(x).

New cards

Waarom schaalt Rejection Sampling slecht naar hoog-dimensionele problemen?

In hoge dimensies wordt het overlappingsgebied tussen p(x) en q(x) erg klein. Om te garanderen dat Mq(x) >= p(x), moet M gigantisch groot gekozen worden. Hierdoor keldert de acceptatiekans snel naar bijna nul en worden vrijwel alle samples verworpen.

New cards

Wat is de mixing time van een Markov-keten?

Het is de tijd (het aantal stappen) die een Markov-keten nodig heeft om dicht genoeg bij zijn stationaire verdeling (de doeldistributie) te komen, ongeacht de startwaarde. Een snellere mixing time betekent dat je sneller betrouwbare samples krijgt.

New cards

Wat zijn pseudosamples bij MCMC en hoe verschillen ze van gewone samples?

Pseudosamples zijn opeenvolgende samples gegenereerd door een Markov-keten.

Itt gewone samples zijn ze niet onafhankelijk van elkaar (ze zijn gecorreleerd vanwege de random walk). Als de keten echter goed gemixt is en er genoeg tijd tussen zit, representeren ze wel correct de doeldistributie.

New cards

Wat is het basisprincipe van Metropolis-Hastings (MH) en wat moet je zelf ontwerpen?

MH genereert een keten door telkens een nieuwe kandidaat-sample x* voor te stellen op basis van de huidige sample x_t via een voorstelverdeling q(x*|x_t). De kandidaat wordt met een bepaalde acceptatiekans alpha goedgekeurd of geweigerd. Je moet zelf de voorstelverdeling q ontwerpen/kiezen, wat de efficiëntie bepaalt.

New cards

Wanneer werkt Metropolis-Hastings slecht?

Bij multimodale verdelingen (meerdere pieken gescheiden door diepe dalen) of heel scherpe verdelingen. De keten blijft dan hangen in één piek (slechte mixing) of weigert te veel stappen, wat leidt tot lange platte stukken in de traceplot.

New cards

Wat is er bijzonder aan Gibbs sampling?

Het is een speciaal geval van MH waarbij je de variabelen één voor één bijwerkt. Je samplet een nieuwe waarde voor variabele X_i conditioneel op de huidige waarden van alle andere variabelen. Bijzonderheid: er is geen acceptatiestap nodig (elke voorgestelde stap wordt geaccepteerd).

New cards

Hoe werkt Hamiltonian Monte Carlo (HMC) en wat is het voordeel t.o.v. simpele MCMC?

HMC gebruikt fysische Hamiltoniaanse dynamica, gradiëntinformatie en leapfrog-integratie om doelgericht door de parameterruimte te bewegen in plaats van doelloze random walk-stapjes te nemen.

Voordeel: De pseudosamples zijn veel minder gecorreleerd, de keten mixt beter en kan heel efficiënt grote sprongen maken, ook in hoge dimensies.

New cards

Wat zijn de nadelen van Hamiltonian Monte Carlo (HMC)?

Het vereist aanzienlijk meer rekenkracht per sample.
Het heeft gradiënten nodig en werkt dus enkel voor continue modellen (niet voor discrete variabelen).
Het vereist zorgvuldige tuning van hyperparameters (stapgrootte epsilon en aantal leapfrog-stappen L) (tenzij je NUTS gebruikt, dat dit automatisch doet ).

New cards

Hoe herken je de paden van Gibbs vs. HMC vs. MH op een visualisatie?

Gibbs sampling: Volgt een trapvormig pad met perfect rechte, afwisselend horizontale en verticale lijnen (omdat er 1 variabele per keer verandert).
HMC / NUTS: Lange, vloeiende en gebogen paden die efficiënt grote afstanden afleggen.
Metropolis-Hastings: Korte, grillige random-walk stapjes met veel herhalingen op dezelfde plek (bij weigering).

New cards

Wat is de Effective Sample Size (ESS) en waarom is deze lager dan het totaal aantal samples?

De ESS drukt uit hoeveel onafhankelijke samples je verzameling in feite waard is qua informatie. Omdat MCMC-samples onderling gecorreleerd zijn (de volgende stap hangt af van de vorige), bevatten ze minder unieke informatie dan puur onafhankelijke (IID) trekkingen, waardoor de ESS altijd lager is dan de ketenlengte.

New cards

Wat zijn kenmerken van een goed gedragende vs. slecht gedragende MCMC-keten?

Goed: De traceplot ziet eruit als een "fuzzy caterpillar" (vlot bewegend zonder trend), de densityplot heeft stabiele toppen, en de autocorrelatie daalt snel naar nul.
Slecht: Lange platte stukken in de traceplot (te veel weigeringen), trage golvende trends (drift), of de keten blijft hangen in één subregio.

New cards

Hoe kun je een slecht-gedragende keten oplossen?

De stapgrootte/proposal herkalibreren (groter of kleiner maken).

Reparametrisatie toepassen om de parameterruimte beter te schalen.
Overstappen op een geavanceerdere sampler (zoals HMC/NUTS of Adaptive MH).
Bij multimodale verdelingen: meerdere chains starten met verschillende startwaarden of technieken zoals tempering gebruiken.