Looks like no one added any tags here yet for you.
PSE
is ruwe schatting van de fout in de lijn (hierdoor is slecht in te schatten of de effecten significant zijn
hoe bereken je SD?
Verwijder niet significante coeffienten (factoren uit het model) waarbij p kleiner wordt
voer meer metingen uit (voeg centrumpunten toe
repliceren
nogmaals meten
ruis
niet significante factoren
hoe constateer je of effect significant is of ruis?
voer analyse nogmaals uit en neem niet significante factoren weg (p groter dan 0,05)
eisen voor multiple regressiemodel
Lineair in de parameter
De SD van residuen moet overal min of meer hetzelfde zijn (constant)
residuen mogen in tijd geen trends vertonen
R2 adjusted en R2 pred max 20%
matrixplot
onafhankelijke variabelen
residuenplots
residuen moeten normaal verdeeld zijn
anderson-darling toets
test of residuen normaal verdeeld zijn
Hoe bepala je of data normaal verdeeld is aan de hand van anderson darling test?
als p boven 0,05 zit wordt H0 behouden. H0 is verdeling wijkt niet af van normale verdeling
H0 hypothese bij anderson-darling test
verdeling wijkt niet af van normaal verdeling
durban watson test
gaan er vanuit dat de verdeling rondom 0 lijn random is, geen trend te zien is
Hoe valideer je je model bij weinig data?
leave one out cross validation (LOOCV)
Waar zegt R2 wat over?
over hoe goed de data wordt gefit door het model (zegt niets over hoe goed modellen een nieuwe response kunnen voorspellen
PRESS
wanneer is de kans op ruis groter
bij veel (overbodige factoren in een model, prediction wordt onnauwkeuriger.
wat gebeurd er met PRESS als de R2 pred kleiner wordt
deze wordt groter
automatisch emanieren om te bepalen welke factoren er in model gezet kunnen worden
Stepwise regression
Backward elemination regression
Forward selection regression
Forward information criteria
waarom zou je centrumpunten toevoegen?
kost minder werk dan het design repliceren. Dit meot gedaan worden als factoren niet verwijderd kunnen worden uit het model. Pure error kan niet berekend worden en SD van coefficenten neit verkregen.
voordelen van centrumpuntne toevoegen
kunnen berekenen van PE
Bepalen voor er sprake is van Lack of FIt
je kunt zien aan instellingen of er wel of geen trend is
curvature
een kwadraat (of meer) in het model en indien de p kleiner is dan 0,05 is curvature kwadraat term significant
hoe weet je of een model wel of geen lack of fit heeft?
als de gegeven p waarde bij lof groter is dan 0,05. h0 wordt dan neit verworpen
kan lof niet aanwezig zijn omdat curvature aanwezig is?
ja
wat is de H0 hypothese bij lof?
er is geen lof dus geen afwijking in het model
als bij LOF de p waarde kleiner is dan 0,05 betekend dit?
dat H0 hypothese wordt verworpen en er dus sprake is van lack of fit
als geen lof aanwezig is in het model moet de p waarde dan hoger of lager zijn dan 0,05?
deze meot hoger zijn
geen lof
betekend dat model goed bij data past
Randimisation
voorkomt trend door tijd. meet centrumpunten random en niet achter elkaar
significante curvature
kwadratische facotr (of meer) in het model nodig om data goed te beschrijven. Welke factor moet in kwadraat of meedere?
hoe bepaal je welke factor mogelijk in het kwadraat moet bij een significante curvature?
kijk naar residuplot per factor, bij kromming meot factor mogelijk in kwadraat. denk wel aan vrijheidsgraad
wat heb je nodig om kwadratisch model t ebeschrijven?
meer levels dan enkel -1 + 1, dit wordt gedaan door axial punten toe te voegen aan design
waarmee bepaal je de coeffienten voor kwadratische termen?
axiale punten, centrum punten en factoriale punten
central composite design
factor varieert in 5 levels
design is gebouwd op 2 level factoren of gefractioneerd design met een resolutie van V of hoger
kan in stappen worden uitgevoegd
retoorbaar
Roteerbaar zijn
op gelijke afstand van centrumpunt is variantie van bekende repsons hetzelfde
central composite circumscribed (CCC)
alpha is groter dan 1 of kleiner dan -1 en 5 levels voor elke factor
central composite face centered (CCF)
alpha is ongeveer 1, en 3 levels voor elke factor
Central composite inscribed (CCI)
alpha is 1, met 5 levels voor elke factor
axiale punten
punten op afstand van aplha gelegen vanaf het centrumpunt, alpha wordt zo gekozen dt het design roteerbaar of bolvorming is
hoeveel centrumpuntne nodig om LOF/ curvature te bepalen en PE?
minimaal 1, meestal 4
waarvoor is PE nodig?
bepalen significantie van LOF en coefficeinten
roteerbaar design
variantie voor elk voorspelde respons op gelijke afstand van het centrum
Box Behnken
bij repsonse surface regressie model (RSM) zijn kwadraten in regressiemodel toegevoegd
over fit model is te herkenenn aan
goede R2 slechte R2 predict
watvoor model heb je als je een goede r2 waarde hebt maar een slechte r2 precidt?
overfit model
Wanneer is een model onderfit?
slechte R2 en betere R2 predict
watvoor model heb je als je een slechter2 waarde hebt maar een goede 2 precidt?
onderfit model
model complexity
aantal variabelen in model
box cox transformatie
de residuene zijn niet normaal verdeeld en hebben geen constant variantie (trompet)
hoe krijs je residue wel normaal verdeeld?
door de respons te transformeren (log, 1/x of wortel x)
wat doe je als niet constante variantie constant krijgt
response transfromatie uitvoeren, welke bepaal je met de box cox methode
type 1
false positief
type 2 error
fals negatief
fout van eerste soort
zeggen dat de response significant groter is maar dat is niet zo, de grootte van deze fout is alpha, vaak 5%
wanneer meerdere malen dezelfde test wordt utigeoverd verwacht je een gauss curve. Als je een repsons hebt in het zwarte gebied, dan zeg je dat een significant ander repsons is. de neiwue instelling is de oorzaak. echter kan je ook zeggen dat deze repsons wel tot de populatie behoort die bij de eerste instellin hoort. dit is fout. wat voro fout is dit?
eerste soort fout (vals positief)
na het veranderen van de instellingen, meet je andere repsons en andere standaard deviatie. de repons valt nu in het blauwe gebied
dit is een type 1 fout, vals positief
na het veranderen van de instellingen, meet je andere repsons en andere standaard deviatie. de spronse valt nu in het rode gebied, je zegt dan dat de instellingen 2 geen significant andere respons geven
type 2 fout
hoe noem je respons in groen gebied?
significant ander repons (als deze voor het vernaderen van de instellingen in blauw zat
power
de mate van onderscheiding tussen respons 1 en 2 (voor en na verandering instellingen)
power instellingen
80% en aplha op 5%
wat bepaald de standaard deviatie in power?
welk verschil in repsons als significant wordt gezien
wanneer wordt SD (pure error) kleiner
als je meer centrumpunten meet
je meer factoren uti model haalt (meer vrijheidsgraad over voor error)
power
kans om verschil te detecteren
hoe bereken je power met aplha (type 1 fout)
kans dat de repons als significant verschil zien, maar dat is het niet. Je zegt dat het gemeten punt bija ndere populatie hoort, dit is niet zo
power beta
de kans dat we zeggen dat er geen significant verschil is in de respons terwijl dit wel zo is.
We zeggen dat het gemeten punt bij de H0 populatie hoort
maar is dit nie
standaard erorr
hoe precies je meet