N

studied byStudied by 2 people
0.0(0)
Get a hint
Hint

Good of Fit

1 / 77

encourage image

There's no tags or description

Looks like no one added any tags here yet for you.

78 Terms

1

Good of Fit

maat over hoe goed een statistisch model past bij reeks waarnemingen

New cards
2

Lack of Fit

hoe slecht het past (H= geen lof)

New cards
3

wat doe je bij hoge lof?

mogelijk linear naar kwadraat verband gaan of y transformeren naar In of log

New cards
4

meet in hoeverre model in staat is bepaalde uitkomst te voorspellen

New cards
5

R² adjusted

houdt rekening met voorspellers en variabelen en bestraft de toevoeging van onnodige variabelen

New cards
6

R² Pred

New cards
7

R² = 0

slecht

New cards
8

R² = 1

goed wordt beter bij meerdere waarde

New cards
9

Uitbijter

outlier en leverage point

New cards
10

leverage point

extreme x waarde

New cards
11

outlier

extreme y waarde

New cards
12

uitbijter bepaal je met cooks distance

CD² groter dan 1

New cards
13

autocorrelatie

systematische samenhang tussen 2 grootheden → je wilt geen correlatie

New cards
14

durban watson

rond 2 is goed geen correlatie andere inclusief zegt niet of er wel of geen correlatie is

New cards
15

residual

fout goeveel je ernaast zit

New cards
16

error

afstand van 1 punt tot lijn van gemiddelde lengte van lijn

New cards
17

regressie

samenhang tussen 2 variabelen

New cards
18

wat voorspel je met regressiemodel?

voorspel de waarde van afhankelijke variabelen op basis van de waarde van 1 of meer onafhankelijke variabelen

New cards
19

wat is de beste lijn?

lijn waarbij het totaal van gewaarde afwijking (error)kleinst is

New cards
20

CI (betrouwbaarheidsinterval)

waarde valt waarschijnlijk in gegeven interval van 95%

New cards
21

PI (predicted interval)

schatting van interval waarin nieuwe waarde gaat vallen (in welk interval nieuwe y valt bij gegeven x)

New cards
22

R²=0 betekend

geen correlatie, een kromme lijn is dan beter. want deze gaat beter door data en verklaard de data beter

New cards
23

grote R² (1)

betekend niet gelijk dat model beter kan voorspelen met kleine PI

New cards
24

influentiel punt

effect op waarde als deze wel of niet wordt meegenomen in model (waarde zoals SD, R² of coefficienten)

New cards
25

groot residu

punt ver van lijn

New cards
26

LINE

L- check lijn van scatterplot

I- independent

N-normaal verdeeld (anderson darling)

E-equivalent verdeeld

New cards
27

Equivalent verdeeld

spreiding van residuen rondom het gemiddelde 0 bij alle waarde ongeveer hetzelfde is

New cards
28

Durban watson

checkt correlatie, bij 2 is geen correlatie

New cards
29

positieve steriele correlatie

pauze in dezelfde stapgrootte

New cards
30

negatieve steriele correlatie

van plus naar min

New cards
31

bij niet normale verdeling?

  • box cox transformatie

  • wortel (zwakke correlatie)

  • log normaal (meest gebruikt) of log 10

  • 1/x (sterke correlatie)

New cards
32

heteroscadastiteit

variantie neemt toe (klustering) met x waarde (dus niet equivalent verdeeld)

New cards
33

Hoe los je heteroscadastitiet op?

  • y waarde transformeren

  • wortel trekken van y waarde (milde manier)

  • 1/Y (forse manier)

    • log/In van y nemen

New cards
34

Wat doe je als je geen rechte lijn hebt van waarnemingen?

kwadraat toevoegen

New cards
35

Co-lineariteit

New cards
36

wortel VIF

factor waarmee de SD van variabelen is toegenomen tov als er geen correlatie ou zijn

New cards
37

VIF = 5 of hoger

sterk gecorreleerd, gooi eruit

New cards
38

Waar kijkt stepwijze naar? welke waarde verwijderd het?

gooit eruit gebaseerd op p waarde

New cards
39

Hoe bepaal je welke variabelen je in kwadraat moet zetten?

kijk naar residuplot per variabelen. Zijn redisuen plot per predictor gebogen? voeg hier kwadraat toe

New cards
40

Orthogonale desigb

onafhankelijke design (zorgt voor makkelijke interpetatie)

New cards
41

Waarom verwijder je factoren of interacties voor vrijheidsgraden?

Voor SS error → PE wordt kleiner significant factoren veranderd

New cards
42

wat gebeurd er als PE kleiner wordt door verwijderd factoren?

significantie van interactie veranderd

New cards
43

Experimenteel design

collectie van methode om experimenten op systematische manier te plannen waardoor max. informatie verkregen wordt (slim plannen)

New cards
44

factorial design

hoog en laag niveau (2 niveaus)

New cards
45

Interactie

effect op afhankelijke variabelen (y) van onafhankelijke variabelen afhankelijk van waarde van andere onafhankelijke waarde

New cards
46

wanneer is geen interactie te zien?

als lijn paralel loopt

New cards
47

PSE

ruwe schatting van fout in lijn (slecht te schatten of interactie significant is)

New cards
48

hoe bereken je de significantie van interactie (dus niet via plot)

bereken SD van fout verwijder niet significante coefficienten

New cards
49

ruis

niet significante coefficienten (p waarde boven 0,05. h0= niet significant)

New cards
50

eisen regressie model

  • linear in parameters

  • onafhankelijke variabelen

  • residuen normaal verdeeld

  • SD = constant

  • reisuden mogen geen trend in lijn laten zien

    • R² adjusted en predicted max 20%

New cards
51

geen trend als

de verdeling rondom 0 lijn random is (test met durban watson test → correlatie)

New cards
52

wat gebeurd er als je overbodige factoren in de model laat?

bij prediction test zorgt dit voor ruis → predictie is niet nauwkeurig (groter interval) → kleine R² → grote PRESS

New cards
53

Centrumpunten

hoeft geen factor te verwidjeren om PE en SD van coefficenten te kunnen bepalen (4 of 5 cnpt)

New cards
54

waarom voer je centrumpunt meetingen uit?

  • om lof te kunnen bepalen

  • om te kunnen bepalen of er PE is

    • om te zein of curvature aanwezig is

New cards
55

Curvature

betekend 1 kwadrant of meer nodig in model als curvature aanwezig is . H0= is geen curvature Ha= significante kromming

New cards
56

Axiaal punt

zorgt ervoor dat design kan roteren ( bepaal door a op bepaalde afstand vanaf centrumpunt te plaatsen

New cards
57

algemene structuur CCD (central composite design)

2^k factoren + 2k axiaal punten + Nc centrumpunten (met deze waarde kunnen coefficienten die voor kwadratische termen staan bepaald worden)

New cards
58

Factorial 2^k moet minimaal .. zijn (tabel groen geel rood)

V of full liefst full

New cards
59

CCD

varieert over 5 levels, resolutie is V of hoger (full), moet roteerbaar zijn doordat a op gelijke afstand wort geplaats van centrumpunten hierdoor is variantie van repsons hetzelfde

New cards
60

CCC (centrum composite circumsiced)

5 levels a is groter dan 1 en kleiner dan -1 (buiten)

New cards
61

CCF (Face)

3 levels, a +- 1 (op)

New cards
62

CCI (insribed)

level 5 a= 1 (in)

New cards
63

PE

nodig voor bepaling van significantie van LOF en coefficienten

New cards
64

pure error

occurs for repeated values of dependent variable, Y for a fixed value of independent variable, X.

New cards
65

Predicted error

ifference between the predicted values made by some model and the actual value

New cards
66

overfit model

goeie R² slechte R² predict

New cards
67

underfit model

slechte R² goeie R² predic

New cards
68

box cox transformatie gebruiken als

geen constante waarde hebt (trompet vorm) of data niet normaal verdeeld is

New cards
69

ED deisgn op 2 niveaus

hoog en laag (2^k)

New cards
70

ED design op 3 niveaus

Hoog, laag en midden (3^k)

New cards
71

full factorial deisgn met 3 factoren

2^4

New cards
72

Na meting vul je repsons in in factorial design. wat dan?

bekijk resultaten in pareto chart. zijn response significant? (rode lijn) zo niet haal laagste eruit (grootste VIF of p waarde) houd hoofdfactor erin

New cards
73

Variantie in plot

neet van verspreiding van reeks waarde

New cards
74

Hoe goed kan model nieuwe repons geven of voorspellen?

bij grote data

  • model met traning set en validatie

bij kleine data

-(leave one out cross validatie)

haal steeds 1 punt uit model

New cards
75

Wat gebeurd er als je veel factoren in desig hebt

geeft ruis minder factoren orgt voor betere verspreiding

New cards
76

Wanneer verwijder je geen factoren?

-als je model wil dupliceren

centrumpunten toegevoegd

New cards
77

Waarom moet je randomiser aanzetten?

voorkomt systematische afwijking door ctpt op verschillende momenten uti te voeren vormt zich geen trend

New cards
78

waneer gebruik ej blokken in ED?

als je alle experimentne niet onder dezelfde omstandigheden kan uitvoeren

New cards

Explore top notes

note Note
studied byStudied by 16 people
... ago
5.0(1)
note Note
studied byStudied by 13 people
... ago
5.0(1)
note Note
studied byStudied by 24 people
... ago
5.0(3)
note Note
studied byStudied by 13 people
... ago
5.0(1)
note Note
studied byStudied by 47 people
... ago
5.0(2)
note Note
studied byStudied by 10 people
... ago
5.0(1)
note Note
studied byStudied by 87 people
... ago
5.0(1)

Explore top flashcards

flashcards Flashcard (183)
studied byStudied by 6 people
... ago
5.0(1)
flashcards Flashcard (48)
studied byStudied by 3 people
... ago
5.0(1)
flashcards Flashcard (111)
studied byStudied by 32 people
... ago
5.0(4)
flashcards Flashcard (111)
studied byStudied by 38 people
... ago
5.0(1)
flashcards Flashcard (132)
studied byStudied by 34 people
... ago
5.0(1)
flashcards Flashcard (28)
studied byStudied by 19 people
... ago
5.0(1)
flashcards Flashcard (108)
studied byStudied by 6 people
... ago
5.0(1)
flashcards Flashcard (201)
studied byStudied by 22 people
... ago
4.0(1)
robot