N

0.0(0)
learnLearn
examPractice Test
spaced repetitionSpaced Repetition
heart puzzleMatch
flashcardsFlashcards
Card Sorting

1/77

encourage image

There's no tags or description

Looks like no tags are added yet.

Study Analytics
Name
Mastery
Learn
Test
Matching
Spaced

No study sessions yet.

78 Terms

1
New cards

Good of Fit

maat over hoe goed een statistisch model past bij reeks waarnemingen

2
New cards

Lack of Fit

hoe slecht het past (H= geen lof)

3
New cards

wat doe je bij hoge lof?

mogelijk linear naar kwadraat verband gaan of y transformeren naar In of log

4
New cards

meet in hoeverre model in staat is bepaalde uitkomst te voorspellen

5
New cards

R² adjusted

houdt rekening met voorspellers en variabelen en bestraft de toevoeging van onnodige variabelen

6
New cards

R² Pred

7
New cards

R² = 0

slecht

8
New cards

R² = 1

goed wordt beter bij meerdere waarde

9
New cards

Uitbijter

outlier en leverage point

10
New cards

leverage point

extreme x waarde

11
New cards

outlier

extreme y waarde

12
New cards

uitbijter bepaal je met cooks distance

CD² groter dan 1

13
New cards

autocorrelatie

systematische samenhang tussen 2 grootheden → je wilt geen correlatie

14
New cards

durban watson

rond 2 is goed geen correlatie andere inclusief zegt niet of er wel of geen correlatie is

15
New cards

residual

fout goeveel je ernaast zit

16
New cards

error

afstand van 1 punt tot lijn van gemiddelde lengte van lijn

17
New cards

regressie

samenhang tussen 2 variabelen

18
New cards

wat voorspel je met regressiemodel?

voorspel de waarde van afhankelijke variabelen op basis van de waarde van 1 of meer onafhankelijke variabelen

19
New cards

wat is de beste lijn?

lijn waarbij het totaal van gewaarde afwijking (error)kleinst is

20
New cards

CI (betrouwbaarheidsinterval)

waarde valt waarschijnlijk in gegeven interval van 95%

21
New cards

PI (predicted interval)

schatting van interval waarin nieuwe waarde gaat vallen (in welk interval nieuwe y valt bij gegeven x)

22
New cards

R²=0 betekend

geen correlatie, een kromme lijn is dan beter. want deze gaat beter door data en verklaard de data beter

23
New cards

grote R² (1)

betekend niet gelijk dat model beter kan voorspelen met kleine PI

24
New cards

influentiel punt

effect op waarde als deze wel of niet wordt meegenomen in model (waarde zoals SD, R² of coefficienten)

25
New cards

groot residu

punt ver van lijn

26
New cards

LINE

L- check lijn van scatterplot

I- independent

N-normaal verdeeld (anderson darling)

E-equivalent verdeeld

27
New cards

Equivalent verdeeld

spreiding van residuen rondom het gemiddelde 0 bij alle waarde ongeveer hetzelfde is

28
New cards

Durban watson

checkt correlatie, bij 2 is geen correlatie

29
New cards

positieve steriele correlatie

pauze in dezelfde stapgrootte

30
New cards

negatieve steriele correlatie

van plus naar min

31
New cards

bij niet normale verdeling?

  • box cox transformatie

  • wortel (zwakke correlatie)

  • log normaal (meest gebruikt) of log 10

  • 1/x (sterke correlatie)

32
New cards

heteroscadastiteit

variantie neemt toe (klustering) met x waarde (dus niet equivalent verdeeld)

33
New cards

Hoe los je heteroscadastitiet op?

  • y waarde transformeren

  • wortel trekken van y waarde (milde manier)

  • 1/Y (forse manier)

    • log/In van y nemen

34
New cards

Wat doe je als je geen rechte lijn hebt van waarnemingen?

kwadraat toevoegen

35
New cards

Co-lineariteit

36
New cards

wortel VIF

factor waarmee de SD van variabelen is toegenomen tov als er geen correlatie ou zijn

37
New cards

VIF = 5 of hoger

sterk gecorreleerd, gooi eruit

38
New cards

Waar kijkt stepwijze naar? welke waarde verwijderd het?

gooit eruit gebaseerd op p waarde

39
New cards

Hoe bepaal je welke variabelen je in kwadraat moet zetten?

kijk naar residuplot per variabelen. Zijn redisuen plot per predictor gebogen? voeg hier kwadraat toe

40
New cards

Orthogonale desigb

onafhankelijke design (zorgt voor makkelijke interpetatie)

41
New cards

Waarom verwijder je factoren of interacties voor vrijheidsgraden?

Voor SS error → PE wordt kleiner significant factoren veranderd

42
New cards

wat gebeurd er als PE kleiner wordt door verwijderd factoren?

significantie van interactie veranderd

43
New cards

Experimenteel design

collectie van methode om experimenten op systematische manier te plannen waardoor max. informatie verkregen wordt (slim plannen)

44
New cards

factorial design

hoog en laag niveau (2 niveaus)

45
New cards

Interactie

effect op afhankelijke variabelen (y) van onafhankelijke variabelen afhankelijk van waarde van andere onafhankelijke waarde

46
New cards

wanneer is geen interactie te zien?

als lijn paralel loopt

47
New cards

PSE

ruwe schatting van fout in lijn (slecht te schatten of interactie significant is)

48
New cards

hoe bereken je de significantie van interactie (dus niet via plot)

bereken SD van fout verwijder niet significante coefficienten

49
New cards

ruis

niet significante coefficienten (p waarde boven 0,05. h0= niet significant)

50
New cards

eisen regressie model

  • linear in parameters

  • onafhankelijke variabelen

  • residuen normaal verdeeld

  • SD = constant

  • reisuden mogen geen trend in lijn laten zien

    • R² adjusted en predicted max 20%

51
New cards

geen trend als

de verdeling rondom 0 lijn random is (test met durban watson test → correlatie)

52
New cards

wat gebeurd er als je overbodige factoren in de model laat?

bij prediction test zorgt dit voor ruis → predictie is niet nauwkeurig (groter interval) → kleine R² → grote PRESS

53
New cards

Centrumpunten

hoeft geen factor te verwidjeren om PE en SD van coefficenten te kunnen bepalen (4 of 5 cnpt)

54
New cards

waarom voer je centrumpunt meetingen uit?

  • om lof te kunnen bepalen

  • om te kunnen bepalen of er PE is

    • om te zein of curvature aanwezig is

55
New cards

Curvature

betekend 1 kwadrant of meer nodig in model als curvature aanwezig is . H0= is geen curvature Ha= significante kromming

56
New cards

Axiaal punt

zorgt ervoor dat design kan roteren ( bepaal door a op bepaalde afstand vanaf centrumpunt te plaatsen

57
New cards

algemene structuur CCD (central composite design)

2^k factoren + 2k axiaal punten + Nc centrumpunten (met deze waarde kunnen coefficienten die voor kwadratische termen staan bepaald worden)

58
New cards

Factorial 2^k moet minimaal .. zijn (tabel groen geel rood)

V of full liefst full

59
New cards

CCD

varieert over 5 levels, resolutie is V of hoger (full), moet roteerbaar zijn doordat a op gelijke afstand wort geplaats van centrumpunten hierdoor is variantie van repsons hetzelfde

60
New cards

CCC (centrum composite circumsiced)

5 levels a is groter dan 1 en kleiner dan -1 (buiten)

61
New cards

CCF (Face)

3 levels, a +- 1 (op)

62
New cards

CCI (insribed)

level 5 a= 1 (in)

63
New cards

PE

nodig voor bepaling van significantie van LOF en coefficienten

64
New cards

pure error

occurs for repeated values of dependent variable, Y for a fixed value of independent variable, X.

65
New cards

Predicted error

ifference between the predicted values made by some model and the actual value

66
New cards

overfit model

goeie R² slechte R² predict

67
New cards

underfit model

slechte R² goeie R² predic

68
New cards

box cox transformatie gebruiken als

geen constante waarde hebt (trompet vorm) of data niet normaal verdeeld is

69
New cards

ED deisgn op 2 niveaus

hoog en laag (2^k)

70
New cards

ED design op 3 niveaus

Hoog, laag en midden (3^k)

71
New cards

full factorial deisgn met 3 factoren

2^4

72
New cards

Na meting vul je repsons in in factorial design. wat dan?

bekijk resultaten in pareto chart. zijn response significant? (rode lijn) zo niet haal laagste eruit (grootste VIF of p waarde) houd hoofdfactor erin

73
New cards

Variantie in plot

neet van verspreiding van reeks waarde

74
New cards

Hoe goed kan model nieuwe repons geven of voorspellen?

bij grote data

  • model met traning set en validatie

bij kleine data

-(leave one out cross validatie)

haal steeds 1 punt uit model

75
New cards

Wat gebeurd er als je veel factoren in desig hebt

geeft ruis minder factoren orgt voor betere verspreiding

76
New cards

Wanneer verwijder je geen factoren?

-als je model wil dupliceren

centrumpunten toegevoegd

77
New cards

Waarom moet je randomiser aanzetten?

voorkomt systematische afwijking door ctpt op verschillende momenten uti te voeren vormt zich geen trend

78
New cards

waneer gebruik ej blokken in ED?

als je alle experimentne niet onder dezelfde omstandigheden kan uitvoeren