Kaarten: Statistiek2 Hf1: Data manipulatie | Quizlet

0.0(0)
Studied by 0 people
call kaiCall Kai
learnLearn
examPractice Test
spaced repetitionSpaced Repetition
heart puzzleMatch
flashcardsFlashcards
GameKnowt Play
Card Sorting

1/47

encourage image

There's no tags or description

Looks like no tags are added yet.

Last updated 12:50 PM on 4/14/26
Name
Mastery
Learn
Test
Matching
Spaced
Call with Kai

No analytics yet

Send a link to your students to track their progress

48 Terms

1
New cards

De data in R: Functie om vectoren aan te maken

<- c(…) vb: > leeftijd <- c(18, 22, 17, 19, 19)

(het pijltje verwijst naar de naamgeving)

2
New cards

Wat is een vector?

een reeks objecten dat als één samengesteld object beschouwd wordt door R

3
New cards

De data in R: Als we enkel de data willen zien van een bepaald individu gebruiken we ...

vierkante haakjes →

[...]

➡Bv: leeftijd [3] zal output 17 geven

<p>vierkante haakjes →</p><p>[...]</p><p>➡Bv: leeftijd [3] zal output 17 geven</p>
4
New cards

De data in R: Gemiddelde

mean

<p>mean</p>
5
New cards

De data in R: Lengte van de vector opvragen

= hoeveel afzonderlijke waarden zitten er in de vector: length (steekproefgrootte)

<p>= hoeveel afzonderlijke waarden zitten er in de vector: length (steekproefgrootte)</p>
6
New cards

De data in R: De kleinste waarde van de vector

min

<p>min</p>
7
New cards

De grootste waarde van de vector

max vb: > max (leeftijd)

[1] 22

<p>max vb: &gt; max (leeftijd)</p><p>[1] 22</p>
8
New cards

Het mediaan van de vector

median vb: > median (leeftijd)

[1] 19

9
New cards

wat is een string

een reeks tekens zonder betekenis voor R (bv: ABC1$, 2018, intrinsieke-motivatie,

...)

10
New cards

Hoe verwarring vermijden wanneer men een reeks tekens ingeeft die niets betekenen voor R (een string)? (2)

- Om verwarring te vermijden moet je een string altijd tussen aanhalingstekens zetten

➡Hierdoor weet R onmiddellijk dat bv variabele roker van ordinaal of nominaal meetniveau is → R weet dat de strings niet-numeriek zijn

- Een andere manier om verwarring te vermijden is door het commando factor te gebruiken

! vb. bij postcode zou R 9000 interpreteren als een getal, maar door aanhalingstekens weet R dat hij het zo niet moet opvatten

<p>- Om verwarring te vermijden moet je een string altijd tussen aanhalingstekens zetten</p><p>➡Hierdoor weet R onmiddellijk dat bv variabele roker van ordinaal of nominaal meetniveau is → R weet dat de strings niet-numeriek zijn</p><p>- Een andere manier om verwarring te vermijden is door het commando factor te gebruiken</p><p>! vb. bij postcode zou R 9000 interpreteren als een getal, maar door aanhalingstekens weet R dat hij het zo niet moet opvatten</p>
11
New cards

Wat is het grote verschil tussen een factor en aanhalingstekens gebruiken bij een string?

aanhalingstekens bij een string: je zegt gewoon aan R: "dit is tekst" (R kan hier niks mee doen)

factor: je zegt aan R: "het gaat om een categorische variabele" (hier kan R wel mee werken)

(vb. als je bij een factor het gemiddelde zou opvragen zou je foutmelding krijgen)

12
New cards

wat moet je doen als je een vector wil aanmaken met waarden van een ordinale variabele?

dan moet je ook het

commando factor gebruiken, maar je gebruikt ook de argumenten levels en ordered

13
New cards

levels

geeft aan hoeveel verschillende waarden er in de vector zijn

<p>geeft aan hoeveel verschillende waarden er in de vector zijn</p>
14
New cards

Ordered

geeft aan dat de volgorde die je gebruikt de juiste volgorde is

15
New cards

geef een voorbeeld waarbij je de data "uitslag" met drie mogelijke uitkomsten (goud, brons, zilver) in R wilt ingeven

> uitslag <- factor( c("brons", "goud", "goud", "brons", "zilver", "brons", "brons", "brons"), levels = c("brons", "zilver", "goud" ),

ordered =

TRUE)

(ordered: brons < zilver < goud)

16
New cards

wat is het commando data.frame

met het commando data.frame kunnen we tegen R zeggen dat verschillende vectoren bij elkaar horen

(vb. bij 30 studenten 8 variabelen gemeten -> duidelijk maken aan R dat 8 vectoren betrekking hebben op dezelfde 30 studenten)

! data frame is zeer belangrijk, want alle datasets worden in deze vorm weergegeven

17
New cards

maak een data frame aan voor: score, iq, motivatie, geslacht, roken, opleiding, gewicht, lengte

> myData <- data.frame(score, iq, motivatie, geslacht, roken, opleiding, gewicht, lengte)

18
New cards

Wat zal ik krijgen als ik MyData intyp in R?

tabel met alle data van het dataframe Mydata

(R heeft daarbij zelf een extra kolom aangemaakt met een nummer voor elke student)

<p>tabel met alle data van het dataframe Mydata</p><p>(R heeft daarbij zelf een extra kolom aangemaakt met een nummer voor elke student)</p>
19
New cards

hoe kan ik een specifieke kolom raadplegen van een dataframe?

Indien je een specifieke kolom van deze tabel wil raadplegen typ je myData gevolgd door $ en de naam van de variabele

vb. = myData$gewicht

<p>Indien je een specifieke kolom van deze tabel wil raadplegen typ je myData gevolgd door $ en de naam van de variabele</p><p>vb. = myData$gewicht</p>
20
New cards

commando voor aantal rijen en kolommen weergeven

dim

<p>dim</p>
21
New cards

commando steekproefgrootte

dim(...) [1]

22
New cards

commando voor het Het aantal variabelen

dim(...) [2]

23
New cards

Steekproefgrootte

length (...)

<p>length (...)</p>
24
New cards

commando voor eerste 6 rijen

head

25
New cards

commando voor laatste 6 rijen

tail

26
New cards

commando gebruikt om data op te slaan

write.csv

vb: > write.csv(myData, file = "myData.csv", row.names = FALSE)

<p>write.csv</p><p>vb: &gt; write.csv(myData, file = "myData.csv", row.names = FALSE)</p>
27
New cards

commando gebruikt om data in te lezen

read.csv

28
New cards

vector aanmaken

c( )

29
New cards

hoe ken je een naam toe aan een functie

<-

30
New cards

gemiddelde

mean ( )

31
New cards

lengte van een vector (aantal waarden in een vector)

length ( )

32
New cards

kleinste waarde in een vector

min ( )

33
New cards

grootste waarde in een vector

max ( )

34
New cards

mediaan van de vector

median ( )

35
New cards

vector aanmaken van ordinale variabelen

factor ( c(" "), levels = c (" "), ordered = TRUE)

36
New cards

vector aanmaken van categorische variabelen

factor ( c ( ))

37
New cards

data frame aanmaken

data.frame ( )

38
New cards

aantal rijen en kolommen weergeven

dim ( )

39
New cards

steekproefgrootte

dim ( )[1] OF length (...$... )

40
New cards

aantal variabelen

dim ( ) [2]

41
New cards

eerste 6 rijen data frame weergeven

head ( )

42
New cards

laatste 6 rijen data frame weergeven

tail ( )

43
New cards

data frame opslaan

write.csv ( , file = " ", row.names = FALSE)

44
New cards

data frame lezen

read.csv ( file = " ")

45
New cards

Wat is het codeboek?

Een document dat beschrijft hoe gegevens in een databestand gecodeerd worden. Is handig voor zowel de onderzoeker, als voor externe lezers. We kunnen het zien als een soort handleiding dat we verplicht dienen op te stellen tijdens het onderzoek.

46
New cards

Wat is missing data?

Een ontbrekend antwoord in de dataset. (vb. antwoord niet leesbaar, testbatterij plat, participant weigerde te antwoorden etc.)

47
New cards

Hoe kunnen we missing data aanduiden in R?

NA (= Not Available)

48
New cards

Wat zijn conditionele vragen? Wat is hierbij bijzonder nuttig?

"zo ja, volgende vraag - zo nee, geen volgende vraag"

! waarde NVT of "niet van toepassing" van belang hierbij