Kaarten: Statistiek2 Hf1: Data manipulatie | Quizlet

0.0(0)

Studied by 0 people

Call Kai

Learn

Practice Test

Spaced Repetition

Match

Flashcards

Knowt Play

Card Sorting

1/47

There's no tags or description

Looks like no tags are added yet.

Last updated 1:13 PM on 5/21/26

Name	Mastery	Learn	Test	Matching	Spaced	Call with Kai

No analytics yet

Send a link to your students to track their progress

48 Terms

New cards

De data in R: Functie om vectoren aan te maken

<- c(…) vb: > leeftijd <- c(18, 22, 17, 19, 19)

(het pijltje verwijst naar de naamgeving)

New cards

Wat is een vector?

een reeks objecten dat als één samengesteld object beschouwd wordt door R

New cards

De data in R: Als we enkel de data willen zien van een bepaald individu gebruiken we ...

vierkante haakjes →

[...]

➡Bv: leeftijd [3] zal output 17 geven

New cards

De data in R: Gemiddelde

mean

New cards

De data in R: Lengte van de vector opvragen

= hoeveel afzonderlijke waarden zitten er in de vector: length (steekproefgrootte)

New cards

De data in R: De kleinste waarde van de vector

min

New cards

De grootste waarde van de vector

max vb: > max (leeftijd)

[1] 22

New cards

Het mediaan van de vector

median vb: > median (leeftijd)

[1] 19

New cards

wat is een string

een reeks tekens zonder betekenis voor R (bv: ABC1$, 2018, intrinsieke-motivatie,

...)

New cards

Hoe verwarring vermijden wanneer men een reeks tekens ingeeft die niets betekenen voor R (een string)? (2)

- Om verwarring te vermijden moet je een string altijd tussen aanhalingstekens zetten

➡Hierdoor weet R onmiddellijk dat bv variabele roker van ordinaal of nominaal meetniveau is → R weet dat de strings niet-numeriek zijn

- Een andere manier om verwarring te vermijden is door het commando factor te gebruiken

! vb. bij postcode zou R 9000 interpreteren als een getal, maar door aanhalingstekens weet R dat hij het zo niet moet opvatten

<p>- Om verwarring te vermijden moet je een string altijd tussen aanhalingstekens zetten</p><p>➡Hierdoor weet R onmiddellijk dat bv variabele roker van ordinaal of nominaal meetniveau is → R weet dat de strings niet-numeriek zijn</p><p>- Een andere manier om verwarring te vermijden is door het commando factor te gebruiken</p><p>! vb. bij postcode zou R 9000 interpreteren als een getal, maar door aanhalingstekens weet R dat hij het zo niet moet opvatten</p>

New cards

Wat is het grote verschil tussen een factor en aanhalingstekens gebruiken bij een string?

aanhalingstekens bij een string: je zegt gewoon aan R: "dit is tekst" (R kan hier niks mee doen)

factor: je zegt aan R: "het gaat om een categorische variabele" (hier kan R wel mee werken)

(vb. als je bij een factor het gemiddelde zou opvragen zou je foutmelding krijgen)

New cards

wat moet je doen als je een vector wil aanmaken met waarden van een ordinale variabele?

dan moet je ook het

commando factor gebruiken, maar je gebruikt ook de argumenten levels en ordered

New cards

levels

geeft aan hoeveel verschillende waarden er in de vector zijn

New cards

Ordered

geeft aan dat de volgorde die je gebruikt de juiste volgorde is

New cards

geef een voorbeeld waarbij je de data "uitslag" met drie mogelijke uitkomsten (goud, brons, zilver) in R wilt ingeven

> uitslag <- factor( c("brons", "goud", "goud", "brons", "zilver", "brons", "brons", "brons"), levels = c("brons", "zilver", "goud" ),

ordered =

TRUE)

(ordered: brons < zilver < goud)

New cards

wat is het commando data.frame

met het commando data.frame kunnen we tegen R zeggen dat verschillende vectoren bij elkaar horen

(vb. bij 30 studenten 8 variabelen gemeten -> duidelijk maken aan R dat 8 vectoren betrekking hebben op dezelfde 30 studenten)

! data frame is zeer belangrijk, want alle datasets worden in deze vorm weergegeven

New cards

maak een data frame aan voor: score, iq, motivatie, geslacht, roken, opleiding, gewicht, lengte

> myData <- data.frame(score, iq, motivatie, geslacht, roken, opleiding, gewicht, lengte)

New cards

Wat zal ik krijgen als ik MyData intyp in R?

tabel met alle data van het dataframe Mydata

(R heeft daarbij zelf een extra kolom aangemaakt met een nummer voor elke student)

New cards

hoe kan ik een specifieke kolom raadplegen van een dataframe?

Indien je een specifieke kolom van deze tabel wil raadplegen typ je myData gevolgd door $ en de naam van de variabele

vb. = myData$gewicht

New cards

commando voor aantal rijen en kolommen weergeven

dim

New cards

commando steekproefgrootte

dim(...) [1]

New cards

commando voor het Het aantal variabelen

dim(...) [2]

New cards

Steekproefgrootte

length (...)

New cards

commando voor eerste 6 rijen

head

New cards

commando voor laatste 6 rijen

tail

New cards

commando gebruikt om data op te slaan

write.csv

vb: > write.csv(myData, file = "myData.csv", row.names = FALSE)

New cards

commando gebruikt om data in te lezen

read.csv

New cards

vector aanmaken

c( )

New cards

hoe ken je een naam toe aan een functie

New cards

gemiddelde

mean ( )

New cards

lengte van een vector (aantal waarden in een vector)

length ( )

New cards

kleinste waarde in een vector

min ( )

New cards

grootste waarde in een vector

max ( )

New cards

mediaan van de vector

median ( )

New cards

vector aanmaken van ordinale variabelen

factor ( c(" "), levels = c (" "), ordered = TRUE)

New cards

vector aanmaken van categorische variabelen

factor ( c ( ))

New cards

data frame aanmaken

data.frame ( )

New cards

aantal rijen en kolommen weergeven

dim ( )

New cards

steekproefgrootte van data set aan R vragen (twee verschillende manieren)

dim ( )[1] OF length (...$... )

New cards

aantal variabelen

dim ( ) [2]

New cards

eerste 6 rijen data frame weergeven

head ( )

New cards

laatste 6 rijen data frame weergeven

tail ( )

New cards

data frame opslaan

write.csv ( , file = " ", row.names = FALSE)

New cards

data frame lezen

read.csv ( file = " ")

New cards

Wat is het codeboek?

Een document dat beschrijft hoe gegevens in een databestand gecodeerd worden. Is handig voor zowel de onderzoeker, als voor externe lezers. We kunnen het zien als een soort handleiding dat we verplicht dienen op te stellen tijdens het onderzoek.

New cards

Wat is missing data?

Een ontbrekend antwoord in de dataset. (vb. antwoord niet leesbaar, testbatterij plat, participant weigerde te antwoorden etc.)

New cards

Hoe kunnen we missing data aanduiden in R?

NA (= Not Available)

New cards

Wat zijn conditionele vragen? Wat is hierbij bijzonder nuttig?

"zo ja, volgende vraag - zo nee, geen volgende vraag"

! waarde NVT of "niet van toepassing" van belang hierbij