Lecture Notes Flashcards: Messy Data, Research Design, R, Big Data, and Data Visualization

0.0(0)
studied byStudied by 0 people
0.0(0)
full-widthCall Kai
learnLearn
examPractice Test
spaced repetitionSpaced Repetition
heart puzzleMatch
flashcardsFlashcards
GameKnowt Play
Card Sorting

1/33

flashcard set

Earn XP

Description and Tags

A set of exam-style questions covering key topics from messy data, reliability/validity and bias, research design, R and data workflows, big data 5 V's, data visualization, ethics, and datafication.

Study Analytics
Name
Mastery
Learn
Test
Matching
Spaced

No study sessions yet.

34 Terms

1
New cards

Wat is random fout en geef een voorbeeld?

Onvoorspelbare fluctuaties die geen ware veranderingen in de onderliggende constructie weerspiegelen; bijvoorbeeld, jaar-op-jaar gegevens kunnen te hoog of te laag lijken, wat leidt tot vals-positieven of vals-negatieven.

2
New cards

Wat is betrouwbaarheid in meting?

De onderliggende constructie blijft hetzelfde en herhaalde metingen onder dezelfde omstandigheden leveren hetzelfde resultaat op.

3
New cards

Wat is bias in gegevensverzameling?

Systematische fout die resultaten in een consistente richting vertekent, zoals onderrapportage of overrapportage van specifieke waarnemingen.

4
New cards

Wat is validiteit in meting?

De mate waarin een meting daadwerkelijk de beoogde constructie meet; betrouwbaarheid is een voorwaarde voor validiteit.

5
New cards

Wat is extrapolatie fout?

Conclusies uitbreiden buiten de waargenomen gegevens, waardoor de trend dramatischer lijkt dan hij is.

6
New cards

Waarom is betrouwbaarheid een voorwaarde voor validiteit?

Als een meting niet betrouwbaar is, kan deze niet valide zijn; betrouwbaarheid is noodzakelijk voor validiteit.

7
New cards

Zijn oogkleuroordelen onder dezelfde omstandigheden betrouwbaar en valide?

Ja, ze zijn betrouwbaar en valide onder dezelfde omstandigheden, tenzij de waarnemer kleurenblind is.

8
New cards

Wat impliceert een schaal met geen fout of bias?

Het levert betrouwbare en valide metingen op.

9
New cards

Wat illustreert het meten van koffie-inname door zelfrapportage over betrouwbaarheid/validiteit?

Het is noch betrouwbaar, noch valide omdat de meting varieert met de persoon en over tijd.

10
New cards

Wat start de theorie–data cyclus?

Een idee of theorie die een onderzoeksvraag formuleert.

11
New cards

Wat is preregistratie in onderzoek?

Een plan dat gedetailleerd beschrijft wat zal worden gedaan, in welke stappen, hoe analyses zullen worden uitgevoerd, en wat wordt verwacht, om data mining te voorkomen.

12
New cards

Wat is een nulhypothese?

Er is geen verschil tussen groepen of omstandigheden.

13
New cards

Wat is een hypothese?

Er is een verschil tussen groepen of omstandigheden.

14
New cards

Wat is inductief (data-gedreven) onderzoek?

Een empirische benadering die patronen in data zoekt, voorlopige hypothesen vormt, en deze test op nieuwe data om algemene theorie op te bouwen.

15
New cards

Wat betekent falsifieerbaarheid in een theorie?

Een theorie moet op zo'n manier testbaar zijn dat deze door bewijs onwaar kan worden bevonden.

16
New cards

Wat betekent parsimonie in theoriekeuze?

Geef de voorkeur aan eenvoudige verklaringen of hypothesen die rekening houden met data zonder onnodige complexiteit.

17
New cards

Wat zijn kenmerken van een data-gedreven (inductieve) benadering?

Generalizeerbaar, lichtgewicht, interpreteerbaar door mensen, data bestaat vaak, weinig a priori aannames, flexibel tot context, en gericht op nauwkeurige voorspellingen.

18
New cards

Wat zijn potentiële nadelen van een theorie-gedreven benadering?

Veel concurrerende theorieën; onduidelijk of theorie standhoudt na toepassing; veel stappen om data te verkrijgen; gemakkelijk om correlaties te cherry-picken; resultaten afhankelijk van datakwaliteit.

19
New cards

Wat is een R-omgeving?

Een verzameling objecten die momenteel zijn opgeslagen in R's werkgeheugen.

20
New cards

Wat is een IDE in de context van R?

Integrated Development Environment; software die je R-scripts laat schrijven en output laat zien.

21
New cards

Wat is CRAN?

Comprehensive R Archive Network; online bibliotheek van R-pakketten.

22
New cards

Wat is reproduceerbaarheid in onderzoek?

Als ik het kan doen, kun jij het reproduceren met weinig moeite; resultaten kunnen door anderen gerepliceerd worden.

23
New cards

Wat is een oogkleurvoorbeeld dat betrouwbaarheid/validiteit illustreert?

Oogkleuroordelen onder dezelfde omstandigheden zijn betrouwbaar en valide tenzij kleurenblindheid de perceptie beïnvloedt.

24
New cards

Wat doet de toewijzingsoperator in R en wat is het symbool?

Kent een waarde toe aan een object; symbool is '<-'. In code zie je vaak x <- 5.

25
New cards

Wat doet ls() in R?

Toont alle objectnamen die momenteel zijn opgeslagen in de R-sessie.

26
New cards

Wat betekenen nesten en inside-out evaluatie in R?

Argumenten worden van binnen naar buiten geëvalueerd; binnenste functies worden berekend vóór buitenste functies.

27
New cards

Hoe kun je hulp krijgen in R en leren over functie-argumenten?

Gebruik ?functienaam voor hulp en args(functienaam) om de argumentenlijst te zien.

28
New cards

Wat zijn de vijf V's van Big Data?

Volume, Velocity, Variety, Veracity, Value.

29
New cards

Wat is ongestructureerde data?

Data die niet is georganiseerd in een vooraf gedefinieerd schema; maakt een groot deel van de data uit en vereist aanzienlijke verwerking om waarde te extraheren.

30
New cards

Wat is dataficatie van alles?

Het proces van het omzetten van vele aspecten van het leven in data voor analyse, met implicaties voor privacy en profilering.

31
New cards

Wat maakt een visualisatie goed?

Het toont vergelijkingen, demonstreert oorzaak en gevolg, gebruikt meerdere variabelen, integreert visualisatie met tekst en data, en is geloofwaardig en inhoud-gericht.

32
New cards

Welke privacyzorg roept grootschalige dataverzameling op?

Het potentieel voor profilering en privacy schendingen, waarbij bedrijven mogelijk data monetiseren.

33
New cards

Welk type fout beïnvloedt specifiek de betrouwbaarheid van een meting?

Willekeurige fouten, die leiden tot onvoorspelbare fluctuaties in de resultaten en ze inconsistent maken.

34
New cards

Kan een meetinstrument valide zijn zonder betrouwbaar te zijn?

Nee. Betrouwbaarheid is een noodzakelijke voorwaarde voor validiteit; als een meting niet consistent is (niet betrouwbaar), kan deze niet nauwkeurig meten wat het bedoeld is te meten.

Explore top flashcards

Peripheral Nerve
Updated 905d ago
flashcards Flashcards (62)
-4 Poverty, Part 1
Updated 1088d ago
flashcards Flashcards (61)
BIO-205 Chapter 12
Updated 263d ago
flashcards Flashcards (51)
Anime
Updated 51d ago
flashcards Flashcards (70)
Optics and Vision
Updated 45d ago
flashcards Flashcards (50)
Peripheral Nerve
Updated 905d ago
flashcards Flashcards (62)
-4 Poverty, Part 1
Updated 1088d ago
flashcards Flashcards (61)
BIO-205 Chapter 12
Updated 263d ago
flashcards Flashcards (51)
Anime
Updated 51d ago
flashcards Flashcards (70)
Optics and Vision
Updated 45d ago
flashcards Flashcards (50)