Big data concepten

0.0(0)
Studied by 0 people
call kaiCall Kai
learnLearn
examPractice Test
spaced repetitionSpaced Repetition
heart puzzleMatch
flashcardsFlashcards
GameKnowt Play
Card Sorting

1/44

encourage image

There's no tags or description

Looks like no tags are added yet.

Last updated 1:36 PM on 5/29/26
Name
Mastery
Learn
Test
Matching
Spaced
Call with Kai

No analytics yet

Send a link to your students to track their progress

45 Terms

1
New cards

Longue durée / Macro-geschiedenis

Bestuderen van geschiedenis over zeer lange tijdlijnen (eeuwen) om langetermijntrends zichtbaar te maken en maatschappelijk relevant te blijven

2
New cards

Short-termism / Micro-geschiedenis

Historisch onderzoek dat focust op slechts een korte tijdspanne (5 tot 50 jaar) of een specifieke kleine casus

3
New cards

The Little Divergence

Het historische fenomeen waarbij sommige delen van Noordwest-Europa (Groot-Brittannië, Lage Landen) vóór de industriële revolutie structureel rijker werden dan de rest van Europa

4
New cards

Mannelijk Kostwinnersmodel

Het historische (en deels achterhaalde) concept dat huishoudinkomens voornamelijk rond de werkende man draaiden, terwijl de vrouw een passieve rol had in de economie

5
New cards

Urban Relief Stocks

Stedelijke graan- en voedselreserves die door overheden werden opgekocht en goedkoop of gratis verdeeld om armen bij te staan tijdens pre-industriële hongersnoden

6
New cards

Moral Economy

Het idee dat de overheid mensen moet beschermen tegen de markt, hoewel dit wordt genuanceerd doordat markt en regulering in de geschiedenis vaak samenwerkten

7
New cards

Entitlements (Amartya Sen)

De theorie dat hongersnood vaker een verdelingsprobleem is (gebrek aan toegang of rechten tot voedsel) dan een absoluut tekort aan voedsel in een gebied

8
New cards

Labour Stabilization

De mate waarin (koloniale) arbeidsmigranten zich permanent mochten of wilden vestigen in de steden

9
New cards

Circulaire migratie (Rite de passage)

Migratie als tijdelijk onderdeel in het leven (bijv. van jonge mannen in Afrika) waarbij ze na een periode in de stad terugkeerden naar het platteland

10
New cards

Critical Junctures

Grote, ingrijpende levensgebeurtenissen of keerpunten (positief of negatief) die de verdere levensloop en het welzijn of de tevredenheid van een persoon sterk beïnvloeden

11
New cards

Nominale data

Categorieën zonder enige natuurlijke of wiskundige rangorde, zoals religies of eigennamen

12
New cards

Ordinale data

Categorieën mét een duidelijke onderlinge rangorde, maar zonder vaste, meetbare afstand ertussen, zoals sociaal-economische status of legerrangen

13
New cards

Kardinale data (Ratio / Interval)

Numerieke data waarbij de afstand tussen waarden vast en meetbaar is. Interval kent geen absoluut nulpunt (zoals jaartallen), Ratio kent wel een natuurlijk nulpunt (zoals loon of leeftijd)

14
New cards

Afhankelijke variabele (Y)

Datgene binnen een onderzoek wat je probeert te verklaren of te voorspellen, zoals bijvoorbeeld het BBP per hoofd

15
New cards

Onafhankelijke variabele (X)

De factor die je aanpast of observeert om te onderzoeken of en hoe sterk het de afhankelijke variabele beïnvloedt

16
New cards

Proxy-variabele

Een indirecte, meetbare benadering voor een variabele die zelf heel moeilijk direct te meten is (bijvoorbeeld boekconsumptie als proxy voor menselijk kapitaal)

17
New cards

Descriptieve (beschrijvende) statistiek

Het organiseren en samenvatten van data om historische of kwantitatieve informatie efficiënt in kaart te brengen

18
New cards

Inferentiële statistiek

Het toepassen van statistiek om op basis van steekproeven algemene conclusies en patronen te trekken over een veel grotere, bredere populatie

19
New cards

Tweestapsbronkritiek

De methode waarbij je niet alleen kijkt naar wat de historische data zelf tonen, maar ook extreem kritisch bent op hoe, waarom en door wie deze cijfers ooit in het verleden geregistreerd zijn

20
New cards

Gemiddelde (Mean)

De optelsom van alle waarden, gedeeld door het totaal aantal waarnemingen. Dit is een veelgebruikte maat, maar deze is wel erg gevoelig voor uitschieters

21
New cards

Mediaan (Median)

Het exacte middelste getal bij een gesorteerde waardenreeks. Dit is de meest ideale centrummaat als de data veel onvoorspelbare uitschieters of extreme waarden bevat

22
New cards

Modus (Mode)

De waarde of categorie die absoluut het vaakst voorkomt in een dataset. Deze maat wordt vooral gebruikt bij categorische of nominale data

23
New cards

Variatiebreedte (Range)

De spreidingsmaat die simpelweg de afstand berekent tussen de allerhoogste en de allerlaagste meting in een dataset

24
New cards

Variantie

Een spreidingsmaat die wordt berekend als het gemiddelde van het kwadraat van alle individuele afwijkingen ten opzichte van het algemene gemiddelde

25
New cards

Standaardafwijking (SD)

De vierkantswortel uit de variantie. Een grote waarde toont aan dat datapunten enorm verspreid zijn; het grote voordeel is dat het wordt uitgedrukt in precies dezelfde eenheden als de originele data

26
New cards

Kwartielafwijking

Een maat die specifiek kijkt naar de spreiding van de waarden direct rondom de mediaan (de middelste 50% van de data)

27
New cards

Normale verdeling (Bell Curve)

Een perfect symmetrische, klokvormige verdeling waarbij in de theorie de modus, mediaan en het gemiddelde exact aan elkaar gelijk zijn

28
New cards

Scheve verdeling (Asymmetrisch)

Een verdeling waarbij de meerderheid van de data piekt aan de linker- of rechterkant, waardoor er een asymmetrische 'staart' ontstaat die het gemiddelde dicteert (bijvoorbeeld bij inkomensongelijkheid)

29
New cards

Multimodale verdeling

Een distributie die wordt gekenmerkt door meerdere pieken (modussen), wat een sterk signaal is dat je te maken hebt met verschillende, ongelijksoortige subpopulaties

30
New cards

Tijdreeks (Time Series)

Een opeenvolging van chronologisch geordende kwantitatieve gegevens die worden gemeten met een strikt en regelmatig tijdsinterval, zoals per jaar of per maand

31
New cards

Trend

Een vaste en waarneembare langetermijngroei of –daling over een tijdsverloop, vaak getoond als een rechte lijn (de best passende lijn) in een spreidingsgrafiek

32
New cards

Reguliere fluctuaties

Structurele schommelingen die op min of meer cyclische, voorspelbare of vaste seizoensgebonden momenten afwijken van de langetermijntrend

33
New cards

Onregelmatige fluctuaties / Schokken

Korte, onvoorspelbare en eenmalige pieken of dalen in een reeks, vaak veroorzaakt door onverwachte catastrofes zoals een epidemie of oorlog

34
New cards

Voortschrijdend Gemiddelde (Moving Average)

Een techniek om woelige data glad te strijken door continu het gemiddelde te berekenen van een vast aantal recente opeenvolgende perioden. Hierdoor vlakt men kortetermijnschommelingen af en wordt de trend duidelijker

35
New cards

Gemiddelde Groei

Een groeipercentage dat wordt berekend door de absolute groei te nemen (eindwaarde min beginwaarde) gedeeld door het totaal aantal tussenliggende jaren of observaties

36
New cards

Groeivoet

Een wiskundig groeipercentage dat je verkrijgt door het verschil tussen eindwaarde en beginwaarde te delen door louter de beginwaarde

37
New cards

Indexcijfer

Een methode die de veranderingen van een variabele uitdrukt als percentage ten opzichte van een afgesproken basisjaar (wat altijd op 100 wordt gezet) om zo verschillende grootheden goed visueel te kunnen vergelijken

38
New cards

Samengestelde Index (Composite Index)

Een index die functioneert als een gewogen combinatie van meerdere individuele indices of reeksen, zoals 'kosten van levensonderhoud', om complexe veranderingen in één getal uit te drukken

39
New cards

Reële Index

Een index die wordt gecreëerd door nominale reeksen (zoals lonen) eerst te corrigeren voor de inflatie (veranderingen in prijzen), zodat je de daadwerkelijke historische verandering of koopkracht overhoudt

40
New cards

Correlatie (r)

Een statistische maat die in één cijfer (tussen -1 en 1) aangeeft in hoeverre en in welke specifieke richting (positief of negatief) er een lineair verband bestaat tussen twee geteste variabelen

41
New cards

Causaliteit

Het mechanisme waarbij de ene factor de andere direct veroorzaakt. Let op: dat twee factoren correleren of samen voorkomen, is geen garantie dat er ook echt een causaal, direct verband is (oorzaak-gevolg)

42
New cards

Regressieanalyse

Een veelgebruikte statische methode waarmee wetenschappers het onafhankelijke effect van meerdere variabelen (X) op een afhankelijke variabele (Y) tegelijkertijd kunnen inschatten, terwijl andere variabelen constant worden gehouden

43
New cards

Coëfficiënt (in regressie)

De voorspelde waarde die exact aangeeft hoeveel de afhankelijke variabele naar verwachting zal veranderen bij een stijging van precies 1 eenheid in de bijbehorende onafhankelijke variabele

44
New cards

Significantie (P-waarde)

De statistische zekerheidsmaat die uitdrukt in hoeverre men erop kan vertrouwen dat een gevonden wiskundig verband echt in de populatie bestaat, in plaats van dat dit slechts gebaseerd is op simpel toeval. Wordt in academische tabellen steevast aangeduid met sterretjes

45
New cards

Standard Error

De statistische aanduiding in regressiemodellen die exact de onzekerheid of de foutmarge rondom een bepaalde schatting weerspiegelt