1/128
Flashcards met definities van statistische termen gebruikt in de criminologie.
Name | Mastery | Learn | Test | Matching | Spaced |
|---|
No study sessions yet.
Absolute frequentie
Aantal elementen met een bepaalde waarde van een variabele. De som van alle absolute frequenties is gelijk aan het totaal aantal elementen in de steekproef en wordt voorgesteld door n.
Alternatieve hypothese
Als de nulhypothese verworpen kan worden, kan de onderzoekshypothese aanvaard worden; deze wordt nu de alternatieve hypothese genoemd.
Aselecte steekproef
Een toeval steekproef.
Asymmetrische relatie
Een relatie waarbij de ene variabele een 'causale' invloed uitoefent op de andere.
Beschrijvende onderzoeksvraag
Een onderzoeksvraag die de kwantitatieve beschrijving van een fenomeen onder studie betreft. Er zijn drie soorten: naar centraliteit, naar spreiding en naar vorm.
Beschrijvende statistiek
Het op een overzichtelijke en samenvattende wijze weergeven van kenmerken die voorkomen in een onderzoekspopulatie of in een steekproef.
Bivariate analyse
Een analyse die nagaat hoe twee kenmerken samen variëren of samenhangen.
Box-plot
Een visuele voorstelling van gegevens vanaf het ordinaal meetniveau, waarmee de positie, spreiding en symmetrie van de verdeling visueel geïnspecteerd kunnen worden. Het toont de kleinste waarde, eerste kwartiel, mediaan, derde kwartiel en de grootste waarde.
Categorische meetniveau
Het nominale en ordinale meetniveau.
Cel frequentie
Aantal keer dat een bepaalde combinatie van categorieën van variabelen voorkomen.
Centrale onderzoeksvraag
De drijvende gedachte achter een onderzoeksproject; breed en ietwat vaag, maar geeft het doel van het onderzoeksproject weer.
Centrale punt van de puntenwolk
Het zwaartepunt van de tweedimensionale verdeling, gevormd door het punt dat als coördinaten in het assenstelsel het rekenkundig gemiddelde van beide variabelen bevat.
Chi²
Een associatiemaat voor kenmerken op het nominale niveau, voornamelijk gebruikt in de inferentiële statistiek om na te gaan of een verband al dan niet op toeval berust. Een waarde van 0 betekent geen samenhang.
Concepten
Termen waarover in het algemeen een consensus bestaat, die betrekking kunnen hebben op een kenmerk, fenomeen of een groep van inter-gerelateerde fenomenen.
Conceptueel model
Visuele samenvatting van concepten en hun onderlinge relaties.
Confounders
Storende variabelen die de relatie tussen twee variabelen kunnen maskeren.
Consistent paar
Een paar onderzoekseenheden waarbij de waarde van de ene onderzoekseenheid op beide variabelen hoger is dan de waarde van de andere onderzoekseenheid.
Continue meetschaal
Meetschaal waarbij alle mogelijke waarden de uitkomsten kunnen zijn van een meetprocedure.
Correlatiecoëfficiënt
De product-moment correlatiecoëfficiënt van Pearson, de meest gebruikte bivariate maat van samenhang voor kenmerken op het metrische niveau. Neemt waarden aan van -1 tot +1.
Covariatie
Een maat van samenhang op het metrische niveau die de mate voorstelt waarin twee kenmerken samen variëren. Het is de som van de kruisproducten van de deviatiescores van X en van Y.
Cramer's V
Een associatiemaat gebaseerd op chi², die varieert van 0 tot 1, en kan ook gebruikt worden bij grotere tabellen dan 22 tabellen. Bij een 22 tabel is de waarde gelijk aan de waarde van Phi.
Cumulatief frequentiediagram
Een diagram waarin de absolute of relatieve cumulatieve frequenties worden voorgesteld vanaf het ordinale niveau.
Cumulatieve percentages
Percentages waarbij elk percentage wordt opgeteld bij het volgende percentage, waardoor te zien is hoeveel waarnemingen kleiner dan of gelijk zijn aan een bepaalde waarde.
Covariantie
Een maat van samenhang op het metrische niveau. Het is de som van de kruisproducten van de deviatiescores van X en Y gedeeld door n-1.
De rangcorrelatiecoëfficiënt van Kendall's Tau
Een ordinale maat van samenhang die waarden aanneemt van -1 tot +1 en de waarde 0 aanneemt bij afwezigheid van een lineaire samenhang.
Deductie
Van theorie naar data, waarbij de data worden gebruikt om de theorie te toetsen.
Determinatiecoëfficiënt
Een goodness of fit maat die weergeeft hoeveel procent van de geobserveerde verschillen of varia(n)tie in de afhankelijke variabele kan verklaard worden op basis van de onafhankelijke variabele.
Deviatiescores
De afwijkingen tegenover het gemiddelde.
Dichotomie
Een variabele die slechts twee waarden kan aannemen.
Direct effect
Rechtstreekse invloed van de ene variabele op de andere.
Discrete meetschaal
Meetschaal waarbij in regel gehele getallen worden gebruikt en tussenliggende waarden tussen die gehele getallen in principe geen betekenis hebben.
Een verdelingsfunctie
Het overzicht van de uitkomsten van een kans variabele met de hierbij behorende gecumuleerde kansen.
Empirische coëfficiënt van Pearson
Een parameter om de symmetrie te berekenen door het verschil tussen het gemiddelde en de mediaan te delen door de standaardafwijking. Een positieve waarde geeft een positief asymmetrische verdeling aan, andersom negatief asymmetrisch.
Endogene variabele
Variabelen waar pijlen toekomen. Ze worden causaal bepaald door een reeks andere variabelen.
Exogene variabele
Een variabele waar geen causale effectrelaties toekomen. Er vertrekken enkel pijlen naar andere variabelen.
Foutenterm
Het verschil tussen de werkelijke (geobserveerde) waarde van de afhankelijke variabele en de voorspelde waarde van de afhankelijke variabele.
Frequentiepolygoon
Een lijndiagram voor in klassen gegroepeerde gegevens, waarbij de categorieën worden voorgesteld door hun klasse middens op de x-as en de punten gevormd door de frequentie op de y-as, met elkaar worden verbonden.
Frequentietabel
Tabel waarin men een overzicht krijgt van de waarnemingen van een bepaalde variabele, met de verschillende waarden in de eerste kolom en de frequentie van elke categorie in de tweede kolom.
Gamma
Een associatiemaat voor kenmerken op het ordinale niveau. Gamma neemt een waarde van -1 aan bij perfecte negatieve samenhang, + 1 bij perfect positieve samenhang en 0 bij de afwezigheid van samenhang.
Gaussverdeling
Een standaardnormale verdeling.
Geldige percentages
Percentages berekend op diegenen die een geldig antwoord hebben gegeven op de vraag.
Gemiddelde absolute afwijking
Een metrische spreidingsmaat. Het is de som van de absolute waarden van de afwijkingen van elke waarde ten aanzien van het rekenkundig gemiddelde, gedeeld door het aantal waarnemingen.
Hercoderen
Samenvoegen van categorieën van een kenmerk wanneer het aantal categorieën heel groot is, of de aantallen in bepaalde categorieën te laag. Men moet hier echter wel rekening houden met het meetniveau van de variabelen.
Het percentageverschil
Een bivariate associatiemaat voor kenmerken op het nominale niveau. We vergelijken de percentages op 1 categorie van de afhankelijke variabele voor de verschillende categorieën van de onafhankelijke variabele, dit verschil wordt weergegeven in percentagepunten.
Het rekenkundig gemiddelde
Een centrummaat die wordt verkregen door alle voorkomende waarden bij elkaar op te tellen en vervolgens het totaal te delen door het aantal respondenten. Ze wordt gebruikt bij variabelen gemeten op het metrische niveau.
Histogram
Zoals een staafdiagram maar met één verschil. De blokjes worden hier aan elkaar getekend omdat de waarden van de variabele elkaar opvolgen. Kortom, de categorieën liggen op een continuüm. Geschikt voor grafische voorstelling van variabelen gemeten op het metrische niveau.
Homoscedasticiteit
Een Regressieassumptie voor de lineaire regressie: het betekent dat de variatie van de afhankelijke variabele voor elke waarde van de onafhankelijke variabele gelijk dient te zijn.
Hypothesen
Specifieke (toetsbare) stellingen over de (causale) relatie tussen twee of meer concepten, die afgeleid zijn uit de theorie.
Inconsistent paar
Een paar onderzoekseenheden waarbij de waarde van het ene element op de ene variabele hoger is en de andere variabele lager is dan van het andere element.
Index van diversiteit
Een nominale spreidingsmaat. Ze is gebaseerd op de relatieve frequenties van de categorieën en er wordt rekening gehouden met de proportie van waarnemingen binnen iedere categorie. De waarde van deze parameter geeft een idee van de mate van concentratie van de waarnemingen over de categorieën van de variabele.
Indirect effect
Onrechtstreekse invloed van de ene variabele op de andere. Het effect loopt via een mediatorvariabele.
Inductie
Ontwikkeling van een theorie, startend van observatie naar theorie. Er wordt gepoogd om op basis van de data een theorie te ontwikkelen.
Inductieve of inferentiële statistiek
Het veralgemenen van de gegevens verzameld voor een steekproef naar de onderzoekspopulatie waaruit ze getrokken werden.
Interdeciel-afstand
Het verschil tussen het negende en eerste deciel.
Interkwartiel-afstand
Een ordinale spreidingsmaat. De interkwartiel-afstand is het verschil tussen het derde en eerste kwartiel en bevat dus de helft van het totale aantal waarnemingen.
Intervallen of klassen
Groeperen van gegevens.
Intervalniveau
Op intervalniveau, kunnen we de waarden op het kenmerk classificeren, ordenen en is er sprake van een vaste meeteenheid tussen de verschillende waarden. De intervallen tussen de verschillende waarden die een variabele kan aannemen krijgt hier dus betekenis.
Intervalschatting
De marges waarbinnen we met een zekere graad van onzekerheid een puntschatting inschatten. (= betrouwbaarheidsinterval).
Klassengrenzen
De grenzen van de intervallen.
Klassenmidden
Het gemiddelde van de beide grenzen van het interval. Deze wordt bekomen door de waarden van beide klassegrenzen samen te tellen en te delen door twee.
Kruistabel of contingentietabel
Een tabel waarin de categorieën van twee variabelen tegenover elkaar worden uitgezet en waarin de waargenomen frequentie van elke combinatie van categorieën vermeld staat.
Kurtosis
De mate van afplatting van de gegevens rondom het rekenkundig gemiddelde van een verdeling.
Kwantielen
Een maat die men gebruikt wanneer men een geordende rij elementen in om het even welk aantal groepen met een gelijk aantal elementen verdeelt. Ze kunnen berekend worden vanaf het ordinale niveau.
Kwartielen
De drie waarden (Q1, Q2 en Q3) die een geordende reeks uitkomsten in 4 gelijke stukken verdelen, die ieder een kwart van de uitkomsten bevatten.
Lijndiagram
Visuele voorstelling van de niet in klassen gegroepeerde gegevens door hun frequentie op een as aan te duiden en de punten vervolgens door middel van een lijn met elkaar te verbinden.
Lineariteit
Het verband tussen X en Y is lineair.
Mediaan
Het midden van een statistische verdeling. Het is een centrummaat die het punt in de frequentieverdeling aangeeft waaronder 50% van de gevallen en waarboven de andere 50% van de gevallen liggen. Kortom, de frequentieverdeling wordt in twee gelijke stukken gedeeld.
Mediatorvariabele
Intermediaire of mediërende variabele. Een variabele die tussen een oorzaak-gevolgrelatie staat en hiermee het effect tussen de oorzaak-gevolgrelatie beter verklaart en de relatie sterker maakt.
Meetniveau
Het meetniveau van een variabele wordt bepaald door de manier waarop een kenmerk gemeten wordt. Het meetniveau bepaalt welke statistische analysetechnieken toegepast mogen worden. Hoe hoger het meetniveau hoe meer analysetechnieken men kan toepassen. We onderscheiden van laag naar hoog vier meetniveaus: het nominale, ordinale, interval en ratio meetniveau.
Metrische meetniveau
Het interval en ratio meetniveau.
Metrische spreidingsmaten
Men bepaalt voor deze spreidingsmaten eerst het rekenkundig gemiddelde en gaat dan voor elk van de waarneming en hun frequenties na, hoever ze van het rekenkundig gemiddelde verwijderd liggen.
Modus
Een centrummaat en betreft de categorie van de variabele met de frequentie die het vaakst voorkomt. Ze kan in principe gehanteerd worden voor alle meetniveaus.
Multicollineariteit
De samenhang tussen onafhankelijke variabelen. Is de samenhang hoger dan .50 dan dient men voorzichtig te zijn bij de interpretatie van de resultaten. Is de samenhang .80 of hoger, dan mag men geen meervoudige regressie met die onafhankelijke variabelen uitvoeren.
Multivariate analyse
De multivariate statistiek houdt zich bezig met de relatie tussen meer dan twee kenmerken. De sociale wereld is zeer complex, gedrag komt tot stand door een grote diversiteit aan factoren. Daardoor is de sociale wereld in se multivariaat.
Negatief asymmetrisch
Wanneer de verdeling een langere staart naar links heeft. In dit geval is het rekenkundig gemiddelde kleiner dan de mediaan.
Nominale meetniveau
Het nominale meetniveau brengt de kenmerken van onderzoekseenheden onder, in elkaar uitsluitende categorieën. Hier heeft de waarde die een variabele kan aannemen alleen de betekenis van een naam, een categorie.
Nominale gegevens
kunnen ingegeven worden in een classificatiesysteem dat voldoet aan de regels van exclusiviteit en exhaustiviteit.
Normaliteit
De variabele volgt een normaalverdeling.
Nulhypothese
De nulhypothese is de omkering van de onderzoekshypothese, of de hypothese dat er geen verband bestaat tussen de kenmerken die men onderzoekt.
Odds (ratio)
De odds is een maat om de verhouding tussen het voorkomen van een gebeurtenis en het niet voorkomen van een gebeurtenis te beschrijven. De odds ratio is dan de verhouding tussen twee odds.
Onderzoeksdeelvragen
Delen de centrale onderzoeksvraag in sub problemen die gemakkelijker te behandelen zijn en zorgen ervoor dat de centrale onderzoeksvraag toetsbaar wordt met behulp van het onderzoek.
Onderzoekseenheden
De eenheden over wie of wat je op basis van het onderzoek een uitspraak doet.
Onderzoekshypothese
De onderzoekshypothese formuleert de betrokken stelling in de richting van de verwachtingen van de onderzoeker.
Onderzoekspopulatie
De verzameling van individuen waarover we een uitspraak willen gaan doen.
Ongestandaardiseerde richtingscoëfficiënt
De ongestandaardiseerde richtingscoëfficiënt dient geïnterpreteerd te worden als de toename in de voorspelde waarde van de afhankelijke variabele, wanneer de waarde van de onafhankelijke variabele met één eenheid stijgt.
Operationalisering
Het proces van het vertalen van een concept, dat abstract en woordelijk is, in een variabele die kan gezien en getoetst worden door het omschrijven hoe het concept kan gemeten worden.
Ordinale meetniveau
Het ordinale meetniveau kenmerkt zich door het principe van de ordenbaarheid van de categorieën. We kunnen dus niet enkel classificeren, maar in onze classificatie kunnen we ook gaan ordenen.
Overschrijdingskans
De significantietoets meet de kans op het krijgen van een uitkomst die even extreem is of nog extremer dan de waargenomen uitkomst. De kans om een even extreme of nog extremere uitkomst te bekomen noemt men de overschrijdingskans.
Padmodel
Wanneer de relaties tussen de variabelen uit het conceptueel model op basis van empirisch onderzoek tot stand komen. Een padmodel is gebaseerd op een reeks meervoudige regressies, maar het model houdt rekening met het feit dat een variabele in de ene relatie een onafhankelijke variabele kan zijn, en in relatie tot een andere variabele de afhankelijke.
Partiële correlatie
Correlatie tussen X en Y, gecontroleerd voor een derde variabele. We berekenen dit wanneer er een vermoeden bestaat van een schijnverband.
Percentages
Gaan van nul tot honderd procent. Het is de verhouding tussen het absolute aantal keer dat een waarde voorkomt gedeeld door de totale steekproefgrootte (n) maal 100.
Phi
Phi is een associatiemaat gebaseerd op chi² en heeft de waarde 0 bij afwezigheid van associatie en neemt de waarde 1 aan bij perfecte statistische associatie. Phi wordt gebruikt in 2*2 tabellen.
Positief asymmetrisch
Wanneer de verdeling een langere staart naar rechts heeft. In dit geval is het rekenkundig gemiddelde groter dan de mediaan.
Proportie
Absolute frequentie delen door het totaal aantal waarnemingen (n) proporties gaan van 0 tot 1, de soms van alle proporties is steeds gelijk aan 1.
Puntschatting
De schatting van een kenmerk in de populatie op basis van steekproefgegevens.
Rangcorrelatiecoëfficiënt van Spearman
De rangcorrelatiecoëfficiënt van Spearman is een associatiemaat voor kenmerken op ordinaal niveau die afgeleid is van de Pearson productmomentcorrelatiecoëfficiënt. De rangcorrelatiecoëfficiënt van Spearman neemt waarden aan tussen -1 en +1 en neemt de waarde 0 aan bij afwezigheid van een lineaire samenhang.
Rationiveau
Op dit niveau kunnen we de waarden op het kenmerk, classificeren, ordenen, is er sprake van een vaste meeteenheid en is er ook een absoluut nulpunt aanwezig.
Regressieconstante of intercept
De regressieconstante of het intercept is de verwachte of voorspelde waarde die de afhankelijke variabele aanneemt, wanneer de onafhankelijke variabele gelijkgesteld wordt aan 0.
Regression sum of squares
De regression sum of squares geeft de variatie in de afhankelijke, variabele weer, die kan voorspeld worden op basis van de onafhankelijke variabele.
Relatieve frequentie
Dit is de verhouding tussen het aantal keer een waarde voorkomt ten opzichte van de geldige steekproefomvang.