1/29
Deze flashcards behandelen de kernbegrippen van Data Science, inclusief de Data Science Cyclus, goed datamanagement (Excel), FAIR-principes, GDPR-wetgeving en medische datastandaarden zoals LOINC en SNOMED-CT.
Name | Mastery | Learn | Test | Matching | Spaced | Call with Kai |
|---|
No analytics yet
Send a link to your students to track their progress
Data Science
Een interdisciplinair vakgebied dat data omzet in kennis en inzichten om beslissingen te ondersteunen.
User Needs (Probleemstelling)
De eerste fase van de Data Science Cyclus waarbij wordt bepaald welk probleem onderzocht wordt en de onderzoeksvraag wordt geformuleerd.
Metadata
Informatie over de data, zoals het gebruikte toestel, het protocol, de onderzoeker en het tijdstip van verzameling.
Data Dictionary
Een document waarin elke variabele uit een dataset wordt uitgelegd.
Sensitiviteit
Het percentage zieken dat correct door een model of test wordt herkend.
Specificiteit
Het percentage gezonden dat correct door een model of test wordt herkend.
F1-score
Een statistische maat die een combinatie vormt van precisie en sensitiviteit.
AUROC
Een maat voor het onderscheidend vermogen van een model.
Bias
Een systematische vertekening van resultaten.
Valorisatie
Het omzetten van onderzoeksresultaten naar impact in de praktijk, zoals in de kliniek, een labo, een app, een patent of beleid.
Tabular Data
Gegevens in de vorm van tabellen, zoals Excel-bestanden of CSV-bestanden.
Omics Data
Datatypes zoals genomics, transcriptomics en proteomics.
Time Series Data
Gegevens die over een tijdsverloop zijn verzameld, zoals een ECG of data van wearables.
FAIR Data
Principes die data makkelijker vindbaar, toegankelijk, herbruikbaar en uitwisselbaar maken: Findable, Accessible, Interoperable, Reusable.
Interoperable (Uitwisselbaar)
Onderdeel van FAIR waarbij data gecombineerd kan worden met andere datasets door het gebruik van gestandaardiseerde talen en vocabularia.
GDPR (AVG)
Europese privacywetgeving (General Data Protection Regulation) die sinds 2018 bepaalt hoe persoonsgegevens verwerkt moeten worden.
Dataminimalisatie
Een GDPR-principe dat stelt dat alleen de noodzakelijke gegevens verzameld mogen worden.
Verwerkingsverantwoordelijke
De rol binnen de GDPR die beslist over het doel en de middelen van de dataverwerking (waarom en hoe).
Gegevensverwerker
Een partij die data verwerkt in opdracht van de verwerkingsverantwoordelijke, zoals een cloudprovider.
Pseudonimisering
Het vervangen van identificeerbare gegevens door een code; dit proces is meestal omkeerbaar en de koppeling blijft mogelijk.
Anonimisering
Het permanent verwijderen van alle identificerende informatie zodat een persoon niet meer geïdentificeerd kan worden; dit is niet omkeerbaar.
Data Suppressie
Een de-identificatiestrategie waarbij een volledige kolom of rij (bijv. de naam) wordt verwijderd.
Data Masking
Het vervangen van een werkelijke waarde door een fictieve waarde om de privacy te beschermen.
Synthetische Data
Kunstmatig gegenereerde data die statistisch lijkt op echte data zonder echte persoonsgegevens te bevatten.
Data Generalisatie
Het vervangen van specifieke waarden door categorieën (bijv. exact 43 jaar vervangen door de categorie 40-50 jaar) om individuen minder uniek te maken.
Data Harmonisatie
Het compatibel maken van verschillende datasets door een gemeenschappelijke taal te gebruiken.
LOINC
Logical Observation Identifiers Names and Codes; een standaard voor laboratoriumtesten en medische observaties.
ATC
Anatomical Therapeutic Chemical Classification System; een systeem voor de classificatie van geneesmiddelen.
ICD-10
International Classification of Diseases; een standaard om ziekten en diagnoses te coderen.
SNOMED-CT
Systematized Nomenclature of Medicine – Clinical Terms; een standaard voor klinische terminologie in elektronische patiëntendossiers.