Relational Databases & Warehousing - VOCABULARY Flashcards (Dutch)

0.0(0)

Studied by 0 people

Knowt Play

Learn

Practice Test

Spaced Repetition

Match

Flashcards

Card Sorting

1/82

Earn XP

Description and Tags

Korte definities van sleutelbegrippen uit de les over relationele databases, indexen en datawarehousing, in Dutch, bedoeld als vocabulaire flashcards.

Study Analytics

Name	Mastery	Learn	Test	Matching	Spaced

No study sessions yet.

83 Terms

New cards

De Wet van Moore

De observatie dat het aantal transistors in een dicht geïntegreerde schakeling ongeveer elke twee jaar verdubbelt.

New cards

Index

Een datastructuur die rijen in een tabel sneller toegankelijk maakt door een geordende weergave van gegevens te bieden; voordelen: snellere toegang, nadelen: extra opslag en tragere bewerkingen zoals UPDATE/INSERT/DELETE.

New cards

Primaire sleutel en Unieke sleutel

Kolommen die automatisch worden geïndexeerd; verwijst vaak naar sleutels die sleutels in JOINs aanduiden.

New cards

Kleurende kolommen kiezen om te indexeren

Kiezen van kolommen die vaak in zoekfuncties of ORDER BY voorkomen; vermijd kolommen met lage kardinaliteit of kolommen uit kleine tabellen.

New cards

Clustered index

Sorteert de fysieke data van een tabel op basis van de indexsleutel; kan slechts één per tabel hebben; data bevindt zich in de leaf-nodes; clustering key noemt.

New cards

Leaf-nodes

Het laatste niveau van de indexstructuur waar de daadwerkelijke data (bij clustered index) of verwijzingen (bij nonclustered) opgeslagen zijn.

New cards

Clustering key

De kolom waarop de clustered index is gebaseerd.

New cards

Query speed met clustering key

Query's die filteren of sorteren op de clustering key zijn vaak sneller.

New cards

Clustered Index Seek

Snelle zoekmethode die de indexboom doorloopt om rechtstreeks naar de juiste data te navigeren.

New cards

INCLUDE-kolommen

Kolommen die in een nonclustered index kunnen worden opgenomen zodat een query alle benodigde data kan terughalen zonder de tabel te lezen.

New cards

Nonclustered index

Een aparte structuur met kopieën van relevante kolommen plus verwijzingen (RIDs) naar de echte data; kan meerdere per tabel zijn.

New cards

RIDs (row identifiers)

Verwijzingen in een nonclustered index naar de fysieke locatie van de data in de tabel.

New cards

WHERE-clausule bij nonclustered index

Kan gebruikt worden om te filteren op specifieke voorwaarden bij het aanmaken van een nonclustered index.

New cards

Index Seek vs Index Scan

Index Seek vindt specifieke rijen via de index; Index Scan doorzoekt de gehele index wanneer de hele index wordt doorzocht.

New cards

Covering Index

Een nonclustered index die alle kolommen bevat die nodig zijn om een SELECT-query te voldoen, waardoor lezen van de tabel onnodig is.

New cards

Filtered Index

Een index waarop een WHERE-clausule is toegepast zodat alleen bepaalde rijen in de index staan.

New cards

Heap

Een tabel zonder clustered index en zonder specifieke fysieke volgorde; toegang via IAM; kan leiden tot verspreide data en prestatieproblemen.

New cards

IAM (Index Allocation Map)

Databasepagina die in SQL Server extents toewijzing bijhoudt voor een heap of index.

New cards

Table Scan

De hele tabel wordt doorzocht; inefficiënt voor grote datasets.

New cards

Index Seek

Een zoekmethode die via de index directe naar de gewenste rijen navigeert.

New cards

Transacties

Een logische werkeenheid van één of meer SQL-statement die als één geheel worden uitgevoerd; ofwel alle statements slagen, ofwel geen enkele.

New cards

Expliciete transacties

Transacties die door de gebruiker zijn gedefinieerd en bestuurd met BEGIN TRANSACTION, COMMIT en ROLLBACK.

New cards

Impliciete transacties (autocommit)

Transacties die automatisch worden aangemaakt en beheerd door het DBMS bij elke datawijziging.

New cards

Logbestand (Logfile)

Record van alle uitgevoerde transacties, gebruikt voor herstel en concurrency control, inclusief before- en after-images.

New cards

Recovery

Het proces van het terugbrengen van een database naar een consistente staat na storing.

New cards

ACID

Atomiciteit, Consistentie, Isolatie, Duurzaamheid; fundamentele eigenschappen voor betrouwbare transacties.

New cards

Atomiciteit

Een transactie wordt volledig uitgevoerd of helemaal niet; ongedaan maken bij fout.

New cards

Consistentie

Database blijft in een geldige staat; regels en constraints worden nageleefd.

New cards

Isolatie

Transacties worden onafhankelijk uitgevoerd; de uitvoering van een transactie mag anderen niet beïnvloeden.

New cards

Duurzaamheid

Wijzigingen zijn permanent na een succesvolle transactie, ook na systeemstoringen.

New cards

Transacties falen

Een transactie kan niet voltooid worden en wordt teruggedraaid (rollback).

New cards

System fail & recovery

Systeemfout: volledige systeemuitval; recoveries herstellen de DB naar consistentie, vaak via undo/redo en logbestanden.

New cards

Media fail & recovery

Fout van het opslagmedium; herstel via disk mirroring, archivering en rollforward recovery.

New cards

Disk mirroring

Real-time kopie van gegevens naar meerdere schijven voor beschikbaarheid.

New cards

Archivering

Periodiek kopiëren van databasebestanden naar andere opslagmedia als back-up.

New cards

Rollforward recovery

Herstelmethode die archivering combineert met logbestand-mirroring voor recente transacties.

New cards

Concurrency control

Beheer van meerdere gelijktijdige transacties om data-integriteit te bewaren.

New cards

Lost update

Twee transacties werken tegelijk bij hetzelfde stuk data; een update gaat verloren door gebrek aan coördinatie.

New cards

Dirty read

Lezen van data die door een andere transactie nog niet is vastgelegd.

New cards

Inconsistent analysis

Lezen van dezelfde rij meerdere keren waarbij waarden kunnen veranderen tussen lezingen.

New cards

Non-repeatable read

Bij meerdere lezingen van dezelfde rij levert een andere data op door wijzigingen van anderen.

New cards

Phantom read

Een transactie leest een set rijen; later voegen/verwijderen andere transacties rijen die aan de voorwaarden voldoen.

New cards

Schedules

Een verzameling van transacties en hun volgorde; seriële rooster vs niet-serieel rooster.

New cards

Pessimistic scheduler

Concurrency control die uitgaat van conflicten en transacties uitstelt om conflicten te vermijden.

New cards

Locking

Mechanisme om gelijktijdige toegang tot data te beheren; voorkomt conflicten.

New cards

Exclusieve lock (x-lock)

Einige transactie heeft op dat moment exclusief recht op een object; anderen kunnen niet lezen of schrijven.

New cards

Shared lock (S-lock)

Lezers kunnen lezen; schrijvers worden geblokkeerd totdat lock wordt vrijgegeven.

New cards

Two-phase locking (2PL)

Locking-protocol met twee fasen: groei (locks toewijzen) en shrink (locks vrijgeven).

New cards

Rigorous 2PL

Alle locks worden vastgehouden tot de commit; strikt naleving van 2PL.

New cards

Static 2PL

Locks zijn vooraf toegewezen aan het begin van de transactie.

New cards

Long-term lock

Lock die langer wordt vastgehouden dan nodig; verhoogt doorvoer maar kan blokkeren.

New cards

Short-term lock

Lock die alleen is voor korte duur wordt gehanteerd; wekt conflict met 2PL op.

New cards

Isolation Levels

Niveaus die bepalen hoe transacties elkaar en data beïnvloeden om anomalies te voorkomen.

New cards

Read Uncommitted

Laagste isolatie; dirty reads toegestaan; geen shared locks voor lezers.

New cards

Read Committed

Standaard; leest alleen gecommitteerde data; lezers wachten op schrijvers.

New cards

Repeatable Read

Langdurige shared locks op gelezen rijen; dezelfde rij kan meerdere keren gelezen worden.

New cards

Serializable

Sterkste isolatieniveau; voorkomt non-repeatable en phantom reads; 2PL doorgevoerd.

New cards

Deadlock

Situatie waarin twee of meer transacties elkaars locks vasthouden en elkaar wachten.

New cards

Zek ACID en recovery

ACID-principes plus recovery manager die verantwoordelijk is voor herstel.

New cards

Datawarehousing (DWH)

Geïntegreerde, onderwerp-georiënteerde, tijd-variërende en niet-vluchtige verzameling data ter ondersteuning van besluitvorming.

New cards

Business Intelligence (BI)

Proces van data verzamelen, analyseren en omzetten in bruikbare informatie voor betere beslissingen.

New cards

OLTP

Online Transaction Processing; veel kleine transacties, genormaliseerd voor consistentie.

New cards

OLAP

Online Analytical Processing; grote datasets voor rapportages en analyses, minder genormaliseerd.

New cards

Datawarehouse vs reguliere database

DWH is onderwerp-georiënteerd, geïntegreerd, tijdsvariërend en niet-vluchtig; gericht op snelle analyse.

New cards

ETL

Extractie, Transformatie en Laden; processen om data uit verschillende bronnen te halen, transformeren en in het DWH te laden.

New cards

Datamart

Subset van data gericht op de analysebehoeften van een specifieke afdeling.

New cards

Star Schema

Stam-structuur met feitentabel in het midden en rondom dimensionele tabellen; snelle queries.

New cards

Fact table

De kern van het star schema met meetbare feiten (opgetelde waarden) per gebeurtenis.

New cards

Dimension table

Beschrijvende tabellen rondom de fact table; bevatten tekstuele metadata en attributen.

New cards

Snowflake schema

Genormaliseerde variant van het star schema waarbij dimensies verder zijn onderverdeeld.

New cards

Kleine dimensies: Junk en Outrigger

Junk dimensies: laag-cardinaliteit attributen; Outrigger-tabellen: aanvullende attributen in aparte tabellen.

New cards

Slowly Changing Dimensions (SCD)

Dimensies waarvan waarden traag veranderen; Type 1/2/3 beheren historische data.

New cards

Rapid Changing Dimensions (RCD)

Dimensies waarvan waarden snel veranderen; split data in aparte tabellen om historische en actuele waarden te scheiden.

New cards

SCD Type 1

Wijzigingen overschrijven attribuut, geen historie behouden.

New cards

SCD Type 2

Wijzigingen leiden tot een nieuw rij in dimensietabel met historische data intact.

New cards

SCD Type 3

Behouden van oude en nieuwe waarden in hetzelfde record, meestal met attributen zoals begin- en einddatum.

New cards

Surrogate keys

Niet-business sleutels (surrogate) ter vervanging van business keys; handig bij veranderende business keys.

New cards

Granulariteit

Nauwkeurigheid van data; hogere granulariteit betekent meer detail en mogelijk meer rijen.

New cards

ERD vs dimensionale modellen

ERD voor OLTP-ontwerp; dimensionale modellen voor DWH/OLAP; minder redundantie, snelle analyses.

New cards

Inmon vs Kimball

Inmon: Enterprise Data Warehouse met EDW en data marts; Kimball: bus matrix en stapsgewijze data marts via ster-schema.

New cards

Surrogaat sleutels vs business keys

Surrogaat sleutels dienen als stabiele, betekenisloze integers; business keys kunnen veranderen.

New cards

Dimensietabellen en feiten

Dimensionele tabellen geven beschrijvende informatie; feitentabellen bevatten meetbare waarden.

New cards

Granulariteit van Feitentabel

Hoe gedetailleerd elke rij in de feitentabel is; hoger detail mogelijk bij hogere granulariteit.