Data Science - KOMPLETT

0.0(0)
Studied by 0 people
call kaiCall Kai
learnLearn
examPractice Test
spaced repetitionSpaced Repetition
heart puzzleMatch
flashcardsFlashcards
GameKnowt Play
Card Sorting

1/174

encourage image

There's no tags or description

Looks like no tags are added yet.

Last updated 2:59 PM on 3/22/26
Name
Mastery
Learn
Test
Matching
Spaced
Call with Kai

No analytics yet

Send a link to your students to track their progress

175 Terms

1
New cards

LLMs (Large Language Models)

KI-Systeme, die mit sehr großen Textmengen trainiert wurden und menschliche Sprache verstehen und erzeugen können

2
New cards

Beispiele für LLMs

ChatGPT, Gemini

3
New cards

Funktionsweise von LLMs

Training mit Milliarden Textbeispielen – Lernen statistischer Sprachmuster – Vorhersage des wahrscheinlich nächsten Wortes – dadurch entstehen Sätze, Absätze oder Dokumente

4
New cards

Einsatz von LLMs

Chatbots, KI-Assistenten, Support, Analyse, digitale Teammitglieder

5
New cards

Arithmetisches Mittel

Addiert alle Werte und teilt durch die Anzahl der Werte (klassischer Durchschnitt)

6
New cards

Geometrisches Mittel

Multipliziert alle Werte und zieht die n-te Wurzel – genutzt bei Wachstumsraten und Renditen

7
New cards

Harmonisches Mittel

Kehrwert bilden → arithmetisches Mittel berechnen → wieder Kehrwert – genutzt bei Durchschnittsgeschwindigkeiten und Preisen pro Einheit

8
New cards

Median

Mittlerer Wert einer sortierten Datenreihe – bei gerader Anzahl Durchschnitt der beiden mittleren Werte

9
New cards

Modus

Am häufigsten vorkommender Wert einer Datenreihe

10
New cards

Offene Daten (Open Data)

Öffentlich zugängliche Daten wie Linked Open Data, Regierungsdaten oder wissenschaftliche Daten

11
New cards

Interne Daten

Unternehmensinterne, nicht öffentliche Daten wie Stammdaten, Transaktionsdaten und Sensordaten

12
New cards

Strukturierte Daten

Jeder Datensatz folgt exakt derselben Struktur (z. B. Excel, CSV, relationale Datenbanken)

13
New cards

Semi-strukturierte Daten

Struktur vorhanden, aber flexibel (z. B. XML, JSON)

14
New cards

Unstrukturierte Daten

Kein festes Schema – Bedeutung steckt im Inhalt (z. B. PDF, Textfiles, Word, E-Mail, Bilder)

15
New cards

Big Data 5V

Volume – Velocity – Variety – Veracity – Value
Volumen – Geschwindigkeit – Vielfalt – Wahrhaftigkeit – Wert

16
New cards

Volume

Extrem große Datenmengen

17
New cards

Velocity

Daten entstehen sehr schnell und müssen in Echtzeit verarbeitet werden

18
New cards

Variety

Viele verschiedene Datenarten und Formate

19
New cards

Veracity

Datenqualität ist unsicher oder unterschiedlich gut

20
New cards

Value

Daten sind nur sinnvoll, wenn daraus ein Nutzen entsteht

21
New cards

NoSQL

Nicht-relationale Datenbanken mit flexiblem Schema, horizontaler Skalierung und Abfragen ohne komplexe JOINs

22
New cards

Key-Value-Datenbank

Speichert Daten als Schlüssel-Wert-Paare – sehr schnell – einfache Struktur

23
New cards

Wide-Column-Datenbank

Spaltenorientierte Speicherung mit dynamischen Spalten – ideal für große Datenmengen und hohe Schreiblast

24
New cards

Dokumentenorientierte Datenbank

Speichert hierarchische Dokumente (JSON/XML) mit flexiblem Schema

25
New cards

Graphendatenbank

Speichert Daten als Knoten und Beziehungen – effizient bei stark vernetzten Daten

26
New cards

Descriptive Analytics

„Was ist passiert?“ – Analyse vergangener Daten – Reports, Dashboards, KPIs

27
New cards

Diagnostic Analytics

„Warum ist es passiert?“ – Ursachenanalyse und Mustererkennung

28
New cards

Predictive Analytics

„Was wird passieren?“ – Prognosen mithilfe von Statistik und Machine Learning

29
New cards

Prescriptive Analytics

„Was sollen wir tun?“ – Handlungsempfehlungen und Optimierung

30
New cards

Anwendungsgebiete von Data Science

Vorhersage – Optimierung – Personalisierung – Komfort – Intelligenz

31
New cards

CRISP-DM

Cross-Industry Standard Process for Data Mining – Standard-Vorgehensmodell für Data-Science-Projekte

32
New cards

Phasen von CRISP-DM

Business Understanding – Data Understanding – Data Preparation – Modeling – Evaluation – Deployment

33
New cards

Business Understanding

Geschäftsproblem verstehen, Ziele definieren, Erfolgskriterien festlegen

34
New cards

Data Understanding

Daten sammeln, beschreiben, erste Analyse durchführen, Datenqualität prüfen

35
New cards

Data Preparation

Daten auswählen, bereinigen, transformieren und zusammenführen (70–80 % der Arbeit)

36
New cards

Modeling

Modell auswählen, trainieren, Parameter einstellen und Testdesign erstellen

37
New cards

Evaluation

Ergebnisse bewerten und prüfen, ob das Business-Ziel erreicht wurde

38
New cards

Deployment

Modell produktiv einsetzen sowie Monitoring und Wartung durchführen

39
New cards

Trainingsdaten

Ca. 70 % – Modell wird gelernt

40
New cards

Validierungsdaten

Ca. 15 % – Modell wird geprüft und optimiert

41
New cards

Testdaten

Ca. 15 % – finale Überprüfung des Modells

42
New cards

Aufgaben Data Engineering

Erfassung

Extraktion

Bereinigung

Speicherung

Verbreitung

Suche

43
New cards

Erfassung/Capture

Daten sammeln

44
New cards

Extraktion/Extraction

Daten aus Quellen holen

45
New cards

Bereinigung/Curation

Fehler korrigieren (Bereinigung)

46
New cards

Speicherung/Storage

Daten speichern

47
New cards

Verbreitung/Sharing

Daten zugänglich machen

48
New cards

Suche/Search

Daten auffindbar machen

49
New cards

Aufgaben Data Science

Anfragen

Analyse

Visualisierung

50
New cards

Anfragen/Querying

Daten abfragen

51
New cards

Analyse/Analysis

Modelle und Auswertungen durchführen

52
New cards

Visualisierung/Visualization

Ergebnisse darstellen

53
New cards

Bestandteile eines Data-Science-Projekts

Daten aufbereiten – Modell entwickeln und bewerten – Ergebnisse analysieren und nutzen

54
New cards

ROC-Analyse (Receiver Operating Characteristic)

Bewertung binärer Klassifikationsmodelle – zeigt, wie gut ein Modell zwischen zwei Klassen unterscheidet

55
New cards

Bestandteile der ROC-Matrix

True Positive – False Positive – True Negative – False Negative

56
New cards

True Positive (TP)

Modell sagt positiv und es ist wirklich positiv

57
New cards

False Positive (FP)

Modell sagt positiv, aber es ist negativ

58
New cards

True Negative (TN)

Modell sagt negativ und es ist wirklich negativ

59
New cards

False Negative (FN)

Modell sagt negativ, aber es ist positiv

60
New cards

Daten

Zeichen, Zahlen oder Werte, die geordnet vorliegen und im Zusammenhang Bedeutung bekommen

61
New cards

Datenhierarchie

Bit – Byte – Field – Record – File – Database

62
New cards

Bit

Kleinste Einheit

63
New cards

Byte

8 Bits

64
New cards

Field (Feld)

Einzelner Wert

65
New cards

Record (Datensatz)

Mehrere Felder zusammen

66
New cards

File (Datei)

Viele Datensätze zusammen

67
New cards

Database (Datenbank)

Mehrere Dateien zusammen

68
New cards

Kategorisierung von ERP-Daten

Stammdaten – Bewegungsdaten – Referenzdaten – Setup-Daten

69
New cards

Stammdaten

Ändern sich selten – beschreiben grundlegende Dinge

70
New cards

Bewegungsdaten

Entstehen durch Vorgänge – ändern sich ständig

71
New cards

Referenzdaten

Standardisierte feste Werte zur Einordnung

72
New cards

Setup-Daten

Definieren Regeln und Systemeinstellungen

73
New cards

Datenqualität - KPI

Vollständigkeit – Gültigkeit – Aktualität – Konsistenz – Genauigkeit – Monitoring & Risiken

74
New cards

Vollständigkeit

Sind alle Pflichtfelder ausgefüllt?

75
New cards

Gültigkeit

Entsprechen Daten den Regeln?

76
New cards

Aktualität

Sind Daten auf dem neuesten Stand?

77
New cards

Konsistenz

Gibt es Widersprüche?

78
New cards

Genauigkeit

Spiegeln Daten die Realität korrekt wider?

79
New cards

Monitoring & Risiken

Werden Datenfehler erkannt und überwacht?

80
New cards

Arten von Datenaustauschformaten

Proprietäre Formate – Offene Formate – Bildformate – Plain Text

81
New cards

Proprietäre Formate

.doc, .xls, .ppt – softwaregebunden

82
New cards

Offene Formate

.docx, .txt, .rtf, .pdf, .html – breiter nutzbar

83
New cards

Bildformate

.jpeg, .png, .gif

84
New cards

Plain Text

Nur Text ohne Formatierung – überall lesbar

85
New cards

CSV

Tabellenformat – Zeilen/Spalten – Trennung durch Komma oder Semikolon – einfacher Datenaustausch

86
New cards

XML

Hierarchische strukturierte Daten mit Tags – System-zu-System-Austausch

87
New cards

RDF (Resource Description Framework)

Strukturierte und verknüpfte Webdaten – genutzt in KI und Wissensgraphen

88
New cards

Aufgaben des Datenmanagements

Speichern – Verwalten – Schützen – Analysieren – Löschen

89
New cards

Datenmanagementsystem (DMS)

Software zum Speichern, Organisieren, Bereitstellen und sicheren Verwalten von Daten

90
New cards

ERP-System

Software zur Verbindung aller wichtigen Geschäftsbereiche

91
New cards

Datenbankmanagementsystem (DBMS)

Software zur Verwaltung von Datenbanken

92
New cards

Aufgaben eines DBMS

Datenschutz – Datenunabhängigkeit – Datensicherheit

93
New cards

Zugriffsarten im DBMS

Abfrage (Query)

Mutation

Transaktion

94
New cards

Anfrage/Query

Nur Lesen von Daten

95
New cards

Mutation

Einfügen, Aktualisieren oder Löschen von Daten

96
New cards

Transaktion

Mehrere Lese- oder Schreibvorgänge zusammen

97
New cards

Datenbank

Strukturierte Sammlung von Daten

98
New cards

ACID-Modell

Atomarität – Konsistenz – Isolation – Dauerhaftigkeit

99
New cards

Atomarität

Ganz oder gar nicht – Rollback oder Commit – kein Zwischenzustand

100
New cards

Konsistenz (ACID)

Datenbank bleibt korrekt und regelkonform

Explore top flashcards

flashcards
Microscopic examination CASTS
34
Updated 657d ago
0.0(0)
flashcards
Zoology Exam 1
145
Updated 45d ago
0.0(0)
flashcards
Med Micro Case Studies
76
Updated 1196d ago
0.0(0)
flashcards
Y2 U1L1 Vamos a acampar
55
Updated 915d ago
0.0(0)
flashcards
Modern World History Midterm
51
Updated 205d ago
0.0(0)
flashcards
World History Exam
232
Updated 1033d ago
0.0(0)
flashcards
Concept of Globalization
22
Updated 1141d ago
0.0(0)
flashcards
Microscopic examination CASTS
34
Updated 657d ago
0.0(0)
flashcards
Zoology Exam 1
145
Updated 45d ago
0.0(0)
flashcards
Med Micro Case Studies
76
Updated 1196d ago
0.0(0)
flashcards
Y2 U1L1 Vamos a acampar
55
Updated 915d ago
0.0(0)
flashcards
Modern World History Midterm
51
Updated 205d ago
0.0(0)
flashcards
World History Exam
232
Updated 1033d ago
0.0(0)
flashcards
Concept of Globalization
22
Updated 1141d ago
0.0(0)