Data Science - KOMPLETT

0.0(0)

Studied by 0 people

Call Kai

Learn

Practice Test

Spaced Repetition

Match

Flashcards

Knowt Play

Card Sorting

1/174

There's no tags or description

Looks like no tags are added yet.

Last updated 2:59 PM on 3/22/26

Name	Mastery	Learn	Test	Matching	Spaced	Call with Kai

No analytics yet

Send a link to your students to track their progress

175 Terms

New cards

LLMs (Large Language Models)

KI-Systeme, die mit sehr großen Textmengen trainiert wurden und menschliche Sprache verstehen und erzeugen können

New cards

Beispiele für LLMs

ChatGPT, Gemini

New cards

Funktionsweise von LLMs

Training mit Milliarden Textbeispielen – Lernen statistischer Sprachmuster – Vorhersage des wahrscheinlich nächsten Wortes – dadurch entstehen Sätze, Absätze oder Dokumente

New cards

Einsatz von LLMs

Chatbots, KI-Assistenten, Support, Analyse, digitale Teammitglieder

New cards

Arithmetisches Mittel

Addiert alle Werte und teilt durch die Anzahl der Werte (klassischer Durchschnitt)

New cards

Geometrisches Mittel

Multipliziert alle Werte und zieht die n-te Wurzel – genutzt bei Wachstumsraten und Renditen

New cards

Harmonisches Mittel

Kehrwert bilden → arithmetisches Mittel berechnen → wieder Kehrwert – genutzt bei Durchschnittsgeschwindigkeiten und Preisen pro Einheit

New cards

Median

Mittlerer Wert einer sortierten Datenreihe – bei gerader Anzahl Durchschnitt der beiden mittleren Werte

New cards

Modus

Am häufigsten vorkommender Wert einer Datenreihe

New cards

Offene Daten (Open Data)

Öffentlich zugängliche Daten wie Linked Open Data, Regierungsdaten oder wissenschaftliche Daten

New cards

Interne Daten

Unternehmensinterne, nicht öffentliche Daten wie Stammdaten, Transaktionsdaten und Sensordaten

New cards

Strukturierte Daten

Jeder Datensatz folgt exakt derselben Struktur (z. B. Excel, CSV, relationale Datenbanken)

New cards

Semi-strukturierte Daten

Struktur vorhanden, aber flexibel (z. B. XML, JSON)

New cards

Unstrukturierte Daten

Kein festes Schema – Bedeutung steckt im Inhalt (z. B. PDF, Textfiles, Word, E-Mail, Bilder)

New cards

Big Data 5V

Volume – Velocity – Variety – Veracity – Value
Volumen – Geschwindigkeit – Vielfalt – Wahrhaftigkeit – Wert

New cards

Volume

Extrem große Datenmengen

New cards

Velocity

Daten entstehen sehr schnell und müssen in Echtzeit verarbeitet werden

New cards

Variety

Viele verschiedene Datenarten und Formate

New cards

Veracity

Datenqualität ist unsicher oder unterschiedlich gut

New cards

Value

Daten sind nur sinnvoll, wenn daraus ein Nutzen entsteht

New cards

NoSQL

Nicht-relationale Datenbanken mit flexiblem Schema, horizontaler Skalierung und Abfragen ohne komplexe JOINs

New cards

Key-Value-Datenbank

Speichert Daten als Schlüssel-Wert-Paare – sehr schnell – einfache Struktur

New cards

Wide-Column-Datenbank

Spaltenorientierte Speicherung mit dynamischen Spalten – ideal für große Datenmengen und hohe Schreiblast

New cards

Dokumentenorientierte Datenbank

Speichert hierarchische Dokumente (JSON/XML) mit flexiblem Schema

New cards

Graphendatenbank

Speichert Daten als Knoten und Beziehungen – effizient bei stark vernetzten Daten

New cards

Descriptive Analytics

„Was ist passiert?“ – Analyse vergangener Daten – Reports, Dashboards, KPIs

New cards

Diagnostic Analytics

„Warum ist es passiert?“ – Ursachenanalyse und Mustererkennung

New cards

Predictive Analytics

„Was wird passieren?“ – Prognosen mithilfe von Statistik und Machine Learning

New cards

Prescriptive Analytics

„Was sollen wir tun?“ – Handlungsempfehlungen und Optimierung

New cards

Anwendungsgebiete von Data Science

Vorhersage – Optimierung – Personalisierung – Komfort – Intelligenz

New cards

CRISP-DM

Cross-Industry Standard Process for Data Mining – Standard-Vorgehensmodell für Data-Science-Projekte

New cards

Phasen von CRISP-DM

Business Understanding – Data Understanding – Data Preparation – Modeling – Evaluation – Deployment

New cards

Business Understanding

Geschäftsproblem verstehen, Ziele definieren, Erfolgskriterien festlegen

New cards

Data Understanding

Daten sammeln, beschreiben, erste Analyse durchführen, Datenqualität prüfen

New cards

Data Preparation

Daten auswählen, bereinigen, transformieren und zusammenführen (70–80 % der Arbeit)

New cards

Modeling

Modell auswählen, trainieren, Parameter einstellen und Testdesign erstellen

New cards

Evaluation

Ergebnisse bewerten und prüfen, ob das Business-Ziel erreicht wurde

New cards

Deployment

Modell produktiv einsetzen sowie Monitoring und Wartung durchführen

New cards

Trainingsdaten

Ca. 70 % – Modell wird gelernt

New cards

Validierungsdaten

Ca. 15 % – Modell wird geprüft und optimiert

New cards

Testdaten

Ca. 15 % – finale Überprüfung des Modells

New cards

Aufgaben Data Engineering

Erfassung

Extraktion

Bereinigung

Speicherung

Verbreitung

Suche

New cards

Erfassung/Capture

Daten sammeln

New cards

Extraktion/Extraction

Daten aus Quellen holen

New cards

Bereinigung/Curation

Fehler korrigieren (Bereinigung)

New cards

Speicherung/Storage

Daten speichern

New cards

Verbreitung/Sharing

Daten zugänglich machen

New cards

Suche/Search

Daten auffindbar machen

New cards

Aufgaben Data Science

Anfragen

Analyse

Visualisierung

New cards

Anfragen/Querying

Daten abfragen

New cards

Analyse/Analysis

Modelle und Auswertungen durchführen

New cards

Visualisierung/Visualization

Ergebnisse darstellen

New cards

Bestandteile eines Data-Science-Projekts

Daten aufbereiten – Modell entwickeln und bewerten – Ergebnisse analysieren und nutzen

New cards

ROC-Analyse (Receiver Operating Characteristic)

Bewertung binärer Klassifikationsmodelle – zeigt, wie gut ein Modell zwischen zwei Klassen unterscheidet

New cards

Bestandteile der ROC-Matrix

True Positive – False Positive – True Negative – False Negative

New cards

True Positive (TP)

Modell sagt positiv und es ist wirklich positiv

New cards

False Positive (FP)

Modell sagt positiv, aber es ist negativ

New cards

True Negative (TN)

Modell sagt negativ und es ist wirklich negativ

New cards

False Negative (FN)

Modell sagt negativ, aber es ist positiv

New cards

Daten

Zeichen, Zahlen oder Werte, die geordnet vorliegen und im Zusammenhang Bedeutung bekommen

New cards

Datenhierarchie

Bit – Byte – Field – Record – File – Database

New cards

Bit

Kleinste Einheit

New cards

Byte

8 Bits

New cards

Field (Feld)

Einzelner Wert

New cards

Record (Datensatz)

Mehrere Felder zusammen

New cards

File (Datei)

Viele Datensätze zusammen

New cards

Database (Datenbank)

Mehrere Dateien zusammen

New cards

Kategorisierung von ERP-Daten

Stammdaten – Bewegungsdaten – Referenzdaten – Setup-Daten

New cards

Stammdaten

Ändern sich selten – beschreiben grundlegende Dinge

New cards

Bewegungsdaten

Entstehen durch Vorgänge – ändern sich ständig

New cards

Referenzdaten

Standardisierte feste Werte zur Einordnung

New cards

Setup-Daten

Definieren Regeln und Systemeinstellungen

New cards

Datenqualität - KPI

Vollständigkeit – Gültigkeit – Aktualität – Konsistenz – Genauigkeit – Monitoring & Risiken

New cards

Vollständigkeit

Sind alle Pflichtfelder ausgefüllt?

New cards

Gültigkeit

Entsprechen Daten den Regeln?

New cards

Aktualität

Sind Daten auf dem neuesten Stand?

New cards

Konsistenz

Gibt es Widersprüche?

New cards

Genauigkeit

Spiegeln Daten die Realität korrekt wider?

New cards

Monitoring & Risiken

Werden Datenfehler erkannt und überwacht?

New cards

Arten von Datenaustauschformaten

Proprietäre Formate – Offene Formate – Bildformate – Plain Text

New cards

Proprietäre Formate

.doc, .xls, .ppt – softwaregebunden

New cards

Offene Formate

.docx, .txt, .rtf, .pdf, .html – breiter nutzbar

New cards

Bildformate

.jpeg, .png, .gif

New cards

Plain Text

Nur Text ohne Formatierung – überall lesbar

New cards

CSV

Tabellenformat – Zeilen/Spalten – Trennung durch Komma oder Semikolon – einfacher Datenaustausch

New cards

XML

Hierarchische strukturierte Daten mit Tags – System-zu-System-Austausch

New cards

RDF (Resource Description Framework)

Strukturierte und verknüpfte Webdaten – genutzt in KI und Wissensgraphen

New cards

Aufgaben des Datenmanagements

Speichern – Verwalten – Schützen – Analysieren – Löschen

New cards

Datenmanagementsystem (DMS)

Software zum Speichern, Organisieren, Bereitstellen und sicheren Verwalten von Daten

New cards

ERP-System

Software zur Verbindung aller wichtigen Geschäftsbereiche

New cards

Datenbankmanagementsystem (DBMS)

Software zur Verwaltung von Datenbanken

New cards

Aufgaben eines DBMS

Datenschutz – Datenunabhängigkeit – Datensicherheit

New cards

Zugriffsarten im DBMS

Abfrage (Query)

Mutation

Transaktion

New cards

Anfrage/Query

Nur Lesen von Daten

New cards

Mutation

Einfügen, Aktualisieren oder Löschen von Daten

New cards

Transaktion

Mehrere Lese- oder Schreibvorgänge zusammen

New cards

Datenbank

Strukturierte Sammlung von Daten

New cards

ACID-Modell

Atomarität – Konsistenz – Isolation – Dauerhaftigkeit

New cards

Atomarität

Ganz oder gar nicht – Rollback oder Commit – kein Zwischenzustand

100

New cards

Konsistenz (ACID)

Datenbank bleibt korrekt und regelkonform

Explore top notes

Chapter 10: American Revolution and the New Nation (1775–1787)

Updated 1083d ago

0.0(0)

Unfinished Nation - Chapter 9: Jacksonian America

Updated 1262d ago

0.0(0)

Chapter 7- Covalent and Metallic Bonding

Updated 1276d ago

0.0(0)

Chapter 5 - The Structure and Function of Large Biological Molecules

Updated 1434d ago

0.0(0)

hospitality notes

Updated 1160d ago

0.0(0)

Adolescent Development: Health

Updated 1147d ago

0.0(0)

UNIT 4: Chemical Bonding and Structure

Updated 744d ago

0.0(0)

Stylistic Devices for IB English Language and Literature

Updated 937d ago

0.0(0)

Chapter 10: American Revolution and the New Nation (1775–1787)

Updated 1083d ago

0.0(0)

Unfinished Nation - Chapter 9: Jacksonian America

Updated 1262d ago

0.0(0)

Chapter 7- Covalent and Metallic Bonding

Updated 1276d ago

0.0(0)

Chapter 5 - The Structure and Function of Large Biological Molecules

Updated 1434d ago

0.0(0)

hospitality notes

Updated 1160d ago

0.0(0)

Adolescent Development: Health

Updated 1147d ago

0.0(0)

UNIT 4: Chemical Bonding and Structure

Updated 744d ago

0.0(0)

Stylistic Devices for IB English Language and Literature

Updated 937d ago

0.0(0)

Explore top flashcards

IB Computer Science - Topic 2 - Computer Organization

48Updated 1206d ago

0.0(0)

Microscopic examination CASTS

34Updated 657d ago

0.0(0)

Zoology Exam 1

145Updated 45d ago

0.0(0)

Med Micro Case Studies

76Updated 1196d ago

0.0(0)

Y2 U1L1 Vamos a acampar

55Updated 915d ago

0.0(0)

Modern World History Midterm

51Updated 205d ago

0.0(0)

World History Exam

232Updated 1033d ago

0.0(0)

Concept of Globalization

22Updated 1141d ago

0.0(0)

IB Computer Science - Topic 2 - Computer Organization

48Updated 1206d ago

0.0(0)

Microscopic examination CASTS

34Updated 657d ago

0.0(0)

Zoology Exam 1

145Updated 45d ago

0.0(0)

Med Micro Case Studies

76Updated 1196d ago

0.0(0)

Y2 U1L1 Vamos a acampar

55Updated 915d ago

0.0(0)

Modern World History Midterm

51Updated 205d ago

0.0(0)

World History Exam

232Updated 1033d ago

0.0(0)

Concept of Globalization

22Updated 1141d ago

0.0(0)