Masterarbeit: Adaptive Rechnungsverarbeitung mit Human-in-the-Loop

0.0(0)
Studied by 0 people
call kaiCall Kai
learnLearn
examPractice Test
spaced repetitionSpaced Repetition
heart puzzleMatch
flashcardsFlashcards
GameKnowt Play
Card Sorting

1/36

flashcard set

Earn XP

Description and Tags

Diese Flashcards decken die technischen Grundlagen, die Methodik (DSR, SLR), die KI-Modelle (LayoutLMv3, EasyOCR), die XAI-Komponenten und die ERP-Integration der Masterarbeit ab.

Last updated 1:20 PM on 6/15/26
Name
Mastery
Learn
Test
Matching
Spaced
Call with Kai

No analytics yet

Send a link to your students to track their progress

37 Terms

1
New cards

Masterarbeits-Ziel

Konzeption, prototypische Umsetzung und Evaluation einer adaptiven, erklärbaren End-to-End-Pipeline zur Rechnungsverarbeitung mit Human-in-the-Loop (HITL) zur Senkung des manuellen Prüfaufwands.

2
New cards

Evaluationskriterien (4 Lücken)

1) Auditierbarkeit, 2) Erklärbarkeit, 3) Zeitaufwand, 4) Fehlerquote.

3
New cards

Design Science Research (DSR)

Forschungsansatz nach Peffers et al. (2007), bei dem ein IT-Artefakt gebaut und evaluiert wird, um ein reales Problem zu lösen.

4
New cards

Systematische Literaturrecherche (SLR)

Eine reproduzierbare Literatursuche nach Kitchenham & Charters (2007) mit vorab definierten Suchbegriffen und Ein-/Ausschlusskriterien.

5
New cards

OCR (Optical Character Recognition)

Die Umwandlung von Bild- oder Scaninhalten in maschinenlesbaren Text.

6
New cards

EasyOCR

Eine quelloffene Python-Library, die Deep Learning für die Texterkennung nutzt (bestehend aus CRAFT und einem CRNN).

7
New cards

CRAFT

Character Region Awareness for Text detection; der Teil von EasyOCR, der detektiert, WO Text steht und Bounding-Boxes erstellt.

8
New cards

CRNN

Convolutional Recurrent Neural Network; der Teil von EasyOCR, der liest, WAS in einer Text-Box steht.

9
New cards

LayoutLMv3

Ein multimodales Transformer-Modell für Dokumentenverständnis, das Text, Layout (Position) und Bild gemeinsam verarbeitet.

10
New cards

Multimodaler Transformer

Eine Architektur, die unterschiedliche Datentypen (hier: Text + Layout-Positionen + Bildinformationen) kombiniert verarbeitet.

11
New cards

Token Classification

Die Machine-Learning-Aufgabe, bei der jedem einzelnen Wort oder Token ein Label (z. B. Rechnungsnummer) zugewiesen wird.

12
New cards

BIO-Tagging

Ein Schema zur Kennzeichnung von Feldern: B (Beginn eines Felds), I (Inside/Fortsetzung), O (Outside/kein Feld).

13
New cards

Human-in-the-Loop (HITL)

Ein Prinzip, bei dem Menschen gezielt unsichere Modellausgaben prüfen und korrigieren, wobei diese Korrekturen als Trainingssignal zurückfließen.

14
New cards

HuggingFace

Firma und Plattform, die einen Model Hub für vortrainierte Modelle sowie die Python-Library 'transformers' bereitstellt.

15
New cards

PyTorch

Ein Deep-Learning-Framework für Python, das für das Training und die Inferenz (Tensoren, Backpropagation) genutzt wird.

16
New cards

MPS (Metal Performance Shaders)

Das GPU-Backend von Apple Silicon, das PyTorch zur Beschleunigung des Trainings auf Mac-Hardware nutzt.

17
New cards

LIME (Local Interpretable Model-agnostic Explanations)

Eine Python-Library für erklärbare KI (XAI), die lokale Erklärungen für Einzelvorhersagen durch Variation der Eingabe erzeugt.

18
New cards

Flask & Jinja2

Flask ist ein leichtgewichtiges Web-Framework für Python; Jinja2 ist die zugehörige Template-Engine für dynamische HTML-Seiten.

19
New cards

Pseudo-Ground-Truth

Trainingslabels, die aus einer ursprünglichen Basis und den manuellen HITL-Korrekturen der Reviewer zusammengesetzt werden.

20
New cards

Label-Poisoning-Bug

Ein kritischer Fehler im Code, bei dem nicht korrigierte Felder fälschlich als 'O' gelabelt wurden, was zu einer Verschlechterung der Modellleistung führte.

21
New cards

Konfidenz-Schwellenwert (0,850,85)

Die Untergrenze der modellinternen Sicherheit; Vorhersagen darunter werden automatisch zur menschlichen Prüfung (HITL) geroutet.

22
New cards

Validierungsregeln (arithmetisch)

Ein deterministisches Sicherheitsnetz (z. B. Netto + Steuer = Brutto), das Fehler bei hoher Konfidenz (Silent Failures) abfangen soll.

23
New cards

Touchless / Dunkelverarbeitung

Die vollautomatische Bearbeitung einer Rechnung ohne jeglichen menschlichen Eingriff.

24
New cards

F1-Score

Das harmonische Mittel aus Precision und Recall; dient zur Bewertung der tatsächlichen Modellgüte gegen die Ground Truth.

25
New cards

Silent Failure

Ein Fehlerfall, bei dem das Modell einen falschen Wert liefert, dabei aber eine sehr hohe Konfidenz aufweist.

26
New cards

Modellkalibrierung

Das Ausmaß der Übereinstimmung zwischen der statistischen Konfidenz des Modells und seiner tatsächlichen Korrektheit.

27
New cards

Ablationsstudie

Eine Untersuchung, bei der eine Komponente (z. B. das HITL-Retraining) gezielt variiert oder weggelassen wird, um deren kausalen Effekt zu messen.

28
New cards

XAI (Explainable AI)

Methoden, die die Entscheidungsfindung von KI-Modellen für Menschen nachvollziehbar machen (z. B. LIME oder Attention).

29
New cards

Attention (Aufmerksamkeitsgewichte)

Ein Transformer-interner Mechanismus, der zeigt, auf welche Regionen oder Wörter das Modell bei einer Entscheidung fokussiert hat.

30
New cards

SAP-Schnittstelle (Prototyp)

Eine file-basierte Batch-Übergabe mittels CSV-Dateien im Zielformat (Alternative zu Live-APIs wie IDoc oder BAPI).

31
New cards

ERP (Enterprise Resource Planning)

Integriertes Unternehmenssystem (z. B. SAP), das alle Kernprozesse auf einer gemeinsamen Datenbasis bündelt.

32
New cards

Purchase-to-Pay (P2P)

Der betriebliche Gesamtprozess von der Bestellung über den Wareneingang und die Rechnungsprüfung bis zur Zahlung.

33
New cards

3-Way-Match

Der automatisierte Abgleich zwischen Bestellung, Wareneingang und Rechnung zur Verifizierung der Zahlungsfreigabe.

34
New cards

BPM (Business Process Management)

Ansatz zur Modellierung, Ausführung, Überwachung und Optimierung von Geschäftsprozessen.

35
New cards

Medienbruch

Der Wechsel des Datenmediums (z. B. von digitalem PDF zu manueller Tastatureingabe), der im Projekt durch IDP eliminiert wird.

36
New cards

IDP vs. RPA

RPA automatisiert strukturierte Klickfolgen; IDP (Intelligent Document Processing) nutzt KI, um unstrukturierte Dokumente inhaltlich zu verstehen.

37
New cards

GoBD

Grundsätze zur ordnungsmäßigen Führung und Aufbewahrung von Büchern in elektronischer Form; relevant für die Revisionssicherheit.