Leibniz FH
Business Intelligence & Data Science
Die duale Hochschule für Wirtschaft und Informatik in Niedersachsen
Wintersemester 2025 / 2026
Business Intelligence & Data Science
Thorben Müller #JoinOurNetwork
Bearbeitungsanleitung für Office 365
Mit Leibniz-FH-Konto bei office.com anmelden
Über bereitgestellte Links Aufgaben bearbeiten und „Absenden“.
Antwort zum Bearbeiten Speichern
Antwort kann auch später über Forms eingesehen werden
Gliederung
Themenübersicht
Einführung
Historische Entwicklung
Dateien und Datenbanken
Operative vs. Dispositive Daten
Data Warehouse
Transformationsprozesse („ETLs“)
OLAP und Sternschema
Reifegradmodell
Big Data
Data Science
Einführung
Historische Entwicklung
Industrielle Revolutionen
1. Erste Industrielle Revolution (ca. 1770 – 1840)
Manuelle zu maschineller Fertigung
Technologien: Dampfmaschine, mechanischer Webstuhl, Spinning Jenny
2. Zweite Industrielle Revolution (ca. 1870 – 1914)
Elektrifizierung, Fließbandproduktion
Technologien: Dynamomaschine, Massenproduktion von Automobilen, Telefon, Telegramm
3. Dritte Industrielle Revolution (ca. 1970er)
Computertechnologie, Robotik, Internationalisierung, Automatisierung
4. Vierte Industrielle Revolution (ca. 2000er)
Digitalisierung, Vernetzung, datengetriebene Produktion/Logistik, smarte Technologien, IoT, Industrie 4.0
5. Fünfte Industrielle Revolution (Gegenwart/nahe Zukunft)
Intelligente Technologien, Mensch-Maschine-Kollaboration
Begriffsdefinition von Business Intelligence (BI)
1. Definition 1: „Business Intelligence kann als Sammlung unterschiedlicher Methoden und Technologien verstanden werden, welche dazu dienen, Erkenntnisse aus verfügbaren Daten für unternehmerische Entscheidungen zur Steuerung der Geschäftsprozesse zu gewinnen.“
(Quelle: Horváth, Peter et al. (2020), S. 117) 2. Definition 2: „Business Intelligence bezeichnet die systematische Auswertung von Daten eines Unternehmens, um damit Geschäftsprozesse zu analysieren und zu optimieren.“
(Quelle: Schnider, Dani et al. (2016), S. 1) 3. Definition 3: „Business Intelligence – kurz BI – wird so umschrieben, dass hierunter alle Aktivitäten in einer Unternehmung zusammengefasst werden, die der Integration, der qualitativen Verbesserung, der Transformation, und der statistischen Analyse der operativen und externen Daten mit dem Ziel dienen, Informationen und letztendlich Wissen innerhalb eines vorgegebenen Planungs-, Entscheidungs- und Controllingrahmens zu generieren.“
(Quelle: Müller, Roland M. & Lenz, Hans-Joachim (2013), S. 3)
Ziele von Business Intelligence
Datenanalyse und -visualisierung
Informierte Entscheidungsfindung
Kundenzufriedenheit und -bindung
Leistungsüberwachung
Risikomanagement
Effizienzsteigerung
Wettbewerbsvorteile
Dateien und Datenbanken
Vergleich Dateien vs. Datenbanken
Kriterium | Dateimanagement | Datenbankmanagement |
|---|---|---|
Zweck | Organisation, Verwaltung und Speicherung von Dateien | Organisation, Verwaltung und Speicherung von Datenbanken |
Struktur | Hierarchische Struktur mit Verzeichnissen und Dateien; erlaubt verschiedene Formate | Datenbanken mit Schemata und Tabellen (Attribute/Spalten sowie Datensätze/Zellen) |
Zugriff | Direkter Pfad | Abfrage |
Mehrbenutzerfähigkeit | Optimiert für Anwendungen; in der Regel eingeschränkter Mehrfachzugriff | Optimiert für Abfragen und Verwaltung der Mehrbenutzerzugriffe |
Beispiele | Windows NTFS, FAT32, Linux ext4 | Microsoft SQL-Server, IBM DB2, Oracle Database |
Datenbank-Strukturen
Datenbank (DB): Systematische, strukturierte Ansammlung von Daten
Datenbankmanagementsystem (DBMS): Pendant zum Dateisystem, steuert Verwaltung und Nutzung gespeicherter Daten
Datenbanksystem: Kombination aus DB und DBMS, üblicherweise verwaltet ein Server mehrere DBs vom selben DBMS
NoSQL-Datenbanken
Nutzen nicht feste Tabellenschemata, setzen auf Key-Value-Verfahren.
Basieren nicht auf Tabellen; erlauben strukturierte, teilstrukturierte und unstrukturierte Daten (Big-Data-Bereich).
Objektorientierte Datenbanken
Halten Daten als Objekte mit Attributen, analog zur objektorientierten Programmierung.
Vorteil: Bessere abbildbare komplexe Strukturen und Beziehungen.
Verteilte Datenbanken
Organisieren Daten an mehreren Standorten; verbunden für verbesserte Skalierbarkeit.
Hohe Ausfallsicherheit, bedingen jedoch komplexe Verwaltung.
Hierarchische Datenbanken
Organisieren Daten in baumartigen Strukturen mit Eltern-Kind-Beziehungen.
Netzwerkdatenbanken
Organisieren Daten in netzwerkartigen Strukturen; komplexer als relationale Datenbanken in Verwaltung und Abfragen.
Relationale Datenbanken
Weit verbreitete Datenbankstruktur basierend auf Tabellen (n:1) mit Primär- und Fremdschlüsseln.
Die Structured Query Language (SQL) ermöglicht Abfragen und Manipulation von Daten.
Strukturelle Komponenten (Relational)
Tabelle: Grundlegender Baustein der relationalen Datenbank.
Datensatz: Spezifische Zeile einer Tabelle, mit einem oder mehreren Feldern.
Primärschlüssel: Eindeutiger Wert zur Identifizierung eines Datensatzes.
Fremdschlüssel: Verweist auf den Primärschlüssel einer anderen Tabelle.
Beziehungen und Kardinalitäten
1:1 - Jeder Datensatz in der ersten Tabelle steht exakt einem Datensatz in der zweiten gegenüber.
1:n - Ein Datensatz in der ersten Tabelle steht mehreren Datensätzen in der zweiten gegenüber.
n:m - Datensätze in einer Tabelle sind mehreren Datensätzen der anderen Tabelle zugeordnet.
Operative Daten vs. Dispositive Daten
Charakteristika
Operative Daten
Generiert durch Administrations- und Abrechnungssysteme.
Hohe Granularität, auf effiziente Betriebsabläufe ausgelegt.
Oft redundant und inkonsistent.
Dispositive Daten
Dienen der Unterstützung von Entscheidungsprozessen.
Häufig verdichtete, transformierte Daten; konsistent modelliert.
Data Warehouse
Begrifflichkeiten
Data Warehouses (DWHs): Von den operativen Datenbeständen getrennte, logisch zentralisierte Datenhaltungssysteme.
Dienen als einheitliche Datenbasis für Entscheidungsunterstützungssysteme.
Merkmale von Data Warehouses
Themenorientierung: Ausrichtung an Interessengebieten der Entscheidungsträger (z.B.: Unternehmensstruktur, Regionalstruktur).
Integration: Anspruch an eine inhaltlich widerspruchsfreie Datensammlung (Single Point of Truth).
Zeitraumbezug: Granularität verfeinert sich mit der Leistungsfähigkeit der Systeme.
Nicht-Volatilität: Dauerhaftes Ablegen von Informationen ohne kontinuierliche Veränderungen.
DWH-Architektur
Staging Area: Enthält Daten aus unterschiedlichen Quellen ohne Struktur.
Cleansing Area: Behandlung von fehlerhaften Daten.
Core: Themenspezifisch, hochgradig historisierte und atomare Speicherung.
Data Marts: Fachspezifische Teilmengen des Cores, auf Voraussetzungen eines Fachbereichs abgestimmt.
Transformationsprozesse – ETL
Schritte des ETL-Prozesses
1. Extraktion: Daten aus operativen Daten, Behandlung von heterogenen internen und externen Daten.
2. Transformation: Harmonisierung und Aggregation, Schlüsseldisharmonien und unterschiedliche Kodierungen werden behandelt.
3. Laden: Fertige Daten werden in das DWH überführt.
OLAP und Sternschema
OLAP (Online Analytical Processing): Technik zur Bereitstellung von Abfragen in multidimensionalen Datenräumen.
Ad-Hoc-Abfragen ermöglichen.
12 Regeln nach Codd umreißen Grundprinzipien.
Dimensionen und Measures bieten strukturierte Datenanalyse.
Reifegradmodell nach Gartner
5 Stufen von Analytics
Deskriptive Analytik: Klassisches Reporting, Bereitstellung von Kennzahlen.
Diagnostische Analytik: Self-Service BI, Ursachenanalyse.
Prädiktive Analytik: Vorhersagen, Nutzung statistischer Modelle.
Präskriptive Analytik: Szenarien und Simulationen, Handlungsvorschläge.
Kognitive Analytik: Automatisierte Entscheidungen, Lernen aus Daten.
Big Data
Begrifflichkeiten und Merkmale
Big Data: Bezieht sich auf große Datenmengen aus verschiedenen Quellen.
Volume: erhebliche Datenmengen.
Variety: unterschiedliche Quellen und Strukturen.
Velocity: Daten werden in Echtzeit verarbeitet.
Technologien
Hohe Anforderungen an Speicherkapazität und Rechenleistung; konventionelle Lösungen nicht ausreichend.
Künstliche Intelligenz
Abgrenzung zu Big Data
Künstliche Intelligenz (KI): Nachahmung menschlicher Intelligenz durch Computersysteme.
Maschinelles Lernen als Teilbereich; Deep Learning nutzt neuronale Netze.
Large Language Models (LLMs) als spezialisierte Algorithmen der KI.
Quellenverzeichnis
Literaturhinweise
Baars, Henning & Kemper, Hans-Georg (2021): Business Intelligence & Analytics – Grundlagen und praktische Anwendungen, Wiesbaden: Springer Vieweg.
Bauer, Andreas & Günzel, Holger (2013): Data Warehouse Systeme – Architektur, Entwicklung, Anwendung, Heidelberg: dpunkt.verlag.
Ferrari, Alberto & Russo, Marco (2018): Datenanalyse mit Microsoft Power BI und Power Pivot für Excel, Heidelberg: dpunkt.verlag.
Schnider, Dani et al (2016): Data Warehouse Blueprints: Business Intelligence in der Praxis, München: Hanser Verlage. .