Leibniz FH

Business Intelligence & Data Science

Die duale Hochschule für Wirtschaft und Informatik in Niedersachsen

Wintersemester 2025 / 2026

Business Intelligence & Data Science

Thorben Müller #JoinOurNetwork

Bearbeitungsanleitung für Office 365

  1. Mit Leibniz-FH-Konto bei office.com anmelden

  2. Über bereitgestellte Links Aufgaben bearbeiten und „Absenden“.

  3. Antwort zum Bearbeiten Speichern

  4. Antwort kann auch später über Forms eingesehen werden


Gliederung

Themenübersicht

  1. Einführung

  2. Historische Entwicklung

  3. Dateien und Datenbanken

  4. Operative vs. Dispositive Daten

  5. Data Warehouse

  6. Transformationsprozesse („ETLs“)

  7. OLAP und Sternschema

  8. Reifegradmodell

  9. Big Data

  10. Data Science


Einführung

Historische Entwicklung

Industrielle Revolutionen

1. Erste Industrielle Revolution (ca. 1770 – 1840)

  • Manuelle zu maschineller Fertigung

  • Technologien: Dampfmaschine, mechanischer Webstuhl, Spinning Jenny

2. Zweite Industrielle Revolution (ca. 1870 – 1914)

  • Elektrifizierung, Fließbandproduktion

  • Technologien: Dynamomaschine, Massenproduktion von Automobilen, Telefon, Telegramm

3. Dritte Industrielle Revolution (ca. 1970er)

  • Computertechnologie, Robotik, Internationalisierung, Automatisierung

4. Vierte Industrielle Revolution (ca. 2000er)

  • Digitalisierung, Vernetzung, datengetriebene Produktion/Logistik, smarte Technologien, IoT, Industrie 4.0

5. Fünfte Industrielle Revolution (Gegenwart/nahe Zukunft)

  • Intelligente Technologien, Mensch-Maschine-Kollaboration


Begriffsdefinition von Business Intelligence (BI)

1. Definition 1: „Business Intelligence kann als Sammlung unterschiedlicher Methoden und Technologien verstanden werden, welche dazu dienen, Erkenntnisse aus verfügbaren Daten für unternehmerische Entscheidungen zur Steuerung der Geschäftsprozesse zu gewinnen.“
(Quelle: Horváth, Peter et al. (2020), S. 117)    2. Definition 2: „Business Intelligence bezeichnet die systematische Auswertung von Daten eines Unternehmens, um damit Geschäftsprozesse zu analysieren und zu optimieren.“
(Quelle: Schnider, Dani et al. (2016), S. 1)    3. Definition 3: „Business Intelligence – kurz BI – wird so umschrieben, dass hierunter alle Aktivitäten in einer Unternehmung zusammengefasst werden, die der Integration, der qualitativen Verbesserung, der Transformation, und der statistischen Analyse der operativen und externen Daten mit dem Ziel dienen, Informationen und letztendlich Wissen innerhalb eines vorgegebenen Planungs-, Entscheidungs- und Controllingrahmens zu generieren.“
(Quelle: Müller, Roland M. & Lenz, Hans-Joachim (2013), S. 3)


Ziele von Business Intelligence

  • Datenanalyse und -visualisierung

  • Informierte Entscheidungsfindung

  • Kundenzufriedenheit und -bindung

  • Leistungsüberwachung

  • Risikomanagement

  • Effizienzsteigerung

  • Wettbewerbsvorteile


Dateien und Datenbanken

Vergleich Dateien vs. Datenbanken

Kriterium

Dateimanagement

Datenbankmanagement

Zweck

Organisation, Verwaltung und Speicherung von Dateien

Organisation, Verwaltung und Speicherung von Datenbanken

Struktur

Hierarchische Struktur mit Verzeichnissen und Dateien; erlaubt verschiedene Formate

Datenbanken mit Schemata und Tabellen (Attribute/Spalten sowie Datensätze/Zellen)

Zugriff

Direkter Pfad

Abfrage

Mehrbenutzerfähigkeit

Optimiert für Anwendungen; in der Regel eingeschränkter Mehrfachzugriff

Optimiert für Abfragen und Verwaltung der Mehrbenutzerzugriffe

Beispiele

Windows NTFS, FAT32, Linux ext4

Microsoft SQL-Server, IBM DB2, Oracle Database


Datenbank-Strukturen

  • Datenbank (DB): Systematische, strukturierte Ansammlung von Daten

  • Datenbankmanagementsystem (DBMS): Pendant zum Dateisystem, steuert Verwaltung und Nutzung gespeicherter Daten

  • Datenbanksystem: Kombination aus DB und DBMS, üblicherweise verwaltet ein Server mehrere DBs vom selben DBMS


NoSQL-Datenbanken

  • Nutzen nicht feste Tabellenschemata, setzen auf Key-Value-Verfahren.

  • Basieren nicht auf Tabellen; erlauben strukturierte, teilstrukturierte und unstrukturierte Daten (Big-Data-Bereich).


Objektorientierte Datenbanken

  • Halten Daten als Objekte mit Attributen, analog zur objektorientierten Programmierung.

  • Vorteil: Bessere abbildbare komplexe Strukturen und Beziehungen.


Verteilte Datenbanken

  • Organisieren Daten an mehreren Standorten; verbunden für verbesserte Skalierbarkeit.

  • Hohe Ausfallsicherheit, bedingen jedoch komplexe Verwaltung.


Hierarchische Datenbanken

  • Organisieren Daten in baumartigen Strukturen mit Eltern-Kind-Beziehungen.


Netzwerkdatenbanken

  • Organisieren Daten in netzwerkartigen Strukturen; komplexer als relationale Datenbanken in Verwaltung und Abfragen.


Relationale Datenbanken

  • Weit verbreitete Datenbankstruktur basierend auf Tabellen (n:1) mit Primär- und Fremdschlüsseln.

  • Die Structured Query Language (SQL) ermöglicht Abfragen und Manipulation von Daten.

Strukturelle Komponenten (Relational)

  • Tabelle: Grundlegender Baustein der relationalen Datenbank.

  • Datensatz: Spezifische Zeile einer Tabelle, mit einem oder mehreren Feldern.

  • Primärschlüssel: Eindeutiger Wert zur Identifizierung eines Datensatzes.

  • Fremdschlüssel: Verweist auf den Primärschlüssel einer anderen Tabelle.


Beziehungen und Kardinalitäten

  • 1:1 - Jeder Datensatz in der ersten Tabelle steht exakt einem Datensatz in der zweiten gegenüber.

  • 1:n - Ein Datensatz in der ersten Tabelle steht mehreren Datensätzen in der zweiten gegenüber.

  • n:m - Datensätze in einer Tabelle sind mehreren Datensätzen der anderen Tabelle zugeordnet.


Operative Daten vs. Dispositive Daten

Charakteristika

Operative Daten
  • Generiert durch Administrations- und Abrechnungssysteme.

  • Hohe Granularität, auf effiziente Betriebsabläufe ausgelegt.

  • Oft redundant und inkonsistent.

Dispositive Daten
  • Dienen der Unterstützung von Entscheidungsprozessen.

  • Häufig verdichtete, transformierte Daten; konsistent modelliert.


Data Warehouse

Begrifflichkeiten

Data Warehouses (DWHs): Von den operativen Datenbeständen getrennte, logisch zentralisierte Datenhaltungssysteme.

  • Dienen als einheitliche Datenbasis für Entscheidungsunterstützungssysteme.

Merkmale von Data Warehouses

  • Themenorientierung: Ausrichtung an Interessengebieten der Entscheidungsträger (z.B.: Unternehmensstruktur, Regionalstruktur).

  • Integration: Anspruch an eine inhaltlich widerspruchsfreie Datensammlung (Single Point of Truth).

  • Zeitraumbezug: Granularität verfeinert sich mit der Leistungsfähigkeit der Systeme.

  • Nicht-Volatilität: Dauerhaftes Ablegen von Informationen ohne kontinuierliche Veränderungen.


DWH-Architektur

  • Staging Area: Enthält Daten aus unterschiedlichen Quellen ohne Struktur.

  • Cleansing Area: Behandlung von fehlerhaften Daten.

  • Core: Themenspezifisch, hochgradig historisierte und atomare Speicherung.

  • Data Marts: Fachspezifische Teilmengen des Cores, auf Voraussetzungen eines Fachbereichs abgestimmt.


Transformationsprozesse – ETL

Schritte des ETL-Prozesses

1. Extraktion: Daten aus operativen Daten, Behandlung von heterogenen internen und externen Daten.
2. Transformation: Harmonisierung und Aggregation, Schlüsseldisharmonien und unterschiedliche Kodierungen werden behandelt.
3. Laden: Fertige Daten werden in das DWH überführt.


OLAP und Sternschema

OLAP (Online Analytical Processing): Technik zur Bereitstellung von Abfragen in multidimensionalen Datenräumen.

  • Ad-Hoc-Abfragen ermöglichen.

  • 12 Regeln nach Codd umreißen Grundprinzipien.

  • Dimensionen und Measures bieten strukturierte Datenanalyse.


Reifegradmodell nach Gartner

5 Stufen von Analytics

  1. Deskriptive Analytik: Klassisches Reporting, Bereitstellung von Kennzahlen.

  2. Diagnostische Analytik: Self-Service BI, Ursachenanalyse.

  3. Prädiktive Analytik: Vorhersagen, Nutzung statistischer Modelle.

  4. Präskriptive Analytik: Szenarien und Simulationen, Handlungsvorschläge.

  5. Kognitive Analytik: Automatisierte Entscheidungen, Lernen aus Daten.


Big Data

Begrifflichkeiten und Merkmale

Big Data: Bezieht sich auf große Datenmengen aus verschiedenen Quellen.

  • Volume: erhebliche Datenmengen.

  • Variety: unterschiedliche Quellen und Strukturen.

  • Velocity: Daten werden in Echtzeit verarbeitet.

Technologien

  • Hohe Anforderungen an Speicherkapazität und Rechenleistung; konventionelle Lösungen nicht ausreichend.


Künstliche Intelligenz

Abgrenzung zu Big Data

Künstliche Intelligenz (KI): Nachahmung menschlicher Intelligenz durch Computersysteme.

  • Maschinelles Lernen als Teilbereich; Deep Learning nutzt neuronale Netze.

  • Large Language Models (LLMs) als spezialisierte Algorithmen der KI.


Quellenverzeichnis

Literaturhinweise

  1. Baars, Henning & Kemper, Hans-Georg (2021): Business Intelligence & Analytics – Grundlagen und praktische Anwendungen, Wiesbaden: Springer Vieweg.

  2. Bauer, Andreas & Günzel, Holger (2013): Data Warehouse Systeme – Architektur, Entwicklung, Anwendung, Heidelberg: dpunkt.verlag.

  3. Ferrari, Alberto & Russo, Marco (2018): Datenanalyse mit Microsoft Power BI und Power Pivot für Excel, Heidelberg: dpunkt.verlag.

  4. Schnider, Dani et al (2016): Data Warehouse Blueprints: Business Intelligence in der Praxis, München: Hanser Verlage. .