Notizen zum Thema Business Intelligence

Einführung in Business Intelligence (BI)

  • Geschäft hat heute riesige Datenmengen, aber oft keinen einfachen Zugang dazu.
  • Wichtigkeit der einfachen Zugang zu relevanten Geschäftsdaten.
  • Verwirrung bei sich wiederholenden Präsentationen von Geschäftsdaten.

Datenquellen im Business Intelligence

  • Logdateien
  • Sensordaten
  • Website-Klickströme
  • Soziale Medien (Kommentare, Diskussionen, Likes)
  • Dokumentensammlungen (E-Mails, Kundenakten)
  • Geolokalisierungsdaten (Wanderungen, interessante Punkte)
  • Medieninhalte (Bilder, Videos, Audio)
  • Kontextdaten (Wetter, Verkehr, Umweltverhältnisse)

Historische Perspektive der Datenverarbeitung

  • 1960er Jahre: Master-Dateien mit Einzelanwendungen, Nutzung von Lochkarten und Magnetbändern.
  • 1970er Jahre: Entwicklung von Direct Access Storage Devices (DASD) und Datenbankmanagementsystemen (DBMS).
  • 1980er Jahre: Entstehung von Management Informationssystemen (MIS) und der Notwendigkeit von Extract Processing.

Begriffsdefinitionen und deren Entwicklung

  • BIS (Business Intelligence System) - 1958 von H.P. Luhn.
  • DSS (Decision Support System) - zur Unterstützung von Managemententscheidungen in schlecht strukturierten Situationen.
  • DWH (Data Warehouse) - zentrale Speicherung und konsolidierte Daten.

Die 4 Vs von Big Data

  1. Volume: Steigende Datenmengen.
  2. Velocity: Zunehmende Geschwindigkeit der Datengenerierung.
  3. Variety: Vielzahl von Datentypen und -quellen.
  4. Veracity: Herausforderung hinsichtlich der Datenqualität und -genauigkeit.

Merkmale eines Data Warehouses

  • Sammlung von Techniken zur Integration von Daten aus operativen Systemen.
  • Daten sind konsistent formatiert und für Analyse und Visualisierung aufbereitet.
  • Subjektorientiert: Datenorganisation basiert auf spezifischen Geschäftsfeldern.
  • Integriert: Einheitliche Sicht auf Daten aus verschiedenen Quellen.
  • Zeitvariant: Langfristige Speicherhistorie, komplexe Datenanalysen über Zeit.
  • Nicht-flüchtig: Dauerhaft gespeicherte, unveränderte Daten.

Unterschiede zwischen OLTP und OLAP

  • OLTP:
    • Strukturiert für hohe Transaktionsgeschwindigkeit.
    • Vornehmlich aktuelle Daten, häufige Updates.
  • OLAP:
    • Unterstützt komplexe Analysen und Abfragen.
    • Fokussiert auf historische Daten und analytische Verarbeitung.

ETL-Prozess (Extract, Transform, Load)

  • Extrahieren: Daten aus verschiedenen Quellen ins System holen.
  • Transformieren: Anpassung und Bereinigung der Daten, um sie in ein einheitliches Format zu bringen.
  • Laden: Einfügen der transformierten Daten in das Data Warehouse.

Architekturen von Datenbanken

  • Datenquellen: OLTP-Systeme, externe Daten und ERP-Systeme.
  • Datenlager: Speicherung in relationalen und multi-dimensionalen Datenbanken.
  • Datenaufbereitung: ETL-Prozesse, um Daten in lagerfähige Formate zu bringen.

OLAP und seine Funktionen

  • Erlaubt multidimensionale Analysen — „Cubes“ sind zentrale operative Elemente.
  • Möglichkeiten für das „Slicing“ und „Dicing“ von Daten für unterschiedliche Sichtweisen.
  • Aggregation: Daten werden in verschiedenen Dimensionen zusammengefasst.

Präsentation von BI-Analysen

  • Standardberichte: Für große Benutzergruppen (z.B. Verkaufsberichte).
  • Ad-hoc-Berichte: Für spezifische Analysen zu besonderen Bedürfnissen.
  • Dashboards: Anpassbare, meist aktuelle Übersicht über KPIs für individuelle Benutzer.

Fazit

  • BI ist entscheidend, um voluminöse und komplexe Daten für fundierte Geschäftsentscheidungen zu nutzen.
  • Kombination of praktischen Anwendungen und technologischen Systemen ist von hoher Relevanz.