Data Science

0.0(0)
studied byStudied by 3 people
learnLearn
examPractice Test
spaced repetitionSpaced Repetition
heart puzzleMatch
flashcardsFlashcards
Card Sorting

1/40

encourage image

There's no tags or description

Looks like no tags are added yet.

Study Analytics
Name
Mastery
Learn
Test
Matching
Spaced

No study sessions yet.

41 Terms

1
New cards

Business Intelligence Definition

Business Intelligence ist die entscheidungsorientierte Sammlung, und Aufbereitung geschäftsrelevanter Informationen

2
New cards

Big Data

Volume

Variety

Velocity

Sichtweise auf Daten

3
New cards
<p>Big Data vs Small Data</p>

Big Data vs Small Data

knowt flashcard image
4
New cards

BA vs. BI

BI ist die Erfassung und Aufbereitung von Daten, welche dann in BA genutzt werden um Trends vorherzusagen

5
New cards

Descriptive Analytics

Analytics aus vergangensheitbezogenen Daten, welche in DWH Systemen gesammelt werden. Grundlage für Vorhersagen.

6
New cards

Predictive Analytics

Die gesammelten Daten (descriptive) werden in Vorhersagen umgewandelt mit Trendanalysen und Machine Learning

7
New cards

Prescriptive Analytics

Ziel ist es Handlungsalternativen zu bewerten. Was soll ich tun?

8
New cards

Business Intelligence Entwicklung Schuabild. (Letzten 2 wichtig)

knowt flashcard image
9
New cards

BI als integrierter Gesamtansatz

BI ist ein integrierter, unternehmensspezifischer, IT-basierter Gesamtansatz der alle Ebenen umfasst.

<p>BI ist ein integrierter, unternehmensspezifischer, IT-basierter Gesamtansatz der alle Ebenen umfasst.</p>
10
New cards

Die 3 Schichten von BI Schaubild

knowt flashcard image
11
New cards

Wissenspyramide Schaubild

knowt flashcard image
12
New cards

Datentypen mit Python Beispiele

Nominal: Definierte Begriffe

Ordinal: Tabellen mit Ordnung

Metrisch: integer, flows

13
New cards

Datentypen

Strukturierte Daten: Datenstrukturen die angeordnet und verknüpft werden können. XCL

Semi-strukturierte Daten: keine allgemeine Struktur und flexibel. XML

Unstrukturierte Daten. Keine formalisierte Struktur. Text, Bilder

14
New cards

Datenrelevanz Schaubild

knowt flashcard image
15
New cards

Datenqualität Beispiele

Korrektheit

Konsistenz

Zuverlässigkeit

Vollständigkeit

16
New cards

Operative vs. Dispositive Daten Schaubild

knowt flashcard image
17
New cards

AbAblauf Datenanalyse Schaubild

knowt flashcard image
18
New cards

Problembereiche Datenselektion

Knnen die selektierten Daten rechtlich/technisch überführt werden?

Technische Restriktionen: Kapazitätsgrenze-, Datentypbeschränkungen

Möglichkeiten zur Problemlösung: Beschränkung auf representative Teildatenmengen, Zusammenführen von Daten aus verschiedenen Quellen. Internen und externe Daten nutzen

19
New cards

Ziele Datenaufbereitung

Elimination von Ausreißern

Re-Codierung von Variablen (Ländercodes)

Ziehung von Teilstichproben

Reduktion der Variablenzahlen

20
New cards

Datentransformierung

Transformierung von bestimmten Daten in das gewollte Format, durch Datentransformationsprozesse. Die Daten werden dann in Data Warehouses gespeichert

21
New cards

DWH Merkmale

Subjektorientierung. Auswahl der zu übernehmenden Daten nach Datenobjekten, wie Firma, Kunde, Land usw.

Integration: Die in verschiedenen (operativen) Quellsystemen unstrukturierten Daten werden einheitlich gespeichert

Zeitraumbezug: Analysen über zeitliche Veränderungen sollen ermöglicht werden, wofür langfristige Speicherung nötig ist.

Nicht-Volatilität: Daten werden dauerhaft gespeichert

22
New cards

DWH Schaubild

knowt flashcard image
23
New cards

ETL Prozess

Überführung von operativen Daten in Subjekt- und themenbezogenen Daten.

Extract, Transform, Load

24
New cards

Cora Data Warehouse

Zentrale Datenhaltung in einer relationalen Datenbank, durch Füllung durch Quellsystemen oder ODS

25
New cards

Data Marts

Kleine Datenpools für spezielle Nutzgruppen oder Anwendungen

26
New cards

Operational Data Store (ODS)

Vorstufe des DWH und enthält in Real-Time eine Kopie der Transaktionsdaten eines operativen Systems, die Historie ist aber begrenzt. In das Core DWH werden dann meist nur wichtige Daten eingespeist

27
New cards

Metadaten

Enthalten „Daten über Daten“ über alles gespeicherten DHW und ODS Daten und ihre Zusammenhänge

28
New cards

Administrationsschnittstellen

Steuerung von Modifikationen, Einschränkung, Erweiterung und Berechtigung

29
New cards

Aktivitäten des ETL Prozess (Nicht ausgeschrieben)

Filterung: Extraktion aus operativen Daten und Bereinigung

Harmonisierung: Betriebswirtschaftliche Abstimmung gefilterter Daten

Aggregation: Verdichtung gefilterter und harmonisierter Daten

Anreicherung: Bildung von Kennzahlen und Dimensionen

30
New cards

OLAP

Online Analytical Processing.

Multidimensionaler Datenzugriff durch Generierung mehrdimensionaler Datenwürfel

31
New cards

Schaubild OLAP Datenwürfel

knowt flashcard image
32
New cards

OLAP Operationen

Drill-Down: Nächst-detailliertes Merkmal suchen (Süden in 4 Zonen)

Roll-Up: nächst-detailliertes Merkmal nach oben suchen (Tag zu Monat)

Slice: Schiebe aus Würfel angucken

Dice: kleineren Würfel angucken

Rotate: Drehung, dadurch andere Sichtweise

33
New cards

OLAP Konzepte vor un Nachteile

ROLAP: Für hohe Datenmenge, kann direkt auf DWH gesetzt werden

MOLAP: Flexibel und schnell, Daten müssen jedoch erst in Datenbank geladen werden

HOLAP: Mischvariante von ROLAP und MOLAP

34
New cards

Nochmal schnell Gründe/Arten von Datenanalysen

Deskriptiv/descriptive: Was ist passiert?

Diagnostisch/diagnostic: Warum ist es passiert

Prädiktiv/predictive: Was wird passieren?

Präskriptiv/prescriptive: Was soll getan werden?

Die Arten beschreiben gleichzeitig die Reife der Analyse, von was war, zu, was soll getan werden.

35
New cards

Methoden für die Analysearten

Deskriptiv: Reporting über Dashboard

Diagnostisch: OLAP über Data Cube

Prädiktiv: Data Mining über Clusterbildung

Präskriptiv: Maschinelles Lernen durch Mustererkennung

36
New cards

Unterschied Top-Down und Bottom-Up Analyse

Top-Down Analyse beginnt mit einer Theorie welche durch Daten gestützt oder verworfen wird.

Bottom-Up bezeichnet das Gegenteil, also aus bestehenden Daten werden Muster erkannt und dann eine Theorie entwickelt

37
New cards

Data Mining Methoden Schaubild

knowt flashcard image
38
New cards

Ablauf maschinelles Lernen

Datenakquise

Verarbeitung

Trainieren

Testen

Einsetzen

39
New cards

Gegenüberstellung Data Mining und Maschinelles Lernen (bestimmt nicht so wichtig) Schaubild

knowt flashcard image
40
New cards

Schichtenmodell für Analytics

Möglichen Use-Case identifizieren

Datenquellen und Inhalt finden und verstehen

Datenakquise und Speicherung über Dateninfrastruktur

Analyse und Umsetzung mit Analyse-Tools

41
New cards