Analysen - Data Science

0.0(0)
Studied by 0 people
call kaiCall Kai
learnLearn
examPractice Test
spaced repetitionSpaced Repetition
heart puzzleMatch
flashcardsFlashcards
GameKnowt Play
Card Sorting

1/48

encourage image

There's no tags or description

Looks like no tags are added yet.

Last updated 4:58 PM on 3/22/26
Name
Mastery
Learn
Test
Matching
Spaced
Call with Kai

No analytics yet

Send a link to your students to track their progress

49 Terms

1
New cards

Hypothesentests

Entscheidung über Beibehalten oder Ablehnen der Nullhypothese
Hypothesen werden nicht bewiesen
H₀ = Ausgangsannahme
H₁ = Untersuchungsziel
Ziel ist Ablehnung von H₀

2
New cards

Signifikanzniveau (α)

Irrtumswahrscheinlichkeit für Fehler 1. Art
z. B. 0,05 = 5 % Risiko, H₀ fälschlich abzulehnen
je kleiner α, desto strenger der Test

3
New cards

Statistisches Testen

Mittelwerttest prüft Durchschnitt – Häufigkeitstest prüft Anteil/Prozentsatz

4
New cards

Fehler 1. und 2. Art

α-Fehler = H₀ wird fälschlich abgelehnt
β-Fehler = H₀ wird fälschlich beibehalten

5
New cards

t-Test

Wird verwendet bei unbekannter Populationsvarianz und meist kleinen Stichproben

6
New cards

Arten des t-Tests

Einstichproben-t-Test prüft Mittelwert gegen Referenzwert
Zweistichproben-t-Test vergleicht zwei Mittelwerte

7
New cards

ANOVA (Varianzanalyse)

Prüft, ob sich mehr als zwei Gruppen im Mittelwert unterscheiden
vergleicht Varianz zwischen Gruppen mit Varianz innerhalb der Gruppen
basiert auf F-Verteilung
F = Varianz zwischen / Varianz innerhalb
F groß → signifikante Unterschiede

8
New cards

Post-hoc-Test

Nach signifikanter ANOVA wird z. B. Tukey-HSD verwendet, um festzustellen, welche Gruppen sich unterscheiden

9
New cards

Zwei-Wege-ANOVA

Untersucht gleichzeitig zwei unabhängige Faktoren auf eine Zielgröße und prüft auch Interaktionseffekte

10
New cards

Zwei-Wege-ANOVA mit Replikation

Mehrere Beobachtungen pro Faktor-Kombination

11
New cards

Korrelationsanalyse

Misst Stärke und Richtung des Zusammenhangs zwischen zwei Variablen
keine Aussage über Kausalität

12
New cards

Korrelationsarten

Kovarianz – Bravais-Pearson (r) – Spearman (ρ) – Kendall (τ)

13
New cards

t- vs. z-Test

z-Test bei bekannter Varianz und großer Stichprobe
t-Test bei unbekannter Varianz und kleiner Stichprobe
t-Verteilung breiter wegen höherer Unsicherheit

14
New cards

Pearson-Korrelationskoeffizient (r)

Misst Stärke und Richtung des linearen Zusammenhangs zwischen zwei metrischen Variablen

15
New cards

Spearman-Rangkorrelation (ρ)

Misst Stärke des monotonen Zusammenhangs
verwendet Rangdaten
geeignet für ordinale Daten (z. B. Schulnoten, Zufriedenheitsskalen)

16
New cards

Vorteile von Spearman gegenüber Pearson

Robuster gegenüber Ausreißern
auch für ordinale Daten geeignet
erkennt monotone, nicht zwingend lineare Zusammenhänge

17
New cards

Variablentypen im Modell

Independent Variable (IV) = Einflussvariable
Dependent Variable (DV) = Zielvariable
Control Variable (CV) = Kontrollvariable zur Vermeidung von Verzerrung

18
New cards

Arten der Power-Analyse

A-priori (vor Studie, Standard) – Post-hoc (nach Studie, kritisch betrachtet)

19
New cards

Effektgröße (Cohen’s d)

Maß für Stärke des Unterschieds zwischen zwei Gruppen

20
New cards

Regression

Modelliert Zusammenhang zwischen abhängiger Variable (y) und einer oder mehreren unabhängigen Variablen (x) – Ziel: Vorhersage und Erklärung

21
New cards

Residuen

Differenz zwischen beobachtetem und vorhergesagtem Wert – Quadratsumme der Residuen = SSE

22
New cards

Ziel der Regression

Minimierung der quadrierten Residuen (Methode der kleinsten Quadrate)

23
New cards

Bestimmtheitsmaß (R²)

Gibt an, wie viel Prozent der Varianz von y durch das Modell erklärt werden

24
New cards

Unterschied Korrelation vs. Regression

Korrelation beschreibt Zusammenhang zwischen ZWEI Variablen

Regression beschreibt Einfluss von X auf Y, es werden ALLE Variablen berücksichtig

25
New cards

VIF (Variance Inflation Factor)

Messzahl für Multikollinearität

26
New cards

Moderation (Interaktionseffekt)

Effekt von x auf y hängt von einer dritten Variable (Moderator z) ab

27
New cards

Homoskedastizität

Annahme konstanter Streuung der Residuen über alle x-Werte – gleich breite „Fehlerwolke“

28
New cards

Heteroskedastizität

Nicht konstante Streuung der Residuen (z. B. Trichterform)
verletzt Regressionsannahme
prüfbar über Residuenplot oder Breusch-Pagan-Test

29
New cards

Polynom-Regression

Erweiterung der linearen Regression bei gekrümmtem Zusammenhang (z. B. x², x³) – Gefahr von Overfitting bei zu hohem Polynomgrad

30
New cards

LASSO-Regression

Lineare Regression mit Regularisierung
bestraft große Koeffizienten
unwichtige Variablen erhalten Koeffizient 0
reduziert Overfitting und führt automatische Variablenselektion durch

31
New cards

Operations Research

Analytischer Ansatz zur Entscheidungsoptimierung mithilfe von Mathematik, Statistik und Algorithmen – Ziel: Kosten senken, Ressourcen optimal nutzen

32
New cards

Lineare Optimierung

Sucht optimale Lösung eines Problems mit linearer Zielfunktion unter Nebenbedingungen – häufig Minimierungsproblem (z. B. Kosten)

33
New cards

Sensitivitätsanalyse

Untersucht, wie empfindlich die optimale Lösung auf Änderungen von Parametern reagiert – berücksichtigt Nebenbedingungen und Schattenpreis

34
New cards

Multikollinearität

Starke Korrelation zwischen unabhängigen Variablen, sodass sie ähnliche Informationen enthalten

35
New cards
VIF (Variance Inflation Factor)
Maß dafür, wie stark eine Variable durch andere Variablen erklärt wird
36
New cards
Korrelation
Maß für den linearen Zusammenhang zwischen zwei Variablen
37
New cards
Korrelieren
Zwei Variablen verändern sich gemeinsam
38
New cards
Korrelation ≠ Kausalität
Zusammenhang bedeutet nicht Ursache
39
New cards
Varianz
Streuung der Werte um den Mittelwert
40
New cards
Standardabweichung
Durchschnittliche Abweichung vom Mittelwert
41
New cards
Koeffizient
Gibt an, wie stark sich Y ändert, wenn X steigt
42
New cards
Signifikanz
Ergebnis ist wahrscheinlich nicht zufällig
43
New cards
p-Wert
Wahrscheinlichkeit, dass ein Ergebnis zufällig ist
44
New cards
Bestimmtheitsmaß (R²)
Anteil der erklärten Varianz im Modell
45
New cards
Adjustiertes R²
Berücksichtigt Anzahl der Variablen und bestraft unnötige
46
New cards
F-Wert
Vergleicht erklärte mit unerklärter Varianz im Modell
47
New cards
Residuen
Differenz zwischen tatsächlichem und vorhergesagtem Wert
48
New cards
Homoskedastizität
Konstante Streuung der Fehler
49
New cards
Heteroskedastizität
Nicht konstante Streuung der Fehler

Explore top flashcards

flashcards
Microscopic examination CASTS
34
Updated 657d ago
0.0(0)
flashcards
Zoology Exam 1
145
Updated 45d ago
0.0(0)
flashcards
Med Micro Case Studies
76
Updated 1196d ago
0.0(0)
flashcards
Y2 U1L1 Vamos a acampar
55
Updated 915d ago
0.0(0)
flashcards
Modern World History Midterm
51
Updated 205d ago
0.0(0)
flashcards
World History Exam
232
Updated 1033d ago
0.0(0)
flashcards
Concept of Globalization
22
Updated 1141d ago
0.0(0)
flashcards
Microscopic examination CASTS
34
Updated 657d ago
0.0(0)
flashcards
Zoology Exam 1
145
Updated 45d ago
0.0(0)
flashcards
Med Micro Case Studies
76
Updated 1196d ago
0.0(0)
flashcards
Y2 U1L1 Vamos a acampar
55
Updated 915d ago
0.0(0)
flashcards
Modern World History Midterm
51
Updated 205d ago
0.0(0)
flashcards
World History Exam
232
Updated 1033d ago
0.0(0)
flashcards
Concept of Globalization
22
Updated 1141d ago
0.0(0)