1/13
Looks like no tags are added yet.
Name | Mastery | Learn | Test | Matching | Spaced | Call with Kai |
|---|
No analytics yet
Send a link to your students to track their progress
Determinationskoeffizient R2
Anteil der Varianz der AV, der durch alle Prädiktoren zusammen erklärt wird
Wertebereich 0 -1
Von was ist das Inkrement in R² abhängig
Inkrement in R2 (∆ R2) abhängig davon, welche anderen UVs schon im Modell sind!
Die Reihenfolge der Aufnahme von Prädiktoren spielt für die Gesamtdetermination (R2) keine Rolle!
Der eigenständige Erklärungsbeitrag (∆R2) eines Prädiktors hängt davon ab, welche anderen Prädiktoren schon im Modell sind!
Warum brauchen wir den Korrigierte Determinationskoeffizient?
R2 überschätzt den wahren Determinationskoeffizienten in der Population. Deshalb wird häufig der korrigierte Determinationskoeffizient (adjusted R2) berichtet
es gibt allerdings unterschiedliche Korrekturformeln]
Nenne die Inferenzstatistsche Test zur multiplen Regression:
Test, ob in der Population alle Prädiktoren (unabhängigen Variablen) zusammen einen Beitrag zur Erklärung von Unterschieden in der abhängigen Variable leisten
Signifikanztest des Determinationskoeffizienten R2
Test, ob in der Population eine bestimmte Prädiktorvariable über die anderen Prädiktoren im Modell hinaus einen Einfluss auf die abhängige Variable hat
Signifikanztest eines bestimmten Partialregressionskoeffizienten bj ‣
Äquivalent dazu: Signifikanztest des Inkrements in R2 bei Hinzunahme einer bestimmten Prädiktorvariablen
Test, ob in der Population mehrere Prädiktorvariablen (zusammengenommen als Set) über die anderen Prädiktoren im Modell hinaus einen Einfluss auf die abhängige Variable haben
Signifikanztest des Inkrements in R2 bei Hinzunahme mehrerer Prädiktorvariablen
Für die inferenzstatistische Absicherung müssen zusätzliche Annahmen getroffen werden. Welche?
die bereits bekannten Voraussetzungen:
1. Linearität
2. Homoskedastizität
3. Normalverteilung
4. Unabhängigkeit der Residuen
Welche SIgnifikanztest nutzt man hier?
- F-verteilte Prüfgröße - empirischer F-Wert unter der H0:
Was heisst es wenn die Ho verworfen wird?
p < α
H0 , dass der Determinationskoeffizient in der Population Null ist, wird verworfen
➝ d.h. - äquivalent dazu - mindestens eine Prädiktorvariable hat einen „Effekt“
Welchen SIgnifikantstest nutzen wir für den partiellen Regressionskoeffizienten?
t-verteilte Prüfgröße
- empirischer t-Wert unter der H0
Definiere Multikollinearität
Multikollinearität = hohe multiple Korrelation eines Prädiktors mit anderen Prädiktoren
Gebe angaben zur Multikollinearität!
Multikollinearität = hohe multiple Korrelation eines Prädiktors mit anderen Prädiktoren Diese ergibt sich aus Abhängigkeiten zwischen den Prädiktorvariablen.
Hohe Multikollinearität führt dazu, dass der Standardfehler des Regressionsgewichts derjenigen Variablen, die mit den anderen hoch korreliert, groß ist und das Regressionsgewicht somit unpräzise geschätzt wird
Die Multikollinearität wird formal entweder in Form von Toleranz oder einem Varianzinflationsfaktor VIF angegeben
Bei hoher Multikollinearität können
redundante Prädiktoren ausgeschlossen werden
hoch korrelierte Prädiktoren zusammengefasst (aggregiert) werde
Wie ermittelt man den Konfidenzintervall für die Partialregressionsgewichte? Und von was hängt der t-Wert ab?
Mit Hilfe des Standardfehlers können für das Partialregressionsgewicht βj die Konfidenzgrenzen ermittelt werden:
Der t-Wert hängt
➝ vom Konfidenzkoeffizienten (1 – α) und
➝ von den Freiheitsgraden (df = n – k – 1)
ab
Was sind die Konventionen nach Cohen?(Determinationskoeffizient R²
Konvention nach Cohen:
klein / .02
mittel /.15
groß ..35
Was macht man bei Verletzungen der Annahmen des Allgemeinen Linearen Modells? zB Homoskadistizität
eine robuste Regressionsanalyse durchführen z.B. mit der Funktion rlm() aus dem Paket MASS oder der Funktion rq() aus dem Paket quantreg
zur Berechnung der b-Koeffizienten werden dabei alternative Schätzer verwendet (MASS) oder es wird für die Berechnung des Steigungskoeffizienten der Median statt des Mittelwerts verwendet (quantreg)
sinnvoll z.B. bei Ausreißern
robuste Standardfehler berechnen mit dem Argument robust=TRUE aus dem Paket parameters und für die Konfidenzintervalle nutzen
sinnvoll z.B. bei Heteroskedastizität
Bootstrapping durchführen mit parameters()
sinnvoll z.B. bei kleinen Stichproben, unbekannten Verteilungseigenschaften
Wie wird eine Regressionsanalyse berichtet?
Wichtige Infos, die nicht fehlen sollten (egal ob in der Tabelle oder im Text):
1. Es werden immer unstandardisierte Koeffizienten berichtet.
2. Zusätzlich sind auch standardisierte Koeffizienten nützlich. Diese können - zusammen mit R2 als Maße der Effektstärke interpretiert werden.
3. APA: Kennwerte, die nicht größer als 1 werden können, werden meist ohne "führende Null" berichtet (also erst die Nachkommastellen).
4. Koeffizienten werden meistens mit 2 oder 3 Nachkommastellen berichtet
5. Konfidenzintervalle werden meist als 95%-CIs berichtet
6. p-Werte sollen exakt berichtet werden (APA