1/26
Looks like no tags are added yet.
Name | Mastery | Learn | Test | Matching | Spaced |
---|
No study sessions yet.
Vorgehensweise: Itemsatz generieren
Der erste Schritt im Prozess der Testkonstruktion, bei dem Items nach rationalen, externalen, induktiven Prinzipien oder dem Prototypenansatz generiert werden, um einen Itempool zu erstellen.
Vorgehensweise: Itemanalyse und Itemauswahl
Der dritte Schritt, bei dem die Eigenschaften Schwierigkeit, Trennschärfe und Homogenität analysiert und die Items ausgewählt werden, um eine vorläufige Testform zu erhalten.
Vorgehensweise: Testbewertung
Der fünfte Schritt, bei dem die Gütekriterien Objektivität, Reliabilität und Validität bewertet werden, um die Testendform zu ermitteln.
Vorgehensweise: Testeichung
Der letzte Schritt der Testkonstruktion, bei dem Normwerte gewonnen werden.
Rationale Konstruktion
Ein Konstruktionsprinzip, das von einer Eigenschaftstheorie ausgeht und theoriegeleitet Verhaltensweisen ableitet. Erfordert die Validierung der Skalen und ist ökonomisch in Herstellung und leicht kommunizierbar.
Externale Konstruktion
Ein Konstruktionsprinzip, das auf dem Vorhandensein verschiedener Personengruppen basiert und Items auswählt, die besonders gut zwischen diesen Gruppen trennen. Die theoretische Reflexion der Merkmalsausprägung ist dabei überflüssig. Sie hat eine geringe Verfälschbarkeit, kann aber inhaltlich heterogen sein.
Induktive Konstruktion
Ein Konstruktionsprinzip, das auf Korrelationsrechnung und Faktorenanalyse basiert, um Items zu Skalen zusammenzufassen, die miteinander hoch korrelieren. Forderungen sind interne Konsistenz und Einfachstruktur.
Schwierigkeitsindex (P)
Gibt an, wie viel Prozent der Probanden einer Stichprobe ein Item im Sinne einer höheren Merkmalsausprägung beantwortet haben. Berechnet sich als P = (N_R / N) * 100 (bei Leistungstests 'richtig', bei Persönlichkeitstests 'zustimmend').
N_R
Der Zähler im Schwierigkeitsindex, der die Anzahl der Versuchspersonen (Vpn) angibt, die im Sinne des Merkmals geantwortet haben.
N
Der Nenner im Schwierigkeitsindex, der die Gesamtzahl aller Versuchspersonen (Vpn) angibt.
Trennschärfe (r_{it})
Die Korrelation zwischen Itemvariable (Itemscores/-werte) und Testvariable (Summenscores/-werte) einer Skala. Sie ist ein Kennwert für das Ausmaß der Übereinstimmung zwischen Item und Skala, d.h., wie repräsentativ das Item für den Test ist. Je höher die Trennschärfe, desto mehr trägt ein Item zur Messung dessen bei, was durch den gesamten Test gemessen wird.
Objektivität
Das Ausmaß, in dem die Ergebnisse eines Tests unabhängig von der Person des Untersuchungsleiters sind. Sie wird durch Standardisierung der Durchführung, Auswertung und Interpretation gesichert.
Reliabilität
Die technische Genauigkeit, mit der ein Test misst, was er misst. Sie wird ausgedrückt als der Anteil der Truescorevarianz an der gemessenen Varianz, mit einem Wertebereich von 0 bis 1.
Reliabilitätskoeffizient
Der Anteil der Truescorevarianz an der gemessenen Varianz.
Tau-Äquivalenz
Eine Annahme bei der Schätzung der Reliabilität, die besagt, dass hinter beiden Messungen (z.B. Y1 und Y2) der gleiche wahre Wert (\tau) steckt.
Retest-Methode
Eine Methode zur Messung des Reliabilitätskoeffizienten, bei der derselbe Test zu zwei verschiedenen Zeitpunkten demselben Probanden vorgelegt wird.
Paralleltest-Methode
Eine Methode zur Messung des Reliabilitätskoeffizienten, bei der zwei inhaltlich und statistisch äquivalente Tests (Parallelformen) denselben Probanden vorgelegt werden.
Testhalbierungs-Methode
Eine Methode zur Messung des Reliabilitätskoeffizienten, bei der der Test in zwei Hälften aufgeteilt und die Korrelation zwischen diesen Hälften berechnet wird (anschließend mit der Spearman-Brown-Formel korrigiert).
Spearman-Brown-Formel
Eine Formel, die verwendet wird, um die Reliabilität eines gesamten Tests aus der Korrelation zweier Testhälften zu schätzen.
Cronbachs Alpha
Ein Maß für die interne Konsistenz oder Homogenität einer Skala, das insbesondere bei mehr als zwei Testteilen verwendet wird, um die Reliabilität zu schätzen.
Validität
Das Ausmaß, mit dem ein Test tatsächlich das Konstrukt misst, das er messen soll oder vorgibt zu messen. Sie umfasst Inhalts-, Kriteriums- und Konstruktvalidität.
Validitätskoeffizient (r_{tc})
Die Korrelation zwischen einem Test und einem externen Kriterium (z.B. Schulleistung).
Konstruktvalidität
Die Einbettung des mit einem Test erfassten Konstruktes in das nomologische Netzwerk anderer (un)ähnlicher Konstrukte. Sie wird durch konvergente und diskriminante Validität geprüft.
Konvergente Validität
Ein Aspekt der Konstruktvalidität, bei dem gezeigt wird, dass der Test hoch mit Maßen korreliert, die dasselbe oder ein ähnliches Konstrukt messen.
Diskriminante Validität
Ein Aspekt der Konstruktvalidität, bei dem gezeigt wird, dass der Test niedrig mit Maßen korreliert, die andere oder unähnliche Konstrukte messen.
Faktorielle Validität
Die strukturelle oder interne Validität eines Tests, die durch explorative Faktorenanalysen und die Bestimmung der Faktorzahl überprüft wird.
Normierung
Der Prozess, der ein Bezugssystem liefert, um Probanden anhand ihrer Testwerte in Relation zu Personen einer repräsentativen Stichprobe einzuordnen. Dies ermöglicht die statistische Interpretation der Scores und führt zu Äquivalenz-, Abweichungs- oder Prozentrangnormen.