Zum Inhalt

Die Interpretation der Ergebnisse von Testverfahren

Wenn ein Testverfahren objektiv konstruiert ist und objektiv ausgeführt wird, dann sind alle Testwerte, die Ergebnis eines Testverfahrens sind, eine Möglichkeit objektiv Leistungsausprägungen zu bemessen. Es gibt allerdings eine gewisse Problematik, wie man erkennen kann, ob die Ergebnisse gut oder schlecht sind. Zum Beispiel, ein Proband Peter bekommt ein Testergebnis von 55 Punkten bei einem Test. Was heißt dann das genau?

Rohwerte

[spacer size=”15″]
Der Testrohwert, 55 Punkte, ermöglicht alleine keine Aussage, wie gut Peter abgeschnitten hat. Auch wenn man weiß, dass Peter 55 Punkte aus einen möglichen 85 Punkte bekommen hat und dass dies 55/85*100=65% ist, hat man immerhin keinen Maßstab, wie gut die Ergebnisse sind. Es kommt natürlich darauf an, wie schwierig bzw. wie leicht der Test gestaltet wurde und was man als Testergebnis „normalerweise“ erwarten kann.

Mittelwert und Wertebereich

[spacer size=”15″]
Damit man erkennen kann, wie gut die Leistung ist, muss man ein Vergleich machen können. Der Mittelwert ist eine Möglichkeit. Weiß man, dass der Mittelwert 50 ist, dann kann man sagen, dass Peter mit seinen 55 Punkten überdurchschnittlich ist. Man weiß allerdings immer noch nicht wie viel über den Durchschnitt Peters Ergebnis liegt und wo Peters Ergebnis im Vergleich zu denen von anderen Probanden liegt. Eine Möglichkeit dies zu beschreiben ist anhand eines Wertebereiches: nehmen wir an zum Beispiel das niedrigste Ergebnis von allen Probanden war 30 Punkte und das beste Ergebnis war 75 Punkte. Das bringt man näher zu dem Erkenntnis, wie gut Peters Leistung ist, aber es bleibt immer noch ein Problem fürs objektive Interpretieren: extrem hohe oder niedrige Ergebnisse können eine Interpretation extrem beeinflussen. Nehmen wir zum Beispiel an, nur ein Proband bekommt 75 Punkte, der nächst Beste bekommt 56 Punkte und alle anderen Probanden bekommen zwischen 46 und 56 Punkte. Hier sieht es auf einmal für Peter mit seinen 55 Punkten etwas besser aus.

Standardabweichung

[spacer size=”15″]
Um das Problem von dem Wertebereich zu vermeiden, nützt man bei einer Testauswertung die Standardabweichung, die die Streuung der Testergebnisse ausdruckt: nehmen wir an, fürs gleiche Test bekommen 68% der Probanden zwischen 48 und 52 Punkte, d.h. 2 Punkte über den Mittelwert und 2 Punkte unter dem Mittelwert, 50. Hier hat man eine Standardabweichung von 2. Wenn man davon ausgeht, dass die Daten normal verteilt sind (eine Standardannahme für Messungen wie Intelligenz, Körpergröße und Alter), dann kann man die Aussage treffen, dass 95% der Probanden Testergebnisse haben, die zwei Standardabweichungen entweder über oder unter dem Mittelwert liegen. Jetzt sieht es echt gut für Peter aus: mit seinen 55 Punkte liegt er 4 Standardabweichungen über den Mittelwert und das heißt er liegt unter den 5% besten Probanden!

Standardisierte Werte

[spacer size=”15″]
Weiß man den Mittelwert und die Standardabweichung, dann ist es möglich eine objektive Interpretation der Rohwerte zu machen, wo die Leistung eines Probanden mit der Leistung von anderen Probanden verglichen wird, oder auch wo die Leistung eines Probanden zwischen zwei verschiedenen Tests verglichen wird. Es sind Standardwerte, die es ermöglichen, objektive Vergleiche zwischen Rohwerten von verschiedenen Datenquellen zu machen. Wie unten beschrieben gibt es auch unterschiedliche Möglichkeiten zu Standardwerten auszurechnen.

z-Werte

[spacer size=”15″]
Ein z-Wert ist eine Beschreibung wie viel Standardabweichungen ein Wert über oder unter den Mittelwert liegt. Man rechnet einen z-Wert wie folgend:

(Rohwert – Mittelwert)/Standardabweichung

Rechnet man zum Beispiel einen z-Wert für einen Probanden von -1,4 aus, heißt es, dass der Wert des Probanden -1,4 Standardabweichungen unter den Mittelwert liegt. Eine Schlussfolgerung ist, dass das Ergebnis der Probanden genauso gut ist oder besser als 8% der anderen Probanden, die den Test abgelegt haben, bzw. 92% der Probanden sind besser.