Home ] Nach oben ] Zurück ]

Auswertung objektivierter Tests

1.0 Testergebnisse müssen untersucht werden

Die Ergebnisse eines Tests sollten nicht unmittelbar zur Grundlage der Leistungsbewertung gemacht werden, weil es Faktoren gibt, die zu Verfahrensfehlern führen und deswegen eine angemessene Leistungsbewertung erschweren. Diese Faktoren müssen durch eine analytische Prüfung der Aufgaben ermittelt und vor der Leistungsbewertung ausgeblendet werden.

Auf der Webseite „Ausarbeitung schriftlicher Lernzielkontrollen" wird ein geeignetes Verfahren erwähnt. Es sei hier in vereinfachter Form vorgestellt.

2.0 Die acht Schritte der Aufgabenanalyse

In die Beurteilung der Schülerleistungen sollten möglichst keine Daten einfließen, die gar nicht das wiedergeben, was zu messen war. Deshalb sollte das Ergebnis eines Test unter einer Reihe von Gesichtspunkte untersucht werden, die zu der im folgenden dargestellten Folge von acht analytischen Schritten führt.

2.1 Rohpunkte

Zunächst wird für alle Arbeiten die Summe der richtigen Antworten - Rohpunktzahl - festgestellt.

2.2 Obergruppe/Untergruppe

Anhand der Rohpunktzahl wird jede Arbeit der besseren Hälfte (Obergruppe) bzw. schlechteren Hälfte (Untergruppe) zugeordnet.

Bei ungerader Schülerzahl wird die in der Mitte liegende Arbeit weggelassen. Wenn Arbeiten im mittleren Bereich gleiche Punktzahl aufweisen, bleiben auch sie außer Betracht.

2.3 Analysebogen

Nun wird ein Analysebogen angelegt, der wie folgt aufgebaut ist.

  O U O + U O - U
1. Amélie        
2. Boris        
3. Christa        
.........        

 Hier werden eingetragen

  • unter O alle richtigen Lösungen aus der Obergruppe,
  • unter U alle richtigen Lösungen aus der Untergruppe.

2.4 Schwierigkeitsgrad

Für die Bewertung der Aufgaben gilt generell:

Je größer die Zahl der richtigen Lösungen ist, desto leichter ist die Aufgabe.

Der Schwierigkeitsgrad wird als Prozentwert angegeben. Dazu ist wie folgt vorzugehen:

Unter O + U wird die Summe der richtigen Lösungen aus beiden Gruppen ermittelt.
Man multipliziert sie mit 100 und teilt das Ergebnis durch die Zahl der Schüler.
Somit wird der Schwierigkeitsgrad als Prozentwert angegeben.

Für die Auswertung gilt:

Der ideale Schwierigkeitsgrad liegt bei 65 %;

in der Praxis gilt als akzeptabler Schwierigkeitsgrad eine Bandbreite zwischen 20 % und 85 %;

Aufgaben, die unter diesen Werten liegen, waren zu schwer,
Aufgaben, die über diesen Werten liegen, waren zu leicht.

2.5 Trennschärfe

Ein gut konstruierter Test soll sowohl den guten als auch den weniger guten Schülern Gelegenheit geben, ihre Leistungsfähigkeit zu zeigen. Anders gesagt:

Er muss stärkere Schüler zur Leistung herausfordern
und darf schwächeren nicht als so schwer erscheinen,

dass „es ja doch keinen Zweck hat", sich anzustrengen.

Nur so kann er die Leistungsfähigkeit des einzelnen Schülers sichtbar machen -
Voraussetzung dafür, Folgerungen für seine weitere Förderung zu ziehen.

Unter O - U wird die Differenz der richtigen Lösungen aus beiden Gruppen ermittelt.
Sie wird - wie beim Schwierigkeitsgrad dargestellt - als Prozentwert angegeben.

Für die Bewertung der Aufgabe gilt:

Die Differenz zwischen O und U soll wenigsten 10 % betragen
(gebrochene Prozentwerte werden aufgerundet);

Aufgaben, die unter diesem Wert liegen, ferner Aufgaben, bei denen O - U eine negative Zahl ergibt, sind nicht hinreichend trennscharf und sollten nicht wieder verwendet werden.

2.6 Zeitfaktor

Nicht die Lösungsgeschwindigkeit ist Prüfungszweck, sondern eine inhaltliche Leistung.

Deshalb sollten mindestens 80 % der Schüler alle Aufgaben bearbeiten können.

Deshalb wird ermittelt, wie viele Schüler (O, U, O + U) die letzte Aufgabe nicht gelöst haben.

2.7 Distraktoren-Analyse

Wenn ein Test als Mehrfach-Antworten-Test angelegt war, muss geprüft werden, welche Antwortmöglichkeiten geeignet waren und welche nicht. Ungeeignete Distraktoren, sog. „Känguruhs", müssen ausgesondert werden.

Ermittelt wird: Wie oft wurde jede Antwortmöglichkeit gewählt?

  • Auf keinen Distraktor soll mehr als die Hälfte aller falschen Antworten entfallen;
  • auf jeden Distraktor soll mindestens ein Zehntel aller falschen Antworten entfallen.

2.8 Folgerungen

Die Aufgabenanalyse ermöglicht es, den Test zu bearbeiten, bevor er erneut verwendet wird. Vor allem jedoch hat sie Konsequenzen für die Leistungsbewertung.

Nicht in die Bewertung einbezogen werden sollen Aufgaben, die

  • zu leicht sind,
  • zu schwer sind,
  • nicht trennscharf genug sind,
  • nicht genügend attraktive Distraktoren enthalten,
  • von mehr als einem Fünftel (20 %) aller Schüler nicht bearbeitet worden sind.

Nunmehr kann die endgültige Rohpunktzahl ermittelt und in eine Häufigkeitenliste eingetragen werden. In Anlehnung an die Normalverteilung kann die Rohpunktzahl den einzelnen Notenstufen wie folgt zugeordnet werden:

  • Notenstufen 3 und 4 zusammen 50 % bis 68 %,
  • darüber und darunter liegende Notenstufen 25 % bis 16 %.

3.0 Schlussbemerkung

Das dargestellte Verfahren bewertet die Schülerleistung zuverlässiger - reliabler -, als wenn die zunächst ermittelten Rohpunkte unmittelbar den Notenstufen zugeordnet worden wären.

Literaturnachweis
Die zugrunde liegende Literatur wird auf der Webseite „Literaturgrundlage" nachgewiesen.


Home ] Nach oben ] Zurück ]


Ausgearbeitet von:     Dr. Manfred Rosenbach -        letzte Änderung am: 15.01.08
-