AWANS INFORMACJE FORUM Dla nauczyciela Dla ucznia LOGOWANIE


Katalog

Joanna Wojcieszak-Żyto
Język niemiecki, Artykuły

Gültig, zuverlässig und objektiv kontrolieren

- n +

Gültig, zuverlässig und objektiv kontrolieren

"Wo immer auf der Welt eine Fremdschprache gelehrt und gelernt wird, geht es um die Feststellung und Bewertung von Lernfortschritten"(Bausch K.) Eine ernst gemeinte Leistungskontrolle der sprachlichen Kenntnisse und Fähigkeiten der Lernenden gehört deswegen zu den wichtigsten und häufigsten Tätigkeiten des Fremdsprachenlehrers und nimmt einen besonders wichtigen Platz in der Fremdschprachendidaktik ein.

Die gelieferten Informationen dienen der Optiemierung des Lehrens und Lernens, der Beurteilung des Lernenden und der Lehr- und Lernforschung. Sowohl die Schüler als auch die Lehrer können daraus Schlüsse ziehen und daraufhin ihre künftigen Schritte fundiert planen.

"Es ist im Grunde genommen eine Brille mit der wir die objektive Realität klar oder getrübt sehen. Sie bildet Erscheinungen eines Objektivbereiches in einem Zwischenbereich ab. Es erhebt sich nur die Frage, welchen Kriterien das Testverfahren zu genugen hat, damit eine möglichst genaue Abbildung errecht wird. Oder anders gesagt: Wie kann man errechen, dass das Testen das abbildet, was es abzubilden vorgibt?"(Esser U.)

Um diese Frage zu beantworten, soll man die Gütekriterien für das Testverfahren näher betrachten und gleichzeitig danach fragen, ob man gültig, zuverlässig und objektiv kontroliert.

Die Validität

Das erste und das wichtigste Kriterium des Testens, d.h. das genaue Erfassen der Leistung oder der Validität, heisst die Frage zu beantworten, ob ein Test, wirklich das misst, was er messen soll oder zu messen vornimmt. Es hat den Anschein, dass die Antwort immer bejaht wird. Man testet wirklich nie auf solche Weise, dass man ein ganz anderes Merkmal überprüft, als man sich zum Ziel setzt.

Jedoch weist H. Komorowska auf eine Gefahr hin, dass ein Test nicht nur dieses eine Merkmal untersucht. Eine Testaufgabe kann so konstruiert sein, dass seine Lösung die Verbindung von mehreren Fähigkeiten verlangt und dabei in einem solchen Grad fordert, dass wir nicht imstande sind, den Grad der Beherrschung dieser Fertigkeit, auf deren Untersuchung es uns besonders ankommt, zu bestimmen.

Dieses Problem geht die einzelne Testaufgabe als auch den ganzen Test an. In der Situation, dass das Testverfahren Informationen liefert, die dem vom Lehrer gesetzten Ziel des Testens nicht entsprechen, ist der ganze Test nicht valide. Indem der Lehrer z.B. die allgemeine Sprachbeherrschung messen will, bereitet er einen Test vor, wo mehrere Testaufgaben die grammatische Kompetenz des Schülers untersuchen. Deswegen spielen die entsprechende Auswahl vom Sprachmaterial und das entsprechende Verhältnis zwischen den einzelnen Aufgaben eine grosse Bedeutung für die Erhaltung, bzw. Wahrung der Validität des Tests.

Die Ursache der Ungültigkeit einer einzelnen Testaufgabe liegt in der schon früher erwähnten Menge der Fertigkeiten, die für ihre richtige Lösung unentbehrlich sind. Das trägt dazu bei, dass der Lehrer keine Antwort bekommt, in welchem Grad die einzelnen Fertigkeiten entwickelt sind, und zusätzlich im Fall der falschen Antworten, kann er keine Schlüsse daraus ziehen, die den Grund betreffen.

Eine ungültige Testaufgabe ist auch diagnostisch wertlos. Wenn der Kontrollierende sich dafür interessiert, ob seine Schüler einen Test verstehen, und dabei komplizierte Antwortmöglichkeiten vorstellt, kann es sich erweisen, dass das Verstehen der angegebenen Antwortmöglichkeiten viel schwieriger als das Verstehen des Hörtextes ist. Dann bedeutet die fasch gelöste Testaufgabe auf keinen Fall, dass der Schüler Schwierigkeiten mit dem Hörverstehen hat.

Damit eine Testaufgabe ein glaubwürdiges Informationserhebungsinstrument darstellt, soll der Lehrer danach streben, eine Aufgabe, die besondere Anforderungen an die Intelligenz oder an das Erinnerungsvermögen stellt, zu vermeiden.Sonst werden diese zusätzlichen Faktoren das Testverfahren und vor allem seine Validität stören. Wenn eine Testaufgabe grammatische Leistungen des Schüler kontrolliert, soll man bei der Formulierung der Anweisung auf grammatische Terminologie verzichten. Die begangenen Fehler können dann in demselben Mass aus der Unkenntnis des grammatischen Problems als auch aus dem Unverständnis der linguistischen Nomenklatur hervorgehen.

Die Testliteratur betont bei den verschiedenen Validitätsbestimmungen unterschiedliche Aspekte der Validität. Eine der Haupttypen der Validität ist die sogenannte Inhaltsvalidität (content validity). Ob ein Test inhaltlich valid ist, lässt sich nur durch einen Vergleich der Lernziele mit den Testinhalten und Aufgabenformen feststellen. "Ein Test ist dann inhaltlich valid, wenn er eine repräsentative Stichprobe der definierten Lernziele darstellt." (Bolton S.)

Die Überprüfung der Inhaltsvalidität ist deshalb bei lernzielorientierten Tests unabdingbar. Die inhaltlich valide Kontrolle gründet sich auf dem eingeführten Stoff, überschreitet seinen Rahmen nicht und beachtet gleichzeitig seine wesentlichen Probleme. Inhaltsvalidität steht auch in Beziehung zum richtigen Verstehen des Hauptlernzieles, zum genauen Lehrziel und zu seiner Wiederspiegelung im Testverfahren. "Der Lehrer soll sich um die Berücksichtigung aller genauen Ziele kümmern, aber auch die Kontrolle nicht mit der Überprüfung der zusätzlichen Fertigkeiten, die nicht unmittelbar mit dem Hauptziel verbunden sind, belasten." (Komorowska H.)

Ein weiteres Kriterium der Validität, das sich auf den Inhalt des Testens bezieht, ist beim Fremdsprachentest die face validity. Dieses Kriterium bedeutet, dass der Test auf den ersten Blick für den Laien valide aussieht, d.h. dass die Aufgaben vom Abnehmer und Benützer als angemessen und relevant empfunden werden.

Man unterscheidet auch die Konstruktvalidität, die von grosser Bedeutung bei der Bestimmung der Abhängigjkeit zwischen den einzelnen von den Testaufgaben hervorgegangenen Benehmensarten ist. Wenn ein Testverfahren sich durch Konstruktvalidität auszeichnet, sind die vom Schüler in den verschiedenen Testaufgaben erlangten Ergebnisse aufeinander zulaufend, wobei alle Aufgaben dasselbe Problem betreffen. Um die Konstruktvalidität zu versichern, empfiehlt es sich ein sprachliches Element oder eine Fertigkeit mit Hilfe von mehreren auf verschiedene Weise konstruierten Testaufgaben zu prüfen. Auf diese Weise vermeidet der Lehrer die Zufälligkeit der Ergebnisse und erlangt ein vollständiges Leistungsbild seines Schülers. Die besprochenen Validitätsformen werden als Innenvalidität bezeichnet.

Die nächste Form der Validität ist die kriterienbezogene Validität. Sie zieht zum Vergleich ein Aussenkriterium heran, d.h. bei dieser Validitätsbestimmung wird ein bestimmter Testwert mit einem anderen verglichen. Wenn zwischen den Ergebnissen der zwei anderen Testverfahren mit gleicher Zielsetzung eine hohe Korrelation besteht, so spricht man von hoher Übereinstimmungsvalidität.

Die Reliabilität

Die zweite Forderung, die neben der Validität an Testen gestellt wird, betrifft die Zuverlässigkeit der Leistungsmessung, d.h. die Reliabilität des Testens. Sie bezieht sich auf die Forderung nach Reproduzierbarkeit der Testergebnisse. So wie eine mehrmalige Messung des gleichen Gegenstandes immer die gleiche Länge - innerhalb einer gewissen Toleranzgrenze - ergeben muss, so sollte auch eine bestimmte sprachliche Leistung immer den gleichen Punktewert erbringen. Nehmen wir an, ein Schüler oder eine Schülerin wiederholt die gleiche Testaufgabe in kurzen Zeitabständen mehrmals - er oder sie hat von einer Kontrolle zur nächsten nichts dazugelernt und nichts vergessen, sie haben auch keine Ratemöglichkeit - dann sollten sie beide in jedem Test die gleiche Punktezahl bekommen.

Wenn es jedoch in der Wirklichkeit vorkommt, dass die erreichten Punktezahlen einer Ermittlung im Vergleich zu der anderen sich unterscheidet, und zwar nicht weil der Leistungsstand des Schülers oder der Schülerin schwankt, ist die Kontrolle unzuverlässig.

Das bedeutet, dass bei mancher Testaufgabe Messfehler auftreten. Die entsprechenden Messfehler kann man nicht völlig eliminieren, weil dem Konzept der Reliabilität die Annahme zugrunde liegt, dass sich jeder Testwert aus einem "wahren" Punktwert (true-score) und einem Messfehler (error-score) zusammensetzt.

Es geht jedoch bei einer reliablen Ermittlung darum, ihre Zahl möglichst stark zu begrenzen. Je geringer der Messfehler, desto höher ist die Reliabilität des Testverfahrens.

Messfehler können aus den verschiedensten Gründen entstehen. Eine mögliche Quelle von Messfehlern liegt darin, dass die Anleitungen zur Durchführung der Kontrolle nicht präzise genug formuliert sind. Man bezeichnet z.B. keine genauen Angaben hinsichtlich der Zeit, die für die Lösung der Aufgaben vorgesehen ist, oder ob die Verwendung von Hilfsmitteln, wie z.B. das Wörterbuch, erlaubt ist.

Eine weitere häufige Quelle von Messfehlern liegt in den konstruktionsbedingten Unzulänglichkeiten des Testens. Die Arbeitsanweisungen werden oft vom Lehrer zu kompliziert oder zu missverständlich formuliert und ermöglichen dabei dem Schüler während der Kontrolle eine beliebiege Interpretation. Wenn der Schüler eine Testaufgabe mit einer Elementenmehrzahl und einer Anweisung "Bilde den Singular" bekommt, kann er vermuten, dass er den Singular von den Subjekten bilden soll oder von allen Substantiven, bei denen das möglich ist.

Deswegen ist die Anweisung nicht eindeutig und trägt zur Ungenauigkeit der Messung bei.

Die Nichteindeutigkeit der Antwortalternativen mindert auch die Reliabilität der Ermittlung. Darüber hinaus kann die Messgenauigkeit des Testens auch durch testexterne Faktoren beeinflusst werden, z.B. Geräuschepegel oder schlechte Akustik beim Hörverstehen. Die Messfehler können auch von den individuellen Faktoren, wie Müdigkeit, Angst oder schlechte körperliche Verfassung des Schülers bedingt sein. Auf diese externen Faktoren hat der Lehrer einen geringen oder gar keinen Einfluss. Da man in Wirklichkeit die Reliabilität eines Testverfahrens nicht dadurch feststellen kann, dass man die gleiche Testaufgabe mit den gleichen Schülern mehrmals durchführt - schon die Wiederholung würde ja die Ergebnisse verfälschen, weil die Schüler nun diese Testaufgaben fast auswendig kennten - wird die Reliabilität durch statistische Verfahren errechnet.

Wenn der Lehrer die Reliabilität bestimmt, soll er seine Aufmerksamkeit auch auf die Trennschärfe der Testaufgabe richten. Die Aufgabe mit der Trennschärfe erlaubt, die Schüler zu unterscheiden, die den Stoff völlig beherrscht haben, von denen, die den Stoff nur teilweise verstanden haben. Man nimmt an, das im Fall, wenn über 85 % der Schüler die Testaufgabe richtig gelöst hat, sie zu leicht ist, bei weniger als 15 % richtiger Lösungen sie zu schwierig ist. Indem der Lehrer ein Testverfahren durchführt, um nur über die allgemeine Beherrschung des bestimmtem Stoffes betreffende Informationen zu bekommen - was in der Schulpraxis sehr oft auftritt - muss die Aufgabe keine Trennschärfe aufweisen. Das wichtigste ist, dass die Bestimmung der Reliabilität erst durchgeführt werden sollte, wenn die Validität hinreichend gesichert ist; denn ein reliabler Test, der nicht valid ist, ist wertlos.

Die Objektivität

Das Kriterium der Objektivität in der Bewertung von Schülerleistungen wird sei langem problematisiert. Verschiedene Lehrer gelangen bei der Beurteilung der gleichen Arbeit zu verschiedenen Erbenissen. Manchmal kommt der gleiche Lehrer mitunter, wenn er die gleiche Arbeit zu verschiedenen Zeiten beurteilt, zu unterschiedlichen Resultaten. Dieses Problem lässt sich mit strengen Objektivitätsforderungen lösen, die sich auf die Durchführung der Kontrolle sowie auf die Auswertung und Interpretation des Ergebnisses beziehen.

Die Durchführungsobjektivität betrifft den Grad der Unabhängigkeit des Testverfahrens von den äusseren Einflussfaktoren, systematischen oder zufälligen, welche die Testergebnisse verändern können. Kleber sagt: "Die äusseren Bedingungen bei der Durchführung sollen völlig gleich gehalten werden, damit Unterschiede in den Ergebnissen auf sogenannte 'innere Bedingungen' zurückgeführt werden können." Die Aufgaben müssen für alle Schüler die gleichen sein und eindeutig und allgemein verständlich abgefasst werden. Es muss auch bei der Kontrolle genau festgestelltsein, wie viel Zeit bei der Bearbeitung einer Aufgabe zur Verfügung steht, welche Hilfsmittel der Schüler verwenden kann, welche Anforderungen hinsichtlich Länge und Inhalt der Testaufgabe beim schriftlichen Ausdruck gestellt werden. Man soll auch die unliebsamen technischen Störungen vermeiden, die leicht ablenkbare Schüler besonders beeinträchtigen können.

Die Auswertungsobjektivität gewährleistet, dass die gleiche sprachliche Leistung von allen Korrektoren gleich beantwortet Auswerter unabhängig sind.

Eine völlig objektive Bewertung lässt sich herstellen, wenn man Aufgaben verwendet, in denen dieLernenden nicht selbst formulieren, sondern nur aus mehreren vorgegebenen Lösungen die richtige erkennen und markieren müssen. Beim freien Sprechen und Schreiben kann man jedoch die Leistungen nicht absolut bewerten; denn der Lehrer fällt dabei ein quantitatives Urteil, was immer zu einem gewissen Grad subjektiv ist. Diese Subjektivität kann man dennoch dadurch reduzieren, indem man die Punkte mit der gleichen den bestimmten Leistungsstufen entsprechenden Bewertungsanleitungen vergibt.

Die dritte Form der Objektivität - die Interpretationsobjektivität - ist dann gegeben, wenn aus den Ergebnissen der Kontrolle von verschiedenen Personen die gleichen Schlussfolgerungen, die in der gleichen Note eine Widerspiegelung finden, gezogen werden. Diese drei Aspekte der Objektivität sind eine notwendige Voraussetzung für die Reliabilität; denn ein Test kann nicht zu reliablen Bewertungen führen, wenn die Ergebnisse des Tests mit jeder Durchführung oder je nach der Person des Auswerters variieren.

H. Komorowska weist auch auf ein Nebengütekriterium hin, das zwar die drei genannten Merkmale nicht beeinflusst, doch in der Praxis der Kontrolldurchführung auch von Bedeutung ist, nämlich die Praktikabilität. Dieses Kriterium betrifft das Verhältnis von Aufwand und der durchgeführten Überprüfung. Der Lehrer soll danach streben, dass seine Leistungsmessung gute Qualität repräsentiert, aber dabei möglichst wenig Zeit und Kosten in Anspruch nimmt.

Nach dem eben Gesagten soll klar geworden sein, wie wesentlich die Bedingungen sind, unter denen das Testen verlässliche Aussagen über die Schülerleistungen geben können. Die sprachlichen Leistungen der Lernenden sollen möglichst genau erfasst, möglich zuverlässig gemessen und möglichst objektiv bewertet werden.

Folgende Bedingungen können für Tests als notwendig gelten:

1. genau das Ziel des Testens zu formulieren,

2. die Aufgaben inhaltlich entsprechend dem Ziel der Kontrolle zu konstruieren,

3. eindeutige Anweisungen und Aufgaben zu stellen, was falsche Lösungen wegen Missverständnissen begrenzt,

4. vom Erinnerungsvermögen unabhängige Aufgaben zu benutzen,

5. verschiedene Aufgaben zur Überprüfung einer Fähigkeit zu verwenden und

6. eine möglichst objektive Bewertung der Aufgaben zu sichern.

Indem der Lehrer die Erfüllung dieser Anforderungen am Testverfahren gewährleistet, schafft er Voraussetzungen für die richtige Aussage der erlangten Ergebnisse und kann die Kontrolle als unentbehrliches, wertvolles Werkzeug bei der Optimierung des Lernprozesses halten.

Bibliographie:

1.Bausch Karl, Richard u.a.(1989) "Handbuch der Fremdschprachenunterrricht", München

2.Beier Werner: (1981) "Bewertung von Teilleistungen als Bestandteil unserer Bewertungspraxis", Deutschunterricht Nr.4

3.Bolton Sibylle: (1982) " Die Gutebestimmung kommunikativer Tests", Frankfurt
a/Mein

4.Dretzke Burkhard: (1974) "Grenzen und Möglichkeiten der objektivenLeistungsmessung im Englischunterricht", Die neueren Sprachen Nr.1

5.Esser Urlich: (1991) "Tests im Fremdschprachenunterricht", Deutsch als Fremdschprachenunterricht Nr. 3

6.Kaiser Ottilie/Jähnig Marlies: (1981) "Gedanken zu Bewertungskriterien für die Schülerleistungen in der mündlichen Abschlussprüfung", Deutschunterricht Nr.2

7.Kleber Eduard W.: (1979) "Tests in der Schule", Ernst Reinheidt Verlag, München

8. Komorowska Hanna: (1974) "Testy w nauczaniu języków obcych",Wydawnictwa Szkolne i Pedagogiczne, Warszawa

9.Lado Robert: "Testen im Schprachunterricht. Handbuch für die Erstellung und den Gebrauch von Leistungstests im Fremdschprachenunterricht", Max Hueber Verlag
opracowała:

Opracowanie: Joanna Wojcieszak-Żyto

Zgłoś błąd    Wyświetleń: 848


Uwaga! Wszystkie materiały opublikowane na stronach Profesor.pl są chronione prawem autorskim, publikowanie bez pisemnej zgody firmy Edgard zabronione.


BAROMETR


1 2 3 4 5 6  
Oceń artukuł!



Ilość głosów: 0

Serwis internetowy, z którego korzystasz, używa plików cookies. Są to pliki instalowane w urządzeniach końcowych osób korzystających z serwisu, w celu administrowania serwisem, poprawy jakości świadczonych usług w tym dostosowania treści serwisu do preferencji użytkownika, utrzymania sesji użytkownika oraz dla celów statystycznych i targetowania behawioralnego reklamy (dostosowania treści reklamy do Twoich indywidualnych potrzeb). Informujemy, że istnieje możliwość określenia przez użytkownika serwisu warunków przechowywania lub uzyskiwania dostępu do informacji zawartych w plikach cookies za pomocą ustawień przeglądarki lub konfiguracji usługi. Szczegółowe informacje na ten temat dostępne są u producenta przeglądarki, u dostawcy usługi dostępu do Internetu oraz w Polityce prywatności plików cookies.
Dowiedz się więcej.