Hauptgütekriterien bei einer Prüfung
Prüfungen im Hochschulbereich dienen dazu, die Leistungen der Studierenden zu erfassen. Um aussagekräftige Resultate zu gewährleisten, müssen Prüfungen bestimmte Gütekriterien wie Objektivität, Reliabilität, Validität erfüllen.
Nebengütekriterien bei einer Prüfung
Nebengütekriterien sind zusätzliche Kriterien, die den Hauptgütekriterien untergeordnet sind und bei der Prüfung berücksichtigt werden können. Folgende Kriterien gehören zu den Nebengütekriterien:
- Ökonomie: Die Ökonomie bezieht sich auf den Konstruktionsaufwand und die Durchführungszeit einer Prüfung. Sie sollte erst dann mit einbezogen werden, wenn die Hauptgütekriterien „Validität“ und „Reliabilität“ sichergestellt sind.
- Akzeptanz: Eine hohe Akzeptanz erreicht eine Prüfung dann, wenn die Inhalte einer Prüfung auch von Studierenden, die nicht gut abgeschnitten haben oder durchgefallen sind, als akzeptabel empfunden werden.
- Fairness: Bei einer Prüfung soll kein Studierender / keine Studierende oder eine Studierendengruppe systematisch bevorzugt oder benachteiligt werden (Lernzielrelevante Faktoren ausgenommen). „Fairness“ als Nebengütekriterium ist hier nicht zu verwechseln mit „Fairness“ in Abgrenzung zu „Chancengleichheit“ im Abschnitt „Haltung“.
- Transparenz: Über alle wichtigen Merkmale einer Prüfung, wie Prüfungsform und - ablauf, zu prüfende Inhalte und Kompetenzen sowie Bewertungsrichtlinien, können sich die Studierenden vorab ausreichend informieren. Zudem erhalten sie nach der Prüfung ein angemessenes Feedback zu ihren individuellen Leistungen.
- Unverfälschbarkeit: Die Studierenden haben keine Möglichkeit, die Prüfungsergebnisse zu manipulieren. Das Schummeln bei einer Prüfung würde beispielsweise die Unverfälschbarkeit einer Prüfung beschädigen.
Quellen:
Metzger, Christoph; Nüesch, Charlotte (2004): Fair prüfen. Ein Qualitätsleitfaden für Prüfende an Hochschulen. Hochschuldidaktische Schriften Band 6. Universität St. Gallen, Institut für Wirtschaftspädagogik
HRK (2015): Kompetenzorientiert Prüfen. Zum Lernergebnis passende Prüfungsaufgaben. In: Hochschulrektorenkonferenz (Hrsg.): Nexus Impulse für die Praxis. Ausgabe 4.
Objektivität
Das Gütekriterium Objektivität erlaubt Aussagen darüber, ob die Ergebnisse einer Prüfung unabhängig von der Person sind, die die Prüfung durchführt, auswertet oder beurteilt. Ziel ist es, durch Standardisierung verschiedener Aspekte des Prüfungsprozesses die Ursachen für Messfehler reduzieren zu können. Es werden drei Arten der Objektivität unterschieden:
- Durchführungsobjektivität: Sie soll sicherstellen, dass alle Studierenden die gleichen Informationen über den Prüfungsablauf, wie etwa Bearbeitungszeit, erlaubte Hilfsmittel und Hinweise zur Bearbeitung und Beantwortung der Fragen, erhalten. Die Aufgabenstellungen sollen so gestaltet sein, dass sie für alle Studierenden verständlich und einheitlich sind.
- Auswertungsobjektivität: Auswertungsobjektivität ist gegeben, wenn alle Zweitprüfer:innen bei der Bewertung von Prüfungsaufgaben zum gleichen Ergebnis kommen. Bei offenen Fragen empfiehlt sich die Verwendung eines Bewertungsrasters.
- Interpretationsobjektivität: Interpretationsobjektivität liegt vor, wenn die Ergebnisse der Prüfungen von unterschiedlichen Korrektor:innen gleich interpretiert werden. Unterstützend sollten die Vergabe der Punkte im Bewertungsraster und die damit jeweils erreichbaren Noten in einem Notenschlüssel festgelegt werden.
Quelle:
Schindler, Christoph Josef (2015): Herausforderung Prüfen: Eine fallbasierte Untersuchung der Prüfungspraxis von Hochschullehrenden im Rahmen eines Qualitätsentwicklungsprogramm. München
Reliabilität
Das Kriterium der Reliabilität (Zuverlässigkeit) gibt an, wie genau eine Prüfung misst bzw. inwieweit eine Prüfung bei wiederholter Anwendung dieselben Ergebnisse liefert. Die Reliabilität kann in zwei Arten unterschieden werden:
- Interpersonelle Zuverlässigkeit: Wenn eine Prüfungsleistung von zwei oder mehreren Lehrenden gleich bewertet wird, liegt eine interpersonelle Zuverlässigkeit vor.
- Intrapersonelle Zuverlässigkeit: Wenn der / die Lehrende bei einer wiederholten Korrektur der Prüfungsleistung immer wieder zum gleichen Ergebnis kommt, liegt eine intrapersonelle Zuverlässigkeit vor.
Quellen:
Bühner, Markus. (2011): Einführung in die Test- und Fragebogenkonstruktion. München: Pearson Studium.
Manukjan, Anke; Wendt, Claudia (2016): Leitfaden Prüfungsentwicklung: Ein kompetenzorientierter Ansatz. Magdeburger Beiträge zur Hochschulentwicklung; Abrufbar unter: https://lehre-fuer-lehre.de/wp-content/uploads/2021/02/MBZHE_LeitfadenPru%CC%88fungsentwicklung.pdf; Stand: 20.04.2022
Validität
Das Gütekriterium der Validität (Gültigkeit) gibt Auskunft dazu, ob eine Prüfung genau das misst, was sie zu messen beabsichtigt – also das Ausmaß, in welchem eine Leistungskontrolle der Studierenden eine aussagekräftige Einschätzung des Erreichens der Lernziele ermöglicht.
Quelle:
Bandtel, Matthias; Baume, Matthias; Brinkmann, Elena; Bedenlier, Svenja; Budde, Jannica, Eugster, Benjamin; Ghoneim, Andrea; Halbherr, Tobias; Persike, Malte; Rampelt, Florian; Reinmann, Gabi; Sari, Zaim; Schulz, Alexsander (Hrsg.) (2021): Digitale Prüfungen in der Hochschule. Whitepaper einer Community Working Group aus Deutschland, Österreich und der Schweiz. Stifterverband für die Deutsche Wissenschaft, Berlin: Hochschulforum Digitalisierung.