Hauptgütekriterien bei einer Prüfung

Prüfungen im Hochschulbereich dienen dazu, die Leistungen der Studierenden zu erfassen. Um aussagekräftige Resultate zu gewährleisten, müssen Prüfungen bestimmte Gütekriterien wie Objektivität, Reliabilität, Validität erfüllen.

 

 

 

Abbildung 3: Gütekriterien (eigene Darstellung)

 

 

 


Nebengütekriterien bei einer Prüfung

Nebengütekriterien sind zusätzliche Kriterien, die den Hauptgütekriterien untergeordnet sind und bei der Prüfung berücksichtigt werden können. Folgende Kriterien gehören zu den Nebengütekriterien:

  • Ökonomie: Die Ökonomie bezieht sich auf den Konstruktionsaufwand und die Durchführungszeit einer Prüfung. Sie sollte erst dann mit einbezogen werden, wenn die Hauptgütekriterien „Validität“ und „Reliabilität“ sichergestellt sind.

 

  • Akzeptanz: Eine hohe Akzeptanz erreicht eine Prüfung dann, wenn die Inhalte einer Prüfung auch von Studierenden, die nicht gut abgeschnitten haben oder durchgefallen sind, als akzeptabel empfunden werden.

 

  • Fairness: Bei einer Prüfung soll kein Studierender / keine Studierende oder eine Studierendengruppe systematisch bevorzugt oder benachteiligt werden (Lernzielrelevante Faktoren ausgenommen). „Fairness“ als Nebengütekriterium ist hier nicht zu verwechseln mit „Fairness“ in Abgrenzung zu „Chancengleichheit“ im Abschnitt „Haltung“.

 

  • Transparenz: Über alle wichtigen Merkmale einer Prüfung, wie Prüfungsform und - ablauf, zu prüfende Inhalte und Kompetenzen sowie Bewertungsrichtlinien, können sich die Studierenden vorab ausreichend informieren. Zudem erhalten sie nach der Prüfung ein angemessenes Feedback zu ihren individuellen Leistungen.

 

  • Unverfälschbarkeit: Die Studierenden haben keine Möglichkeit, die Prüfungsergebnisse zu manipulieren. Das Schummeln bei einer Prüfung würde beispielsweise die Unverfälschbarkeit einer Prüfung beschädigen.

 

Quellen:

Metzger, Christoph; Nüesch, Charlotte (2004): Fair prüfen. Ein Qualitätsleitfaden für Prüfende an Hochschulen. Hochschuldidaktische Schriften Band 6. Universität St. Gallen, Institut für Wirtschaftspädagogik

HRK (2015): Kompetenzorientiert Prüfen. Zum Lernergebnis passende Prüfungsaufgaben. In: Hochschulrektorenkonferenz (Hrsg.): Nexus Impulse für die Praxis. Ausgabe 4.


Objektivität

Das Gütekriterium Objektivität erlaubt Aussagen darüber, ob die Ergebnisse einer Prüfung unabhängig von der Person sind, die die Prüfung durchführt, auswertet oder beurteilt. Ziel ist es, durch Standardisierung verschiedener Aspekte des Prüfungsprozesses die Ursachen für Messfehler reduzieren zu können. Es werden drei Arten der Objektivität unterschieden:

  • Durchführungsobjektivität: Sie soll sicherstellen, dass alle Studierenden die gleichen Informationen über den Prüfungsablauf, wie etwa Bearbeitungszeit, erlaubte Hilfsmittel und Hinweise zur Bearbeitung und Beantwortung der Fragen, erhalten. Die Aufgabenstellungen sollen so gestaltet sein, dass sie für alle Studierenden verständlich und einheitlich sind.

 

  • Auswertungsobjektivität: Auswertungsobjektivität ist gegeben, wenn alle Zweitprüfer:innen bei der Bewertung von Prüfungsaufgaben zum gleichen Ergebnis kommen. Bei offenen Fragen empfiehlt sich die Verwendung eines Bewertungsrasters.

 

  • Interpretationsobjektivität: Interpretationsobjektivität liegt vor, wenn die Ergebnisse der Prüfungen von unterschiedlichen Korrektor:innen gleich interpretiert werden. Unterstützend sollten die Vergabe der Punkte im Bewertungsraster und die damit jeweils erreichbaren Noten in einem Notenschlüssel festgelegt werden.

 

Quelle:

Schindler, Christoph Josef (2015): Herausforderung Prüfen: Eine fallbasierte Untersuchung der Prüfungspraxis von Hochschullehrenden im Rahmen eines Qualitätsentwicklungsprogramm. München


Reliabilität

Das Gütekriterium „Reliabilität“ ist erfüllt, wenn durch die Prüfungsaufgaben zuverlässig der wahre Leistungsstand von Studierenden in einer Prüfung gemessen wird. (vgl. Universität Zürich 2024) Die Prüfungsergebnisse sollten bei ein und demselben Studierenden gleichbleiben und sie sollten zwischen unterschiedlichen Studierenden, die das gleiche Kompetenzniveau haben, gleichbleiben. Sie sollten außerdem bei unterschiedlichen Prüferinnen und Prüfern gleichbleiben. Die Reliabilität kann laut der Universität Zürich (2024) in der Praxis durch folgende Faktoren erhöht werden:

  • Die Prüfungsdauer sollte so gewählt sein, dass mindestens 80% der Studierenden alle Prüfungsaufgaben beantworten können.
  • Generell sollten die Prüfungsaufgaben nicht zu schwer und nicht zu leicht sein, das heißt, es sollten überwiegend Aufgaben mit mittlerem Schwierigkeitsgrad gestellt werden.
  • Je mehr Fragen von den Studierenden beantwortet werden, desto besser kann der Leistungsstand und die Erreichung der Lernziele gemessen werden.

 

Quellen:

Bühner, Markus. (2011): Einführung in die Test- und Fragebogenkonstruktion. München: Pearson Studium.

Manukjan, Anke; Wendt, Claudia (2016): Leitfaden Prüfungsentwicklung: Ein kompetenzorientierter Ansatz. Magdeburger Beiträge zur Hochschulentwicklung; Abrufbar unter: https://lehre-fuer-lehre.de/wp-content/uploads/2021/02/MBZHE_LeitfadenPru%CC%88fungsentwicklung.pdf; Stand: 20.04.2022


Validität

Das Gütekriterium der Validität (Gültigkeit) gibt Auskunft dazu, ob eine Prüfung genau das misst, was sie zu messen beabsichtigt – also das Ausmaß, in welchem eine Leistungskontrolle der Studierenden eine aussagekräftige Einschätzung des Erreichens der Lernziele ermöglicht.

 

Quelle:

Bandtel, Matthias; Baume, Matthias; Brinkmann, Elena; Bedenlier, Svenja; Budde, Jannica, Eugster, Benjamin; Ghoneim, Andrea; Halbherr, Tobias; Persike, Malte; Rampelt, Florian; Reinmann, Gabi; Sari, Zaim; Schulz, Alexsander (Hrsg.) (2021): Digitale Prüfungen in der Hochschule. Whitepaper einer Community Working Group aus Deutschland, Österreich und der Schweiz. Stifterverband für die Deutsche Wissenschaft, Berlin: Hochschulforum Digitalisierung.