Die Geburt der Schulnote
Vor dem 16. Jahrhundert gab es keine Schulnoten, wie wir sie kennen. Im antiken Rom etwa wurden Schueler muendlich geprueft - direkt, spontan, ohne Ziffern. Der Lehrer beobachtete, korrigierte, lobte oder tadelte. Eine systematische Bewertung auf einer numerischen Skala? Undenkbar.
Das aenderte sich mit den Jesuiten. Der 1534 gegruendete Jesuitenorden erkannte frueh, dass Bildung ein Machtinstrument war - und dass man Bildung organisieren musste. In ihren Klosterschulen fuehrten sie das erste dokumentierte numerische Bewertungssystem ein: eine fuenfstufige Skala mit lateinischen Bezeichnungen. Erstmals mussten Schueler formale Pruefungen bestehen, um in die naechste Klasse aufzusteigen.
1599 kodifizierten die Jesuiten ihr Bildungssystem in der beruehmten Ratio Studiorum - einem umfassenden Lehrplan, der Unterrichtsinhalte, Pruefungsmethoden und Bewertungskriterien festlegte. Es war das erste standardisierte Curriculum der westlichen Welt. Das Grundprinzip: Wer die Pruefung nicht besteht, steigt nicht auf. Dieses Klassensystem - so selbstverstaendlich es uns heute erscheint - war eine Revolution.
Parallel oeffnete die protestantische Reformation den Zugang zu Bildung ueber die katholische Kirche hinaus. Martin Luther forderte oeffentliche Schulen fuer alle Kinder. Mehr Schulen bedeuteten mehr Schueler, mehr Schueler bedeuteten mehr Bedarf an standardisierter Bewertung. Die Buechse der Pandora war geoeffnet.
Von Preussen zur Sechserskala
Schon 1530, vier Jahre vor den Jesuiten, experimentierte das Koenigreich Sachsen mit numerischen Pruefungen. Zweimal jaehrlich mussten Schueler vor dem Pfarrer und dem Buergermeister ihr Wissen unter Beweis stellen. Doch es waren die Preussen, die die Notengebung im 19. Jahrhundert industrialisierten.
Um 1850 etablierte Preussen ein dreistufiges Bewertungssystem. Doch drei Stufen waren zu grob - zu viele Schueler landeten in der Mitte. Also erweiterte man auf vier, dann auf fuenf Stufen. Das Problem blieb: Bei einer ungeraden Zahl tendieren Lehrer zur Mitte. Die Note 3 wurde zur Default-Bewertung, die eigentlich nichts aussagte.
Die Loesung kam 1938 - ausgerechnet unter dem NS-Regime. Reichserziehungsminister Bernhard Rust ordnete die reichsweite Umstellung auf ein sechsstufiges Notensystem an. Die Logik: Eine gerade Anzahl von Noten zwingt den Lehrer, sich zu entscheiden - entweder die obere oder die untere Haelfte. Kein bequemes Mittelfeld mehr.
Was als mathematischer Trick begann, wurde zur laengsten Konstante im deutschen Bildungswesen: Das System von 1938 ist bis heute - 88 Jahre spaeter - unveraendert in Kraft. Keine andere bildungspolitische Entscheidung des 20. Jahrhunderts hat so lange ueberlebt.
Die deutsche Teilung und Wiedervereinigung
Nach 1945 kehrte die DDR zum fuenfstufigen System zurueck (1 = sehr gut bis 5 = ungenuegend), waehrend Westdeutschland das Sechsersystem beibehielt. Mit der Wiedervereinigung 1990 wurde die Sechserskala fuer das gesamte Bundesgebiet uebernommen - ein stiller Sieg der westdeutschen Bildungstradition.
Drei Laender, drei Systeme
Deutschland, Oesterreich und die Schweiz teilen eine Sprache, aber nicht ein Notensystem. Die Unterschiede sind historisch gewachsen - und fuer Schueler, die zwischen den Laendern wechseln, oft verwirrend.
Warum die Unterschiede? Oesterreich behielt nach 1945 sein aelteres 5-Stufen-System bei - eine bewusste Abgrenzung von der reichsweiten Reform von 1938. Die Schweiz entwickelte ihr System unabhaengig, beeinflusst durch die franzoesischsprachige Kultur der Westschweiz, wo hoehere Zahlen intuitiv "besser" bedeuten.
Fuer Eltern, die zwischen diesen Laendern umziehen, kann das zu realen Problemen fuehren: Eine schweizerische 4 (knapp bestanden) wird in Deutschland als "ausreichend" gelesen - aber eine deutsche 4 waere in der Schweiz eine gute Note.
Weltweit: So bewerten andere Laender
Weltweit existieren Dutzende unterschiedlicher Notensysteme. Was in einem Land "gut" ist, waere in einem anderen "mittelmässig". Einige Laender bewegen sich sogar komplett weg von numerischen Noten.
| Land | System | Bestanden | Besonderheit |
|---|---|---|---|
| 🇺🇸USA | A - F (GPA 0-4.0) | D (60%) | Vergleichsweise milde Bewertung |
| 🇫🇷Frankreich | 0 - 20 Punkte | 10/20 | Streng: 15/20 gilt als exzellent |
| 🇬🇧Grossbritannien | 9 - 1 (seit 2017) | 4 | Vorher A* bis G |
| 🇫🇮Finnland | 4 - 10 | 5 | Kaum standardisierte Tests |
| 🇩🇰Daenemark | 12-Stufen-Skala | 2 | Trend zu verbaler Beurteilung |
| 🇯🇵Japan | 1-5 oder 1-100 | variiert | Relative Bewertung innerhalb der Klasse |
| 🇸🇪Schweden | A - F (seit 2011) | E | Vorher Pass/Fail-System |
Der Trend in Nordeuropa ist bemerkenswert: Finnland, oft als Bildungsvorbild zitiert, setzt auf minimal testing und individuelle Rueckmeldung statt numerischer Noten. Daenemark und Norwegen experimentieren mit rein verbalen Beurteilungen in den fruehen Schuljahren. Die Frage, ob Ziffernnoten ueberhaupt der beste Weg sind, Lernen zu messen, wird weltweit intensiver diskutiert als je zuvor.
Die Notenlotterie - Wie subjektiv sind Noten wirklich?
Dieselbe Klassenarbeit, vorgelegt an verschiedene Lehrkraefte. Das Ergebnis ist ernuechternd - und wissenschaftlich gut dokumentiert.
Ingenkamps Klassiker (1960er Jahre)
Der Bildungsforscher Karl-Heinz Ingenkamp legte denselben Deutschaufsatz 92 verschiedenen Lehrkraeften vor. Nur 40% vergaben dieselbe Note. Die restlichen 60% kamen zu unterschiedlichen Ergebnissen - teilweise mit einer Streuung von drei Notenstufen. Dieses Experiment wurde vielfach wiederholt, mit aehnlichen Ergebnissen.
IQB/Tuebingen-Studie (2024)
Forscher des Instituts fuer Qualitaetsentwicklung im Bildungswesen (IQB) und der Universitaet Tuebingen kamen 2024 zu einem noch radikaleren Befund: Schulnoten korrelieren nur schwach mit den tatsaechlich gemessenen Kompetenzen der Schueler. Eine gute Note sagt weniger ueber das Wissen aus als gemeinhin angenommen.
Dokumentierte Verzerrungen
Gender-Bias: Maedchen erhalten in MINT-Faechern durchschnittlich 0,8 Notenpunkte schlechter - bei nachweislich gleicher Leistung. In sprachlichen Faechern ist der Effekt umgekehrt: Dort werden Jungen benachteiligt. Die Ursache liegt in unbewussten Erwartungshaltungen der Lehrkraefte.
Soziooekononomischer Bias: In rund 30% der Faelle erhalten Kinder aus bildungsfernen Familien schlechtere Noten als Gleichaltrige aus Akademikerfamilien - trotz vergleichbarer Leistung. Dieser "Matthaeus-Effekt" verstaerkt bestehende Ungleichheiten.
Halo-Effekt und Anchoring: Aeussere Erscheinung, Handschrift, Reihenfolge der Korrektur - all das beeinflusst die Notengebung messbar. Wer nach einer Serie schwacher Arbeiten korrigiert wird, profitiert. Wer nach Einser-Arbeiten drankommt, wird strenger bewertet.
Was Noten mit Schuelern machen
Noten sind mehr als Zahlen auf Papier. Sie formen Selbstbilder, beeinflussen Lebenswege und koennen - je nach Kontext - motivieren oder zerstoeren. Die psychologische Forschung zeichnet ein differenziertes Bild.
Extrinsische vs. intrinsische Motivation
Schulnoten sind ein klassisches Instrument extrinsischer Motivation: Man lernt fuer die Note, nicht fuer das Verstehen. Psychologen wie Edward Deci und Richard Ryan haben gezeigt, dass extrinsische Belohnungen die intrinsische Motivation - das Lernen aus Neugier und Freude - langfristig untergraben koennen. Kinder, die fuer gute Noten belohnt werden, lernen weniger gern als solche, die aus eigenem Antrieb lernen.
Pruefungsangst: Ein Massenphänomen
Studien schaetzen, dass 15 bis 25% aller Schueler unter klinisch relevanter Pruefungsangst leiden. Fuer diese Kinder misst die Note nicht das Wissen, sondern die Faehigkeit, unter Druck zu funktionieren. Maedchen sind haeufiger betroffen als Jungen, aeltere Schueler haeufiger als juengere.
Notenidentitaet: "Ich bin eine 4 in Mathe"
Besonders problematisch ist die Verschmelzung von Note und Selbstbild. Wer wiederholt schlechte Noten erhaelt, beginnt, sich selbst als "schlecht in Mathe" zu definieren - unabhaengig davon, ob die Noten fair waren. Diese Selbstzuschreibung wird zur selbsterfuellenden Prophezeiung: Wer glaubt, schlecht zu sein, strengt sich weniger an, erhaelt schlechtere Noten, bestaetigt sein negatives Selbstbild.
Die andere Seite: Warum Noten auch nuetzlich sind
Bei aller berechtigter Kritik: Noten bieten auch Orientierung. Sie machen Leistungen vergleichbar, geben Schuelern und Eltern eine Einschaetzung und koennen - bei fairer Anwendung - tatsaechlich motivieren. Das Problem liegt nicht in der Idee der Leistungsbewertung an sich, sondern in ihrer Ausfuehrung: zu subjektiv, zu wenig transparent, zu stark von Faktoren abhaengig, die mit Leistung nichts zu tun haben.
Die Zukunft: Alternativen und Reformen
Waehrend das Sechsersystem in Deutschland stabil steht, bewegen sich einzelne Bundeslaender und viele Laender weltweit in Richtung differenzierterer Bewertungsformen.
Verbalbeurteilungen
Statt einer Zahl erhaelt das Kind einen beschreibenden Text: Staerken, Entwicklungsfelder, konkrete Empfehlungen. Bremen und Teile Bayerns erlauben dies bereits in der Grundschule. Der Vorteil: reichere Rueckmeldung. Der Nachteil: weniger vergleichbar, aufwaendiger fuer Lehrkraefte.
Waldorf und Montessori: Noten? Nie gehoert.
An Waldorfschulen gibt es von der ersten bis zur letzten Klasse keine Ziffernnoten. Stattdessen verfassen Lehrkraefte ausfuehrliche Textzeugnisse, die das Kind individuell beschreiben. Montessori-Schulen setzen auf Beobachtung und Dokumentation von Lernfortschritten - ohne jegliche Benotung. Beide Ansaetze funktionieren seit Jahrzehnten.
Hamburg 2024: Der Testlauf
Hamburg ist das erste grosse Bundesland, das Schulen erlaubt, bis zur 9. Klasse auf Ziffernnoten zu verzichten und stattdessen Verbalbeurteilungen einzusetzen. Die Teilnahme ist freiwillig, aber der Schritt ist ein Signal: Die Debatte um Alternativen ist in der Politik angekommen.
KI-gestuetzte Bewertung: Fluch oder Segen?
68% der Universitaeten pilotieren bereits KI-basierte Bewertungssysteme (Stand 2025). Die Versprechen sind verlockend: 60-80% weniger Korrekturzeit, hoehere Konsistenz, sofortiges Feedback. Doch KI-Bewertung hat blinde Flecken: Sie kann kreative Antworten schlecht einschaetzen, bildet bestehende Verzerrungen in den Trainingsdaten ab und funktioniert als "Black Box" - Schueler verstehen nicht, warum sie eine bestimmte Note erhalten haben.
Der entstehende Konsens: KI als Werkzeug, nicht als Ersatz. Die beste Bewertung entsteht vermutlich in der Zusammenarbeit von Mensch und Maschine - wobei die paedagogische Urteilskraft der Lehrkraft das letzte Wort behaelt.
Quellenverzeichnis und weiterfuehrende Literatur
- Planet Wissen: Schulgeschichte - Schulnoten
- News4Teachers: Voreingenommene Lehrer (2024)
- Quarks: So wenig aussagekraeftig sind Schulnoten
- Deutsches Schulportal: Schulnoten - Ja oder Nein?
- IQB - Institut fuer Qualitaetsentwicklung im Bildungswesen
- TUM Clearinghouse: Geschlechterunterschiede
- News4Teachers: Hamburg ohne Noten (2024)
- PM Wissen: Seit wann gibt es Schulnoten?
- Wikipedia: Schulnote
- American University: Alternative Grading Systems
- Ingenkamp, K.-H. (1971): Die Fragwuerdigkeit der Zensurengebung. Beltz Verlag.
- Deci, E. L. & Ryan, R. M. (2000): Self-Determination Theory. In: American Psychologist.
Genau deshalb gibt es die Zweitmeinung
In einem System, das nachweislich von Subjektivitaet, Bias und Zufallsfaktoren gepraegt ist, kann eine unabhaengige fachliche Einschaetzung den entscheidenden Unterschied machen.
Zweitmeinung beauftragen