Zwölf Jahre Visible Learning' im wissenschaftlichen Diskurs

Die Seite wird erstellt Anne Vetter
 
WEITER LESEN
PR 2021, 75. Jahrgang, S. 393-408
                       © 2021 Colin Cramer - DOI https://doi.org/10.3726/PR042021.0036

                                               Colin Cramer

                 Zwölf Jahre ‚Visible Learning‘ im
                   wissenschaftlichen Diskurs
                     Eine Zwischenbilanz zur Hattie-Studie

Wie kaum eine andere Studie hat die Me-                     erfahren. Hattie fertigte eine Synthese
ta-Meta-Analyse zu Bedingungsfaktoren                       von über 800 Meta-Analysen zu Bedin-
von Schülerleistungen der Gruppe um John                    gungsfaktoren von Schülerleistung an,
Hattie im öffentlichen wie im wissenschaft-                 mit – je nach Rezeption – mehr oder we-
lichen Diskurs für Aufsehen gesorgt. Die                    niger weitreichenden Implikationen für
Studie wurde umfassend und kontrovers                       Schule, Unterricht sowie Lehrerinnen- und
rezipiert, kommentiert, gelobt und kritisiert.              Lehrerbildung. Nachdem die Zeit eiliger
Eine konsistente Zusammenschau der                          Veröffentlichungen und Stellungnahmen
unterschiedlichen wissenschaftlichen Re-                    (‚Hattie-Hype‘) vorüber scheint, resümiert
zeptionslinien liegt in einem Zeitschriften-                dieser Beitrag die wissenschaftlichen Re-
beitrag aber bislang nicht vor. Der Beitrag                 zeptionslinien mit kritischer Distanz. Diese
nimmt dieses Desiderat auf und zeichnet                     Rezeption verlief bislang überwiegend in
prominente Linien in der wissenschaft-                      Sammelbänden2 oder Thementeilen von
lichen Rezeption der Studie und deren                       Fachzeitschriften3, deren einzelnen Bei-
Ambivalenzen nach.1 Auf diese Weise soll                    träge weitgehend lose nebeneinander-
ein Beitrag zur Versachlichung des Diskur-                  standen. Dies unterstreicht den Bedarf
ses um Visible Learning geleistet werden,                   nach einer Aufarbeitung und Zusammen-
etwa indem über den in der Diskussion zu                    schau der wissenschaftlichen Rezepti-
erkennenden Paradigmenstreit hinaus eine                    on. Eine solche liegt im Kontext größerer
aus erziehungswissenschaftlicher Sicht re-                  Darstellungen für die frühe Rezeption in
alistische Einschätzung des Ertrages aus                    Teilen bereits vor.4 Der vorliegende Bei-
John Hatties Synthese von Meta-Analysen                     trag systematisiert darüber hinaus jedoch
vorgenommen wird.                                           verschiedene methodische und inhaltliche
                                                            Rezeptionslinien und stellt diese konden-
                                                            siert vor und damit zur Diskussion. Damit
1. Einleitung                                              schließt der Artikel an eine auch in dieser
                                                            Zeitschrift geführte Debatte an, die sich
Das Erscheinen des Bandes Visible Lear-                     zurückliegend aber stärker auf die Rezepti-
ning von John Hattie (2009) vor zwölf Jah-                  on Hatties durch die öffentliche Diskussion
ren hat hohe öffentlich-bildungspolitische                  oder deren Folgen für Didaktik und Schul-
und wissenschaftliche Aufmerksamkeit                        praxis bezog.5

4 / 2021                                 Pädagogische Rundschau                                                 393

 Die Online-Ausgabe dieser Publikation ist Open Access verfügbar und im Rahmen der Creative Commons Lizenz CC-BY 4.0
                             wiederverwendbar. http://creativecommons.org/licenses/by/4.0
Dieser Beitrag legt keine weitere Re-                 die Basis der zugrundeliegenden Primär-
zeption vor, vielmehr leistet er eine Bünde-                studien sein.
lung existierender Rezeptionen. Größere                          Die Synthese der Meta-Analysen wird
Rezeptionsmuster quer zu den einzelnen                      in der Rezeption häufig als ‚Meta-Me-
Rezeptionen (Publikationen) werden iden-                    ta-Analyse‘ oder ‚Mega-Analyse‘ bezeich-
tifiziert. Die Rezeptionen werden dabei                     net, während Hattie selbst auf den Begriff
selbst zur ‚Datenquelle‘ und die Rezipie-                   ‚synthesis‘ insistiert. Er zieht Metaanalysen
renden kommen durch Zitate zu Wort.                         heran, die Primärstudien zu einzelnen Aus-
Methodologische und inhaltliche Aspekte                     sagen über den Effekt eines Merkmals A
der Rezeption werden gebündelt, um Po-                      auf ein anderes Merkmal B zusammenfas-
tenziale und Grenzen der Hattie-Studie                      sen. Diese Meta-Analysen werden einer
abschätzen zu können. Einführend werden                     weiteren Synthese unterzogen, indem
Grundlinien der Hattie-Studie aufgezeigt                    mittlere Zusammenhänge der positiven
(Kapitel 2), dann zentrale Rezeptionslinien                 oder negativen Effekte berechnet werden,
rezeptionsimmanent dargelegt (Kapitel 3)                    die damit auf einer noch größeren Daten-
und schließlich die Rezeptionslage zusam-                   basis beruhen. Die Synthese resultiert in
mengefasst und diskutiert (Kapitel 4). Es                   138 Faktoren, die Einfluss auf die Lern-
werden Elemente der sozialwissenschaft-                     leistungen von Schülerinnen und Schülern
lichen Diskursanalyse bzw. Diskursfor-                      haben. Der Einfluss wird als Effektstärke
schung6 herangezogen, indem etwa der                        (,effect size‘) Cohen’s Delta (d) berichtet.
disziplinäre Hintergrund der Rezipienten                    Sie gibt die Größe eines statistischen Ef-
(z.B. Fachdidaktik), die Strukturierung der                 fekts an und gilt als ein auch für Laien in-
Rezeptionen, die Argumentationsfiguren                      tuitiv nachvollziehbares Maß der Relevanz
und die inhaltlichen Positionen in den Re-                  statistischer Befunde.
zeptionslinien herausgearbeitet, gruppiert                       Sortiert nach ihrer Effektstärke werden
und aufeinander bezogen werden.                             die Einzelfaktoren in eine Rangfolge (sehr
                                                            groß bis sehr klein) gebracht. Die drei stärks-
                                                            ten positiven Effekte auf die Lernleistung
2. Grundlinien von                                         weisen auf: ‚Self-report grades‘ (Selbstein-
    Visible Learning                                        schätzung des eigenen Leistungsniveaus),
                                                            ‚Piagetian programs‘ (kognitive Entwick-
In Visible Learning von John Hattie aus                     lungsstufe nach Piaget) und ‚Providing
dem Jahr 2009 werden die Bedeutung der                      formative evaluation‘ (formative Evaluation
Kontexte, Bedingungsfaktoren und Merk-                      des Unterrichts). Stärkste negative Effekte
male erfolgreichen schulischen Lernens                      zeigen: ‚Retention‘ (Nicht-Versetzung), ‚Te-
thematisiert.7 Grundlegend sind Aussagen                    levision‘ (Fernsehen) und ‚Mobility‘ (Schul-
über Zusammenhänge bzw. den prognos-                        wechsel). Die 138 Einzelfaktoren werden zu
tischen Gehalt verschiedenster Variab-                      sechs thematischen Gruppen aggregiert,
len für die Lernleistung der Schülerinnen                   die sich mit absteigender mittlerer Effekt-
und Schüler. Hattie nimmt eine Synthese                     stärke wie folgt darstellen: ‚teacher‘ (Lehr-
von 815 Meta-Analysen vor, die diese Zu-                    person), ‚curricula‘ (Curriculum), ‚teaching‘
sammenhänge empirisch aufbereiten. Es                       (Unterricht), ‚students‘ (Schüler), ‚home‘
sind 52 637 einzelne Studien in diese Me-                   (Elternhaus) und ‚school‘ (Schule). Hattie
ta-Analysen eingeflossen, die zu 146 142                    diskutiert die Befunde auf Basis von The-
ausgewerteten Effekten führen. Rund 236                     orien aus den Bereichen Lehren, Lernen,
Millionen Schülerinnen und Schüler sollen                   Unterricht und Lehrperson.

394                                      Pädagogische Rundschau                                           4 / 2021

 Die Online-Ausgabe dieser Publikation ist Open Access verfügbar und im Rahmen der Creative Commons Lizenz CC-BY 4.0
                             wiederverwendbar. http://creativecommons.org/licenses/by/4.0
3. Rezeptionslinien                                        Unterrichts für den Lernerfolg zentral,
                                                            ebenso wie die Einschätzung der Unter-
Die Rezeptionen lassen sich heuristisch                     richtsqualität durch das Feedback der
drei größeren Rezeptionslinien zuordnen,                    Schülerinnen und Schüler (S. 8). Für Lotz
die nachfolgend zunächst rezeptionsim-                      und Lipowsky bietet Hattie „einen einzig-
manent, d.h. basierend auf den Rezepti-                     artigen Überblick über die Lehr-Lernfor-
onen selbst, dargelegt werden: Potenzial                    schung und zentrale Einflussgrößen auf
und Gewinn (3.1), methodologische Kritik                    den Lernerfolg [...]. Die Studie kann [...]
(3.2) und inhaltliche Kritik (3.3) der Hat-                 eine Diskussion darüber anstoßen, wie
tie-Studie.                                                 wirksam bestimmte unterrichtliche Maß-
                                                            nahmen tatsächlich sind und wie man
3.1 Potenzial und Gewinn                                   Unterricht [...] weiterentwickeln kann“13.
                                                            Insgesamt würdigen solche Rezeptionen
Aufgrund der enormen Datenbasis stelle                      explizit die exemplarische Bedeutung der
Visible Learning eine einmalige Systema-                    Studie für eine Evidenzbasierung von Schu-
tisierungsleistung der Forschung zu er-                     le, Unterricht und Lehrerbildung sowie die
folgreichem schulischem Lernen dar: So                      extrem große Datenbasis. Implizit verwei-
attestiert Terhart: „Hatties Buch basiert auf               sen sie auf die Reichweite der Studie im
einer monumentalen Auswertungs- und                         Sinne der Wissenschaftskommunikation.
Systematisierungsleistung. Eine solche
umfassende und zusammenfassende,                            3.2 Methodologische Kritik
synthetisierende Sicht auf die empirische
Schul-, Lehrer- und Unterrichtsforschung                    Die methodologische Kritik verbindet sich
[...] hat es [...] bisher nicht gegeben“8.                  mit der Befürchtung, eine verkürzte Lesart
Helmke bezeichnet die Studie als „Mei-                      von Visible Learning würde aus wissen-
lenstein der empirischen Forschung zum                      schaftlicher Sicht zu problematischen Fol-
Lehren und Lernen“, erkennt „Aussagen                       gerungen aus der Studie führen: „Hattie
auf der Grundlage einer noch nie jemals                     works to minimise these criticisms of his
dagewesenen Datenbasis“9. Die Breite                        methodology but they need to be taken
des Ansatzes gilt Helmke als „unerhör-                      into account before accepting the analyses
tes Unterfangen!“. Den Gewinn aus der                       as sound for policy purposes“14 (Snook et
Hattie-Studie sieht Pant insbesondere                       al., 2009, S. 96). Zentrale Aspekte dieser
in ihrem „strategischen Stellenwert“ als                    Rezeptionslinie werden nun dargestellt.15
Studie, die international „als ‚Weckruf‘ für
eine Evidenzdebatte im Bildungsbereich                      3.2.1 Paradigmatische Grenzen
funktioniert“10 und Helmke schreibt: „Am                    Zunächst ist paradigmenfremde Kritik zu
wichtigsten finde ich die Botschaft Evi-                    nennen, die nicht aus der quantitativen
denzbasierung“ (S. 8). Beywl und Zierer                     Bildungsforschung stammt. Brügelmann
heben positiv hervor, die Studie sei „the-                  kritisiert, Bildungsforschung münde in
oretisch und empirisch, systematisch, all-                  Wahrscheinlichkeitsaussagen, die für das
gemeindidaktisch, selektiv und integrativ,                  Handeln im Einzelfall nur Hypothesen
also eklektisch“11.                                         lieferten und folglich müssten Wirkungs-
     Für Köller ist Visible Learning ein-                   versprechen bezogen auf Inhalte und Kon-
drucksvoller Hinweis auf die Relevanz der                   texte hin interpretiert werden.16 Kritisiert
Verbesserung von Unterricht, die bedeut-                    wird, die Häufigkeit eines replizierten Be-
samer sei als Reformen des Bildungssys-                     fundes sei Argument für dessen Bedeu-
tems.12 Nach Helmke ist die Qualität des                    tung für die schulische Praxis (de facto ist

4 / 2021                                 Pädagogische Rundschau                                                 395

 Die Online-Ausgabe dieser Publikation ist Open Access verfügbar und im Rahmen der Creative Commons Lizenz CC-BY 4.0
                             wiederverwendbar. http://creativecommons.org/licenses/by/4.0
bei Hattie das Argument die Effektstärke)                   der Einzelstudien innerhalb der syntheti-
und Objektivität werde durch Anwendung                      sierten Meta-Analysen keine relevante As-
von Leistungstests suggeriert (Objektivität                 soziation mit den Effektstärken insgesamt
für Hattie ist aber z.B. die Unabhängig-                    hat. Doch eine spezifische Präselektion
keit der Auswertung einer Meta-Analyse                      der Meta-Analysen ist gleichwohl möglich.
von einer bestimmten Person). Solche                        Starke und erwünschte Effekte würden der
Kritik verbindet sich mit der fehlerhaften                  Rezeption von Snook et al. zufolge häufiger
Interpretation statistischer Begriffe und                   publiziert (S. 97) und Hattie zeichne daher
Verfahren, bezieht sich daher nicht auf                     potenziell ein zu gutes Bild von der Realität.
die im kritisierten Paradigma geltenden                     Auch Hattie ist sich bewusst: „most of the
Standards und ist daher nicht haltbar. Die                  successful effects come from innovations,
Kritik, Hatties Verzicht auf den Einbezug                   and these effects [...] may not be the same
qualitativer Forschung sei „ein echtes,                     as [...] of teachers in regular classrooms“
angesichts von Hatties Zahlen-Fixiertheit                   (S. 6). Als wirksam geltende Faktoren
kaum zu behebendes Defizit“17 markiert                      könnten aufgrund Positivselektion in Schule
einen Paradigmenstreit: Die von Hattie                      und Unterricht geringer ausfallen oder gar
gewählte Methode würde beim Einbezug                        unbedeutend sein, so Snook et al.
qualitativer Daten deren Quantifizierung                        Ein cultural bias wird aufgrund des
erfordern (z.B. durch hoch-inferentes Ra-                   Fokus auf anglo-amerikanische Studien
ting). Doch Hattie selbst nimmt im Vorwort                  angenommen, zumal z.B. asiatische Län-
lediglich eine Setzung vor: „Again, this                    der mit leistungsstarken Schulsystemen
should not mean qualitative studies are not                 unterrepräsentiert seien.19 Hattie betont:
important or powerful but just that I have                  „We should not generalize the findings of
had to draw some lines around what can                      these meta-analyses to non English spe-
be accomplished“ (S. IV). Erst der spezifi-                 aking, non-highly developed countries“
sche, paradigmenfremde Erwartungshori-                      (S. 13) und Snook et al. hegen Zweifel
zont generiert daher diese Form der Kritik.                 an einer Generalisierung für ein bestimm-
                                                            tes Land (S. 96). Ähnliche Forschung für
                                                            den deutschsprachigen Raum wird von
3.2.2 Selektion der Meta-Analysen
                                                            Meyer gefordert (S. 122) und Hattie greift
Es wird die veraltete Literaturbasis der
                                                            den Vorschlag einer Berücksichtigung
Synthese kritisiert. Der größte Teil der
                                                            deutschsprachiger Meta-Analysen auf.20
Meta-Analysen stamme aus den 1980er
                                                                Hattie entscheidet sich für einen Ge-
und 1990er Jahren und es könne an ak-
                                                            genstand: Visible Learning is „not a book
tueller Relevanz der Ergebnisse mangeln.
                                                            about classroom life [...], it synthesizes
Jüngere Befunde, z.B. zur Bedeutung des
                                                            research based on what happens in class-
Professionswissens (z.B. COACTIV),
                                                            rooms; as it is more concerned with main
konnten, wie auch Befunde zur Wirksam-
                                                            effects than interactions“ (S. VIII). Beywl
keit der Lehrerbildung (z.B. TEDS), nicht
                                                            und Zierer bewerten diese Setzung als
berücksichtigt werden.18 Da Hattie die
                                                            „eklektisch“ (S. 11), weil Ergebnisse einer
Auswertung fortführt, sei dieses Defizit
                                                            Auswahl an Meta-Analysen systematisiert
vermutlich temporär. Doch sich schnell
                                                            werden. Aus einem fachdidaktischen Er-
wandelnde Bereiche (z.B. ‚computer-
                                                            wartungshorizont wird dies kritisiert: Fach-
assisted instruction‘) kann jedes systema-
                                                            liche Aspekte blieben unterbelichtet, so
tisierende Verfahren nur verzögert abbil-
                                                            Demantowsky und Waldis.
den, so Beywl und Zierer.
                                                                Über Kriterien der Selektion der Me-
     Nach Hattie (S. 20) gibt es keinen nen-
                                                            ta-Analysen bleibt Hattie Rechenschaft
nenswerten publication bias, weil die Anzahl

396                                      Pädagogische Rundschau                                           4 / 2021

 Die Online-Ausgabe dieser Publikation ist Open Access verfügbar und im Rahmen der Creative Commons Lizenz CC-BY 4.0
                             wiederverwendbar. http://creativecommons.org/licenses/by/4.0
schuldig. Terhart geht von sehr unter-                      Fällen jedoch auch diskutierbar“ (S. XIII).
schiedlicher Qualität der einbezogenen Me-                  Weshalb der Einzelfaktor ‚teaching quality‘
ta-Analysen aus (S. 14). Hattie verlässt sich               von Hattie dem Hauptfaktor ‚Lehrperson‘
auf die Güte der Primärstudien: „I have de-                 und nicht ‚Unterricht‘ zugeordnet wurde,
liberately not included much about modera-                  „bleibt vorerst unklar“22. Der Vorschlag, Le-
tors of research findings [...] not because                 sende sollten angesichts dieser Unschär-
these are unimportant [...], but because                    fe ermutigt werden, „mit den Daten und
they have been dealt with elsewhere by                      Konzepten Hatties zu experimentieren“, so
others“ (S. IX). Wenn Hattie (S. 10) aber                   Beywl und Zierer (S. XIV), räumt der Zuord-
Eysenck zitiert, nach dem die Qualität jeder                nung Beliebigkeit ein. Es sei nach Snook
Synthese von der Qualität der zugrundelie-                  et al. ein Grundproblem der Studie, dass
genden Daten abhängt (garbage in – gar-                     unter einem Begriff divergierende Konst-
bage out), dann macht dies ein Offenlegen                   rukte subsummiert werden (S. 97).
von Selektionskriterien notwendig. Gerade                        Die Einzelfaktoren weisen unterschied-
in sophistizierten Studien würden die zur                   liche Abstraktionsniveaus auf, die eine Ag-
Berechnung der Effektstärke relevanten                      gregierung zu Hauptfaktoren erschweren.
Informationen ggf. nicht berichtet, so Pant                 So ist z.B. der Effekt von ‚teacher educa-
(S. 138). Ergebnisse aus Meta-Analysen                      tion‘ gering (d = 0.11; Rang 124), der
müssten daher durch Befunde aus Primär-                     von ‚microteaching‘ hingegen groß (d = 0.88;
studien validiert werden.21                                 Rang 4). Microteaching ist jedoch ein Trai-
                                                            ningsverfahren in der Lehrerinnen- und
3.2.3 Haupt- und Einzelfaktoren                            Lehrerbildung. Dass der globale Einfluss
Die sechs thematischen Gruppen von Ein-                     von ‚teacher education‘ geringer aus-
flussfaktoren (Hauptfaktoren) werden von                    fällt als der einer einzelne Maßnahme,
Hattie ohne Begründung gesetzt: „The                        erscheint nach Hattie der Abstraktion
next seven chapters of this book are struc-                 bzw. Konkretion der erfassten Variablen
tured around six topics […]: (1) the child;                 geschuldet: „There are larger effects for
(2) the home; (3) the school; (4) the curri-                more specific aspects of the teacher
cula; (5) the teacher; (6) the approaches to                education“ (S. 112). Es wäre demzufolge
teaching (two chapters)“ (S. 31). Pauschal                  eine Fehlinterpretation, der Lehrerinnen-
wird angenommen: „What works best ap-                       und Lehrerbildung keine Bedeutung für
pears to be similar across subject, age,                    Schülerlernen zuzuschreiben.
and context“ (ebd.). Weder wird genau                            Am Beispiel der Mathematikdidaktik
diese thematische Gliederung begründet,                     zeigen Bernhard und Reiss ein zentrales
noch wird eine empirische (z.B. faktoren-                   Rezeptionsproblem: Der Faktor ‚prob-
analytische) Begründung der Typen bzw.                      lem-solving teaching‘ suggeriere einen
Cluster gegeben. Der Hinweis von Beywl                      Effekt im Vergleich zu einem nicht-prob-
und Zierer, die „Domänen [...] spiegeln                     lemlösenden Unterricht – Unterschiede
sich im bekannten Modell des didaktischen                   zwischen verschiedenen Wegen problem-
Dreiecks“ (S. XI), kann als Versuch einer                   lösenden Unterrichts würden ignoriert.23
nachträglichen theoretischen Begründung                     Ein solch weiter Faktor erschwere „die
gelesen werden.                                             Interpretation der Ergebnisse ebenso [...]
    Offen bleibt bei Hattie und in der Re-                  wie eine Ableitung von Konsequenzen für
zeption, anhand welcher Kriterien die Ein-                  den Unterricht“ (ebd.). Es fehlten Informa-
zelfaktoren den Hauptfaktoren zugeordnet                    tionen, „um das Zustandekommen der Er-
werden: Für Beywl und Zierer ist „die Zu-                   gebnisse tatsächlich beurteilen zu können“
ordnung in aller Regel passend, in einigen                  (S. 96).

4 / 2021                                 Pädagogische Rundschau                                                 397

 Die Online-Ausgabe dieser Publikation ist Open Access verfügbar und im Rahmen der Creative Commons Lizenz CC-BY 4.0
                             wiederverwendbar. http://creativecommons.org/licenses/by/4.0
3.2.4 Meta-Analysen und deren Synthese                     Kontextes und möglicher Wechselwirkun-
Die Mehrebenenstruktur der „Konstellati-                    gen in keiner Weise“ (S. 10) abgebildet
onen von Einflussfaktoren unter welchen                     werden.
Rahmenbedingungen die gewünschten                               Die Nicht-Berücksichtigung der Streu-
Wirkungen begünstigen“ (S. 136) kann                        ung wird durch mehrfache Aggregation
nach Pant eine Meta-Analyse nicht abbil-                    maximiert: Es werden nicht nur bereits ge-
den: Anhand nur eines Kennwerts (hier:                      mittelte Effekte aus Primärstudien in einer
Effektstärke) wird über alle Einzelstudien                  Meta-Analyse aggregiert, sondern mehre-
hinweg das prognostische Potenzial der                      re Meta-Analysen einer dritten Aggregation
Faktoren für das Kriterium (hier: Schüler-                  (Synthese) unterzogen. Eine vierte Aggre-
leistung) angegeben. Die auf Ebene der                      gation ergibt sich mit der Verrechnung der
Primärstudien ermittelten Effektstärken                     Effekte der Einzelfaktoren zu Effekten der
werden durch das arithmetische Mittel ag-                   Hauptfaktoren. Kritisch kommentiert Rost:
gregiert. Dabei werden i.d.R. Einzelstudien                 Hatties „Elefantenanalyse bietet [...] nicht
proportional zu deren Stichprobenumfang                     viel mehr als ganz allgemeine Zielgrößen.
gewichtet, worauf Hattie verzichtet, wie                    Durch das außergewöhnlich hohe Abs-
Pant (S. 143) am Faktor ‚Direct Instructi-                  traktionsniveau gehen [...] wichtige Rah-
on‘ zeigt: Während die größte Meta-Ana-                     meninformationen und Differenzierungen
lyse über 232 Primärstudien die geringste                   einfach unter“ (S. 44). Zwar sei es nach
Effektstärke (d = 0.21) aufweist, ist Hatties               Helmke der Anspruch von Hattie zu agg-
über alle vier relevanten Metaanalysen ge-                  regieren: „Wenn ich Aussagen über Obst
mittelte Effektstärke (d = 0.59) viel größer.               machen will, dann muss ich Unterschiede
Snook et al. pointieren: „large effect sizes                zwischen Äpfeln und Birnen ignorieren“
from small samples are […] positively dan-                  (S. 11), aber in Hatties Synthese wird
gerous when lumped together with other                      diesem Bild zufolge Obst nicht länger
studies“ (S. 94).                                           von Gemüse unterschieden. Auch erfolgt
    Ist die Streuung der Effektstärken in                   nach Snook et al. keine Differenzierung
den Primärstudien klein, so repräsentiert                   nach Schulart, Alter oder Geschlecht: „All
die aggregierte Effektstärke den tatsäch-                   these complexities are lost in an average
lichen Effekt gut; ist die Streuung der                     effect size“ (S. 97). Es bleibe offen, ob
primären Effekte groß oder divergieren                      z.B. Merkmale der Klassenkomposition
die Vorzeichen, so ist die aggregierte Ef-                  oder Institution kontrolliert wurden, so De-
fektstärke kaum als ‚wahrer Effekt‘ zu                      mantowsky und Waldis (S. 104). Hatties
interpretieren, so Pant (S. 138). Standard-                 Vorgehen lässt sich als Interesse an ma-
mäßig werden daher Homogenitätstests                        ximaler Parsimonität (Sparsamkeit, keine
durchgeführt und bei Heterogenität wird                     Redundanz bei der Bestimmung) im Ver-
nach Moderatoren (Personenmerkmale,                         gleich zu einer Überbestimmung fassen.
Schulstufen usw.) gesucht, die Varianz                          Terhart sieht in der „kompilisatorischen
zwischen Effekten erklären.24 Nach Pant                     und synthetisierenden Leistung“ (S. 20)
sei dies nicht erfolgt (S. 142) und Hattie                  der Hattie-Studie daher „zugleich den
markiert das Problem selbst: „meta-analy-                   Keim für seine Schwäche“ (ebd.). Hattie
sis seeks the big facts and often does not                  entscheidet sich in seiner Synthese für
explain the complexity nor appropriately                    Bandbreite (Spektrum) und vernachlässigt
seek the moderators“ (S. 10), doch seien                    dabei Fidelity (Genauigkeit). Probleme er-
Aussagen über erfolgreiche Interventionen                   geben sich daraus dann, wenn von Hattie
Helmke zufolge dann unangemessen, weil                      selbst oder in der Rezeption Aussagen
„die Komplexität der Bedingungen, des                       getroffen werden, die Fidelity erfordern,

398                                      Pädagogische Rundschau                                           4 / 2021

 Die Online-Ausgabe dieser Publikation ist Open Access verfügbar und im Rahmen der Creative Commons Lizenz CC-BY 4.0
                             wiederverwendbar. http://creativecommons.org/licenses/by/4.0
obwohl nur Bandbreite vorhanden ist. Brü-                   eine Standardabweichung bedeuten.
gelmann zufolge ergebe sich das Problem                     Cohen’s d ist eine kontinuierliche Variable,
der „Entscheidung für Wald oder Bäume                       nimmt positive und negative Werte an und
[in der Fotografie]: Entweder gewinnt man                   ihr Wertebereich ist unbegrenzt.
einen guten Überblick [...] oder es gelingt,                     Hattie passt Benchmarks von Cohen
einzelne Aspekte genauer in den Blick                       (1988) an und definiert einen Effekt von
zu nehmen“ (S. 40). Helmke spricht von                      0.2 ≤ d < 0.4 als klein, 0.4 ≤ d < 0.6 als
der „Durchschnittsfalle“ (S. 12). Bereits                   mittel und d ≥ 0.6 als groß (S. 9); die
Meta-Analysen seien Pant zufolge „häufig                    Schwelle (‚hinge-point‘) von d = 0.4 mar-
gezwungen, hinter den empirischen Dif-                      kiert (ir)relevante Effekte (S. 17). Pant
ferenzierungsgrad methodisch ausge-                         beschreibt diese Schwelle als höhere
feilter Primärstudien zurückzugehen“                        „durchschnittliche Leistung derjenigen
(S. 138). Hattie reflektiert diese Restriktion              Gruppe, die eine Intervention erhalten hat,
(S. 10–15), ignoriert sie aber in der Ergeb-                [...] als die Leistung von zwei Dritteln der
nisdarstellung (3.2.6).                                     Teilnehmer aus der Gruppe ohne diese In-
     Weiterhin ist keine Auskunft über die                  tervention“ (S. 137). Es wird von Snook et
Zusammenhänge der einzelnen Effekte                         al. kritisch angemerkt: „Selecting a cut-off
möglich: Die Effekte der Einzelfaktoren                     point is a hazardous exercise, as it means
auf die Schülerleistung sind Pant zufolge                   that potentially important effects may be
voneinander isoliert (S. 138). So besteht                   overlooked“ (S. 94) und Hattie interpretiert
die Gefahr, dass Faktoren für sich genom-                   entgegen eigener Setzungen z.B. auch
men zwar von hoher Bedeutung sind, sich                     einen Effekt von d = 0.41 kontextspezifisch
im Wechselspiel mit anderen Faktoren                        als wenig bedeutsam (S. 195). 95% der
aber als irrelevant erweisen könnten. Trotz                 Effekte auf die Schülerleistung sind positiv
Bandbreite gelingt es Hattie der Metapher                   und Hattie unterstreicht: „Almost everything
aus der Fotografie zufolge nicht, ein Ge-                   works“ (S. 15). Köller und Baumert gehen
samtbild zu generieren, in dem die Relati-                  von einem mittleren Leistungszuwachs in
on der Objekte klar wird.                                   den Kernfächern zwischen 0.3 < d < 0.5
                                                            pro Schuljahr aus – geringe positive Effek-
3.2.5 Effektstärke Cohen’s d                               te können daher nicht als relevant für die
Die     Berechnung      der   Effektstärke                  Schülerleistung interpretiert werden.25
(Cohens’s d) aus den Metaanalysen er-                            Bei der Ergebnisdarstellung bleibt
möglicht, die dort berichteten Effekte auf                  diese Limitation aufgrund Hatties pauscha-
eine gemeinsame Metrik zu transformie-                      lisierendem Duktus unbeachtet: „take two
ren. Die Effektstärke ist definiert durch                   students of the same ability and it matters
die Mittelwertdifferenz aus Experiment-                     less to which school they go than the in-
algruppe und Kontrollgruppe bzw. aus                        fluences of the teacher, curricula program,
zwei Messzeitpunkten, relativiert an der                    or teaching they experience“ (S. 18). Das
Standardabweichung: d = (AMt2 - AMt1) /                     Postulat eindeutiger Effekte suggeriert, die
SD. Das Maß kann aus unterschiedlichen                      Befunde hätten generell Aussagekraft für
Angaben gewonnen werden. Hat z.B. ein                       die Ebene des individuellen Lernenden,
Prädiktor die Effektstärke d = 1.0, ist die                 doch: „Dass eine Maßnahme weltweit im
Schülerleistung im Mittel um eine Stan-                     Durchschnitt einen bestimmten Effekt hat
dardabweichung erhöht, d = 0.0 würde                        oder wirkungslos ist, ist im konkreten Fall
auf keinen Effekt hinweisen und d = -1.0                    kein Imperativ, diese Maßnahme zu un-
würde eine Reduktion der Leistung um                        terlassen. Das wäre [nach Helmke] ein
                                                            naives empiristisches Missverständnis,

4 / 2021                                 Pädagogische Rundschau                                                 399

 Die Online-Ausgabe dieser Publikation ist Open Access verfügbar und im Rahmen der Creative Commons Lizenz CC-BY 4.0
                             wiederverwendbar. http://creativecommons.org/licenses/by/4.0
ein illegitimer Fehlschluss von einem Ge-                   die Sensitivität solcher datenreicher Ana-
samtergebnis auf eine konkrete Situation“                   lysen ausreichend transparent gemacht
(S. 11).                                                    wird“ (S. 144). Dass die Effektstärken in
                                                            der Interpretation sprachlich zu kausalen
3.2.6 Darstellung der Ergebnisse                           Effekten werden, ist problematisch. Of-
Die von Hattie gewählte Visualisierung                      fenbar wird implizit unterstellt, der Zusam-
eines „barometer of influences“ (S. 18) –                   menhang von Faktoren und Lernleistung
vermeintlich so intuitiv abzulesen wie ein                  gleiche einem Billard-Spiel, bei dem der
Druckmesser – ist Ausdruck des Willens                      Lauf der Kugel unter Kontrolle von Rich-
zur Parsimonität (3.2.4), stellt aber für die               tung, Stärke des Stoßes und Drall der
Rezeption (z.B. durch die Bildungspolitik)                  Kugel vorhergesagt werden könne, ob-
ein Problem dar. Der Standardfehler als                     wohl das bearbeitete Forschungsfeld auch
Maß der Messgenauigkeit – im Vergleich                      Elemente eines Fußballspiels aufweist, in
zur Effektstärke nicht intuitiv zu interpre-                dem Taktik, Unvorhersehbarkeit usw. den
tieren – wird nur beiläufig in einer Daten-                 Spielverlauf bestimmen.
tabelle dargestellt: Nach Pant suggeriert
Hattie, „dass diese ‚finale‘ Effektgröße                    3.3 Inhaltliche Kritik
den ‚wahren‘ Effekt des betrachteten
Schul- und Unterrichtsfaktors wiedergibt“                   Die inhaltliche Kritik von Visible Learning
(S. 143). Hattie geht nur selektiv auf den                  schließt an die methodologische Kritik
Standardfehler ein und unterstreicht a pri-                 (3.2) an, etwa wenn trotz methodologi-
ori die Bedeutung des Barometers: „We                       scher Restriktionen eine Überbewertung
need a barometer that addresses whether                     des Erkenntnisgewinns zu beobachten ist.
the various teaching methods, school re-
forms, and so on are worthwhile relative to                 3.3.1 Überschätzung des Innovationspo-
possible alternatives. We need clear goal-                         tenzials
posts of excellence for all in our schools“                 Viele der Ergebnisse konsolidieren den
(S. 18).                                                    Forschungsstand, implizieren aber kaum
    Hattie wird den Restriktionen seiner                    neue Erkenntnisse. So seien etwa Klas-
Studie in der Undifferenziertheit der Er-                   sengröße und jahrgangsübergreifender
gebnisdarstellung nicht gerecht. Vielmehr                   Unterricht längst als wenig bedeutsam
beansprucht der Barometer eine Inter-                       oder das Sitzenbleiben als problematisch
pretationshilfe zu sein, die eine direkte                   diskutiert worden, worauf etwa Helmke
Relevanz der Effektstärke für Gestal-                       (S. 12), Köller (S. 27–29) oder Terhart
tungsfragen von Schule, Unterricht sowie                    (S. 21) hinweisen. Reviews und Meta-Ana-
Lehrerinnen- und Lehrerbildung sugge-                       lysen zeigen vergleichbare Befunde26:
riert: „The development of this barometer                   Sichtstrukturen von Unterricht seien für
began not by asking whether this or that                    die Erklärung von Schülerleistung eher di-
innovation was working, but whether this                    stal (Seidel & Shavelson, 2007). Auch die
teaching worked better than possible alter-                 Synthese von Metaanalysen und diese als
natives“ (S. 19). So stellt Brügelmann die                  Grundlage für ‚evidence-based teaching‘
Frage: „Warum dann aber ‚Barometer‘,                        heranzuziehen, wird bereits anderenorts
in denen differenzierte Forschungsergeb-                    verfolgt.27 Mit immer neu hinzukommen-
nisse auf wenig aussagekräftige Durch-                      den Auswertungen28 ohne signifikante
schnittswerte schrumpfen?“ (S. 41) und                      Korrektur ursprünglicher Befunde stellt
Pant beklagt, es „wäre zu diskutieren, ob                   sich die Frage nach Aufwand und Ertrag

400                                      Pädagogische Rundschau                                           4 / 2021

 Die Online-Ausgabe dieser Publikation ist Open Access verfügbar und im Rahmen der Creative Commons Lizenz CC-BY 4.0
                             wiederverwendbar. http://creativecommons.org/licenses/by/4.0
des Langfristvorhabens. Mit Blick auf die                   „emotionale und das soziale Lernen [...]
aus Visible Learning resultierenden Er-                     marginalisiert“ (S. 121). Hier wird der An-
kenntnisse wendet etwa Herzog kritisch                      spruch artikuliert, es müssten weitere Er-
ein, dass Hatties „Forderungen an des                       träge von Schule und Unterricht abgebildet
Lehrerhandeln nicht einlösbar sind“29 und                   werden, doch nach Beywl und Zierer kann
sich Hattie dem letztlich auch bewusst sei.                 „Hattie [kann] nicht alle Aspekte des Bil-
                                                            dungsgeschehens abdecken“ (S. XI–XII).
3.3.2 Vermeintlich einfache                                Hattie erachtet die Qualifikation als zen-
         Interpretation der Effekte                         trale Funktion von Schule und führt aus:
Hatties Barometer (3.2.6) legt die eine                     „Of course there are many outcomes of
einfache Rezeption der Ergebnisse nahe.                     schooling [...]. This book focuses on stu-
Nur einen Effekt auszuweisen, erscheint                     dent achievement and that is a limitation“
unterkomplex und die Visualisierung ge-                     (S. 6). Snook et al. schreiben: „Hattie is
radezu irreführend. Zugleich fällt seine                    concerned not with achievement but with
Interpretation einiger besonders starker                    achievement that is amenable to quantita-
Faktoren zurückhaltend aus. Zu ‚piageti-                    tive measurement“ (S. 95) und weisen auf
an programs‘ (Rang 2 von 138) schreibt                      komplexe Leistungsziele hin, die (noch)
Hattie z.B. nur einen knappen Absatz. Zu                    nicht operationalisiert wurden.30
‚television‘ (Rang 137 von 138) sind die                         Als erhebliche inhaltliche Limitation auf
Ausführungen irritierend: Während der                       Seite der Faktoren wird das Fehlen der so-
Barometer schlicht einen negativen Effekt                   zialen Herkunft (PISA 2000) diskutiert: „It
von Fernsehen auf die Lernleistung sugge-                   is not a book about what cannot be influen-
riert, findet sich im Subtext, dass Fernse-                 ced in schools – thus critical discussions
hen bis zehn Stunden in der Woche sogar                     about class, poverty, resources in families,
einen positiven Effekt habe. Völlig offen                   health in families, and nutrition are not in-
bleibt die Frage nach der Qualität des                      cluded but this is NOT because they are
Fernsehangebots: Vielleicht sehen gerade                    unimportant, indeed they may be more im-
diejenigen Schülerinnen und Schüler ‚Bil-                   portant than many of the issues discussed
dungsfernsehen‘, die nur wenig schauen                      in this book. It is just that I have not in-
(dürfen)? Auch ergeben sich Interpretati-                   cluded these topics in my orbit“, so Hattie
onsfehler bei der Effektstärke selbst, wie                  (S. VIII–IX). Doch wie kann die Bedeutung
etwa bei Meyer: „Wenn für eine bestimmte                    von Hatties Faktoren letztlich angemessen
Unterrichtsvariable eine hohe Effektstärke                  beurteilt werden, wenn entscheidende
nachgewiesen ist, ist offensichtlich das                    Faktoren von Schülerleistung nicht kont-
didaktisch-methodische Potenzial, das                       rolliert werden? Darin besteht nach Snook
in dieser Variable steckt, besser ausge-                    et al. eine Gefahr für bildungspolitische
schöpft“ (S. 124). Dies unterstellt, das                    Fehlinterpretationen: „That is his [Hatties]
didaktisch-methodische Potenzial aller                      choice; but it is easy for those seeking to
Variablen sei a priori gleich und es gebe                   make policy decisions to forget this signifi-
keinen empirischen bias sowie die Effekte                   cant qualification“ (S. 98).
seien dekontextualisiert gültig (3.3.4).                         Aus fachdidaktischer Sicht wird die feh-
                                                            lende fachliche Differenzierung der Befun-
3.3.3 Inhaltliche Limitationen                             de angemerkt. Demantowsky und Waldis
Inhaltliche Limitationen werden mit Blick                   zufolge suche man „vergebens nach Aus-
auf das Kriterium der Schülerleistung                       sagen zu eindeutig fachspezifischen Qua-
gesehen. Hattie habe nach Meyer das                         litätsaspekten des Unterrichts“ (S. 110).
                                                            „Am Ende ist der naturwissenschaftliche

4 / 2021                                 Pädagogische Rundschau                                                 401

 Die Online-Ausgabe dieser Publikation ist Open Access verfügbar und im Rahmen der Creative Commons Lizenz CC-BY 4.0
                             wiederverwendbar. http://creativecommons.org/licenses/by/4.0
Unterricht deutlich vielschichtiger als vier                     Etwa von Rolff geforderte „professio-
oder fünf Komponenten, die Hattie destil-                   nelle Standards“ (S. 76) bei der Interpre-
liert und auch in seinen Zielen offener“31.                 tation werden nicht immer eingehalten.
                                                            Ein Beispiel ist der selektive Umgang mit
3.3.4 Dekontextualisierung                                 Ergebnissen, die Argumente der Befür-
Dekontextualisierung meint die Interpre-                    worter eines eher lehrer- und/oder schü-
tation von Befunden unabhängig vom                          lerzentrierten Unterrichts stärken.33 So
Geltungsraum oder von methodischen                          wird etwa umgedeutet: Offener Unterricht
Limitationen. Sie lässt sich z.B. mit einer                 werde „als unbedeutend oder gar kon-
Kritik von Rolff32 an der Rezeption von                     traproduktiv bewertet. Doch ist dies so
Köller fassen, in der schulische Rahmen-                    überhaupt messbar und kann man sein
bedingungen als weitgehend unwirksam                        Konzept und seine Studie nicht auch an-
angenommen werden. Köller argumentiert                      ders lesen und nutzen?“34. Wieder hängt
aus Hattie heraus und bezieht sich ohne                     die Rezeption von der Erwartung an eine
expliziten Ausweis nur auf den anglopho-                    Bestätigung des selbst Präferierten ab.
nen Raum. Die Übertragung der dort ge-                      Die Allgemeinheit der Aussagen und spär-
ringen Wirkung von Rahmenbedingungen                        liche Verweise auf Restriktionen machen
auf den deutschsprachigen Raum nimmt                        Hattie für unzulässige Rezeptionen anfäl-
Rolff selbst vor. Er unterstellt implizit, Hat-             lig, wie Snook et al. befürchten: „We are
tie (und Köller) würden verallgemeinerte                    concerned, however, that [...] politicians
Geltungsbehauptungen aufstellen. Doch                       may use his work to justify policies which
Hattie (S. 13) und die Rezeption, etwa                      [...] his research does not sanction [and]
Bernhard und Reiss (S. 98) berücksich-                      [...] teachers and teacher educators might
tigen die mangelnde national-spezifische                    try to use findings in a simplistic way“
Übertragbarkeit.                                            (S. 104f.). Ähnliche Probleme können sich
    Rolff kritisiert Köller weiterhin, er stelle            in der Rezeption durch Lehrerinnen und
im Gefolge Hatties kleinere Klassen mit                     Lehrer in der Schulpraxis ergeben.35
Blick auf den Lernerfolg als „weitgehend
ertraglos“ (S. 77) dar. Solche Kritik, ähn-                 3.3.5 Theoretische Einbettung
lich auch bei Meyer (S. 123), übersieht:                    Hattie pointiert: „The major argument is
Weder Hattie noch Köller beanspruchen,                      that when teaching and learning is visib-
über mehr als den Lernerfolg Auskunft zu                    le, there is a greater likelihood of students
geben. Gleichwohl erscheint der Verweis                     reaching higher levels of achievement“
auf Limitationen, wie bei Snook et al., an-                 (S. 38). Terhart spricht hier von einer
gemessen: „drawing policy conclusions                       Unterrichtstheorie, die „eine Theorie des
about the unimportance of class size may                    Schülerlernens als auch eine Theorie
be unwarranted and possibly very dama-                      des Lehrerhandelns“ (S. 15) umfasse.
ging to the education of children, parti-                   Rückmeldungen über die Folgen des
cularly young children and lower-ability                    Unterrichts nutzt die Lehrperson als Aus-
children“ (S. 103). Hattie stellt lediglich                 gangspunkt für Feedback an die Schü-
Vermutungen über Ursachen an: „One                          lerinnen und Schüler. Letztere sind nach
reason for the small effect sizes relates                   Hattie (S. 16) aufgefordert, Erträge und
to teachers of smaller classes adopting                     Schwierigkeiten des eigenen Lernens zu
the same teaching methods as they were                      beobachten, bewerten und verbessern.
using in larger classes“ (S. 86).                           Lehrende und Lernende sollen sich über
                                                            die eigenen und fremden Perspektiven

402                                      Pädagogische Rundschau                                           4 / 2021

 Die Online-Ausgabe dieser Publikation ist Open Access verfügbar und im Rahmen der Creative Commons Lizenz CC-BY 4.0
                             wiederverwendbar. http://creativecommons.org/licenses/by/4.0
durch Sichtbarmachung verständigen,                         exemplarisch genannten theoretischen Zu-
was einer konstruktivistischen Didaktik                     schreibungen an Hattie erscheinen vielfäl-
widerstrebt: „The role of the constructivist                tig und letztlich beliebig.
teacher is […] almost directly opposite to
the successful recipe for teaching and le-                  3.3.6 Ableitung von Handlungsempfeh-
arning“ (S. 26). Doch diese Programmatik                           lungen und ökonomische
lässt sich alleine auf Basis von Effektstär-                       Interessen
ken nicht generieren: Wenn z.B. der große                   Hattie selbst warnt vor der Fehlinterpre-
Einfluss der Lehrperson auf die Lernenden                   tation seiner Befunde als Handlungsan-
als Begründung angeführt wird, so könnte                    leitungen, wenn er ein Teilkapitel mit der
dies alternativ etwa dafür sprechen, dass                   Überschrift „An explanatory story, not a
Professionelle die besseren Garanten für                    ‚what works‘ recipe“ (S. 3) einführt. Er
Schülerleistungen sind als die Schülerin-                   warnt vor eiligen Rückschlüssen von sei-
nen und Schüler selbst. Nicht nur Theorie                   nen Daten auf erfolgreiches Handeln:
und Empirie erscheinen recht unverbun-                      „Correlates of school outcomes [...] should
den – beide sind auch weitgehend entkop-                    not be confused with good teaching“
pelt von Hatties Programmatik und die (zu)                  (S. 3). Zugleich assoziiert er Meta-Ana-
einfache Ableitung von Handlungsempfeh-                     lysen mit dem Anspruch nach Kausalität:
lungen bei Hattie sieht sich grundlegender                  „Certainly, the fundamental word in me-
Kritik ausgesetzt.36                                        ta-analysis, effect size, implies causation“
     Hatties Ansatz ist für Beywl und Zierer                (S. 237). Diese Spannung durchzieht la-
„allgemeindidaktisch“ (S. XI), weil die Ab-                 tent den gesamten Band und die Position
leitungen für Lehrerinnen- und Lehrerhan-                   Hatties zu Bedingungen und Grenzen von
deln nicht direkt aus der Empirie erfolgen                  Kausalität bleibt Snook zufolge ambivalent
könnten, sondern nur anhand eines inter-                    (S. 96).
pretativen Zwischenschritts, einer „critical                     Wenn auch keine Anleitungen, so wer-
reflection in light of evidence about their                 den zumindest Handlungsempfehlungen
teaching“ (S. 238). Auch Hatties Vorstel-                   auch in der Rezeption postuliert, etwa im
lungen von der idealen Lehrperson sind                      Band Hattie für gestresste Lehrer.38 Eine
nicht aus der Empirie zu gewinnen: Sie                      ‚Übersetzungshilfe‘ für Lehrpersonen
seien „dedicated, passionate people“ und                    ohne methodische Expertise anzubieten ist
er ergänzt: „Passion [...] can be infecti-                  naheliegend, doch die notwendige Verkür-
ous, it can be taught, it can be modeled,                   zung bedeutet ein Risiko für eine adäqua-
and it can be learnt“ (S. 23). Meyer be-                    te Rezeption: Die Gefahr einer selektiven
zeichnet Hattie als einen „pragmatisch                      Lektüre steigt und die Restriktionen kön-
orientierten Reformpädagogen“ (S. 118),                     nen nicht ausgeräumt werden. Bereits die
zugleich sei er „Sammler und kein Didak-                    Abbildung von vier Barometern auf dem
tiker“ (S. 121) und es fehle eine „norma-                   Einband (auf die Angabe des Standard-
tive (in der Regel bildungstheoretische)                    fehlers wird verzichtet) suggeriert die ein-
Argumentationsfigur“ (ebd.). Für Olberg                     fache Vergleichbarkeit von Effektstärken,
ist Visible Learning eine ‚evidenzbasierte                  die z.B. nach Pant kritisch eingeschätzt
Didaktik‘ und es sei akzeptabel, von einer                  werden kann. Die noch weiter vereinfa-
„eklektischen“ Theorie zu sprechen, die                     chende Darstellung der durchschnittlichen
einer Anwendung psychologischer Lehr-                       Effektstärken der sechs Hauptfaktoren –
und Lerntheorien gleichkäme und die                         deren Berechnung Beywl und Zierer ande-
die Intentionalität didaktischen Handelns                   renorts selbst als eines der „gewagtesten
nicht berücksichtige.37 Solche hier nur

4 / 2021                                 Pädagogische Rundschau                                                 403

 Die Online-Ausgabe dieser Publikation ist Open Access verfügbar und im Rahmen der Creative Commons Lizenz CC-BY 4.0
                             wiederverwendbar. http://creativecommons.org/licenses/by/4.0
Unterfangen Hatties“ (S. XIV) bezeichnen                    durch Hattie und in der Rezeption. Solche
– in einem Kreisdiagramm im Band von                        Folgerungen erscheinen aus Primärstudi-
Zierer (S. 87) greift folglich zu kurz.                     en teils plausibel, nicht aber aus Hatties
    Terhart schreibt die Konjunktur von                     Synthese (große Bandbreite, aber gerin-
Visible Learning u.a. der „weltweit intensi-                ge Fidelity; vgl. 3.2.4). Mit seinem Band
ven Suche nach vertrauenswürdigen und                       Visible Learning for Teachers aus dem
belastbaren empirischen Erkenntnissen“                      Jahr 2012 schreibt Hattie seine Studie
zu, die sich mit der „Suche nach klaren,                    beispielsweise durch ein Lehrerhandbuch
handhabbaren Resultaten“ verbindet.39                       fort. Nach Olberg wolle Hattie „Lehrkräf-
Meyer nennt als Gründe für den ‚Hype                        ten Vorschläge an die Hand geben und
Hattie‘ neben der „Sehnsucht nach einfa-                    erklären, was sie tun sollen, um bessere
chen Antworten“ (S. 118) auch die Kom-                      Lernergebnisse zu bewirken“ (S. 51): Die
plexitätsreduktion der Darstellung, die                     Vorschläge würden differenziert (http://
Bestärkung aller Lesergruppen in ihrem                      www.visiblelearningplus.com) und mit
Handeln, die Handlungsorientierung und                      einem breiten Angebot an kommerziellen
den Aufbau von ‚Drohkulissen‘, indem                        Fortbildungen für Lehrpersonen verbunden
bestimmte Dinge als unnötig proklamiert                     (S. 53–55): „Hattie hat [...] seiner empiri-
würden.                                                     schen Forschung [...] einen vermarktbaren
    Am Beispiel ‚peer tutoring‘ (Einsatz                    Gestaltungsansatz hinzugefügt“ (S. 52).
von Mitschülern als Co-Lehrkräfte; Rang                     Auch formuliert Hattie affirmativ-normative
36 von 138, d = 0.55) wird der Vorwurf                      Einstellungen von Lehrpersonen, die sei-
von zu einfachen Antworten deutlich.                        nem Ansatz entgegenkämen: z.B. Freude
Hattie argumentiert: „While it is used for                  am eigenen Engagement für Unterricht
this purpose [move from being students                      (S. 182–189).
to being teachers], the major influence
is that it is an excellent method to teach                  3.3.7 Die Rolle der Lehrperson im Unter-
students to become their own teachers“                              richt
(S. 186) und Helmke führt aus: Nach Hat-                    Hatties Ergebnisdarstellung liest Terhart
tie sei „ein erfolgreicher Lehrer ein konti-                als „emphatisch-optimistische Passagen
nuierlicher Diagnostiker, ein aktiver Lenker                über guten Unterricht“ – es werde „ein
von Lernprozessen, ein Regisseur – der                      geradezu schäumender Optimismus [...]
aber genau weiß, wann er schweigen und                      vermittelt, der [...] angesichts [...] zum
den Schülern das Feld überlassen muss“                      allergrößten Teil eher skeptisch bis pessi-
(S. 9). Warum Schülerinnen und Schüler                      mistisch stimmender Daten nur staunen“
jedoch (zumindest temporär) zu ihren ei-                    (S. 22) lasse. Hattie geht es aber nach Köl-
genen Lehrpersonen werden sollen, bleibt                    ler „nicht um die Rückkehr zu einem anach-
dagegen offen: Der Einsatz von Mitschü-                     ronistischen lehrerzentrierten Unterricht
lern als Co-Lehrkräfte ist nach Köller sehr                 [...]: Die gute Lehrkraft macht sich immer
effektiv (S. 33), doch dieses im Gefolge                    wieder Gedanken, was sie den Schüle-
Terharts als „Selbstdidaktisierung“ (S. 23)                 rinnen und Schülern beibringen möchte
zu bezeichnende Moment könnte eine                          und wie sie sicherstellen kann, dass diese
Überforderung der Schüler darstellen,                       auch erfolgreich lernen“ (S. 36). Der Kritik
denn Anforderungen an ‚gute‘ Lehrperso-                     aus Neuseeland zufolge propagiere Hattie
nen seien hoch.                                             die „Amerikanisierung“ der Klassenzim-
    Es finden sich weitere Ableitungen für                  mer, indem ein stark lehrerzentrierter Un-
eine ‚gute‘ Praxis in Schule, Unterricht                    terricht mit strikter Leistungsüberwachung
sowie Lehrerinnen- und Lehrerbildung

404                                      Pädagogische Rundschau                                           4 / 2021

 Die Online-Ausgabe dieser Publikation ist Open Access verfügbar und im Rahmen der Creative Commons Lizenz CC-BY 4.0
                             wiederverwendbar. http://creativecommons.org/licenses/by/4.0
und Rückmeldekultur favorisiert werde, so                   have mastered the content or skill, it is time
Terhart (S. 21). Der Dualismus aus leh-                     to provide a reinforcement practice. [...]. It
rer- versus schülerzentriertem Unterricht                   may be homework or group or individual
unterstreicht die ‚Frontlinien‘ der Rezep-                  work in class“ (S. 206). Die untersuchten
tion. Die Metaphorik und Visualisierung                     Konzepte haben Schnittmengen, weshalb
Hatties von Unterricht als „model of visible                qualifizierte Vergleiche nur dann möglich
teaching – visible learning“ (S. 238) meint,                wären, wenn auch die Interaktion der Ef-
Lehrpersonen sollten zwar „through the                      fekte untersucht worden wäre. Zumindest
eyes of the students“ sehen und Schüler                     erscheinen pauschale Interpretationen
„themselves as their own teachers“ verste-                  nach Rost selektiv: „Der in der Lehreraus-
hen, Lehrpersonen sind aber nicht ange-                     bildung so hochgejubelte und ideologisch
halten, sich selbst kritisch zu reflektieren.               überfrachtete konstruktivistische Ansatz
    Wenn nach Hattie kaum ein Effekt                        [...] ist nicht besonders lernwirksam.
(d = 0.04) des Faktors ‚student control over                Seine angeblich hohe Lernwirksamkeit [...]
learning‘ existiert (S. 193) und die Effekt-                ist [...] eher ein Mythos als eine Realität“
stärke von ‚individualised instruction‘ mit                 (S. 44–45). Ein direkter Vergleich von Hat-
d = 0.23 ebenfalls gering ausfällt (S. 198),                ties Faktoren ‚teacher as activator‘ und
so fällt der erheblich stärkere Effekt von                  ‚teacher as facilitator‘ (S. 243–244) lässt
‚direct instruction‘ (d = 0.59) auf. Ein di-                eine solche Interpretation kaum zu.
rekter Vergleich der Effektstärken ist zwar
formal möglich, führt aber leicht zu einer
Fehlinterpretation: Bei der Berechnung                      4. Zusammenfassung
der Effekte wird nicht direkt verglichen,                       und Diskussion
ob etwa die Direkte Instruktion wirksamer
wäre als Freiarbeit, sondern ob die jeweili-                Zusammenfassend können konform zu
ge Konzeption, wenn sie angewandt wird,                     den in Kapitel 3 ausgeführten Rezepti-
im Vergleich zu allen anderen Formen von                    onslinien und deren einzelnen Aspek-
Unterricht Vorteile zeigt. „Offene Unter-                   ten folgende größere Rezeptionsmuster
richtsformen sind laut Hattie im Durch-                     identifiziert werden, welche die Publika-
schnitt genauso lernwirksam (Effektstärke                   tionslage zu Visible Learning insgesamt
von Null) wie traditioneller Unterricht. Da-                charakterisieren: (A) Missverständnis des
raus abzuleiten, Offenen Unterricht solle                   Anspruches von Parsimonität sowie Klä-
man vermeiden, ist für Helmke eine tö-                      rung des Verhältnisses von Bandbreite
richte Verabsolutierung des Zielkriteriums                  versus Fidelity (z.B. Entscheidungen be-
‚schulische Leistung‘“ (S. 13) und es gehe                  züglich des Abstraktionsniveaus alleine
nicht um die absolute Leistung eines be-                    sind kein Kriterium von Güte); (B) Ab-
stimmten Unterrichtskonzepts, sondern                       hängigkeit der Kritik von der Erwartungs-
um relative Leistungsvorteile, die hier nicht               haltung der Rezipientin/des Rezipienten
nachgewiesen werden könnten.                                (z.B. Kritik häufig nicht Hattie-immanent;
    Geringe Effekte von Individualisierung                  Erwartungshaltung geschürt durch Pro-
würden bedeuten, dass Schülerinnen                          minenz der Studie; fehlende Sachlich-
und Schüler in stark individualisierendem                   keit, z.B. methodologische Unschärfe im
Unterricht nicht mehr lernen als in einem                   Umgang mit Hattie; selektive Lesart); (C)
Unterricht ohne Individualisierung – aber                   Diskrepanz zwischen Limitationen, die
auch nicht weniger. Zugleich ist Individuali-               Hattie selbst nennt und seiner Art und
sierung bei Hattie ein konstitutives Element                Weise, Ergebnisse darzustellen und zu
von Direkter Instruktion: „Once students                    vermarkten (z.B. einfache Übertragungen

4 / 2021                                 Pädagogische Rundschau                                                 405

 Die Online-Ausgabe dieser Publikation ist Open Access verfügbar und im Rahmen der Creative Commons Lizenz CC-BY 4.0
                             wiederverwendbar. http://creativecommons.org/licenses/by/4.0
von Effektstärken in Handlungsempfeh-                       Es werde deutlich, dass die „Schelte der
lungen); (D) Vermischung von metho-                         Rezensenten“, so Meyer (S. 121), im wis-
dologischer und inhaltlicher Kritik (z.B.                   senschaftlichen Feld ebenfalls einer kriti-
Kritik des methodologischen Vorgehens                       schen Prüfung auszusetzen sei. Hierfür
von Hattie aufgrund inhaltlich nicht zu-                    kann die heuristische Zusammenschau ein
friedenstellender Ergebnisse); (E) Gefahr                   Ausgangspunkt sein: Die Rezeptionslinien,
zu einfacher (z.B. bildungspolitischer)                     die bislang weitgehend parallel verlaufen
Schlussfolgerungen aus der Studie (z.B.                     (Kritik der Methode oder der Inhalte usw.),
Nichtbeachtung der Limitationen; man-                       können zusammengeführt werden, um ein
gelndes Verständnis (des methodischen                       ausgewogenes und realistisches Bild der
Vorgehens) der Studie).                                     Potenziale und Grenzen von Visible Lear-
     Das Resümieren der Rezeptionslinien                    ning zu gewinnen. Denn, mit Terhart: „John
von Visible Learning hat Limitationen. Es                   Hatties Studie ist dann ein nützliches Ins-
kann keine Vollständigkeit beansprucht                      trument, wenn man seine Leistungen und
werden und die Argumentation bleibt ex-                     Grenzen einzuschätzen weiß [...]. Kurz-
emplarisch. Aufgenommen wurden ins-                         schlüssige Folgerungen aus einzelnen
besondere solche Rezeptionen, die an                        Befunden Hatties zu ziehen ist dagegen
prominenter Stelle (z.B. in Sammelbänden,                   irreführend, ja gefährlich“ (S. 6).
die sich explizit mit der Hattie-Rezeption
beschäftigen) vorliegen. Für eine vollstän-
digere und kriteriengeleitete Sichtung und
systematische Auswertung der z.B. im ang-
                                                            Anmerkungen
lophonen und deutschsprachigen Raum
vorliegenden Rezeptionen könnte z.B. eine                   1     Bei diesem Beitrag handelt es sich um eine
datenbankbasierte Selektion anhand defi-                          aktualisierte Verschriftlichung des Habilitati-
nierter Kriterien erfolgen.40 Außerdem ist                        onsvortrages des Autors.
jedwede Zusammenschau der Rezeptio-                         2     Terhart, E. (2014). Die Hattie-Studie in der
nen Dritter bei der Auswahl der Zitate und                        Diskussion. Probleme sichtbar machen. Seel-
                                                                  ze: Kallmeyer.
Argumente immer einer eigenen Norma-
                                                            3     Kiel, E., & Weiss, S. (2014). Hattie für die
tivität unterworfen, die nicht ausgeräumt                         Grundschule? Eine Einführung in den Themen-
werden kann. Der Beitrag hatte allerdings                         teil. Die Grundschulzeitschrift, 28(272/273),
keine Systematisierung aller Rezeptionen                          4–5.
zum Ziel, sondern stellt eine Identifikation                4     Steffens, U., & Höfer, D. (2006). Lernen nach
wesentlicher Rezeptionslinien und deren                           Hattie. Wie gelingt guter Unterricht? Wein-
Aspekte dar, um eine Heuristik verschie-                          heim: Beltz.
                                                            5     Riefling, M., de Moll, F., & Zenkel, S. (2016).
dener wissenschaftlicher Interpretationen
                                                                  John Hattie Superstar – ein Bildungsforscher
exemplarisch aufzumachen. Diese können                            rockt den öffentlichen Diskurs. Pädagogische
in weiterführender Forschung quantifiziert                        Rundschau, 70(2), 187–212. Gerwig, M.
werden. Damit steht der Artikel in der Tra-                       (2020). Hattie und die deutsche Didaktik-Traditi-
dition der ›literature review‹41 und schafft                      on. Eine integrale Betrachtung von Visible Lear-
durch das Offenlegen zentraler Argumente                          ning und der Theorie der kategorialen Bildung.
                                                                  Pädagogische Rundschau, 74(2), 131–144.
der Rezeption den Ausgangspunkt für eine
                                                            6     Keller, R., & Truschkat, I. (2013). Methodo-
systematischere Auseinandersetzung mit                            logie und Praxis der wissenssoziologischen
der Hattie-Rezeption.                                             Diskursanalyse. Wiesbaden: Springer VS.
     Für Beywl und Zierer ist die Kritik                    7     Hattie, J. (2009). Visible learning. A synthesis
an Visible Learning in der Rezeption An-                          of over 800 meta-analyses relating to achie-
lass für eine vertiefte Lektüre (S. XVI):                         vement. New York: Routledge.

406                                      Pädagogische Rundschau                                           4 / 2021

 Die Online-Ausgabe dieser Publikation ist Open Access verfügbar und im Rahmen der Creative Commons Lizenz CC-BY 4.0
                             wiederverwendbar. http://creativecommons.org/licenses/by/4.0
Sie können auch lesen