Urteilen und Entscheiden - Uni Kassel

Die Seite wird erstellt Horst-Adolf Schultz
 
WEITER LESEN
Urteilen und Entscheiden
1      Begriffsklärung
    1.) Entscheidung: Von einer Entscheidung spricht man, wenn in einer Situation mindestens
        zwei Handlungsoptionen vorliegen und eine gewisse Freiheit der Wahl besteht. Damit ist
        nicht „freier Wille“ gemeint, sondern daß in dieser Situation nicht völlig konsistent eine der
        beiden Optionen gewählt wird und man statt dessen vor der Wahl überlegt. Ein wichtiges
        Buch zum Thema der Veranstaltung heißt daher auch „Thinking and Deciding“.

    2.) Urteil: Als Ergebnis des Nachdenkens werden Urteile gefällt, auf die sich dann die Ent-
        scheidung stützt. Die dem Urteil vorausgehenden Denkprozesse sind nicht Gegenstand der
        Veranstaltung. Wir beschränken uns auf Urteilscharakteristika und die Beziehung zwischen
        Urteil und Entscheidung.

    3.) Für das Fällen einer Entscheidung sind einige Urteilsarten von besonderer Bedeutung:
         a) Evaluative Urteile: Sie stellen Bewertungen der Handlungsoptionen dar, in denen sich
            der Nutzen, den der Urteiler den einzelnen Optionen zuspricht, widerspiegelt.
         b) Prediktive Urteile: Der Nutzen von Handlungsoptionen ergibt sich aus den Konse-
            quenzen der einzelnen Handlungen. Die Konsequenzen liegen also in der Zukunft und
            müssen daher vorhergesagt werden. Zudem treten sie fast immer nicht mit Sicherheit
            als Folge einer Handlung auf, sondern nur mit einer gewissen Wahrscheinlichkeit.
         c) Klassifikatorische Urteile: Wahrnehmungen werden Kategorien zugeordnet und erhal-
            ten dadurch ihre Bedeutung.

    4.) Entscheidungsbewußtsein: Es gibt Entscheidungen mit wenig oder keinem Bewußtsein einer
        Entscheidung beispielsweise die Entscheidung, bei der Kreuzung auf dem Weg zur Arbeit
        rechts abzubiegen. Es handelt sich um Routinen, bei denen die zu treffende Entscheidung
        aus dem Gedächtnis abgerufen wird. Daneben gibt es Entscheidungen mit hohem Entschei-
        dungsbewußtsein beispielsweise die Entscheidung, ein bestimmtes Fach zu studieren.

    5.) Urteils- und Entscheidungsnormen: Fragen wir nicht danach wie geurteilt wird sondern wie
        geurteilt werden sollte, suchen wir nach Kriterien für richtige Urteile und Entscheidungen
        sog. Normen, anhand derer wir dann auch Urteils- und Entscheidungsfehler diagnostizieren
        können.

    6.) Intuitives Urteilen: Die meisten unserer Urteile machen wir intuitiv ohne große Überlegun-
        gen, weil sie entweder keine große Bedeutung haben oder routinisiert sind. Viele Menschen
        müssen jedoch auch Urteile von herausragender Bedeutung treffen beispielsweise Fluglot-
        sen, Manager oder Politiker, für die die früher so wichtigen physischen Fähigkeiten keine
        Bedeutung haben sondern konzeptuelle Fähigkeiten wie das Verarbeiten von Informationen.

2      Grundlagen von Urteilen
Die moderne kognitive Psychologie beschreibt die geistige Tätigkeit von Menschen als Verarbei-
tung von Informationen. Unsere Kapazität, Informationen zu verarbeiten unterliegt Einschrän-
kungen, die sich auch auf das Fällen von Urteilen auswirken. Solche Einschränkungen sind:
WS 2004/05
Urteilen und Entscheiden                                               Prof. Dr. Johannes Becker

    1.) Die Wahrnehmung von Informationen ist nicht umfassend sondern selektiv. Wir können
        schätzungsweise nur 1/70 der Informationen, die im visuellen Feld präsent sind, zu einem
        Zeitpunkt t erfassen. Wir müssen also auswählen. Um das zu tun, müssen wir wissen, was
        wir auswählen. Erwartungen beeinflussen daher in starkem Maße, was wir sehen.

    2.) Die Verarbeitung von Informationen ist zu einem gewichtigen Teil sequentieller Natur. Wir
        nehmen Information über die Zeit hinweg auf und machen dann Vorhersagen auf der Basis
        dieser Information bei der Verfolgung von Zielen, die zu kleineren Handlungsanpassungen
        führen. In stabilen Umgebungen mit geringen Schwankungen ist dies eine erfolgreiche Vor-
        gehensweise nicht jedoch, wenn zwischen zwei aufeinanderfolgenden Beobachtungen sehr
        viel stärkere Schwankungen auftreten als erwartet.

    3.) Menschen besitzen keinen intuitiven Rechner, der sie zu präzisen Kalkulationen befähigt,
        sondern benutzen sehr viel einfachere Daumenregeln auch Heuristiken genannt. Sie sind oft
        erfolgreich jedoch nicht immer wie noch zu zeigen sein wird. Eine Entscheidungsregel, die
        zu inkonsistenten Entscheidungen führte, wurde demonstriert (Abb. 1).

    4.) Menschen haben eine begrenzte Gedächtniskapazität. Anders als Computer können wir
        meist nicht auf Informationen in ihrer Originalform (so wie aufgenommen) zugreifen son-
        dern rekonstruieren auf der Basis von Assoziationen aus Fragmenten. Je nach Assoziation
        kann es zu unterschiedlichen Rekonstruktionen ein und desselben Ereignisses kommen.

    5.) Anders als Computer stützen Menschen die Auswahl von Informationen und die Antizipa-
        tionen, die sie anhand dieser Informationen machen, auf die Bedeutung dieser Informatio-
        nen. Diese Bedeutung entsteht in einem Akt der Interpretation. Eine sehr häufige Form
        der Interpretation ist die Klassifikation einer Information, d.h. ihre Zuordnung zu einem
        Begriff. Um Urteile einer Person verstehen zu können, muß man wissen, wie eine Person
        ihre Umwelt deutet.

    6.) Ein allgemeines Urteilsmodell ist das Linsenmodell von Brunswick. Eine Person fällt Ur-
        teile über unsichere Ereignisse auf der Basis von Hinweisen (cues) oder Bezugspunkten
        A,B,C,...F. Es gibt subjektive Beziehungen der Hinweise untereinander und zum Urteil.
        Auf der anderen Seite gibt es die realen Beziehungen der Hinweise untereinander und zum
        unsicheren Ereignis, wobei die Situation dadurch kompliziert wird, dass die Beziehung zwi-
        schen Hinweisen und Ereignis eine Wahrscheinlichkeitsbeziehung ist. Wir haben also zwei
        Systeme. Das eine System ist die Umwelt, das andere System die mentale Repräsentation
        oder Abbildung der Umwelt. Urteilsgenauigkeit hängt davon ab, inwieweit diese beiden
        Systeme einander entsprechen (Abb. 2).

3      Probabilistische Umwelt
Thema der ersten Sitzungen war die Natur menschlicher Urteile, Thema der nachfolgenden Sit-
zungen der Charakter der Umwelt, in der Menschen urteilen, der sich bei perfekter Anpassung
im Urteil widerspiegeln sollte. Grundsätzlich leben wir wie schon erwähnt in einer probabilisti-
schen oder vom Zufall regierten Umwelt, die nicht vorhersagbar ist. Diese Feststellung ist nicht
ganz korrekt, da Umweltereignisse nicht grundlos auftreten, sondern häufig von so vielen und
kleinen Faktoren abhängen, daß wir nicht in der Lage sind, alle diese Faktoren wahrzunehmen.
Daher kommt es uns so vor, als seien die Ereignisse zufälliger Natur, wie wir am Beispiel des

2
WS 2004/05
Urteilen und Entscheiden                                              Prof. Dr. Johannes Becker

Münzwurfs gesehen haben. Über den Zufall und die Beziehung zwischen probabilistischer Umwelt
und Urteilen ist folgendes sagen:

 1.) Menschen haben Schwierigkeiten, den zufälligen Charakter von Ereignissen zu akzeptie-
     ren (Beispiel des spanischen Lotto-Gewinners). Bei Aufgaben, bei denen Fähigkeit und
     Glück (also Zufall) über den Erfolg entscheiden, wird der Fähigkeitsanteil überschätzt.
     Sogar bei nur vom Zufall abhängigen Ereignissen überschätzen Menschen systematisch
     dann die Erfolgswahrscheinlichkeit, wenn die Aufgabe Merkmale aufweist, die mit Situa-
     tionen assoziiert sind, die Menschen aufgrund von Fertigkeiten beherrschen wie etwa Wahl,
     Anstrengung oder Wettbewerb. Man bezeichnet dies als Kontrollillusion (Beispiel: frei ge-
     wählte Losnummern sind subjektiv sehr viel wertvoller). Allein schon das bloße Nachdenken
     über ein ungewisses, in der Zukunft liegendes Ereignis erzeugt Kontrollillusion. Ein solches
     Nachdenken ist auch die Tätigkeit, die man als Planen bezeichnet. Eine Gefahr von Planen
     ist also, daß es ein unrealistisches Gefühl des „wir haben alles im Griff“ erzeugt.

 2.) Bei einer reinen Zufallsfolge ist das nachfolgende Ergebnis völlig unabhängig vom vor-
     ausgegangenen Ergebnis, präziser formuliert: Die Wahrscheinlichkeit eines Ergebnisses ist
     unabhängig davon, welches Ergebnis vorher aufgetreten ist. Man nennt dies statistische
     Unabhängigkeit.

 3.) Neben reinen Zufallsfolgen gibt es Ereignisfolgen, die partiell zufällig sind z.B. Börsenkurs-
     verläufe. Hier sind die nachfolgenden Ereignisse (Tageskurse) zum Teil von den vorausge-
     gangenen Ereignissen beeinflußt.

 4.) Wie die sog. Spielertäuschung zeigt, glauben Menschen auch bei reinen Zufallsfolgen, daß
     nachfolgende Ereignisse von vorausgegangenen abhängen.

 5.) Die Fähigkeit, ein Ereignis vorherzusagen, ist abhängig vom Ausmaß von Zufallsschwan-
     kungen in der Ereignisfolge. Die Einzelresultate einer Folge von Münzwürfen sind nicht
     vorhersagbar, weil es sich um eine reine Zufallsereignisse handelt. Vorhersagen läßt sich
     nur, auf welche relativen Häufigkeitswerte die einzelnen möglichen Ereignisse (Kopf, Zahl)
     mit zunehmender Länge der Folge hinstreben.

 6.) Ob eine Ereignisfolge rein zufällig ist oder nicht, fällt Menschen schwer zu erkennen. Sollen
     sie eine Zufallsfolge generieren, erzeugen sie Folgen mit zu vielen Wechseln also zu kurze
     Subfolgen eines bestimmten Ereignisses und zuwenig Abweichungen von den erwarteten
     Häufigkeiten der möglichen Ereignisse. Sie unterschätzen das Ausmaß an Fluktuation in
     Zufallsfolgen.

 7.) Dieses Phänomen wird wie folgt erklärt: Menschen haben eine bestimmte Vorstellung von
     Zufall und Zufallsfolgen. Man nennt eine solche Vorstellung mentale Repräsentation. Ob
     eine Folge eine Zufallsfolge ist oder nicht, wird nach der Ähnlichkeit einer aufgetretenen
     Folge mit der mentalen Repräsentation von Zufallsfolgen beurteilt. Diese Ähnlichkeit nennt
     man auch Repräsentativität und die auf ihr basierende Urteilsregel Repräsentativitätsheu-
     ristik. In der Vorstellung der meisten Menschen haben Zufallsfolgen mehr Ordnung oder
     Struktur, als sie realiter haben. Entsprechend ist ihre Wahrnehmung verzerrt. Ein Grund
     dafür ist, daß Menschen ein hoch entwickeltes Bedürfnis nach dem Auffinden von Ordnung
     oder auch deren Konstruktion in ihrer Umgebung haben.

                                                                                                 3
WS 2004/05
Urteilen und Entscheiden                                                Prof. Dr. Johannes Becker

    8.) Fast immer basieren Urteile auf Stichproben von Beobachtungen. Dabei ist zu berücksich-
        tigen, daß bei kleinen Stichproben die zufallsbedingte Variabilität der Daten (d.h. ihre
        Abweichungen vom eigentlichen Wert) größer ist als bei großen Stichproben und daß Mit-
        telwerte von Beobachtungen weniger Variabilität aufweisen als die Beobachtungen, auf
        denen sie beruhen. Die Antworten auf die in der Vorlesung vorgestellten Urteilsaufgaben
        zeigen, daß Menschen dennoch nicht akzeptieren, daß Abweichungen von erwarteten Wer-
        ten beispielsweise der Geburtenquote von Jungen bei kleinen Stichproben wahrscheinlicher
        sind als bei großen Stichproben. Dies gilt auch für Experten, wenn sie mit fachfremden
        Problemen zu tun haben.

    9.) Stichproben von Beobachtungen können repräsentativ oder verzerrt sein. Auch offensicht-
        liche Stichprobenverzerrungen werden häufig im Urteil nicht berücksichtigt (Quizbeispiel).

10.) Durch Training läßt sich erreichen, daß Stichprobengröße und -verzerrung sich im Urteil
     niederschlagen.

11.) Wenn Informationen für Vorhersagezwecke benutzt werden, sind folgende Aspekte der be-
     nutzten Informationen zu beachten,
         a) ihre Reliabilität (Zuverlässigkeit): Reliabel ist eine Information – beispielsweise eine
            Zeugenaussage –, wenn sie zuverlässig das wiedergibt, worauf sie sich bezieht. Je un-
            reliabler eine Informationsquelle ist, desto höhere Schwankungen (Variabilität) weist
            sie auf. Ein Beispiel sind unzuverlässige Meßinstrumente, die bei jeder Messung einen
            anderen Wert anzeigen.
         b) ihre Fähigkeit zur Vorhersage: Die Vorhersagefähigkeit einer Information (z.B. Intelli-
            genzquotient) ist hoch, wenn sich mit ihr ein zukünftiges Ereignis (z.B. Berufserfolg)
            gut vorhersagen läßt. Eine Information hat keine allgemeine Vorhersagefähigkeit son-
            dern nur eine spezifische. Mit dem Intelligenzquotient läßt sich Eheglück nur schlecht
            vorhersagen.

12.) Reliabilität und Vorhersagefähigkeit hängen insofern zusammen als mit unreliablen Infor-
     mationen keine Vorhersagen möglich sind. Der Grund dafür ist, daß mangelnde Reliabilität
     die Zufallsfluktuation von Messungen einer Größe erhöht.

13.) Fatal ist, daß die größere Variabilität einer Information ihre subjektive Bedeutung für
     Vorhersagen erhöhen kann, auch wenn die höhere Variabilität auf mangelnde Reliabilität
     zurückgeht.

14.) Bei Größen mit Zufallsvariation folgen auf extrem hohe oder extrem niedrige Werte mit sehr
     viel höherer Wahrscheinlichkeit weniger extreme, also zur Mitte hin tendierende Werte als
     gleich extreme oder noch extremere Werte. Man nennt diesen rein statistisch begründeten
     Effekt Regressionseffekt.

15.) Menschliche Leistungen sind fast immer mit Zufallsfluktuation behaftet. Man erbringt nicht
     immer die gleiche Leistung, weil diese von sehr vielen Faktoren abhängig ist. Daher werden
     auch bei ihnen Regressionseffekte beobachtet. Auf gute Leistungen folgen meist weniger gu-
     te, auf schlechte Leistungen meist bessere. In der Alltagssprache werden Leistungsextreme
     häufig mit „guten bzw. schlechten Tagen“ begründet. Diese Interpretationen sind statisti-
     sche Interpretationen, da sie die Rolle des Zufalls bei diesen Schwankungen betonen.

4
WS 2004/05
Urteilen und Entscheiden                                            Prof. Dr. Johannes Becker

16.) Formal gesehen sind Regressionseffekte immer dann zu erwarten, wenn der Zusammenhang
     (Korrelation) zwischen erster und zweiter Messung einer Größe bzw. zwischen Vorhersage-
     größe und vorgesagtem Kriterium nicht perfekt ist. Regressionseffekte werden mit abneh-
     mendem Zusammenhang immer ausgeprägter. Entsprechend müssen sich Vorsageurteile bei
     nicht perfektem Zusammenhang zu mittleren Werten hin bewegen.

17.) Liegt kein Zusammenhang zwischen zwei Größen vor, ist der mittlere Wert des Kriteriums
     die beste Vorhersage.

18.) Wie schwer es Menschen fällt, Zufallsfluktuationen in Beobachtungen richtig als solche zu
     interpretieren, zeigt sich auch darin, daß Regressionseffekte häufig nicht als Zufallsfluk-
     tuation sondern kausal interpretiert werden. Als Beispiele dafür wurden „Management by
     exception“ und die Fehlbewertung der Folgen von Lob und Tadel genannt. Sehr gute oder
     sehr schlechte Leistungen provozieren wertende Stellungnahmen, auf die mit hoher Wahr-
     scheinlichkeit weniger extreme Leistungen folgen. Diese Änderungen werden dann als Erfolg
     der Maßnahmen kausal interpretiert, obwohl sie nur Ausdruck von Zufallsschwankungen,
     also statistischer Natur sind.

19.) Regressionseffekte werden auch deswegen nicht als Ursache von Leistungsvariation ins Kal-
     kül gezogen, weil menschliche Urteile von extremen Werten besonders beeinflußt werden.
     Extreme Werte sind in der Wahrnehmung von Vorhersagevariablen auffällig und führen zu
     dem Glauben, daß sie mit extremen Werten im vorhergesagten Kriterium zusammengehen.

20.) Besonders schwer zu berücksichtigen sind Zufallsschwankungen, wenn Entscheidungen an-
     hand von Szenarios mit mehreren Informationsquellen, die alle einschränkt zuverlässig sind,
     getroffen werden müssen. Hier tendieren Menschen dazu, bestimmte Unsicherheiten zu eli-
     minieren und sich auf das wahrscheinlichste Szenario zu konzentrieren. Man nennt diese
     Strategie die Strategie der besten Vermutung.

21.) Zeitreihen von Beobachtungen können reinen Zufallscharakter haben. In diesem Fall folgen
     die Beobachtungen einer Linie parallel zur Abszisse, auf der die Zeit abgetragen ist. Von
     einem Trend spricht man, wenn die Linie zur Abszisse nicht parallel verläuft. Dies deutet
     auf ein systematisches Anwachsen oder Abnehmen der beobachteten Leistung über die
     Zeit hinweg. Ob der Trend systematischer Natur ist oder doch nur Zufall, läßt sich mit
     Methoden der statistischen Analyse von Zeitreihen untersuchen.

22.) Zwei einfache (schnelle aber ungenaue) Methoden, um eine Reihe von Beobachtungen auf
     ihren Zufallscharakter hin zu untersuchen, sind die Markierung der Variationsbreite und
     der Versuch, den nachfolgenden Wert anhand des vorangegangenen Werts vorherzusagen.

4   Heuristiken
Wenn Menschen Urteile abgeben, stehen ihnen häufig Informationen aus verschiedenen Quellen
zur Verfügung, die sie kombinieren müssen. Soll beispielsweise der Umsatz einer Firma im nächs-
ten Jahr vorhergesagt werden, sind Informationen über den Umsatz des laufenden Jahres, über
Markttrends, Wettbewerber, Marketingstrategien usw. zu berücksichtigen und für das Urteil zu-
sammen zu fassen. Diese Aufgabe erfordert die Auswahl von Informationen aus der Umgebung
und aus dem Gedächtnis, die Interpretation dieser Informationen, ihre Gewichtung und ihre

                                                                                              5
WS 2004/05
Urteilen und Entscheiden                                               Prof. Dr. Johannes Becker

Kombination zu einem Urteil. Da dies in den meisten Fällen eine Überforderung der menschli-
chen Informationskapazität darstellt, bedienen sich Menschen vereinfachender Urteilsstrategien,
die den Verarbeitungsaufwand reduzieren. Deren Anwendung produziert jedoch in manchen Si-
tuationen Fehler, die bei einer aufwendigeren Verarbeitung nicht aufgetreten wären. Was als
Urteilsfehler zu bezeichnen ist, folgt aus dem Vergleich der Urteile mit Vorschriften für die Selek-
tion, Gewichtung und Kombination von Informationen, die aus der Wahrscheinlichkeitstheorie
folgen. Wie zu zeigen sein wird, verletzen intuitive Urteile häufig diese Regeln.
    Eine erste Vorschrift ist, daß das Vertrauen in das eigene Urteil mit Zunahme der verarbei-
teten Informationen wachsen sollte aber nur dann, wenn die verschiedenen Informationen, die
kombiniert werden, nicht redundant sind. Völlige Redundanz wäre gegeben, wenn zwei gleiche
Informationsstücke kombiniert würden. Meistens sind die kombinierten Informationsstücke in
variierendem Ausmaß voneinander abhängig. Wenn beispielsweise Intelligenz auf Basis der aka-
demischen Leistung und der Art der letzten Beschäftigung geschätzt werden soll, dann besteht
partielle Abhängigkeit der beiden Informationsstücke, da akademische Leistung natürlich auch
die Art der Beschäftigung mit beeinflußt. Je redundanter Informationsstücke sind, desto höher
ist ihre Konsistenz. Diese auf Redundanz zurückgehende Konsistenz ist jedoch kein Indikator
dafür, wie sehr man seinem Urteil vertrauen sollte.
Für Konsistenz sorgt auch eine Urteilsstrategie, die man Repräsentativitätsheuristik nennt. Die
Zugehörigkeit eines Objektes zu einer Klasse wird auf der Basis der Übereinstimmung oder Ähn-
lichkeit von Objekt- und Klassenmerkmalen entschieden. Handelt es sich um Personen spricht
man statt von Klassen von Stereotypen. Beispiele für Stereotypen sind der „Manager“ oder der
„Professor“.
Daß die Repräsentationsheuristik auch bei Vorhersagen angewendet wird, zeigt das Beispiel von
Tom, dessen Studienfachwahl auf der Basis einer Persönlichkeitsbeschreibung von ihm vorherzu-
sagen war. Es wurden die Fächer genannt, deren mentale Repräsentation die größte Ähnlichkeit
(damit auch Konsistenz) mit der Persönlichkeitsbeschreibung aufwiesen.
Liegen inkonsistente Informationen vor, die einander widersprechende Implikationen für das Ur-
teil haben, dann tendieren Urteiler dazu, die Inkonsistenz zu beseitigen, indem eine der beiden
inkonsistenten Informationen bei der Urteilsbildung negiert wird.
Obwohl Konsistenz somit häufig vom Urteiler konstruiert wird und nicht in den Daten liegt,
bestärkt sie die Urteiler in ihrem Vertrauen in ihr Urteil. Gestärkt wird das Vertrauen zudem
durch extreme für die Vorhersage benutzte Informationsstücke, die eigentlich sofort Gedanken an
das Regressionsphänomen wecken sollten. Somit kommt es dazu, daß die Informationsmerkmale,
die Vertrauen in das Urteil auslösen, gerade die sind, die es erschüttern sollten. Man nennt dieses
Phänomen Validitätsillusion.
    Eine zweite Vorschrift ist, auch dann statistisch zu denken, wenn das uns vertraute kausale
Denken damit nicht vereinbar ist. Menschen haben die starke Tendenz nach Ursachenmustern
zu suchen, wenn sie vorhersagen sollen. Das geht soweit, daß sie wie gesehen Kausalbeziehungen
„entdecken“, wo keine sind. Kausales Denken unterscheidet sich jedoch in mancherlei Hinsicht
von statistischem Denken.
    1. Anders als die Natur von Ursachen sind Wahrscheinlichkeitstheorie und Statistik logische
       Systeme, die erlauben die Implikationen bestimmter Annahmen präzise zu beschreiben.
       Man denke an die Möglichkeit, erwartete Regressionseffekte präzise zu kalkulieren.
    2. Kausales Denken ist unidirektional von Ursache zu Wirkung vorgehend. Im statistischen
       Denken kann die Beziehung zwischen Ursache (z.B. Anstrengung) und Effekt (z.B. Müdig-

6
WS 2004/05
Urteilen und Entscheiden                                              Prof. Dr. Johannes Becker

     keit) in beiden Richtungen diskutiert werden.
  3. Statistisches Denken basiert allein auf der logischen Struktur der Information, kausales
     Denken basiert auf Struktur und Inhalt.

  Exkurs zum Denken über wahrscheinliche Ursachen.
Aufgrund vieler Untersuchungen zum kausalen Denken läßt sich sagen, daß 4 Typen von Argu-
menten Kausalurteile beeinflussen,
  1. das kausale Feld oder der kausale Kontext, in dem das Urteil gefällt wird,
  2. verschiedene Hinweise auf kausale Beziehungen, z.B. zeitliche Ordnung (Ursache geht Wir-
     kung voraus), Kovariation, zeitlich-räumliche Nähe, Ähnlichkeit von Ursache und Wirkung,
  3. Urteilsstrategien, mit denen 1. und 2. kombiniert werden,
  4. Alternative Erklärungen, die die Stärke vorliegender kausaler Annahmen herabsetzen.
Die 4 Punkte wurden am Beispiel des Brechens eines Uhrglases diskutiert, als dessen Ursache
bedingt durch einen Wechsel des kausalen Feldes im einen Fall ein Hammerschlag angenommen
wird, in anderen Fall im Rahmen einer Qualitätsprüfung nicht wie im ersten Fall eine einwirkende
Kraft sondern ein Materialfehler verantwortlich gemacht wird.
    Wie verhält sich dieses kausale Denken von Menschen zur Logik der Wahrscheinlichkeitstheo-
rie?
Beim Taxi-Unfallflucht-Problem werden folgende Daten gegeben: 85% der Taxis in einer Stadt
sind grün und 15% blau. Ein Zeuge identifiziert das betroffene Taxi als blau. Bei einem Test
macht der Zeuge 80% richtige und 20% falsche Identifikationen. Werden Urteiler nach der Wahr-
scheinlichkeit gefragt, daß ein blaues Taxi den Unfall verursacht hat, ist die typische Antwort
80%. Damit halten sich die Urteiler an die Zuverlässigkeit der Zeugenaussage d.h. an die spezifi-
sche Information und ignorieren die allgemeine oder Grundrateninformation über die Häufigkeit
der Taxis in der Stadt, die nach der Wahrscheinlichkeitstheorie mit berücksichtigt werden muß.
Die richtige Antwort wäre 41%.
Diverse Untersuchungen bestätigen die Tendenz, Grundraten zu ignorieren besonders dann, wenn
sie anders als im Taxibeispiel wie in unserem Schülerbeispiel nicht explizit vorgegeben sind. Wer-
den beim Taxiproblem nur Grundraten vorgegeben und keine spezifische Information, halten sich
die Urteiler bei ihrem Urteil an die Grundrateninformation, wissen also um ihre Bedeutung. Die
Wahrscheinlichkeit für „blaues Taxi“ wird mit 15% angegeben.
Wie hat man vorzugehen?
Wird zusätzlich zur Grundrate eine spezifische Information gegeben, muß nach den Regeln der
Wahrscheinlichkeitstheorie die auf Basis der Grundrate geschätzte Wahrscheinlichkeit in dem
Ausmaß durch die spezifische Information modifiziert werden, wie diese zuverlässig ist. Sehr viel
besser gelingt Urteilern die richtige Kombination, wenn die Grundrate kausal interpretiert wer-
den kann, beispielsweise wenn gesagt wird, daß 85% der Unfälle von grünen Taxis verursacht
werden.
    Ein weiterer gegen die Logik der Wahrscheinlichkeitstheorie verstoßender Urteilsfehler ist
die Verwechslung der bedingten Wahrscheinlichkeiten p(Y |X) und p(X|Y ). Die bedingte Wahr-
scheinlichkeit bezeichnet die Wahrscheinlichkeit für ein Ereignis, wenn ein anderes Ereignis (die
Bedingung) eingetreten oder gegeben ist. Die Bedingung steht immer hinter dem Querstrich in
der Klammer).
Wenn Ärzte, so hat sich gezeigt, die Wahrscheinlichkeit eines Tumors (z.B. Mammakarzinom, mit
X bezeichnet) nach einem positiven Test (Mammographie, mit Y bezeichnet) einschätzen sollen,

                                                                                                7
WS 2004/05
Urteilen und Entscheiden                                               Prof. Dr. Johannes Becker

basieren sie ihr Urteil auf der bedingten Wahrscheinlichkeit p(positiver Test unter der Bedingung
Tumor, p(Y |X)), also der Zuverlässigkeit des Tests. Richtig wäre, für das Urteil die bedingte
Wahrscheinlichkeit p(Tumor unter der Bedingung positiver Test, p(X|Y )) zu verwenden. Bei-
de Wahrscheinlichkeiten sind nur dann gleich groß, wenn p(X) = p(Y ). Die Wahrscheinlichkeit
p(X) ist aber in vielen Fällen weitaus höher als p(Y ). Dann wird dem Patienten eine völlig über-
höhte Wahrscheinlichkeit für eine Krebserkrankung mitgeteilt und möglicherweise eine unnötig
belastende Behandlung gewählt. Der Grund für die beschriebene Tendenz, die beiden bedingten
Wahrscheinlichkeiten zu verwechseln, ist, so wird spekuliert, daß man zunächst vom Testresultat
erfährt und daraus den Tumor erschließt. Diese zeitliche Reihenfolge, die der kausal relevanten
zuwider läuft, führt zur Bevorzugung von p(Y |X).
    Ein dritter systematischer Fehler wird Konjunktionsfehler genannt. Fragt man nach der Wahr-
scheinlichkeit dafür, daß Tom (a) als Studienfach Journalistik auswählt, (b) mit der Entscheidung
schnell unglücklich ist und (c) zu Elektrotechnik wechselt, wird für das Szenario aus den drei
Einzelereignissen eine höhere Eintretenswahrscheinlichkeit geschätzt als für die Einzelereignisse.
Die Logik der Wahrscheinlichkeitstheorie besagt jedoch, daß die Szenariowahrscheinlichkeit nicht
größer sein kann als die kleinste Einzelwahrscheinlichkeit. Der Grund für diesen Fehler liegt darin,
daß die Urteiler sich bei ihrer Schätzung nicht nur auf die Struktur des Szenarios stützen sondern
auch auf den Inhalt oder die Bedeutung. Die Einzelereignisse bilden in unserem Beispiel eine kau-
sal kohärente und damit hoch plausible Geschichte. Die Plausibilität der Geschichte liegt dann in
einem solchen Fall über der der Einzelereignisse mit der Folge, daß sie auch wahrscheinlicher ist.
Liegen indirekte Informationen über kausale Verknüpfungen vor, können sie Fehlinterpretationen
von Konjunktionen induzieren, wie das Supermarkt-Kaffee Experiment belegt.
Der Konjunktionsfehler ist auch bei Experten beobachtet worden. Darin liegt eine nicht zu un-
terschätzende Gefahr. Experten entwerfen zukünftige Szenarios, um sich schon in der Gegenwart
auf sie vorbereiten zu können. Solche Szenarios sind kausal kohärent konstruiert. Damit wächst
aber die Gefahr, daß ihre Wahrscheinlichkeit deutlich überschätzt wird, wie viele Beispiele (z.B.
Prognosen des Club of Rome) belegen.
   Nicht immer geben Urteiler zu kühne Schätzungen ab. Konservativ sind sie, wenn Meinungen
aufgrund neuer Informationen zu revidieren sind. Folgende Situation demonstriert dies. Vor dem
Urteiler stehen zwei Gefäße. In dem einen Gefäß befinden sich 700 rote und 300 blaue Spiel-
marken, in dem anderen 700 blaue und dreihundert rote Spielmarken. Per Zufall wird eine der
beiden Gefäße ausgewählt. Das Gefäß mit den mehrheitlich roten Marken vor sich zu haben be-
trägt also 50%. Nun zieht man per Zufall aus dem ausgewählten Gefäß nacheinander 12 Marken,
wobei jede sofort wieder zurückgelegt wird. Von ihnen sind 8 rot und 4 blau. Wie groß ist die
Wahrscheinlichkeit, das „rote“ Gefäß erwischt zu haben? Die Urteile bewegen sich zwischen 70%
und 80%. Richtig sind 97%. Die Urteiler ändern also aufgrund der neuen Information nicht in
dem Maße ihre Meinung wie vorgeschrieben. Der Grund dafür ist wahrscheinlich, daß Menschen
nicht wie vorgeschrieben die Wahrscheinlichkeit des Stichprobenergebnisses unter der Hypothese,
„das Gefäß ist mehrheitlich rot“ und der Alternativhypothese „das Gefäß ist mehrheitlich blau“
evaluieren sondern nur unter der aufgestellten Hypothese. Im Alltag ist dies häufig auch sehr
schwierig, weil die Alternativhypothese meist nicht klar definiert werden kann.
   Wie immer wieder angedeutet sind Urteile das Ergebnis des Zusammenspiels von Aufgaben-
struktur und den Eigenschaften der menschlichen Informationsverarbeitung.
So hängt wie schon erwähnt das Urteil vom Aufgabenkontext als einem wichtigen Aspekt der
Aufgabenstruktur ab. Ein gutes Beispiel sind Urteile über die für Vorhersageurteile so wichtige

8
WS 2004/05
Urteilen und Entscheiden                                             Prof. Dr. Johannes Becker

Variabilität von Reizen. Bei gleich großer objektiver Variabilität zweier Zahlenreihen erscheint
diejenige mit den kleineren Zahlen als die variablere. Die absolute Größe der Zahlen ist der
Hintergrund oder Kontext, auf dem die Variabilität beurteilt wird.
    Eine Urteilsstrategie, die für die Schätzung von Häufigkeiten von großer Bedeutung ist, die
sog. Verfügbarkeitsheuristik. Menschen suchen für ihr Urteil nicht nur in ihrer Umgebung nach
Hinweisen sondern auch in ihrem Gedächtnis. Wenn man sich Beispiele für eine bestimmte Art
von Ereignis sehr gut ins Gedächtnis rufen kann (Leichtigkeit der Erinnerung) verglichen mit ei-
nem anderen Ereignis, führt das dazu, daß man die Häufigkeit dieses Ereignisses höher einschätzt.
Die Schätzung der Scheidungsrate im eigenen Land ist stark davon beeinflußt, wie viele Geschie-
dene man in seiner Bekanntschaft hat. Hat man vor kurzem einen Verkehrsunfall beobachtet,
überschätzt man die Häufigkeit von Unfällen. Bei Schätzungen der Häufigkeit von Todesursa-
chen werden die Ursachen überschätzt, über die häufig in den Medien berichtet wird. Obwohl
Verfügbarkeit keine schlechte Strategie ist, kann sie doch unter den angesprochenen Bedingungen
zu Urteilsverzerrungen führen.
    Eine besonders bei quantitativen Urteilen immer wieder benutzte Strategie, die sehr stark
von der gerade verfügbaren Information abhängig ist, ist die Anker-Anpassungsheuristik. Wenn
man beispielsweise die Umsätze für das nächste Jahr schätzen soll, ist es durchaus vernünftig,
von den Verkaufszahlen des letzten Jahres auszugehen (man nennt dies den Anker) und aufgrund
von Überlegungen wie Gewicht der Konkurrenz, Konjunktur, Produkterneuerung eine Anpassung
des Ausgangswerts vorzunehmen. Auch diese Strategie führt häufig zu guten Ergebnissen. Ihre
Problematik liegt in der Generierung des Ankers. Wie sich herausgestellt hat, werden auch völlig
irrelevante Informationen als Anker gewählt. In einem Experiment hatten Urteiler die Zahl der
afrikanischen Staaten in der UNO zu schätzen. Die Experimentatoren generierten mittels eines
Glücksrades eine Zufallszahl und ließen die Urteiler ein Groburteil fällen (Liegt die Zahl afri-
kanischer UNO-Mitgliedsstaaten über oder unter der Glücksradzahl). Die anschließende genaue
Schätzung war dramatisch abhängig vom irrelevanten Anker. Urteiler, die eine hohe Glücksrad-
zahl zugespielt bekommen hatten, gaben weitaus höhere Schätzungen ab als Urteiler, die eine
niedrige Glücksradzahl erhalten hatten.
    Die Art und Weise, wie Informationen präsentiert werden, kann ihre Bedeutung für das Urteil
beeinflussen. Einige Beispiele dafür sind:
   - Informationen, die am Anfang oder am Ende einer Folge von Informationen dargeboten
     werden, haben ein größeres Gewicht für das Urteil (primacy-Effekt, recency-Effekt), obwohl
     aus normativer Sicht die Stellung einer Information in einer Folge für ihre Bedeutung
     belanglos ist.
   - Die Präsentation von zuvielen Informationen führt dazu, manche Informationen unter den
     Tische fallen zu lassen.
   - Informationen, die in Negativform präsentiert werden, sind schwieriger zu verarbeiten.
   - Anscheinend vollständige Informationen können Urteiler blind dafür machen, daß wichtige
     Informationen fehlen.
   - Auch wenn adäquate statistische Informationen vorliegen, können Urteiler durch die Art
     der Benennungen der Informationen in die Irre geführt werden.

   Die Schwierigkeiten und Fehlermöglichkeiten bei der Kombination von Informationen für Vor-
hersagezwecke sind wie die letzten Veranstaltungen gezeigt haben, vielfältig. Was ist zu tun?
Die Lösung für diese Probleme, das zeigen viele Untersuchungen, ist ein strikt mechanisches

                                                                                               9
WS 2004/05
Urteilen und Entscheiden                                                Prof. Dr. Johannes Becker

Vorgehen bei der Bestimmung der Vorhersagevalidität und -reliabilität von Informationen sowie
deren Gewichtung und Kombination. So etwas ist erreichbar durch die Anwendung statistischer
Modelle z.B. Regressionsgleichungen.
Lange Zeit hat man geglaubt, daß solche mechanischen Vorhersagemethoden nicht annähernd die
Fähigkeiten menschlicher Urteiler der Verarbeitung komplexer Informationen erreichen könnten.
Nachdem man die Vorhersagegüte statistischer Modelle und menschlicher Urteiler im Bereich
der klinischen Psychologie und der Vorhersage akademischer Leistungen miteinander verglichen
hatte, ergab sich ein anderes Bild. Statistische Methoden waren Urteilern weit überlegen. In an-
deren Feldern wie etwa im ökonomischen Bereich wurde das Gleiche beobachtet. Warum ist das
so?
     1. Statistische Modelle gewichten Informationen für die Vorhersage nach ihrer Zuverlässigkeit
        und Validität. Menschen fällt dies schwer.
     2. Statistische Methoden sind konsistent, Menschen nicht. Diese werden müde oder langweilen
        sich oder beachten zu unterschiedlichen Zeiten unterschiedliche Informationen.
     3. Häufig wissen Urteiler nicht, was sie tun, hier also, wie sie verschiedene Informationen ge-
        wichten. Dies ist um so stärker der Fall, je erfahrener die Urteiler in ihrem Bereich sind.
        Der Grund dafür ist, daß jede sich wiederholende Tätigkeit einen automatischen Charakter
        bekommt. Ein Merkmal automatisierter kognitiver Strategien ist aber, daß sie weitgehend
        ohne bewußte Kontrolle ablaufen. Eine Konsequenz davon ist auch, daß eingefahrene Stra-
        tegien nur schwer zu verändern sind.
     4. Menschen glauben daß sie viele Informationsstücke beachten, obwohl Modelle, die auf der
        Basis nur weniger Hinweise Vorhersagen machen, menschliche Urteile wesentlich besser
        reproduzieren.

     Gegen die Verwendung statistischer Modelle gibt es einige Einwände.
     1. Sie setzen quantitative Daten voraus.
     2. Man benötigt eine hinreichende Zahl von Fällen aus der Vergangenheit.
     3. Die Annahme muß gerechtfertigt sein, daß das in der Vergangenheit benutzte statistische
        Modell auch in der Zukunft gilt.

Auch wenn diese Einwände nicht falsch sind, so hat sich doch gezeigt, daß sie in der Praxis nicht so
schwer wiegen. Quantifiziert man qualitative Daten so stellt dies eine Verfälschung ihres Charak-
ters dar, ihre Prognosefähigkeit leidet jedoch nur wenig. Ähnliches gilt für das zweite Argument.
Auch wenn nur wenige Daten vorliegen sind, führt der Einsatz statistischer Methoden z.B. die
Berechnung von Mittelwerten zu besseren Prognosen. Das dritte Argument gilt gleichermaßen
für statistische Regeln wie für Regeln, die von Urteilern eigenhändig konstruiert wurden.
   Zusammenfassend läßt sich sagen, daß der große Vorteil statistischer Methoden das ist, was
Menschen an ihnen stört, die mechanische Rigidität, mit der sie vorhersagen und Entscheidun-
gen treffen. Sie handeln nie, wie Menschen es häufig tun, ad hoc. Natürlich gibt es Situationen,
in denen keine statistischen Modelle angewandt werden können z.B. immer dann, wenn keine
Erfahrungswerte vorliegen. Verbesserungen des Urteils lassen sich aber auch für solche Situatio-
nen erreichen, wenn man sich über die Eigenarten menschlicher Urteile und über systematische
Urteilsfehler bei Menschen im Klaren ist, da dann auf dieser Basis Gegenmaßnahmen getroffen
werden können. Ein Seminarbeispiel zeigt, wie man so etwas realisieren kann. Vielleicht läßt sich
eine Analogie zum Sport ziehen: nur Übung verbessert die Leistung.

10
Sie können auch lesen