Urteilen und Entscheiden - Uni Kassel
←
→
Transkription von Seiteninhalten
Wenn Ihr Browser die Seite nicht korrekt rendert, bitte, lesen Sie den Inhalt der Seite unten
Urteilen und Entscheiden 1 Begriffsklärung 1.) Entscheidung: Von einer Entscheidung spricht man, wenn in einer Situation mindestens zwei Handlungsoptionen vorliegen und eine gewisse Freiheit der Wahl besteht. Damit ist nicht „freier Wille“ gemeint, sondern daß in dieser Situation nicht völlig konsistent eine der beiden Optionen gewählt wird und man statt dessen vor der Wahl überlegt. Ein wichtiges Buch zum Thema der Veranstaltung heißt daher auch „Thinking and Deciding“. 2.) Urteil: Als Ergebnis des Nachdenkens werden Urteile gefällt, auf die sich dann die Ent- scheidung stützt. Die dem Urteil vorausgehenden Denkprozesse sind nicht Gegenstand der Veranstaltung. Wir beschränken uns auf Urteilscharakteristika und die Beziehung zwischen Urteil und Entscheidung. 3.) Für das Fällen einer Entscheidung sind einige Urteilsarten von besonderer Bedeutung: a) Evaluative Urteile: Sie stellen Bewertungen der Handlungsoptionen dar, in denen sich der Nutzen, den der Urteiler den einzelnen Optionen zuspricht, widerspiegelt. b) Prediktive Urteile: Der Nutzen von Handlungsoptionen ergibt sich aus den Konse- quenzen der einzelnen Handlungen. Die Konsequenzen liegen also in der Zukunft und müssen daher vorhergesagt werden. Zudem treten sie fast immer nicht mit Sicherheit als Folge einer Handlung auf, sondern nur mit einer gewissen Wahrscheinlichkeit. c) Klassifikatorische Urteile: Wahrnehmungen werden Kategorien zugeordnet und erhal- ten dadurch ihre Bedeutung. 4.) Entscheidungsbewußtsein: Es gibt Entscheidungen mit wenig oder keinem Bewußtsein einer Entscheidung beispielsweise die Entscheidung, bei der Kreuzung auf dem Weg zur Arbeit rechts abzubiegen. Es handelt sich um Routinen, bei denen die zu treffende Entscheidung aus dem Gedächtnis abgerufen wird. Daneben gibt es Entscheidungen mit hohem Entschei- dungsbewußtsein beispielsweise die Entscheidung, ein bestimmtes Fach zu studieren. 5.) Urteils- und Entscheidungsnormen: Fragen wir nicht danach wie geurteilt wird sondern wie geurteilt werden sollte, suchen wir nach Kriterien für richtige Urteile und Entscheidungen sog. Normen, anhand derer wir dann auch Urteils- und Entscheidungsfehler diagnostizieren können. 6.) Intuitives Urteilen: Die meisten unserer Urteile machen wir intuitiv ohne große Überlegun- gen, weil sie entweder keine große Bedeutung haben oder routinisiert sind. Viele Menschen müssen jedoch auch Urteile von herausragender Bedeutung treffen beispielsweise Fluglot- sen, Manager oder Politiker, für die die früher so wichtigen physischen Fähigkeiten keine Bedeutung haben sondern konzeptuelle Fähigkeiten wie das Verarbeiten von Informationen. 2 Grundlagen von Urteilen Die moderne kognitive Psychologie beschreibt die geistige Tätigkeit von Menschen als Verarbei- tung von Informationen. Unsere Kapazität, Informationen zu verarbeiten unterliegt Einschrän- kungen, die sich auch auf das Fällen von Urteilen auswirken. Solche Einschränkungen sind:
WS 2004/05 Urteilen und Entscheiden Prof. Dr. Johannes Becker 1.) Die Wahrnehmung von Informationen ist nicht umfassend sondern selektiv. Wir können schätzungsweise nur 1/70 der Informationen, die im visuellen Feld präsent sind, zu einem Zeitpunkt t erfassen. Wir müssen also auswählen. Um das zu tun, müssen wir wissen, was wir auswählen. Erwartungen beeinflussen daher in starkem Maße, was wir sehen. 2.) Die Verarbeitung von Informationen ist zu einem gewichtigen Teil sequentieller Natur. Wir nehmen Information über die Zeit hinweg auf und machen dann Vorhersagen auf der Basis dieser Information bei der Verfolgung von Zielen, die zu kleineren Handlungsanpassungen führen. In stabilen Umgebungen mit geringen Schwankungen ist dies eine erfolgreiche Vor- gehensweise nicht jedoch, wenn zwischen zwei aufeinanderfolgenden Beobachtungen sehr viel stärkere Schwankungen auftreten als erwartet. 3.) Menschen besitzen keinen intuitiven Rechner, der sie zu präzisen Kalkulationen befähigt, sondern benutzen sehr viel einfachere Daumenregeln auch Heuristiken genannt. Sie sind oft erfolgreich jedoch nicht immer wie noch zu zeigen sein wird. Eine Entscheidungsregel, die zu inkonsistenten Entscheidungen führte, wurde demonstriert (Abb. 1). 4.) Menschen haben eine begrenzte Gedächtniskapazität. Anders als Computer können wir meist nicht auf Informationen in ihrer Originalform (so wie aufgenommen) zugreifen son- dern rekonstruieren auf der Basis von Assoziationen aus Fragmenten. Je nach Assoziation kann es zu unterschiedlichen Rekonstruktionen ein und desselben Ereignisses kommen. 5.) Anders als Computer stützen Menschen die Auswahl von Informationen und die Antizipa- tionen, die sie anhand dieser Informationen machen, auf die Bedeutung dieser Informatio- nen. Diese Bedeutung entsteht in einem Akt der Interpretation. Eine sehr häufige Form der Interpretation ist die Klassifikation einer Information, d.h. ihre Zuordnung zu einem Begriff. Um Urteile einer Person verstehen zu können, muß man wissen, wie eine Person ihre Umwelt deutet. 6.) Ein allgemeines Urteilsmodell ist das Linsenmodell von Brunswick. Eine Person fällt Ur- teile über unsichere Ereignisse auf der Basis von Hinweisen (cues) oder Bezugspunkten A,B,C,...F. Es gibt subjektive Beziehungen der Hinweise untereinander und zum Urteil. Auf der anderen Seite gibt es die realen Beziehungen der Hinweise untereinander und zum unsicheren Ereignis, wobei die Situation dadurch kompliziert wird, dass die Beziehung zwi- schen Hinweisen und Ereignis eine Wahrscheinlichkeitsbeziehung ist. Wir haben also zwei Systeme. Das eine System ist die Umwelt, das andere System die mentale Repräsentation oder Abbildung der Umwelt. Urteilsgenauigkeit hängt davon ab, inwieweit diese beiden Systeme einander entsprechen (Abb. 2). 3 Probabilistische Umwelt Thema der ersten Sitzungen war die Natur menschlicher Urteile, Thema der nachfolgenden Sit- zungen der Charakter der Umwelt, in der Menschen urteilen, der sich bei perfekter Anpassung im Urteil widerspiegeln sollte. Grundsätzlich leben wir wie schon erwähnt in einer probabilisti- schen oder vom Zufall regierten Umwelt, die nicht vorhersagbar ist. Diese Feststellung ist nicht ganz korrekt, da Umweltereignisse nicht grundlos auftreten, sondern häufig von so vielen und kleinen Faktoren abhängen, daß wir nicht in der Lage sind, alle diese Faktoren wahrzunehmen. Daher kommt es uns so vor, als seien die Ereignisse zufälliger Natur, wie wir am Beispiel des 2
WS 2004/05 Urteilen und Entscheiden Prof. Dr. Johannes Becker Münzwurfs gesehen haben. Über den Zufall und die Beziehung zwischen probabilistischer Umwelt und Urteilen ist folgendes sagen: 1.) Menschen haben Schwierigkeiten, den zufälligen Charakter von Ereignissen zu akzeptie- ren (Beispiel des spanischen Lotto-Gewinners). Bei Aufgaben, bei denen Fähigkeit und Glück (also Zufall) über den Erfolg entscheiden, wird der Fähigkeitsanteil überschätzt. Sogar bei nur vom Zufall abhängigen Ereignissen überschätzen Menschen systematisch dann die Erfolgswahrscheinlichkeit, wenn die Aufgabe Merkmale aufweist, die mit Situa- tionen assoziiert sind, die Menschen aufgrund von Fertigkeiten beherrschen wie etwa Wahl, Anstrengung oder Wettbewerb. Man bezeichnet dies als Kontrollillusion (Beispiel: frei ge- wählte Losnummern sind subjektiv sehr viel wertvoller). Allein schon das bloße Nachdenken über ein ungewisses, in der Zukunft liegendes Ereignis erzeugt Kontrollillusion. Ein solches Nachdenken ist auch die Tätigkeit, die man als Planen bezeichnet. Eine Gefahr von Planen ist also, daß es ein unrealistisches Gefühl des „wir haben alles im Griff“ erzeugt. 2.) Bei einer reinen Zufallsfolge ist das nachfolgende Ergebnis völlig unabhängig vom vor- ausgegangenen Ergebnis, präziser formuliert: Die Wahrscheinlichkeit eines Ergebnisses ist unabhängig davon, welches Ergebnis vorher aufgetreten ist. Man nennt dies statistische Unabhängigkeit. 3.) Neben reinen Zufallsfolgen gibt es Ereignisfolgen, die partiell zufällig sind z.B. Börsenkurs- verläufe. Hier sind die nachfolgenden Ereignisse (Tageskurse) zum Teil von den vorausge- gangenen Ereignissen beeinflußt. 4.) Wie die sog. Spielertäuschung zeigt, glauben Menschen auch bei reinen Zufallsfolgen, daß nachfolgende Ereignisse von vorausgegangenen abhängen. 5.) Die Fähigkeit, ein Ereignis vorherzusagen, ist abhängig vom Ausmaß von Zufallsschwan- kungen in der Ereignisfolge. Die Einzelresultate einer Folge von Münzwürfen sind nicht vorhersagbar, weil es sich um eine reine Zufallsereignisse handelt. Vorhersagen läßt sich nur, auf welche relativen Häufigkeitswerte die einzelnen möglichen Ereignisse (Kopf, Zahl) mit zunehmender Länge der Folge hinstreben. 6.) Ob eine Ereignisfolge rein zufällig ist oder nicht, fällt Menschen schwer zu erkennen. Sollen sie eine Zufallsfolge generieren, erzeugen sie Folgen mit zu vielen Wechseln also zu kurze Subfolgen eines bestimmten Ereignisses und zuwenig Abweichungen von den erwarteten Häufigkeiten der möglichen Ereignisse. Sie unterschätzen das Ausmaß an Fluktuation in Zufallsfolgen. 7.) Dieses Phänomen wird wie folgt erklärt: Menschen haben eine bestimmte Vorstellung von Zufall und Zufallsfolgen. Man nennt eine solche Vorstellung mentale Repräsentation. Ob eine Folge eine Zufallsfolge ist oder nicht, wird nach der Ähnlichkeit einer aufgetretenen Folge mit der mentalen Repräsentation von Zufallsfolgen beurteilt. Diese Ähnlichkeit nennt man auch Repräsentativität und die auf ihr basierende Urteilsregel Repräsentativitätsheu- ristik. In der Vorstellung der meisten Menschen haben Zufallsfolgen mehr Ordnung oder Struktur, als sie realiter haben. Entsprechend ist ihre Wahrnehmung verzerrt. Ein Grund dafür ist, daß Menschen ein hoch entwickeltes Bedürfnis nach dem Auffinden von Ordnung oder auch deren Konstruktion in ihrer Umgebung haben. 3
WS 2004/05 Urteilen und Entscheiden Prof. Dr. Johannes Becker 8.) Fast immer basieren Urteile auf Stichproben von Beobachtungen. Dabei ist zu berücksich- tigen, daß bei kleinen Stichproben die zufallsbedingte Variabilität der Daten (d.h. ihre Abweichungen vom eigentlichen Wert) größer ist als bei großen Stichproben und daß Mit- telwerte von Beobachtungen weniger Variabilität aufweisen als die Beobachtungen, auf denen sie beruhen. Die Antworten auf die in der Vorlesung vorgestellten Urteilsaufgaben zeigen, daß Menschen dennoch nicht akzeptieren, daß Abweichungen von erwarteten Wer- ten beispielsweise der Geburtenquote von Jungen bei kleinen Stichproben wahrscheinlicher sind als bei großen Stichproben. Dies gilt auch für Experten, wenn sie mit fachfremden Problemen zu tun haben. 9.) Stichproben von Beobachtungen können repräsentativ oder verzerrt sein. Auch offensicht- liche Stichprobenverzerrungen werden häufig im Urteil nicht berücksichtigt (Quizbeispiel). 10.) Durch Training läßt sich erreichen, daß Stichprobengröße und -verzerrung sich im Urteil niederschlagen. 11.) Wenn Informationen für Vorhersagezwecke benutzt werden, sind folgende Aspekte der be- nutzten Informationen zu beachten, a) ihre Reliabilität (Zuverlässigkeit): Reliabel ist eine Information – beispielsweise eine Zeugenaussage –, wenn sie zuverlässig das wiedergibt, worauf sie sich bezieht. Je un- reliabler eine Informationsquelle ist, desto höhere Schwankungen (Variabilität) weist sie auf. Ein Beispiel sind unzuverlässige Meßinstrumente, die bei jeder Messung einen anderen Wert anzeigen. b) ihre Fähigkeit zur Vorhersage: Die Vorhersagefähigkeit einer Information (z.B. Intelli- genzquotient) ist hoch, wenn sich mit ihr ein zukünftiges Ereignis (z.B. Berufserfolg) gut vorhersagen läßt. Eine Information hat keine allgemeine Vorhersagefähigkeit son- dern nur eine spezifische. Mit dem Intelligenzquotient läßt sich Eheglück nur schlecht vorhersagen. 12.) Reliabilität und Vorhersagefähigkeit hängen insofern zusammen als mit unreliablen Infor- mationen keine Vorhersagen möglich sind. Der Grund dafür ist, daß mangelnde Reliabilität die Zufallsfluktuation von Messungen einer Größe erhöht. 13.) Fatal ist, daß die größere Variabilität einer Information ihre subjektive Bedeutung für Vorhersagen erhöhen kann, auch wenn die höhere Variabilität auf mangelnde Reliabilität zurückgeht. 14.) Bei Größen mit Zufallsvariation folgen auf extrem hohe oder extrem niedrige Werte mit sehr viel höherer Wahrscheinlichkeit weniger extreme, also zur Mitte hin tendierende Werte als gleich extreme oder noch extremere Werte. Man nennt diesen rein statistisch begründeten Effekt Regressionseffekt. 15.) Menschliche Leistungen sind fast immer mit Zufallsfluktuation behaftet. Man erbringt nicht immer die gleiche Leistung, weil diese von sehr vielen Faktoren abhängig ist. Daher werden auch bei ihnen Regressionseffekte beobachtet. Auf gute Leistungen folgen meist weniger gu- te, auf schlechte Leistungen meist bessere. In der Alltagssprache werden Leistungsextreme häufig mit „guten bzw. schlechten Tagen“ begründet. Diese Interpretationen sind statisti- sche Interpretationen, da sie die Rolle des Zufalls bei diesen Schwankungen betonen. 4
WS 2004/05 Urteilen und Entscheiden Prof. Dr. Johannes Becker 16.) Formal gesehen sind Regressionseffekte immer dann zu erwarten, wenn der Zusammenhang (Korrelation) zwischen erster und zweiter Messung einer Größe bzw. zwischen Vorhersage- größe und vorgesagtem Kriterium nicht perfekt ist. Regressionseffekte werden mit abneh- mendem Zusammenhang immer ausgeprägter. Entsprechend müssen sich Vorsageurteile bei nicht perfektem Zusammenhang zu mittleren Werten hin bewegen. 17.) Liegt kein Zusammenhang zwischen zwei Größen vor, ist der mittlere Wert des Kriteriums die beste Vorhersage. 18.) Wie schwer es Menschen fällt, Zufallsfluktuationen in Beobachtungen richtig als solche zu interpretieren, zeigt sich auch darin, daß Regressionseffekte häufig nicht als Zufallsfluk- tuation sondern kausal interpretiert werden. Als Beispiele dafür wurden „Management by exception“ und die Fehlbewertung der Folgen von Lob und Tadel genannt. Sehr gute oder sehr schlechte Leistungen provozieren wertende Stellungnahmen, auf die mit hoher Wahr- scheinlichkeit weniger extreme Leistungen folgen. Diese Änderungen werden dann als Erfolg der Maßnahmen kausal interpretiert, obwohl sie nur Ausdruck von Zufallsschwankungen, also statistischer Natur sind. 19.) Regressionseffekte werden auch deswegen nicht als Ursache von Leistungsvariation ins Kal- kül gezogen, weil menschliche Urteile von extremen Werten besonders beeinflußt werden. Extreme Werte sind in der Wahrnehmung von Vorhersagevariablen auffällig und führen zu dem Glauben, daß sie mit extremen Werten im vorhergesagten Kriterium zusammengehen. 20.) Besonders schwer zu berücksichtigen sind Zufallsschwankungen, wenn Entscheidungen an- hand von Szenarios mit mehreren Informationsquellen, die alle einschränkt zuverlässig sind, getroffen werden müssen. Hier tendieren Menschen dazu, bestimmte Unsicherheiten zu eli- minieren und sich auf das wahrscheinlichste Szenario zu konzentrieren. Man nennt diese Strategie die Strategie der besten Vermutung. 21.) Zeitreihen von Beobachtungen können reinen Zufallscharakter haben. In diesem Fall folgen die Beobachtungen einer Linie parallel zur Abszisse, auf der die Zeit abgetragen ist. Von einem Trend spricht man, wenn die Linie zur Abszisse nicht parallel verläuft. Dies deutet auf ein systematisches Anwachsen oder Abnehmen der beobachteten Leistung über die Zeit hinweg. Ob der Trend systematischer Natur ist oder doch nur Zufall, läßt sich mit Methoden der statistischen Analyse von Zeitreihen untersuchen. 22.) Zwei einfache (schnelle aber ungenaue) Methoden, um eine Reihe von Beobachtungen auf ihren Zufallscharakter hin zu untersuchen, sind die Markierung der Variationsbreite und der Versuch, den nachfolgenden Wert anhand des vorangegangenen Werts vorherzusagen. 4 Heuristiken Wenn Menschen Urteile abgeben, stehen ihnen häufig Informationen aus verschiedenen Quellen zur Verfügung, die sie kombinieren müssen. Soll beispielsweise der Umsatz einer Firma im nächs- ten Jahr vorhergesagt werden, sind Informationen über den Umsatz des laufenden Jahres, über Markttrends, Wettbewerber, Marketingstrategien usw. zu berücksichtigen und für das Urteil zu- sammen zu fassen. Diese Aufgabe erfordert die Auswahl von Informationen aus der Umgebung und aus dem Gedächtnis, die Interpretation dieser Informationen, ihre Gewichtung und ihre 5
WS 2004/05 Urteilen und Entscheiden Prof. Dr. Johannes Becker Kombination zu einem Urteil. Da dies in den meisten Fällen eine Überforderung der menschli- chen Informationskapazität darstellt, bedienen sich Menschen vereinfachender Urteilsstrategien, die den Verarbeitungsaufwand reduzieren. Deren Anwendung produziert jedoch in manchen Si- tuationen Fehler, die bei einer aufwendigeren Verarbeitung nicht aufgetreten wären. Was als Urteilsfehler zu bezeichnen ist, folgt aus dem Vergleich der Urteile mit Vorschriften für die Selek- tion, Gewichtung und Kombination von Informationen, die aus der Wahrscheinlichkeitstheorie folgen. Wie zu zeigen sein wird, verletzen intuitive Urteile häufig diese Regeln. Eine erste Vorschrift ist, daß das Vertrauen in das eigene Urteil mit Zunahme der verarbei- teten Informationen wachsen sollte aber nur dann, wenn die verschiedenen Informationen, die kombiniert werden, nicht redundant sind. Völlige Redundanz wäre gegeben, wenn zwei gleiche Informationsstücke kombiniert würden. Meistens sind die kombinierten Informationsstücke in variierendem Ausmaß voneinander abhängig. Wenn beispielsweise Intelligenz auf Basis der aka- demischen Leistung und der Art der letzten Beschäftigung geschätzt werden soll, dann besteht partielle Abhängigkeit der beiden Informationsstücke, da akademische Leistung natürlich auch die Art der Beschäftigung mit beeinflußt. Je redundanter Informationsstücke sind, desto höher ist ihre Konsistenz. Diese auf Redundanz zurückgehende Konsistenz ist jedoch kein Indikator dafür, wie sehr man seinem Urteil vertrauen sollte. Für Konsistenz sorgt auch eine Urteilsstrategie, die man Repräsentativitätsheuristik nennt. Die Zugehörigkeit eines Objektes zu einer Klasse wird auf der Basis der Übereinstimmung oder Ähn- lichkeit von Objekt- und Klassenmerkmalen entschieden. Handelt es sich um Personen spricht man statt von Klassen von Stereotypen. Beispiele für Stereotypen sind der „Manager“ oder der „Professor“. Daß die Repräsentationsheuristik auch bei Vorhersagen angewendet wird, zeigt das Beispiel von Tom, dessen Studienfachwahl auf der Basis einer Persönlichkeitsbeschreibung von ihm vorherzu- sagen war. Es wurden die Fächer genannt, deren mentale Repräsentation die größte Ähnlichkeit (damit auch Konsistenz) mit der Persönlichkeitsbeschreibung aufwiesen. Liegen inkonsistente Informationen vor, die einander widersprechende Implikationen für das Ur- teil haben, dann tendieren Urteiler dazu, die Inkonsistenz zu beseitigen, indem eine der beiden inkonsistenten Informationen bei der Urteilsbildung negiert wird. Obwohl Konsistenz somit häufig vom Urteiler konstruiert wird und nicht in den Daten liegt, bestärkt sie die Urteiler in ihrem Vertrauen in ihr Urteil. Gestärkt wird das Vertrauen zudem durch extreme für die Vorhersage benutzte Informationsstücke, die eigentlich sofort Gedanken an das Regressionsphänomen wecken sollten. Somit kommt es dazu, daß die Informationsmerkmale, die Vertrauen in das Urteil auslösen, gerade die sind, die es erschüttern sollten. Man nennt dieses Phänomen Validitätsillusion. Eine zweite Vorschrift ist, auch dann statistisch zu denken, wenn das uns vertraute kausale Denken damit nicht vereinbar ist. Menschen haben die starke Tendenz nach Ursachenmustern zu suchen, wenn sie vorhersagen sollen. Das geht soweit, daß sie wie gesehen Kausalbeziehungen „entdecken“, wo keine sind. Kausales Denken unterscheidet sich jedoch in mancherlei Hinsicht von statistischem Denken. 1. Anders als die Natur von Ursachen sind Wahrscheinlichkeitstheorie und Statistik logische Systeme, die erlauben die Implikationen bestimmter Annahmen präzise zu beschreiben. Man denke an die Möglichkeit, erwartete Regressionseffekte präzise zu kalkulieren. 2. Kausales Denken ist unidirektional von Ursache zu Wirkung vorgehend. Im statistischen Denken kann die Beziehung zwischen Ursache (z.B. Anstrengung) und Effekt (z.B. Müdig- 6
WS 2004/05 Urteilen und Entscheiden Prof. Dr. Johannes Becker keit) in beiden Richtungen diskutiert werden. 3. Statistisches Denken basiert allein auf der logischen Struktur der Information, kausales Denken basiert auf Struktur und Inhalt. Exkurs zum Denken über wahrscheinliche Ursachen. Aufgrund vieler Untersuchungen zum kausalen Denken läßt sich sagen, daß 4 Typen von Argu- menten Kausalurteile beeinflussen, 1. das kausale Feld oder der kausale Kontext, in dem das Urteil gefällt wird, 2. verschiedene Hinweise auf kausale Beziehungen, z.B. zeitliche Ordnung (Ursache geht Wir- kung voraus), Kovariation, zeitlich-räumliche Nähe, Ähnlichkeit von Ursache und Wirkung, 3. Urteilsstrategien, mit denen 1. und 2. kombiniert werden, 4. Alternative Erklärungen, die die Stärke vorliegender kausaler Annahmen herabsetzen. Die 4 Punkte wurden am Beispiel des Brechens eines Uhrglases diskutiert, als dessen Ursache bedingt durch einen Wechsel des kausalen Feldes im einen Fall ein Hammerschlag angenommen wird, in anderen Fall im Rahmen einer Qualitätsprüfung nicht wie im ersten Fall eine einwirkende Kraft sondern ein Materialfehler verantwortlich gemacht wird. Wie verhält sich dieses kausale Denken von Menschen zur Logik der Wahrscheinlichkeitstheo- rie? Beim Taxi-Unfallflucht-Problem werden folgende Daten gegeben: 85% der Taxis in einer Stadt sind grün und 15% blau. Ein Zeuge identifiziert das betroffene Taxi als blau. Bei einem Test macht der Zeuge 80% richtige und 20% falsche Identifikationen. Werden Urteiler nach der Wahr- scheinlichkeit gefragt, daß ein blaues Taxi den Unfall verursacht hat, ist die typische Antwort 80%. Damit halten sich die Urteiler an die Zuverlässigkeit der Zeugenaussage d.h. an die spezifi- sche Information und ignorieren die allgemeine oder Grundrateninformation über die Häufigkeit der Taxis in der Stadt, die nach der Wahrscheinlichkeitstheorie mit berücksichtigt werden muß. Die richtige Antwort wäre 41%. Diverse Untersuchungen bestätigen die Tendenz, Grundraten zu ignorieren besonders dann, wenn sie anders als im Taxibeispiel wie in unserem Schülerbeispiel nicht explizit vorgegeben sind. Wer- den beim Taxiproblem nur Grundraten vorgegeben und keine spezifische Information, halten sich die Urteiler bei ihrem Urteil an die Grundrateninformation, wissen also um ihre Bedeutung. Die Wahrscheinlichkeit für „blaues Taxi“ wird mit 15% angegeben. Wie hat man vorzugehen? Wird zusätzlich zur Grundrate eine spezifische Information gegeben, muß nach den Regeln der Wahrscheinlichkeitstheorie die auf Basis der Grundrate geschätzte Wahrscheinlichkeit in dem Ausmaß durch die spezifische Information modifiziert werden, wie diese zuverlässig ist. Sehr viel besser gelingt Urteilern die richtige Kombination, wenn die Grundrate kausal interpretiert wer- den kann, beispielsweise wenn gesagt wird, daß 85% der Unfälle von grünen Taxis verursacht werden. Ein weiterer gegen die Logik der Wahrscheinlichkeitstheorie verstoßender Urteilsfehler ist die Verwechslung der bedingten Wahrscheinlichkeiten p(Y |X) und p(X|Y ). Die bedingte Wahr- scheinlichkeit bezeichnet die Wahrscheinlichkeit für ein Ereignis, wenn ein anderes Ereignis (die Bedingung) eingetreten oder gegeben ist. Die Bedingung steht immer hinter dem Querstrich in der Klammer). Wenn Ärzte, so hat sich gezeigt, die Wahrscheinlichkeit eines Tumors (z.B. Mammakarzinom, mit X bezeichnet) nach einem positiven Test (Mammographie, mit Y bezeichnet) einschätzen sollen, 7
WS 2004/05 Urteilen und Entscheiden Prof. Dr. Johannes Becker basieren sie ihr Urteil auf der bedingten Wahrscheinlichkeit p(positiver Test unter der Bedingung Tumor, p(Y |X)), also der Zuverlässigkeit des Tests. Richtig wäre, für das Urteil die bedingte Wahrscheinlichkeit p(Tumor unter der Bedingung positiver Test, p(X|Y )) zu verwenden. Bei- de Wahrscheinlichkeiten sind nur dann gleich groß, wenn p(X) = p(Y ). Die Wahrscheinlichkeit p(X) ist aber in vielen Fällen weitaus höher als p(Y ). Dann wird dem Patienten eine völlig über- höhte Wahrscheinlichkeit für eine Krebserkrankung mitgeteilt und möglicherweise eine unnötig belastende Behandlung gewählt. Der Grund für die beschriebene Tendenz, die beiden bedingten Wahrscheinlichkeiten zu verwechseln, ist, so wird spekuliert, daß man zunächst vom Testresultat erfährt und daraus den Tumor erschließt. Diese zeitliche Reihenfolge, die der kausal relevanten zuwider läuft, führt zur Bevorzugung von p(Y |X). Ein dritter systematischer Fehler wird Konjunktionsfehler genannt. Fragt man nach der Wahr- scheinlichkeit dafür, daß Tom (a) als Studienfach Journalistik auswählt, (b) mit der Entscheidung schnell unglücklich ist und (c) zu Elektrotechnik wechselt, wird für das Szenario aus den drei Einzelereignissen eine höhere Eintretenswahrscheinlichkeit geschätzt als für die Einzelereignisse. Die Logik der Wahrscheinlichkeitstheorie besagt jedoch, daß die Szenariowahrscheinlichkeit nicht größer sein kann als die kleinste Einzelwahrscheinlichkeit. Der Grund für diesen Fehler liegt darin, daß die Urteiler sich bei ihrer Schätzung nicht nur auf die Struktur des Szenarios stützen sondern auch auf den Inhalt oder die Bedeutung. Die Einzelereignisse bilden in unserem Beispiel eine kau- sal kohärente und damit hoch plausible Geschichte. Die Plausibilität der Geschichte liegt dann in einem solchen Fall über der der Einzelereignisse mit der Folge, daß sie auch wahrscheinlicher ist. Liegen indirekte Informationen über kausale Verknüpfungen vor, können sie Fehlinterpretationen von Konjunktionen induzieren, wie das Supermarkt-Kaffee Experiment belegt. Der Konjunktionsfehler ist auch bei Experten beobachtet worden. Darin liegt eine nicht zu un- terschätzende Gefahr. Experten entwerfen zukünftige Szenarios, um sich schon in der Gegenwart auf sie vorbereiten zu können. Solche Szenarios sind kausal kohärent konstruiert. Damit wächst aber die Gefahr, daß ihre Wahrscheinlichkeit deutlich überschätzt wird, wie viele Beispiele (z.B. Prognosen des Club of Rome) belegen. Nicht immer geben Urteiler zu kühne Schätzungen ab. Konservativ sind sie, wenn Meinungen aufgrund neuer Informationen zu revidieren sind. Folgende Situation demonstriert dies. Vor dem Urteiler stehen zwei Gefäße. In dem einen Gefäß befinden sich 700 rote und 300 blaue Spiel- marken, in dem anderen 700 blaue und dreihundert rote Spielmarken. Per Zufall wird eine der beiden Gefäße ausgewählt. Das Gefäß mit den mehrheitlich roten Marken vor sich zu haben be- trägt also 50%. Nun zieht man per Zufall aus dem ausgewählten Gefäß nacheinander 12 Marken, wobei jede sofort wieder zurückgelegt wird. Von ihnen sind 8 rot und 4 blau. Wie groß ist die Wahrscheinlichkeit, das „rote“ Gefäß erwischt zu haben? Die Urteile bewegen sich zwischen 70% und 80%. Richtig sind 97%. Die Urteiler ändern also aufgrund der neuen Information nicht in dem Maße ihre Meinung wie vorgeschrieben. Der Grund dafür ist wahrscheinlich, daß Menschen nicht wie vorgeschrieben die Wahrscheinlichkeit des Stichprobenergebnisses unter der Hypothese, „das Gefäß ist mehrheitlich rot“ und der Alternativhypothese „das Gefäß ist mehrheitlich blau“ evaluieren sondern nur unter der aufgestellten Hypothese. Im Alltag ist dies häufig auch sehr schwierig, weil die Alternativhypothese meist nicht klar definiert werden kann. Wie immer wieder angedeutet sind Urteile das Ergebnis des Zusammenspiels von Aufgaben- struktur und den Eigenschaften der menschlichen Informationsverarbeitung. So hängt wie schon erwähnt das Urteil vom Aufgabenkontext als einem wichtigen Aspekt der Aufgabenstruktur ab. Ein gutes Beispiel sind Urteile über die für Vorhersageurteile so wichtige 8
WS 2004/05 Urteilen und Entscheiden Prof. Dr. Johannes Becker Variabilität von Reizen. Bei gleich großer objektiver Variabilität zweier Zahlenreihen erscheint diejenige mit den kleineren Zahlen als die variablere. Die absolute Größe der Zahlen ist der Hintergrund oder Kontext, auf dem die Variabilität beurteilt wird. Eine Urteilsstrategie, die für die Schätzung von Häufigkeiten von großer Bedeutung ist, die sog. Verfügbarkeitsheuristik. Menschen suchen für ihr Urteil nicht nur in ihrer Umgebung nach Hinweisen sondern auch in ihrem Gedächtnis. Wenn man sich Beispiele für eine bestimmte Art von Ereignis sehr gut ins Gedächtnis rufen kann (Leichtigkeit der Erinnerung) verglichen mit ei- nem anderen Ereignis, führt das dazu, daß man die Häufigkeit dieses Ereignisses höher einschätzt. Die Schätzung der Scheidungsrate im eigenen Land ist stark davon beeinflußt, wie viele Geschie- dene man in seiner Bekanntschaft hat. Hat man vor kurzem einen Verkehrsunfall beobachtet, überschätzt man die Häufigkeit von Unfällen. Bei Schätzungen der Häufigkeit von Todesursa- chen werden die Ursachen überschätzt, über die häufig in den Medien berichtet wird. Obwohl Verfügbarkeit keine schlechte Strategie ist, kann sie doch unter den angesprochenen Bedingungen zu Urteilsverzerrungen führen. Eine besonders bei quantitativen Urteilen immer wieder benutzte Strategie, die sehr stark von der gerade verfügbaren Information abhängig ist, ist die Anker-Anpassungsheuristik. Wenn man beispielsweise die Umsätze für das nächste Jahr schätzen soll, ist es durchaus vernünftig, von den Verkaufszahlen des letzten Jahres auszugehen (man nennt dies den Anker) und aufgrund von Überlegungen wie Gewicht der Konkurrenz, Konjunktur, Produkterneuerung eine Anpassung des Ausgangswerts vorzunehmen. Auch diese Strategie führt häufig zu guten Ergebnissen. Ihre Problematik liegt in der Generierung des Ankers. Wie sich herausgestellt hat, werden auch völlig irrelevante Informationen als Anker gewählt. In einem Experiment hatten Urteiler die Zahl der afrikanischen Staaten in der UNO zu schätzen. Die Experimentatoren generierten mittels eines Glücksrades eine Zufallszahl und ließen die Urteiler ein Groburteil fällen (Liegt die Zahl afri- kanischer UNO-Mitgliedsstaaten über oder unter der Glücksradzahl). Die anschließende genaue Schätzung war dramatisch abhängig vom irrelevanten Anker. Urteiler, die eine hohe Glücksrad- zahl zugespielt bekommen hatten, gaben weitaus höhere Schätzungen ab als Urteiler, die eine niedrige Glücksradzahl erhalten hatten. Die Art und Weise, wie Informationen präsentiert werden, kann ihre Bedeutung für das Urteil beeinflussen. Einige Beispiele dafür sind: - Informationen, die am Anfang oder am Ende einer Folge von Informationen dargeboten werden, haben ein größeres Gewicht für das Urteil (primacy-Effekt, recency-Effekt), obwohl aus normativer Sicht die Stellung einer Information in einer Folge für ihre Bedeutung belanglos ist. - Die Präsentation von zuvielen Informationen führt dazu, manche Informationen unter den Tische fallen zu lassen. - Informationen, die in Negativform präsentiert werden, sind schwieriger zu verarbeiten. - Anscheinend vollständige Informationen können Urteiler blind dafür machen, daß wichtige Informationen fehlen. - Auch wenn adäquate statistische Informationen vorliegen, können Urteiler durch die Art der Benennungen der Informationen in die Irre geführt werden. Die Schwierigkeiten und Fehlermöglichkeiten bei der Kombination von Informationen für Vor- hersagezwecke sind wie die letzten Veranstaltungen gezeigt haben, vielfältig. Was ist zu tun? Die Lösung für diese Probleme, das zeigen viele Untersuchungen, ist ein strikt mechanisches 9
WS 2004/05 Urteilen und Entscheiden Prof. Dr. Johannes Becker Vorgehen bei der Bestimmung der Vorhersagevalidität und -reliabilität von Informationen sowie deren Gewichtung und Kombination. So etwas ist erreichbar durch die Anwendung statistischer Modelle z.B. Regressionsgleichungen. Lange Zeit hat man geglaubt, daß solche mechanischen Vorhersagemethoden nicht annähernd die Fähigkeiten menschlicher Urteiler der Verarbeitung komplexer Informationen erreichen könnten. Nachdem man die Vorhersagegüte statistischer Modelle und menschlicher Urteiler im Bereich der klinischen Psychologie und der Vorhersage akademischer Leistungen miteinander verglichen hatte, ergab sich ein anderes Bild. Statistische Methoden waren Urteilern weit überlegen. In an- deren Feldern wie etwa im ökonomischen Bereich wurde das Gleiche beobachtet. Warum ist das so? 1. Statistische Modelle gewichten Informationen für die Vorhersage nach ihrer Zuverlässigkeit und Validität. Menschen fällt dies schwer. 2. Statistische Methoden sind konsistent, Menschen nicht. Diese werden müde oder langweilen sich oder beachten zu unterschiedlichen Zeiten unterschiedliche Informationen. 3. Häufig wissen Urteiler nicht, was sie tun, hier also, wie sie verschiedene Informationen ge- wichten. Dies ist um so stärker der Fall, je erfahrener die Urteiler in ihrem Bereich sind. Der Grund dafür ist, daß jede sich wiederholende Tätigkeit einen automatischen Charakter bekommt. Ein Merkmal automatisierter kognitiver Strategien ist aber, daß sie weitgehend ohne bewußte Kontrolle ablaufen. Eine Konsequenz davon ist auch, daß eingefahrene Stra- tegien nur schwer zu verändern sind. 4. Menschen glauben daß sie viele Informationsstücke beachten, obwohl Modelle, die auf der Basis nur weniger Hinweise Vorhersagen machen, menschliche Urteile wesentlich besser reproduzieren. Gegen die Verwendung statistischer Modelle gibt es einige Einwände. 1. Sie setzen quantitative Daten voraus. 2. Man benötigt eine hinreichende Zahl von Fällen aus der Vergangenheit. 3. Die Annahme muß gerechtfertigt sein, daß das in der Vergangenheit benutzte statistische Modell auch in der Zukunft gilt. Auch wenn diese Einwände nicht falsch sind, so hat sich doch gezeigt, daß sie in der Praxis nicht so schwer wiegen. Quantifiziert man qualitative Daten so stellt dies eine Verfälschung ihres Charak- ters dar, ihre Prognosefähigkeit leidet jedoch nur wenig. Ähnliches gilt für das zweite Argument. Auch wenn nur wenige Daten vorliegen sind, führt der Einsatz statistischer Methoden z.B. die Berechnung von Mittelwerten zu besseren Prognosen. Das dritte Argument gilt gleichermaßen für statistische Regeln wie für Regeln, die von Urteilern eigenhändig konstruiert wurden. Zusammenfassend läßt sich sagen, daß der große Vorteil statistischer Methoden das ist, was Menschen an ihnen stört, die mechanische Rigidität, mit der sie vorhersagen und Entscheidun- gen treffen. Sie handeln nie, wie Menschen es häufig tun, ad hoc. Natürlich gibt es Situationen, in denen keine statistischen Modelle angewandt werden können z.B. immer dann, wenn keine Erfahrungswerte vorliegen. Verbesserungen des Urteils lassen sich aber auch für solche Situatio- nen erreichen, wenn man sich über die Eigenarten menschlicher Urteile und über systematische Urteilsfehler bei Menschen im Klaren ist, da dann auf dieser Basis Gegenmaßnahmen getroffen werden können. Ein Seminarbeispiel zeigt, wie man so etwas realisieren kann. Vielleicht läßt sich eine Analogie zum Sport ziehen: nur Übung verbessert die Leistung. 10
Sie können auch lesen