Spielerlust und Spielerfrust in 50 Jahren Lotto - ein Beispiel f ur visuell gesteuerte Datenanalyse
←
→
Transkription von Seiteninhalten
Wenn Ihr Browser die Seite nicht korrekt rendert, bitte, lesen Sie den Inhalt der Seite unten
Spielerlust und Spielerfrust in 50 Jahren Lotto – ein Beispiel f ür visuell gesteuerte Datenanalyse A NDREAS E ICHLER , B IELEFELD Zusammenfassung: 50 Jahre Lotto laden dazu ein, 2 Erforschung der Spieleinsätze im Lotto den gewaltigen Datensatz von über 2500 Ausspie- Es geht im Folgendenen darum, die Besonderheiten lungen des Samstagslottos zu erforschen. In die- in dem Datensatz zu sehen und die nachfolgenden sem Artikel wird ein Teilbereich untersucht: das Untersuchungsschritte anhand der grafischen Dar- Tipp-Verhalten der Spieler in Abhängigkeit von dem stellungen zu konzipieren. Ausgangspunkt ist dabei sich ändernden normativen Spiel-Modells hinsicht- der Datensatz zum Lottospiel so, wie er im Netz vor- lich der Spielregeln und Tipp-Preise. An die Daten- handen ist. Ein erster, noch unbedarfter Schritt be- analyse schließt sich eine didaktische Erörterung des steht in der grafischen Darstellung der Spieleinsätze Beispiels unter Beachtung der momentanen Tenden- seit 1955. zen der Stochastikdidaktik an. 1 Einführung Seit fast 50 Jahren bewegen 6 kleine Kugeln die deut- schen Spielerherzen. Nach einem eher bescheidenen Anfang am 9. Oktober 1955, als rund eine Million Spieltipps einen Spieleinsatz von 500 000 D-Mark ergaben und die 10 Hauptgewinner mit 5 Richtigen jeweils etwa 13 000 D-Mark einstrichen, entwickelte sich das deutsche Volks-Glücksspiel rasant und zieht mittlerweile mit Rekord-Jackpots von vielen Euro- Abb. 1: Entwicklung der Spieleinsätze im Samstags- Millionen ganz Deutschland in seinen Bann. lotto von 1955 bis heute in D-Mark Theoretisch ist das Lotto-Spiel nahezu vollständig ausgeleuchtet. Zum Beispiel, dass der Einzelne so Auffallend ist hier zunächst zweierlei. Offensicht- gut wie keine Chance auf den Hauptgewinn hat, lich wächst der eingesetzte Betrag kontinuierlich an, es sei denn, er trifft tatsächlich eine von nahezu nur in den letzten Jahren scheinen die Einsätze ein- 140 Millionen Möglichkeiten – was vergleichbar zubrechen. Die letzte Besonderheit ist schnell ge- mit dem richtigen Tipp auf eine einzelne Sekunde klärt, da es sich um die Spieleinsätze nach der Euro- in rund viereinhalb Jahren ist – ist hinlänglich be- Einführung im Jahr 2002 handelt. Eine Umrechnung kannt. Ebenso sind die Wahrscheinlichkeiten für alle aller Beträge in die neue Währung Euro ergibt das Trefferanzahlen, für Zwillinge, Drillinge oder sons- folgende Bild. tige Besonderheiten in Einfach- oder Systemtipps ausführlich diskutiert worden.1 Wie aber lässt sich abseits der theoretischen Über- legungen zum Lotto das tatsächliche Spielverhalten der Glücksritter beschreiben? 50 Jahre Lotto (das sind über 2500 Samstagsausspielungen) laden gera- de dazu ein, sich in dem gewaltigen Datensatz, der im Netz frei zur Verfügung steht2 , auf die Suche nach Mustern und Besonderheiten zu machen. Da- zu wird im Folgenden der Spieleinsatz im Sams- tagslotto im Sinne eines Datendetektivs“ (Biehler Abb. 2: Entwicklung der Spieleinsätze im Samstags- ” lotto von 1955 bis heute in Euro (1997)) untersucht und durch einen Ausblick auf weitere Möglichkeiten ergänzt. Abschließend wer- den didaktische Anmerkungen zur Behandlung des Im Sinne einer nicht weiter nachfragenden Statistik Lotto-Beispiels in der Schule formuliert. wäre man hier fast am Ende der Analyse angelangt. 2 Stochastik in der Schule 26(2006)2 S. 2–11
Die Punktwolke ruft geradezu nach dem Einfügen ei- Da der Preis für einen Lotto-Tipp nicht konstant ist, ner Gerade, die ob nach Augenmaß oder mit der Me- bietet das Merkmal Spieleinsatz (in Euro) zwar einen thode der kleinsten Quadrate schnell eingefügt ist Eindruck über die Einnahmen des deutschen Lotto- Blocks, verschleiert aber die Veränderung des Tipp- y = 1611800 · x − 3151500000 Verhaltens. In der grafischen Darstellung der Tipp- Anzahlen seit 1955 wird nämlich deutlich, was schon (wenn y den Spieleinsatz und x das Jahr bezeich- bei der ersten Betrachtung der Preiserhöhungen zu net). Die Güte der linearen Abhängigkeit ist hoch vermuten ist: Insbesondere die erste Preiserhöhung (r ≈ 0, 96), die erklärte Varianz (bzw. das Bestimmt- hat zwar die Einnahmen des deutschen Lotto-Blocks heitsmaß) ebenso (r 2 ≈ 0, 92). nur wenig beeinflusst, aber offenbar eine Schock- Doch es gibt beim genaueren Hinschauen und eben- welle ausgelöst, die bis heute fortwirkt. So hat sich so beim eingehenderen Einbezug des Sachkontexts die Anzahl der abgegebenen Tipps mit der Preis- noch eine Fülle von Fragen zu stellen und Besonder- erhöhung 1981 von rund 170 Millionen auf rund 100 heiten zu entdecken, die ein weiteres Beschäftigen Millionen nahezu halbiert und ist seitdem weitge- mit der Punktwolke fruchtbar erscheinen lassen: hend konstant geblieben (wobei die Betonung hier- bei auf weitgehend liegt! Vgl. Abb. 3). Auch die 1. Gab es in der Lottogeschichte Preiserhöhun- (gleichzeitige) Erhöhung der Gewinnobergrenze auf gen? Wo kann man diese entdecken und wie 3 Millionen D-Mark hat offenbar den ungeheuren haben sie sich ausgewirkt? Einbruch der Tipp-Zahlen nicht verhindern können. Vermutlich ist die Einführung des Mittwochslottos – 2. Hat sich die Wiedervereinigung der beiden zunächst als Spiel 7 aus 38 – der (erfolgreiche) Ver- deutschen Staaten, bei der sich die Zahl der such, die Lotto-Flucht auszugleichen. potenziellen Lotto-Spieler schlagartig um ein Viertel erhöhte, in einer deutlichen Mehrein- nahme des deutschen Lottoblocks gezeigt? 3. Wie sind die punktuellen Abweichungen von dem Hauptstrang der Lotto-Einnahmen, die so gut durch eine Gerade repräsentiert werden können, zu erklären? Die drei Fragen, denen im Folgenden nachgegangen werden soll, zielen auf ein tieferes Eintauchen in den Datensatz, die Verbindung des Sachkontexts und der Daten sowie das grafikgesteuerte und detektivische Abb. 3: Entwicklung der Tipp-Anzahl im Samstags- Aufspüren von Besonderheiten in den zunächst leb- lotto von 1955 bis heute losen Zahlenkolonnen. Auch ohne die vertiefte mathematische Beschrei- 2.1 Spieleinsatz und Tipp-Preise bung einzelner Phasen lohnt sich ein Blick auf Eine e-mail an die offizielle Lotto-Kontaktadresse er- die weiteren Preiserhöhungen, die offensichtlich bei gibt folgende Informationen zu den verschiedenen Weitem nicht die Wirkung der ersten zeigen. Eine Er- Preiserhöhungen im Lotto: Ein Lotto-Tipp kostete klärung mag in der weniger drastischen Erhöhung, aber auch in flankierenden Maßnahmen liegen. So • 50 Pfennige vom 9.10.1955 bis zum 27.6.1981 ging seit 1981 jede Preiserhöhung mit Erweiterun- (ab dem 1.1.1958 musste der Mindesteinsatz gen des Spiels einher, möglicherweise, um die Preis- allerdings 1 D-Mark betragen); erhöhung durch ebenfalls erhöhte Attraktivität abzu- • 1 D-Mark vom 4.7.1981 bis zum 30.11.1991; federn. So gibt es seit dem 7. Dezember 1991 (Preis- erhöhung auf 1,25 D-Mark) die Gewinnklassen I (6er • 1,25 D-Mark vom 7.12.1991 bis zum mit Superzahl) und VII (3er mit Zusatzzahl). 15.5.1999 und Die Einführung der (neuen) Gewinnklasse I mach- • 1,50 D-Mark bzw. 0,75 Euro (wobei hier te den bereits seit 1985 bestehenden Jackpot oh- vereinfachend der Umrechnungsfaktor 2 von ne Gewinnobergrenze erst interessant:3 Er wird erst Euro zu D-Mark genommen wird) ab dem dann fesselnd, wenn er sich füllt. Im Zeitraum von 22.5.1999. 1985 bis zur Einführung der Superzahl Ende 1991 3
gab es allerdings in rund 250 Ausspielungen nur sie- weiter thematisiert werden. ben, in denen die damalige Gewinnklasse I (’Sech- ser’) nicht belegt war. In keinem Fall folgten zwei Ein deutlich sichtbares Charakteristikum der Zeitrei- Nicht-Belegungen der ersten Gewinnklasse aufein- hen sowohl hinsichtlich des Spieleinsatzes als auch ander, so dass zwar prinzipiell der Aufbau eines Jack- der Tipps besteht in den außergewöhnlichen Daten- pots möglich war, faktisch aber nicht stattfand. punkten, die weit ober- bzw. unterhalb der Haupt- masse der Daten liegen. Diese werden später ausführ- lich betrachtet. 2.2 Spieleinsatz vor und nach der Vereinigung 20 Prozent mehr potenzielle Lotto-Spieler hat die Wiedervereinigung der beiden deutschen Staaten dem Lotto-Block beschert. Das müsste sich doch auch in den Spieleinsätzen bzw. den Anzahlen der abgegebenen Tipps nach 1990 (bzw. nach 1989) Abb. 4: Belegung der ehemaligen Gewinnklasse I niederschlagen. Tut es aber nicht, zumindest weni- vom 1.6.1985 bis zum 30.11.1991 ger, als man es erwarten könnte. Die Boxplots der Tipps in den Jahren um die Wiedervereinigung zei- Erst die Einführung der Superzahl und damit die Ver- gen einen hinsichtlich des Medians und des ersten kleinerung der Wahrscheinlichkeit um den Faktor 10, und dritten Quartils zwar sichtbaren, jedoch geringen einen Tipp in der (neuen) Gewinnnklasse I (’Sechser Anstieg von den Jahren 1988 und 1989 zu den Jahren mit Superzahl’) zu landen, ermöglichte in mehreren 1990 und 1991. Fällen den Aufbau eines Jackpots über mehr als zwei Ausspielungen. Dennoch lässt sich in der Zeitreihe zu den insgesamt abgegebenen Tipps erkennen, dass auch schon die Einführung des Jackpots 1985 den Abwärtstrend stoppen konnte. Welche weiteren Verbindungen kann man zwischen dem Ringen des deutschen Lotto-Blocks um Spie- ler und den Daten erkennen? Da gibt es die beiden ’Knicks’ oder ’Sprünge’ in der offenbar nahezu li- near verlaufenden Entwicklung bis 1981 (vgl. Abb. 3). Beide können durch Neuerungen im Lotto-Spiel erklärt werden. Der erste ’Knick’ liegt in der Mitte der 60er Jahre und fällt damit mit dem Beginn der Abb. 5: Entwicklung der Spieleinsätze in der Zeit der Fernsehübertragungen der Lottoziehung am 4. Sep- Wiedervereinigung tember 1965 zusammen. Es lässt sich vermuten, dass die Werbewirksamkeit der Fernsehübertragung den Prozentual beträgt der Anstieg der Tipps von 1989 zu Anstieg der Tipp-Anzahlen verursacht hat. 1990 rund 3,4 Prozent und gibt einen höchstens sehr Der zweite ’Knick’ Mitte der 70er Jahre fällt mit vagen Hinweis, dass sich die Anzahl der potenziel- der Anhebung des Höchstgewinns von 500 000 auf len Spieler stark erhöht hat. So ist etwa der Anstieg 1,5 Millionen D-Mark am 1. Januar 1974 zusam- der Tipps vom Jahr 1987 auf das Jahr 1988 deutlich men, die offenbar weitere Spieler mobilisierte bzw. größer (rund 4,7 Prozent). Ein möglicherweise den- die vermehrte Anzahl von Tipps der bisherigen Spie- noch bestehender Effekt der Wiedervereinigung auf ler bedingte. In der Zeit schließlich nach 1985 scheint die Anzahl der abgegebenen Tipps überlagert sich sich die Erholung der Tipp-Zahlen bis etwa 2002 spätestens ab Ende 1991 mit einer Spieländerung im zu erstrecken. Danach gehen die Tipp-Zahlen wieder Lotto, die sehr viel deutlicher Effekte zeigt – nämlich zurück. Ob dies mit der wirtschaftlichen Stimmung die Einführung der Superzahl und der damit verbun- in Deutschland, der Einführung des Euro oder auch dene temporär enorme Anstieg des Jackpots sowie der Zusammenlegung der Mittwochs- und Samstags- der Tipp-Anzahlen. Dieser temporäre Anstieg soll ziehung im Lotto zusammenhängt, soll hier nicht abschließend untersucht werden. 4
2.3 Auswirkungen von Jackpots auf das Dass sich erst ab einer Länge der 0-Serie von mindes- Tipp-Verhalten tens 3 der Spieleinsatz sichtbar erhöht, ist zwar qua- Die Entwicklung der Tipp-Anzahl (vgl. Abb. 3) wie litativ in der Grafik erkennbar, andere Einflüsse, wie auch der Spieleinsätze (vgl. Abb. 2) zeigt zwei Grup- etwa die insgesamt bestehende Abnahme an Tipps pen oder Cluster von Datenpunkten, die deutlich von zu Beginn dieses Jahrhunderts, stören jedoch dieses den ’normalen’ Tipp-Anzahlen bzw. Spieleinsätzen Bild. Es scheint daher von Nutzen zu sein, einzelne abweichen. Entwicklungen des Jackpot-Aufbaus zu betrachten. Die Erklärung für die Gruppe der nach un- ten abweichenden Tipp-Anzahlen scheint banal zu sein (es sind drei nicht-zusammenhängende Lotto- Ausziehungen des Jahres 2001). Mit Blick auf den gesamten Datensatz handelt es sich offenbar um einen Fehler in der Datenerfassung, in dem der Spieleinsatz des Mittwochslottos fälschlicherweise für den Samstag (und umgekehrt) verwendet wurde. Die Spieleinsätze des Mittwochs-Lottos, das seit dem 2. Dezember 2000 mit den gleichen Regeln wie das Samstags-Lotto gespielt wird und damit schlicht Abb. 7: Tipps in Abhängigkeit von der Länge einer einen weiteren Termin des Samstagslottos darstellt, 0-Serie ist in der unten stehenden Grafik in die bekannte Zeitreihe eingefügt. Eine Beobachtung, die hier nicht Dazu bietet sich die längste 0-Serie aus dem Jahr weiter verfolgt werden soll, ist die – trotz gleicher 1994 an. Hier blieb zwischen dem 2. Juli und dem Spielregeln und zusammengelegter Jackpots – deut- 10. September die Gewinnklasse I zehn Wochen lang lich niedrigere Tipp-Anzahl des Mittwochs- (einge- unbesetzt. kreist) gegenüber dem Samstags-Lotto. Abb. 8: Tipps in Abhängigkeit von der Länge einer 0-Serie zwischen dem 2. Juli und 10. Sep- Abb. 6: Tipps im Mittwochs- und Samstagslotto seit tember 1994 Dezember 2000 Rein qualitativ erkennt man drei Phasen: die Phase, Eingehender sollen die nach oben abweichenden in der wenig oder nichts passiert, die Phase eines Tipp-Anzahlen seit 1991 untersucht werden. Eine sprunghaften Anstiegs der abgegebenen Tipps, und erste Analyse des Datensatzes bestätigt die plausi- am Ende dieser kurzen Zeitreihe deutet sich mögli- ble Vermutung, dass den sichtbaren ’Ausreißern’ ei- cherweise eine Phase der Ermüdung an. Mathema- ne mehrwöchige Phase des Jackpot-Aufbaus voran- tisch sollen im Folgenden zwei Modelle zur Be- gegangen ist.4 Betrachtet man insgesamt den Zusam- schreibung dieses Phänomens verwendet werden, ei- menhang zwischen der Länge der 0-Serien, d.h. die ne elementare, stückweise lineare Funktion sowie die Anzahl der Ausspielungen ohne Besetzung der Ge- logistische Funktion zur Beschreibung von Wachs- winnklasse I (Sechser mit Superzahl), und der An- tumsprozessen: zahl der abgegebenen Tipps, so ergibt sich zunächst ein diffuses Bild (vgl. Abb. 7). 5
der Tipp-Markt quasi abrupt gesättigt ist und keine g1 x≤5 weitere Steigerung der Tippzahlen zulässt. g2 −g1 f (x) := 4 · (x − 5) + g1 für 5 < x ≤ 9 Ein anderes, aber mathematisch komplexeres Modell g2 x>9 bietet die logistische Funktion, die die allmähliche l1 Sättigung der Tippanzahlen beschreibt und hier etwa g(x) := + l4 1 + l2 · e−l3 ·x folgende Gestalt hat:6 Beiden mathematischen Modellen ist gemein, dass 228 · 106 sie ein Supremum besitzen, nämlich g1 im linearen g(x) := + 84 · 106 1 + 293 · e−0,7765·x und l1 + l4 im logistischen Modell. Obwohl das Modell plausibler zu sein scheint, ist Elementar lassen sich die drei genannten Phasen hier das einfachere lineare Modell hinsichtlich der zunächst mit dem linearen Modell bestimmen (vgl. Summe der Residuenquadrate überlegen. So ist diese Abb. 9). Mathematisch sind nur die konstanten An- Summe rund halb so groß wie im zweiten Modell. teile der stückweise linearen Funktion zu schätzen bzw. in die Punktwolke einzupassen. Die lineare Die Sättigung ist im ersten Modell bei einem Wert Funktion mit positiver Steigung ergibt sich durch die von etwa 280 · 106 erreicht, im zweiten Modell bei Zwei-Punkt-Form der Gerade (unter der vernünfti- einer Tipp-Anzahl von etwa 300 · 106 . gen Annahme, dass die Funktion an den Enden des durch die zweite Phase gegebenen Intervalls keine Sprungstellen hat).5 Abb. 10: Tipps in Abhängigkeit von der Länge einer 0-Serie zwischen dem 2. Juli und dem 10. September 1994 Abb. 9: Tipps in Abhängigkeit von der Länge einer 0-Serie zwischen dem 2. Juli und 10. Sep- Ohne auf eine weitere Residuen- oder Regressions- tember 1994 analyse, die den Schulrahmen sprengen würde, ein- zugehen, soll abschließend vielmehr der Frage nach- An dieser Stelle wird keine Optimierung der Anpas- gegangen werden, ob beide oder zumindest eines der sung für notwendig erachtet, auch wenn sie über die beiden Modelle geeignet ist, auch die anderen An- abschnittsweise Berechnung der Regressionsgerade stiege von Tipp-Anzahlen bei längeren 0-Serien zu mit Hilfe der Minimierung der Summe der Residuen- repräsentieren. Eine solche Modell-Überprüfung ist quadrate (bzw. der Abweichungsquadrate) möglich nicht zuletzt dadurch unbedingt erforderlich, dass es wäre. auf einer einzigen 0-Serie und die Modell-Annahme Wichtigeres Ergebnis ist hier, dass per Augenmaß ei- einer Sättigungsphase allein auf einem Datum basiert ne die Punktwolke sinnvoll repräsentierende Funkti- (obwohl die Annahme einer wie auch immer gearte- on eingepasst werden kann. Die Gleichung der linea- ten Sättigung bzw. Beschränkung der Tipp-Anzahlen ren Funktion hat hier etwa folgende Gestalt: selbstverständlich plausibel ist). 95 · 106 x≤5 Es gibt in der Geschichte des Jackpots nach 1991 f (x) := 6 6 182 · 10 · x − 816 · 10 für 5 < x ≤ 9 fünf weitere Serien, in denen sieben Wochen lang 277 · 106 x>9 die Gewinnklasse I unbesetzt blieb. Diese sollen im Folgenden betrachtet werden. Die weiteren acht Se- Dieses elementar zu erstellende Modell hat im Sach- rien mit einer Länge von sechs Wochen sowie die kontext den Nachteil, dass man davon ausgeht, dass kürzeren Serien werden hier nicht beachtet, da sich 6
der sprunghafte Anstieg der Tipp-Anzahlen nach den bisherigen Beobachtungen erst bei längeren Serien Deskriptiv müsste man bei der bestehenden Modell- zeigt. annahme die die Steigung der Funktionen beinflus- Es zeigt sich hinsichtlich des gewählten Modells, senden Parameter ändern, etwa in: dass die Jackpotserien in drei Gruppen zerfallen. Zunächst gibt es drei Jackpotserien (Klasse 1), zu de- 88 · 106 nen das bzw. die gewählten linearen bzw. logitischen x≤5 f (x) := 6 6 26 · 10 · x − 42 · 10 für 5 < x ≤ 12 Modelle passen (auch wenn in diesen Serien keine 270 · 106 x > 12 Sättigung erkennbar ist). 228 · 106 g(x) := + 80 · 106 1 + 293 · e−0,641·x Die geänderte Steigung könnte als allmählicher An- stieg und als Erreichen der Sättigungsphase erst ab einer Länge der 0-Serie von 12 Wochen interpretiert werden. Für das lineare Modell sind hier die Parame- ter unter der Annahme der gleichen absoluten Tipp- Zunahme wie in der ersten Klasse von Jackpotserien konstruiert worden. Abb. 11: Klasse 1 der Jackpotserien Der in der Grafik zu sehende ’Doppelgraph’ erklärt sich durch die Gleichschaltung des Samstag- und des Mittwochslottos ab dem 2. Dezember 2000. Ab die- sem Zeitpunkt wird der Jackpot vom Samstag auf den Mittwoch und umgekehrt übernommen. In der Grafik ist sowohl für die Samstagsausspie- lungen als auch die Mittwochsausspielungen allein das logistische Modell verwendet worden. Das li- neare Modell lässt sich analog verwenden. Es zeigt Abb. 13: Klasse 2 der Jackpotserien, lineares und lo- sich, dass einerseits die Tipps am Mittwoch deut- gistisches Modell lich geringer sind als am Samstag, und dass in diesen Ohne weiteren Zusatz ist so eine Modellvariie- beiden Jackpotserien der absolute Zuwachs nahezu rung natürlich unbefriedigend. Interessant wird die- identisch ist. Das heißt, die gewählten Modellen sind se, wenn man die Zeitpunkte der unterschiedlichen bis auf eine vertikale Translation (also ein Startni- Jackpotserien mit einbezieht: Die zunächst betrach- veau bezüglich der Tipps) identisch. teten drei Jackpotserien könnte man (wenn man so Daneben gibt es zwei weitere Jackpotserien (Klasse will) als Ausdruck der aufgestauten Jackpotlust der 2), die einen deutlich geringeren Anstieg der Tipp- Spieler bezeichnen. Die eine ist die erste Jackpotse- Anzahlen offenbaren. rie überhaupt. Vor den beiden anderen hatte dagegen über fünf respektive über zweieinhalb Jahre keine Jackpotserie mehr als sechs Wochen bestanden. Die beiden Jackpotserien mit einem geringeren Anstieg der Tippanzahlen folgten einer vorangehenden Jack- potserie nach weniger als einem dreiviertel Jahr. Der weitaus geringere Anstieg der Tippanzahlen könnte also durch eine gewisse Jackpotmüdigkeit begründet sein. Schließlich gibt es noch eine Jackpotserie, bei der überhaupt kein Anstieg der Tipp-Anzahlen erkenn- Abb. 12: Klasse 2 der Jackpotserien bar ist (vgl. Abb. 12). 7
Ist hier möglicherweise die Neutralisierung der ver- 3 Anmerkungen zum didaktischen ringerten Jackpotlust (der letzte Jackpot liegt knapp Nutzen neun Monate zurück) und die Unsicherheit mit der Im Folgenden sollen zunächst zwei Anmerkungen zu Einführung des Euro zu beobachten? einer Verwendung des Lotto-Beispiels in der Schu- le gemacht werden. Anschließend werden wenige Nach- und einige Vorteile bzw. Möglichkeiten dieses Beispiels diskutiert. 3.1 Das Lotto-Beispiel in der Schule Bei der Verwendung des Lotto-Datensatzes in der Schule sind natürlich Herangehensweisen möglich und denkbar, die von dem hier vorgestellten Model- lierungsgang abweichen. Etwa könnte man zunächst mit der Punktwolke zu den Tipp-Anzahlen oder mit Abb. 14: Jackpotserie ohne Anstieg der Tipp- einem weiter veränderten Datensatz beginnen. Hier Anzahlen sollte dagegen allein der nicht vorkonstruierte Gang beschrieben werden, der mit dem Datensatz so be- Wenn auch Vieles auf Grund der schmalen Datenba- ginnt, wie er im Netz verfügbar ist (dieser enthält sis unsicher bleibt, die gewählten Modelle ermögli- z.B. keine Angaben über die Tipp-Anzahlen). chen dennoch eine Beschreibung des Spielerverhal- tens in längeren Jackpotserien, die hinsichtlich des Es wurden zwei Modelle vorgestellt, ein lineares und Sachkontexts plausibel sind. Wie jede deskriptive ein logistisches. Das lineare ist sicher bereits in der Musteranpassung an einen Datensatz (hier die linea- Sekundarstufe I verfügbar. Mit diesem Modell las- re bzw. logistische Funktion) enthält auch diese das sen sich die wesentlichen Schritte der hier vorgestell- Potenzial für eine Prognose für zukünftige Jackpot- ten Datenanalyse durchführen. Das logistische Mo- serien. Diese umfasst folgende Vermutungen: dell ist dagegen allein für die Sekundarstufe II ge- eignet, etwa bei der übergreifenden Behandlung von • In längeren Jackpot- bzw. 0-Serien zeigt sich Wachstumsprozessen. nach etwa fünf Wochen gleichbleibender Tipp- Anzahlen eine Phase des sprunghaften An- 3.2 Grenzen des Lotto-Beispiels stiegs, die ab zehn bzw. mehr als zehn Wochen in eine Phase der Ermüdung übergeht. Im Sinne der in der Datenanalyse bzw. des anwen- dungsorientierten Mathematikunterrichts nicht auf- • Die Phase des Anstiegs in einer 0-Serie ist zuhebenden Trennung der Mathematik mit dem durch den Zeitabstand zur vorangegangenen 0- Sachkontext kann die Erforschung des Lotto- Serie bestimmt. 0-Serien mit einem Abstand Datensatzes erst dann ansetzen, wenn es für Schüle- zur vorangegangenen, der größer als zweiein- rinnen und Schüler sinnvoll ist, sich mit diesem halb Jahre ist, zeigen einen deutlich stärkeren Glücksspiel zu beschäftigen. Damit ist eine Behand- Anstieg als solche mit einem Abstand von we- lung dieses Beispiels erst am Ende der Sekundarstufe niger als einem Jahr zur vorangegangenen 0- I angemessen. Denn das verständige Entdecken setzt Serie (die mit einem Abstand zwischen einem einen gewissen Umgang mit Glücksspielen, mit Geld dreiviertel Jahr und zweieinhalb Jahren gibt es und mit den alltäglichen Medien, die über Lotto be- zurzeit nicht). richten, voraus. Auch im Sinne einer Verbindung von • Der absolute Anstieg der Tippanzahlen bei Explorativer Datenanalyse und der Wahrscheinlich- Jackpotserien ist im Mittwochs- und Sams- keitsrechnung sowie der Kombinatorik als ihr Hilfs- tagslotto nahezu identisch (der prozentuale ist mittel ist diese Einschränkung sinnvoll.7 damit im Mittwochslotto deutlich größer). Ein Erforschen der Lotto-Daten ohne den Rechner Inwieweit das bzw. die gewählten Modelle ist sinnlos. Obwohl dies im Sinne der allgemei- tatsächlich tragfähig für die Beschreibung von 0- nen didaktischen Diskussion keine Grenze, sondern Serien sind oder ob andere Modelle vorzuziehen eher eine Möglichkeit ist, scheint es in der offenbar sind, kann endgültig erst die Zukunft des Lotto- (noch?) überwiegend rechnerfreien Schul-Stochastik Spiels zeigen. zumindest momentan eine Grenze darzustellen.8 8
3.3 Möglichkeiten des Lotto-Beispiels Punktwolke bzw. einer Zeitreihe als spezieller Punkt- Die Möglichkeiten, die die Erforschung des Lotto- wolke durch eine Funktion stets eine Reduzierung Datensatzes umfasst, sollen anhand dreier Aspekte der Daten um den Zufall umfasst. skizziert werden. Diese Aspekte betreffen Wichtig ist ebenso die Verbindung zu anderen Leit- • die Formulierung von Standards des Ideen des Mathematikunterrichts, insbesondere zur Mathematik- und Stochastikunterrichts, etwa Leitidee des funktionalen Zusammenhangs. So ist in der Leitidee Daten und Zufall durch die ein wesentlicher Aspekt der Analyse der Lotto-Daten Kultusministerkonferenz (KMK (2003)), die Verwendung einer oder mehrerer Funktionen zur Beschreibung quantitativer Zusammenhänge“ ” • die Prinzipien der Explorativen Datenanalyse, (KMK (2003, S. 15). Die Funktion ist hier ein ideales wie sie von Tukey et al. (1982) formuliert und Muster zur Beschreibung der Realität. seitdem in vielen didaktischen Arbeiten zitiert An dieser Stelle soll dennoch betont werden, dass der und ausgestaltet wurden, sowie Lotto-Datensatz kein didaktisch konstruiertes, be- • die Phasen des statistischen Denkens, das als sonders wertvolles Beispiel darstellt, durch das der daten- und realitätsorientiertes Pendant des Gedanke der Funktion als modellhafte Beschreibung stochastischen Denkens seit einiger Zeit in der von Daten herausragend berührt wird. Vielmehr han- Stochastikdidaktik diskutiert wird (vgl. Pfann- delt es sich bei dem Lotto-Datensatz um ein reichhal- kuch/Wild (1999)). tiges Entdeckungsfeld, das eben auch die Musterer- kennung in Daten bzw. eine Funktionsanpassung in Diese drei Aspekte sollen im Folgenden kurz präzi- einer Zeitreihe ermöglicht. Der Gedanke einer Pro- siert und auf das Lotto-Beispiel bezogen werden. gnose ist hier als Zusatz zu verstehen, ermöglicht Standards Die Kultusministerkonferenz veröffent- aber den Einstieg in eine grundlegendere Behand- lichte 2003 allgemeinverbindliche Standards für den lung von Prognosen auf Grund statistischer Daten. Stochastikunterricht in der Sekundarstufe I, die in Im Sinne eines Spiralcurriculums tauchen die in den neu gestaltete Lehrpläne der einzelnen Bundesländer Standards formulierten Ideen auch in Überlegungen eingegangen sind bzw. eingehen werden. Zu die- zum Mathematikunterricht in der Sekundarstufe II sen Standards, die eine wesentliche Verringerung der auf (vgl. etwa Borneleit et al. (2000)) und sind damit Wahrscheinlichkeitsrechnung zugunsten der Daten- auf der Basis komplexerer mathematischer Betrach- analyse umfassen, gehören: tungsweisen übertragbar. • die Planung, Durchführung und Auswertung Prinzipien der Explorativen Datenanalyse Prin- von statistischen Erhebungen, zipiell kann die Explorative Datenanalyse im Ge- • die systematische Datensammlung und -aufbe- gensatz zur klassischen Beschreibenden Statistik reitung insbesondere mit grafischen Verfahren als Umkehrung eines Bearbeitungsablaufs Modell– unter Verwendung des Rechners, Datenerhebung und -auswertung verstanden werden (vgl. Borovcnik/Ossimitz (1984)). So geht es um das • die Interpretation der Daten mit Hilfe von detektivische Durchforsten eines Datensatzes mit ei- Kenngrößen, ner möglichst flexiblen Verwendung der statistischen Methoden, um Besonderheiten und Muster zu entde- • die Verbindung von Realität und Mathematik cken, die dann Grundlage für das Aufstellen eines durch die Interpretation von Argumenten, die Modells sein können. Grundlage dieses induktiven auf der Datenanalyse beruhen und Vorgehens sind (vgl. Tukey et al. (1982)) • die Beschreibung von Zufallsphänomenen in • die zentrale Verwendung grafischer Methoden alltäglichen Situationen und deren mathemati- (eine Grafik sagt mehr als 1000 Worte), sche Modellierung mit Wahrscheinlichkeiten. • die Verwendung robuster Methoden, etwa der Während die Planung der Datenerhebung in diesem Einsatz von Median (bzw. Quantilen) sowie Beispiel keine Rolle spielt, werden die übrigen Stan- zugehöriger Streuparameter und dards offenbar bedient, wobei der Analyseprozess stets durch die in den Standards zentral genannten • die Clusterung von Daten, d.h. die Ein- grafischen Verfahren gesteuert wird. Auch der letz- schränkung der Datenanalyse aus sachlichen te Punkt wird angesprochen, da das Ersetzen einer Gründen auf einen Teil der Daten. 9
Die Steuerung des Analyseprozesses der Lotto- Das Erkennen der Notwendigkeit statistischer Daten Daten geschieht bei dem hier beschriebenen Vorge- zur Beschreibung und Beurteilung eines Sachkon- hen offensichtlich auf Grund der grafischen Darstel- texts ist hier vorweggenommen und prinzipiell eher lungen. Man untersucht, was man sieht und versucht, eine Anforderung an allgemeine Problemlöseprozes- das Gesehene mathematisch bzw. statistisch zu fas- se, bei der die Bezugnahme auf statistische Daten sen und mit dem Sachkontext zu verbinden. nicht offensichtlich ist. Die Verwendung robuster Methoden als Prinzip der Die flexible Repräsentation der Daten ist ein wesent- Explorativen Datenanalyse kann und sollte nicht liches Moment der Analyse der Lotto-Daten. Dabei mehr rigider Bestandteil der schulischen Datenanaly- ist die Analyse geleitet durch die im vorangegan- se sein. So geht es – insbesondere mit Hilfe des Rech- genen Abschnitt diskutierten Prinzipien der Explo- ners – vielmehr um ein verständiges Einsetzen aller rativen Datenanalyse. Sie umfasst die unterschied- statistischer Methoden. Dabei meint verständig, dass lichen grafischen Darstellungen, die Reduktion auf man unterschiedliche Methoden wie etwa das arith- statistische Maßzahlen und schließlich die Darstel- metische Mittel oder den Median im Bewusstsein lungen ein und desselben Sachverhalts in verschie- der daraus möglicherweise unterschiedlichen Daten- dener Form auf Grund von Datentransformationen. interpretationen einsetzen kann. In der Analyse der Die Variabilität der Lotto-Daten zum Spieleinsatz Lotto-Daten sind robuste und nicht-robuste Metho- bzw. zur Zahl der abgegebenen Tipps ist in jeder den vermischt. Diese Mischung wird etwa bei der Phase des Analyseprozesses sichtbar. Im Zusammen- Anpassung eines Funktionsgraphen an die Punktwol- hang mit dem Einbinden der Daten in Modelle geht ken sichtbar, z.B. bei der Frage, ob man versucht, es um den zentralen Aspekt des statistischen Den- die Summe der Abweichungsquadrate zu minimie- kens: Die Aufteilung der statistischen Daten in ein ren, oder ob man sich von anderen (und damit zu- Muster (bzw. ein mathematisches Modell) und Resi- meist robusteren) mathematischen Methoden leiten duen (bzw. Zufall). Die mathematischen Muster be- lässt. stehen etwa in der Reduktion der Datenvielfalt auf ei- Die Clusterung ist in der Analyse der Lotto-Daten ein ne Funktion, die prinzipiell Trends der Spieleinsätze durchgängiges Prinzip. So werden die Cluster von oder der Tipp-Anzahl beschreiben und zum Teil er- Spieleinsätzen, die durch unterschiedliche Währun- klären helfen und damit auch als Gundlage für (vor- gen entstehen, angeglichen. Gleiches geschieht mit sichtige) Prognosen dienen kann, die in der Zukunft den Clustern der Spieleinsätze bzw. der Tipps, die zu falsifizieren oder auch zu verifizieren sind. Diese sich hinsichtlich der unterschiedlichen Preisstufen mathematischen Modelle heben allerdings die Varia- in der Lottogeschichte ergeben. Schließlich werden bilität der Daten nicht auf, sondern stellen ein Muster ganz bestimmte Cluster herausgegriffen und geson- dar, um die die Daten streuen. dert untersucht, um ein Modell – hier die Tipp- Der Einbezug des Sachkontexts ist bei der Analy- Anzahl beim Ansteigen des Jackpots – zu erstellen. se des Lotto-Datensatzes unabdingbar. Deutlich wird Statistisches Denken Das statistsche Denken, das hier, wie die Veränderung eines normativen Modells bei Pfannkuch/Wild (1999) in ein umfassenderes die Daten hinsichtlich der betrachteten Merkmale Modell des Problemlösens eingebunden ist, enthält Spieleinsatz und Anzahl der abgegebenen Tipps be- folgende Phasen oder Katgorien: einflusst. D.h. die sich ändernden Spielregeln und Tipp-Preise steuern ebenso wie die als zufällig zu • Erkennen der Notwendigkeit realer Daten (re- betrachtenden 0-Serien das Verhalten der Spieler. cognition of the need for data), Der Sachkontext leitet schließlich die Konstruktion der Modelle, in dem etwa trotz der bisher denkbar • Flexible Repräsentation der relevanten Daten schlechten Datenlage allein aus Plausibilitätsgründen und deren Diskussion (transnumeration), von einer Sättigungsphase der Tippanzahlen ausge- • Einsicht in die Variabilität von und Muster in gangen wird. den Daten (consideration of variation), 4 Schlussbemerkung • Einbinden der Daten in statistische Modelle (reasoning with statistical models) und Die Analyse der Lotto-Daten birgt eine Möglichkeit, im Stochastikunterricht reale Daten im Sinne der für • Verbinden von Kontext und Statistik (integra- die Schule geforderten Standards der Leitidee Da- ting the statistical and contextual). ten und Zufall zu behandeln. Wesentliche auf statisti- 10
6 Die Parameter der logistischen Funktion sind hier mit fathom schen Grundbegriffen aufbauende Methoden können angepasst worden. Vgl. Anmerkung 5. zur Analyse verwendet werden. 7 Beispielsweise ist in Niedersachsen die elementare Behand- Dabei ist es möglich, die Methoden je nach Klas- lung des Lotto-Spiels auf die Klasse 10 beschränkt (vgl. RRL (2003) oder Griesel/Postel (1996)). Unglücklich ist hier senstufe weitgehend elementar zu halten. Es ist aber die Trennung von Datenanalyse und Wahrscheinlichkeitsrech- ebenso möglich, mit sehr viel komplexeren mathe- nung, wobei die Datenanalyse quasi als kleine Schwester der matischen bzw. statistischen Methoden zu arbei- Wahrscheinlichkeitsrechnung in den unteren Klassen der Se- ten, wie dies nur im Vergleich der Modelle, die kundarstufe I behandelt wird. 8 Auch wenn es sicherlich viele Ausnahmen gibt, scheint die auf einer linearen bzw. logistischen Funktion basie- genannte These auf Grund von Erfahrungen in der Lehrer- ren, aufgezeigt wurde. Insbesondere die Optimierung fortbildung im Rahmen von SINUS sowie der Erforschung der Funktionsanpassung birgt Möglichkeiten oder von Lehrervorstellungen zum Stochastikunterricht (vgl. Eich- aber auch Probleme, die über die Schule hinauswei- ler (2005)) angemessen zu sein. sen. Darüber hinaus umfasst der Lotto-Datensatz die Möglichkeit, quasi nebenbei Elemente der Zeitrei- henanalyse zu behandeln und schließlich einen Ein- stieg in das Themenfeld Prognose zu leisten. Literatur Von den vielen Untersuchungsmöglichkeiten, die Borneleit, P., Danckwerts, R., Henn, H.- der Lotto-Datensatz bietet, ist in dieser Arbeit nur W., Weigand, H.-G. (2000): Exper- ein kleiner Aspekt ausgewählt worden, der Appe- tise zum Mathematikuntericht in der tit auf mehr machen soll. Die Untersuchung von gymnasialen Oberstufe. www.math.uni- Quoten, den sogenannten Narrenzahlen, kleinen und siegen.de/didaktik/downl/expertise.pdf. großen Katastrophen und nicht zuletzt die Verbin- Biehler, R. (1997): Auf Entdeckungsreise in Daten. dung des wahrscheinlichkeitstheoretischen Wissens In: mathematiklehren 97, 1997, 4-5. zum Lotto mit den empirischen Daten sind zukünf- Eichler, A. (2005): Individuelle Stochastikcurricula tige Betätigungmöglichkeiten für Datendetektive in von Lehrerinnen und Lehrern. Hildesheim: Franz- der 50jährigen Geschichte eines Glücksspiels, das becker. gleichermaßen die Öffentlichkeit wie auch die klei- Griesel, H., Postel, H. (1996, Hrsg): Elemente der nen und großen Mathematiker in seinen Bann ziehen Mathematik 10, Niedersachsen. Hannover: Schro- kann. edel. Pfannkuch, M., Wild, C. (1999): Statistical Thinking Anmerkungen in Empirical Enquiry. In: International Statistical 1 Stellvertetend für alle Lotto-Artikel kann hier die Fülle der Review 67(3) 1999, 223-248. Arbeiten von Strick (z.B. (2003)) gelten, der sich seit Jahr- Niedersächsisches Kultusministerium (2003, Hrsg.): zehnten mit dem Lotto beschäftigt. 2 Diese sind als txt-Datei auf der Webpage von Lotto- Rahmenrichtlinien für das Gymnasium, Klasse 7 – Rheinland-Pfalz zu finden (vgl. http://www.lotto-rlp.de). 10 Mathematik. Hannover: Schroedel. In diesem Datensatz sind leider manche Inkonsistenzen Sekretariat der Ständigen Konferenz der Kultusmi- enthalten. Einen bereinigten Datensatz im Excel oder nister der Länder in der Bundesrepublik Deutsch- fathom-Format erhält man auf der persönlichen Seite des Autors innerhalb folgender Homepage: http://www.tu- land (2003): Bildungsstandards im Fach Mathe- braunschweig.de/idm. matik für den Mittleren Schulabschluss. Bonn. 3 Beim Jackpot wird die prozentual festgelegte Gewinnaus- Tukey, P.A., Gnanadesikan, R., Kettering, J.R., Sie- schüttung der Gewinnklasse I (bis zum 7.12.1991 der ’Sech- gel, A.F. (1982): Themen aus der Datenanalyse: ser’, danach der ’Sechser’ mit Superzahl) zu der Gewinnaus- Begriffe, Methoden, Beispiele und Pädagogik. In: schüttung der nächsten Ziehung hinzugefügt, wenn es keinen (richtigen) Tipp in der Gewinnklasse I gab. Der Mathematikunterricht 28(1) 1982, 28-56. 4 Die Software fathom unterstützt diesen ersten Analyseprozess sehr gut. So können einzelne Datenpunkte markiert und zu diesen alle erhobenen Merkmale in einer Infobox angezeigt Anschrift des Verfassers werden. Letztere erlaubt wiederum das leicht handhabbare Andreas Eichler Betrachten der Vorgänger- oder Nachfolge-Ziehungen. 5 Die Verwendung von fathom ermöglicht eine sehr einfach Institut für Didaktik der Mathematik zu handhabende Eingabe einer Funktion in ein bestehendes Universität Bielefeld Diagramm. Die zu schätzenden Parameter lassen sich durch Postfach 10 01 31 Schieberegler wiederum sehr leicht anpassen. Zudem gibt es 33501 Bielefeld die Möglichkeit, sich die Summe der Residuenquadrate zu ei- andreas.eichler@uni-bielefeld.de ner eingepassten Funktion anzeigen zu lassen. 11
Sie können auch lesen