Spielerlust und Spielerfrust in 50 Jahren Lotto - ein Beispiel f ur visuell gesteuerte Datenanalyse

 
WEITER LESEN
Spielerlust und Spielerfrust in 50 Jahren Lotto – ein Beispiel f ür visuell
gesteuerte Datenanalyse
A NDREAS E ICHLER , B IELEFELD

Zusammenfassung: 50 Jahre Lotto laden dazu ein,          2 Erforschung der Spieleinsätze im Lotto
den gewaltigen Datensatz von über 2500 Ausspie-         Es geht im Folgendenen darum, die Besonderheiten
lungen des Samstagslottos zu erforschen. In die-         in dem Datensatz zu sehen und die nachfolgenden
sem Artikel wird ein Teilbereich untersucht: das         Untersuchungsschritte anhand der grafischen Dar-
Tipp-Verhalten der Spieler in Abhängigkeit von dem      stellungen zu konzipieren. Ausgangspunkt ist dabei
sich ändernden normativen Spiel-Modells hinsicht-       der Datensatz zum Lottospiel so, wie er im Netz vor-
lich der Spielregeln und Tipp-Preise. An die Daten-      handen ist. Ein erster, noch unbedarfter Schritt be-
analyse schließt sich eine didaktische Erörterung des   steht in der grafischen Darstellung der Spieleinsätze
Beispiels unter Beachtung der momentanen Tenden-         seit 1955.
zen der Stochastikdidaktik an.

1 Einführung
Seit fast 50 Jahren bewegen 6 kleine Kugeln die deut-
schen Spielerherzen. Nach einem eher bescheidenen
Anfang am 9. Oktober 1955, als rund eine Million
Spieltipps einen Spieleinsatz von 500 000 D-Mark
ergaben und die 10 Hauptgewinner mit 5 Richtigen
jeweils etwa 13 000 D-Mark einstrichen, entwickelte
sich das deutsche Volks-Glücksspiel rasant und zieht
mittlerweile mit Rekord-Jackpots von vielen Euro-        Abb. 1: Entwicklung der Spieleinsätze im Samstags-
Millionen ganz Deutschland in seinen Bann.                       lotto von 1955 bis heute in D-Mark
Theoretisch ist das Lotto-Spiel nahezu vollständig
ausgeleuchtet. Zum Beispiel, dass der Einzelne so        Auffallend ist hier zunächst zweierlei. Offensicht-
gut wie keine Chance auf den Hauptgewinn hat,            lich wächst der eingesetzte Betrag kontinuierlich an,
es sei denn, er trifft tatsächlich eine von nahezu      nur in den letzten Jahren scheinen die Einsätze ein-
140 Millionen Möglichkeiten – was vergleichbar          zubrechen. Die letzte Besonderheit ist schnell ge-
mit dem richtigen Tipp auf eine einzelne Sekunde         klärt, da es sich um die Spieleinsätze nach der Euro-
in rund viereinhalb Jahren ist – ist hinlänglich be-    Einführung im Jahr 2002 handelt. Eine Umrechnung
kannt. Ebenso sind die Wahrscheinlichkeiten für alle    aller Beträge in die neue Währung Euro ergibt das
Trefferanzahlen, für Zwillinge, Drillinge oder sons-    folgende Bild.
tige Besonderheiten in Einfach- oder Systemtipps
ausführlich diskutiert worden.1

Wie aber lässt sich abseits der theoretischen Über-
legungen zum Lotto das tatsächliche Spielverhalten
der Glücksritter beschreiben? 50 Jahre Lotto (das
sind über 2500 Samstagsausspielungen) laden gera-
de dazu ein, sich in dem gewaltigen Datensatz, der
im Netz frei zur Verfügung steht2 , auf die Suche
nach Mustern und Besonderheiten zu machen. Da-
zu wird im Folgenden der Spieleinsatz im Sams-
tagslotto im Sinne eines Datendetektivs“ (Biehler        Abb. 2: Entwicklung der Spieleinsätze im Samstags-
                          ”                                      lotto von 1955 bis heute in Euro
(1997)) untersucht und durch einen Ausblick auf
weitere Möglichkeiten ergänzt. Abschließend wer-
den didaktische Anmerkungen zur Behandlung des           Im Sinne einer nicht weiter nachfragenden Statistik
Lotto-Beispiels in der Schule formuliert.                wäre man hier fast am Ende der Analyse angelangt.

2                                                                     Stochastik in der Schule 26(2006)2 S. 2–11
Die Punktwolke ruft geradezu nach dem Einfügen ei-      Da der Preis für einen Lotto-Tipp nicht konstant ist,
ner Gerade, die ob nach Augenmaß oder mit der Me-        bietet das Merkmal Spieleinsatz (in Euro) zwar einen
thode der kleinsten Quadrate schnell eingefügt ist      Eindruck über die Einnahmen des deutschen Lotto-
                                                         Blocks, verschleiert aber die Veränderung des Tipp-
      y = 1611800 · x − 3151500000                       Verhaltens. In der grafischen Darstellung der Tipp-
                                                         Anzahlen seit 1955 wird nämlich deutlich, was schon
(wenn y den Spieleinsatz und x das Jahr bezeich-         bei der ersten Betrachtung der Preiserhöhungen zu
net). Die Güte der linearen Abhängigkeit ist hoch      vermuten ist: Insbesondere die erste Preiserhöhung
(r ≈ 0, 96), die erklärte Varianz (bzw. das Bestimmt-   hat zwar die Einnahmen des deutschen Lotto-Blocks
heitsmaß) ebenso (r 2 ≈ 0, 92).                          nur wenig beeinflusst, aber offenbar eine Schock-
Doch es gibt beim genaueren Hinschauen und eben-         welle ausgelöst, die bis heute fortwirkt. So hat sich
so beim eingehenderen Einbezug des Sachkontexts          die Anzahl der abgegebenen Tipps mit der Preis-
noch eine Fülle von Fragen zu stellen und Besonder-     erhöhung 1981 von rund 170 Millionen auf rund 100
heiten zu entdecken, die ein weiteres Beschäftigen      Millionen nahezu halbiert und ist seitdem weitge-
mit der Punktwolke fruchtbar erscheinen lassen:          hend konstant geblieben (wobei die Betonung hier-
                                                         bei auf weitgehend liegt! Vgl. Abb. 3). Auch die
   1. Gab es in der Lottogeschichte Preiserhöhun-       (gleichzeitige) Erhöhung der Gewinnobergrenze auf
      gen? Wo kann man diese entdecken und wie           3 Millionen D-Mark hat offenbar den ungeheuren
      haben sie sich ausgewirkt?                         Einbruch der Tipp-Zahlen nicht verhindern können.
                                                         Vermutlich ist die Einführung des Mittwochslottos –
   2. Hat sich die Wiedervereinigung der beiden
                                                         zunächst als Spiel 7 aus 38 – der (erfolgreiche) Ver-
      deutschen Staaten, bei der sich die Zahl der
                                                         such, die Lotto-Flucht auszugleichen.
      potenziellen Lotto-Spieler schlagartig um ein
      Viertel erhöhte, in einer deutlichen Mehrein-
      nahme des deutschen Lottoblocks gezeigt?
   3. Wie sind die punktuellen Abweichungen von
      dem Hauptstrang der Lotto-Einnahmen, die so
      gut durch eine Gerade repräsentiert werden
      können, zu erklären?
Die drei Fragen, denen im Folgenden nachgegangen
werden soll, zielen auf ein tieferes Eintauchen in den
Datensatz, die Verbindung des Sachkontexts und der
Daten sowie das grafikgesteuerte und detektivische       Abb. 3: Entwicklung der Tipp-Anzahl im Samstags-
Aufspüren von Besonderheiten in den zunächst leb-              lotto von 1955 bis heute
losen Zahlenkolonnen.
                                                         Auch ohne die vertiefte mathematische Beschrei-
2.1 Spieleinsatz und Tipp-Preise                         bung einzelner Phasen lohnt sich ein Blick auf
Eine e-mail an die offizielle Lotto-Kontaktadresse er-   die weiteren Preiserhöhungen, die offensichtlich bei
gibt folgende Informationen zu den verschiedenen         Weitem nicht die Wirkung der ersten zeigen. Eine Er-
Preiserhöhungen im Lotto: Ein Lotto-Tipp kostete        klärung mag in der weniger drastischen Erhöhung,
                                                         aber auch in flankierenden Maßnahmen liegen. So
   • 50 Pfennige vom 9.10.1955 bis zum 27.6.1981         ging seit 1981 jede Preiserhöhung mit Erweiterun-
     (ab dem 1.1.1958 musste der Mindesteinsatz          gen des Spiels einher, möglicherweise, um die Preis-
     allerdings 1 D-Mark betragen);                      erhöhung durch ebenfalls erhöhte Attraktivität abzu-
   • 1 D-Mark vom 4.7.1981 bis zum 30.11.1991;           federn. So gibt es seit dem 7. Dezember 1991 (Preis-
                                                         erhöhung auf 1,25 D-Mark) die Gewinnklassen I (6er
   • 1,25 D-Mark vom 7.12.1991 bis zum                   mit Superzahl) und VII (3er mit Zusatzzahl).
     15.5.1999 und
                                                         Die Einführung der (neuen) Gewinnklasse I mach-
   • 1,50 D-Mark bzw. 0,75 Euro (wobei hier              te den bereits seit 1985 bestehenden Jackpot oh-
     vereinfachend der Umrechnungsfaktor 2 von           ne Gewinnobergrenze erst interessant:3 Er wird erst
     Euro zu D-Mark genommen wird) ab dem                dann fesselnd, wenn er sich füllt. Im Zeitraum von
     22.5.1999.                                          1985 bis zur Einführung der Superzahl Ende 1991

                                                                                                              3
gab es allerdings in rund 250 Ausspielungen nur sie-      weiter thematisiert werden.
ben, in denen die damalige Gewinnklasse I (’Sech-
ser’) nicht belegt war. In keinem Fall folgten zwei       Ein deutlich sichtbares Charakteristikum der Zeitrei-
Nicht-Belegungen der ersten Gewinnklasse aufein-          hen sowohl hinsichtlich des Spieleinsatzes als auch
ander, so dass zwar prinzipiell der Aufbau eines Jack-    der Tipps besteht in den außergewöhnlichen Daten-
pots möglich war, faktisch aber nicht stattfand.         punkten, die weit ober- bzw. unterhalb der Haupt-
                                                          masse der Daten liegen. Diese werden später ausführ-
                                                          lich betrachtet.

                                                          2.2 Spieleinsatz vor und nach der Vereinigung
                                                          20 Prozent mehr potenzielle Lotto-Spieler hat die
                                                          Wiedervereinigung der beiden deutschen Staaten
                                                          dem Lotto-Block beschert. Das müsste sich doch
                                                          auch in den Spieleinsätzen bzw. den Anzahlen der
                                                          abgegebenen Tipps nach 1990 (bzw. nach 1989)
Abb. 4: Belegung der ehemaligen Gewinnklasse I            niederschlagen. Tut es aber nicht, zumindest weni-
        vom 1.6.1985 bis zum 30.11.1991                   ger, als man es erwarten könnte. Die Boxplots der
                                                          Tipps in den Jahren um die Wiedervereinigung zei-
Erst die Einführung der Superzahl und damit die Ver-     gen einen hinsichtlich des Medians und des ersten
kleinerung der Wahrscheinlichkeit um den Faktor 10,       und dritten Quartils zwar sichtbaren, jedoch geringen
einen Tipp in der (neuen) Gewinnnklasse I (’Sechser       Anstieg von den Jahren 1988 und 1989 zu den Jahren
mit Superzahl’) zu landen, ermöglichte in mehreren       1990 und 1991.
Fällen den Aufbau eines Jackpots über mehr als zwei
Ausspielungen. Dennoch lässt sich in der Zeitreihe
zu den insgesamt abgegebenen Tipps erkennen, dass
auch schon die Einführung des Jackpots 1985 den
Abwärtstrend stoppen konnte.
Welche weiteren Verbindungen kann man zwischen
dem Ringen des deutschen Lotto-Blocks um Spie-
ler und den Daten erkennen? Da gibt es die beiden
’Knicks’ oder ’Sprünge’ in der offenbar nahezu li-
near verlaufenden Entwicklung bis 1981 (vgl. Abb.
3). Beide können durch Neuerungen im Lotto-Spiel
erklärt werden. Der erste ’Knick’ liegt in der Mitte
der 60er Jahre und fällt damit mit dem Beginn der        Abb. 5: Entwicklung der Spieleinsätze in der Zeit der
Fernsehübertragungen der Lottoziehung am 4. Sep-                 Wiedervereinigung
tember 1965 zusammen. Es lässt sich vermuten, dass
die Werbewirksamkeit der Fernsehübertragung den
                                                          Prozentual beträgt der Anstieg der Tipps von 1989 zu
Anstieg der Tipp-Anzahlen verursacht hat.
                                                          1990 rund 3,4 Prozent und gibt einen höchstens sehr
Der zweite ’Knick’ Mitte der 70er Jahre fällt mit        vagen Hinweis, dass sich die Anzahl der potenziel-
der Anhebung des Höchstgewinns von 500 000 auf           len Spieler stark erhöht hat. So ist etwa der Anstieg
1,5 Millionen D-Mark am 1. Januar 1974 zusam-             der Tipps vom Jahr 1987 auf das Jahr 1988 deutlich
men, die offenbar weitere Spieler mobilisierte bzw.       größer (rund 4,7 Prozent). Ein möglicherweise den-
die vermehrte Anzahl von Tipps der bisherigen Spie-       noch bestehender Effekt der Wiedervereinigung auf
ler bedingte. In der Zeit schließlich nach 1985 scheint   die Anzahl der abgegebenen Tipps überlagert sich
sich die Erholung der Tipp-Zahlen bis etwa 2002           spätestens ab Ende 1991 mit einer Spieländerung im
zu erstrecken. Danach gehen die Tipp-Zahlen wieder        Lotto, die sehr viel deutlicher Effekte zeigt – nämlich
zurück. Ob dies mit der wirtschaftlichen Stimmung        die Einführung der Superzahl und der damit verbun-
in Deutschland, der Einführung des Euro oder auch        dene temporär enorme Anstieg des Jackpots sowie
der Zusammenlegung der Mittwochs- und Samstags-           der Tipp-Anzahlen. Dieser temporäre Anstieg soll
ziehung im Lotto zusammenhängt, soll hier nicht          abschließend untersucht werden.

4
2.3 Auswirkungen von Jackpots auf das                    Dass sich erst ab einer Länge der 0-Serie von mindes-
    Tipp-Verhalten                                       tens 3 der Spieleinsatz sichtbar erhöht, ist zwar qua-
Die Entwicklung der Tipp-Anzahl (vgl. Abb. 3) wie        litativ in der Grafik erkennbar, andere Einflüsse, wie
auch der Spieleinsätze (vgl. Abb. 2) zeigt zwei Grup-   etwa die insgesamt bestehende Abnahme an Tipps
pen oder Cluster von Datenpunkten, die deutlich von      zu Beginn dieses Jahrhunderts, stören jedoch dieses
den ’normalen’ Tipp-Anzahlen bzw. Spieleinsätzen        Bild. Es scheint daher von Nutzen zu sein, einzelne
abweichen.                                               Entwicklungen des Jackpot-Aufbaus zu betrachten.

Die Erklärung für die Gruppe der nach un-
ten abweichenden Tipp-Anzahlen scheint banal zu
sein (es sind drei nicht-zusammenhängende Lotto-
Ausziehungen des Jahres 2001). Mit Blick auf den
gesamten Datensatz handelt es sich offenbar um
einen Fehler in der Datenerfassung, in dem der
Spieleinsatz des Mittwochslottos fälschlicherweise
für den Samstag (und umgekehrt) verwendet wurde.

Die Spieleinsätze des Mittwochs-Lottos, das seit dem
2. Dezember 2000 mit den gleichen Regeln wie
das Samstags-Lotto gespielt wird und damit schlicht      Abb. 7: Tipps in Abhängigkeit von der Länge einer
einen weiteren Termin des Samstagslottos darstellt,              0-Serie
ist in der unten stehenden Grafik in die bekannte
Zeitreihe eingefügt. Eine Beobachtung, die hier nicht   Dazu bietet sich die längste 0-Serie aus dem Jahr
weiter verfolgt werden soll, ist die – trotz gleicher    1994 an. Hier blieb zwischen dem 2. Juli und dem
Spielregeln und zusammengelegter Jackpots – deut-        10. September die Gewinnklasse I zehn Wochen lang
lich niedrigere Tipp-Anzahl des Mittwochs- (einge-       unbesetzt.
kreist) gegenüber dem Samstags-Lotto.

                                                         Abb. 8: Tipps in Abhängigkeit von der Länge einer
                                                                 0-Serie zwischen dem 2. Juli und 10. Sep-
Abb. 6: Tipps im Mittwochs- und Samstagslotto seit               tember 1994
        Dezember 2000
                                                         Rein qualitativ erkennt man drei Phasen: die Phase,
Eingehender sollen die nach oben abweichenden            in der wenig oder nichts passiert, die Phase eines
Tipp-Anzahlen seit 1991 untersucht werden. Eine          sprunghaften Anstiegs der abgegebenen Tipps, und
erste Analyse des Datensatzes bestätigt die plausi-     am Ende dieser kurzen Zeitreihe deutet sich mögli-
ble Vermutung, dass den sichtbaren ’Ausreißern’ ei-      cherweise eine Phase der Ermüdung an. Mathema-
ne mehrwöchige Phase des Jackpot-Aufbaus voran-         tisch sollen im Folgenden zwei Modelle zur Be-
gegangen ist.4 Betrachtet man insgesamt den Zusam-       schreibung dieses Phänomens verwendet werden, ei-
menhang zwischen der Länge der 0-Serien, d.h. die       ne elementare, stückweise lineare Funktion sowie die
Anzahl der Ausspielungen ohne Besetzung der Ge-          logistische Funktion zur Beschreibung von Wachs-
winnklasse I (Sechser mit Superzahl), und der An-        tumsprozessen:
zahl der abgegebenen Tipps, so ergibt sich zunächst
ein diffuses Bild (vgl. Abb. 7).

                                                                                                              5
der Tipp-Markt quasi abrupt gesättigt ist und keine
           
            g1                               x≤5         weitere Steigerung der Tippzahlen zulässt.
               g2 −g1
f (x) :=          4     · (x − 5) + g1   für 5 < x ≤ 9   Ein anderes, aber mathematisch komplexeres Modell
               g2                             x>9
           
                                                          bietet die logistische Funktion, die die allmähliche
                 l1                                       Sättigung der Tippanzahlen beschreibt und hier etwa
g(x) :=                     + l4
           1 + l2 · e−l3 ·x                               folgende Gestalt hat:6

Beiden mathematischen Modellen ist gemein, dass                                228 · 106
sie ein Supremum besitzen, nämlich g1 im linearen              g(x) :=                        + 84 · 106
                                                                          1 + 293 · e−0,7765·x
und l1 + l4 im logistischen Modell.
                                                          Obwohl das Modell plausibler zu sein scheint, ist
Elementar lassen sich die drei genannten Phasen
                                                          hier das einfachere lineare Modell hinsichtlich der
zunächst mit dem linearen Modell bestimmen (vgl.
                                                          Summe der Residuenquadrate überlegen. So ist diese
Abb. 9). Mathematisch sind nur die konstanten An-
                                                          Summe rund halb so groß wie im zweiten Modell.
teile der stückweise linearen Funktion zu schätzen
bzw. in die Punktwolke einzupassen. Die lineare           Die Sättigung ist im ersten Modell bei einem Wert
Funktion mit positiver Steigung ergibt sich durch die     von etwa 280 · 106 erreicht, im zweiten Modell bei
Zwei-Punkt-Form der Gerade (unter der vernünfti-         einer Tipp-Anzahl von etwa 300 · 106 .
gen Annahme, dass die Funktion an den Enden des
durch die zweite Phase gegebenen Intervalls keine
Sprungstellen hat).5

                                                          Abb. 10: Tipps in Abhängigkeit von der Länge einer
                                                                   0-Serie zwischen dem 2. Juli und dem 10.
                                                                   September 1994
Abb. 9: Tipps in Abhängigkeit von der Länge einer
        0-Serie zwischen dem 2. Juli und 10. Sep-         Ohne auf eine weitere Residuen- oder Regressions-
        tember 1994                                       analyse, die den Schulrahmen sprengen würde, ein-
                                                          zugehen, soll abschließend vielmehr der Frage nach-
An dieser Stelle wird keine Optimierung der Anpas-        gegangen werden, ob beide oder zumindest eines der
sung für notwendig erachtet, auch wenn sie über die     beiden Modelle geeignet ist, auch die anderen An-
abschnittsweise Berechnung der Regressionsgerade          stiege von Tipp-Anzahlen bei längeren 0-Serien zu
mit Hilfe der Minimierung der Summe der Residuen-         repräsentieren. Eine solche Modell-Überprüfung ist
quadrate (bzw. der Abweichungsquadrate) möglich          nicht zuletzt dadurch unbedingt erforderlich, dass es
wäre.                                                    auf einer einzigen 0-Serie und die Modell-Annahme
Wichtigeres Ergebnis ist hier, dass per Augenmaß ei-      einer Sättigungsphase allein auf einem Datum basiert
ne die Punktwolke sinnvoll repräsentierende Funkti-      (obwohl die Annahme einer wie auch immer gearte-
on eingepasst werden kann. Die Gleichung der linea-       ten Sättigung bzw. Beschränkung der Tipp-Anzahlen
ren Funktion hat hier etwa folgende Gestalt:              selbstverständlich plausibel ist).

          95 · 106
         
                                          x≤5             Es gibt in der Geschichte des Jackpots nach 1991
f (x) :=            6             6
           182 · 10 · x − 816 · 10 für 5 < x ≤ 9         fünf weitere Serien, in denen sieben Wochen lang
           277 · 106                      x>9             die Gewinnklasse I unbesetzt blieb. Diese sollen im
         
                                                          Folgenden betrachtet werden. Die weiteren acht Se-
Dieses elementar zu erstellende Modell hat im Sach-       rien mit einer Länge von sechs Wochen sowie die
kontext den Nachteil, dass man davon ausgeht, dass        kürzeren Serien werden hier nicht beachtet, da sich

6
der sprunghafte Anstieg der Tipp-Anzahlen nach den
bisherigen Beobachtungen erst bei längeren Serien
                                                          Deskriptiv müsste man bei der bestehenden Modell-
zeigt.
                                                          annahme die die Steigung der Funktionen beinflus-
Es zeigt sich hinsichtlich des gewählten Modells,        senden Parameter ändern, etwa in:
dass die Jackpotserien in drei Gruppen zerfallen.
Zunächst gibt es drei Jackpotserien (Klasse 1), zu de-
                                                                    88 · 106
                                                                   
nen das bzw. die gewählten linearen bzw. logitischen                                           x≤5
                                                          f (x) :=          6             6
                                                                     26 · 10 · x − 42 · 10 für 5 < x ≤ 12
Modelle passen (auch wenn in diesen Serien keine
                                                                     270 · 106                  x > 12
                                                                   
Sättigung erkennbar ist).

                                                                        228 · 106
                                                          g(x) :=                       + 80 · 106
                                                                    1 + 293 · e−0,641·x

                                                          Die geänderte Steigung könnte als allmählicher An-
                                                          stieg und als Erreichen der Sättigungsphase erst ab
                                                          einer Länge der 0-Serie von 12 Wochen interpretiert
                                                          werden. Für das lineare Modell sind hier die Parame-
                                                          ter unter der Annahme der gleichen absoluten Tipp-
                                                          Zunahme wie in der ersten Klasse von Jackpotserien
                                                          konstruiert worden.
        Abb. 11: Klasse 1 der Jackpotserien

Der in der Grafik zu sehende ’Doppelgraph’ erklärt
sich durch die Gleichschaltung des Samstag- und des
Mittwochslottos ab dem 2. Dezember 2000. Ab die-
sem Zeitpunkt wird der Jackpot vom Samstag auf
den Mittwoch und umgekehrt übernommen.

In der Grafik ist sowohl für die Samstagsausspie-
lungen als auch die Mittwochsausspielungen allein
das logistische Modell verwendet worden. Das li-
neare Modell lässt sich analog verwenden. Es zeigt       Abb. 13: Klasse 2 der Jackpotserien, lineares und lo-
sich, dass einerseits die Tipps am Mittwoch deut-                  gistisches Modell
lich geringer sind als am Samstag, und dass in diesen
                                                          Ohne weiteren Zusatz ist so eine Modellvariie-
beiden Jackpotserien der absolute Zuwachs nahezu
                                                          rung natürlich unbefriedigend. Interessant wird die-
identisch ist. Das heißt, die gewählten Modellen sind
                                                          se, wenn man die Zeitpunkte der unterschiedlichen
bis auf eine vertikale Translation (also ein Startni-
                                                          Jackpotserien mit einbezieht: Die zunächst betrach-
veau bezüglich der Tipps) identisch.
                                                          teten drei Jackpotserien könnte man (wenn man so
Daneben gibt es zwei weitere Jackpotserien (Klasse        will) als Ausdruck der aufgestauten Jackpotlust der
2), die einen deutlich geringeren Anstieg der Tipp-       Spieler bezeichnen. Die eine ist die erste Jackpotse-
Anzahlen offenbaren.                                      rie überhaupt. Vor den beiden anderen hatte dagegen
                                                          über fünf respektive über zweieinhalb Jahre keine
                                                          Jackpotserie mehr als sechs Wochen bestanden. Die
                                                          beiden Jackpotserien mit einem geringeren Anstieg
                                                          der Tippanzahlen folgten einer vorangehenden Jack-
                                                          potserie nach weniger als einem dreiviertel Jahr. Der
                                                          weitaus geringere Anstieg der Tippanzahlen könnte
                                                          also durch eine gewisse Jackpotmüdigkeit begründet
                                                          sein.
                                                          Schließlich gibt es noch eine Jackpotserie, bei der
                                                          überhaupt kein Anstieg der Tipp-Anzahlen erkenn-
        Abb. 12: Klasse 2 der Jackpotserien               bar ist (vgl. Abb. 12).

                                                                                                             7
Ist hier möglicherweise die Neutralisierung der ver-    3 Anmerkungen zum didaktischen
ringerten Jackpotlust (der letzte Jackpot liegt knapp      Nutzen
neun Monate zurück) und die Unsicherheit mit der
                                                         Im Folgenden sollen zunächst zwei Anmerkungen zu
Einführung des Euro zu beobachten?
                                                         einer Verwendung des Lotto-Beispiels in der Schu-
                                                         le gemacht werden. Anschließend werden wenige
                                                         Nach- und einige Vorteile bzw. Möglichkeiten dieses
                                                         Beispiels diskutiert.

                                                         3.1 Das Lotto-Beispiel in der Schule
                                                         Bei der Verwendung des Lotto-Datensatzes in der
                                                         Schule sind natürlich Herangehensweisen möglich
                                                         und denkbar, die von dem hier vorgestellten Model-
                                                         lierungsgang abweichen. Etwa könnte man zunächst
                                                         mit der Punktwolke zu den Tipp-Anzahlen oder mit
Abb. 14: Jackpotserie ohne Anstieg der Tipp-             einem weiter veränderten Datensatz beginnen. Hier
         Anzahlen                                        sollte dagegen allein der nicht vorkonstruierte Gang
                                                         beschrieben werden, der mit dem Datensatz so be-
Wenn auch Vieles auf Grund der schmalen Datenba-         ginnt, wie er im Netz verfügbar ist (dieser enthält
sis unsicher bleibt, die gewählten Modelle ermögli-    z.B. keine Angaben über die Tipp-Anzahlen).
chen dennoch eine Beschreibung des Spielerverhal-
tens in längeren Jackpotserien, die hinsichtlich des    Es wurden zwei Modelle vorgestellt, ein lineares und
Sachkontexts plausibel sind. Wie jede deskriptive        ein logistisches. Das lineare ist sicher bereits in der
Musteranpassung an einen Datensatz (hier die linea-      Sekundarstufe I verfügbar. Mit diesem Modell las-
re bzw. logistische Funktion) enthält auch diese das    sen sich die wesentlichen Schritte der hier vorgestell-
Potenzial für eine Prognose für zukünftige Jackpot-   ten Datenanalyse durchführen. Das logistische Mo-
serien. Diese umfasst folgende Vermutungen:              dell ist dagegen allein für die Sekundarstufe II ge-
                                                         eignet, etwa bei der übergreifenden Behandlung von
    • In längeren Jackpot- bzw. 0-Serien zeigt sich     Wachstumsprozessen.
      nach etwa fünf Wochen gleichbleibender Tipp-
      Anzahlen eine Phase des sprunghaften An-
                                                         3.2 Grenzen des Lotto-Beispiels
      stiegs, die ab zehn bzw. mehr als zehn Wochen
      in eine Phase der Ermüdung übergeht.             Im Sinne der in der Datenanalyse bzw. des anwen-
                                                         dungsorientierten Mathematikunterrichts nicht auf-
    • Die Phase des Anstiegs in einer 0-Serie ist        zuhebenden Trennung der Mathematik mit dem
      durch den Zeitabstand zur vorangegangenen 0-       Sachkontext kann die Erforschung des Lotto-
      Serie bestimmt. 0-Serien mit einem Abstand         Datensatzes erst dann ansetzen, wenn es für Schüle-
      zur vorangegangenen, der größer als zweiein-      rinnen und Schüler sinnvoll ist, sich mit diesem
      halb Jahre ist, zeigen einen deutlich stärkeren   Glücksspiel zu beschäftigen. Damit ist eine Behand-
      Anstieg als solche mit einem Abstand von we-       lung dieses Beispiels erst am Ende der Sekundarstufe
      niger als einem Jahr zur vorangegangenen 0-        I angemessen. Denn das verständige Entdecken setzt
      Serie (die mit einem Abstand zwischen einem        einen gewissen Umgang mit Glücksspielen, mit Geld
      dreiviertel Jahr und zweieinhalb Jahren gibt es    und mit den alltäglichen Medien, die über Lotto be-
      zurzeit nicht).                                    richten, voraus. Auch im Sinne einer Verbindung von
    • Der absolute Anstieg der Tippanzahlen bei          Explorativer Datenanalyse und der Wahrscheinlich-
      Jackpotserien ist im Mittwochs- und Sams-          keitsrechnung sowie der Kombinatorik als ihr Hilfs-
      tagslotto nahezu identisch (der prozentuale ist    mittel ist diese Einschränkung sinnvoll.7
      damit im Mittwochslotto deutlich größer).
                                                         Ein Erforschen der Lotto-Daten ohne den Rechner
Inwieweit das bzw. die gewählten Modelle                ist sinnlos. Obwohl dies im Sinne der allgemei-
tatsächlich tragfähig für die Beschreibung von 0-     nen didaktischen Diskussion keine Grenze, sondern
Serien sind oder ob andere Modelle vorzuziehen           eher eine Möglichkeit ist, scheint es in der offenbar
sind, kann endgültig erst die Zukunft des Lotto-        (noch?) überwiegend rechnerfreien Schul-Stochastik
Spiels zeigen.                                           zumindest momentan eine Grenze darzustellen.8

8
3.3 Möglichkeiten des Lotto-Beispiels                   Punktwolke bzw. einer Zeitreihe als spezieller Punkt-
Die Möglichkeiten, die die Erforschung des Lotto-       wolke durch eine Funktion stets eine Reduzierung
Datensatzes umfasst, sollen anhand dreier Aspekte        der Daten um den Zufall umfasst.
skizziert werden. Diese Aspekte betreffen                Wichtig ist ebenso die Verbindung zu anderen Leit-
   • die Formulierung von Standards des                  Ideen des Mathematikunterrichts, insbesondere zur
     Mathematik- und Stochastikunterrichts, etwa         Leitidee des funktionalen Zusammenhangs. So ist
     in der Leitidee Daten und Zufall durch die          ein wesentlicher Aspekt der Analyse der Lotto-Daten
     Kultusministerkonferenz (KMK (2003)),               die Verwendung einer oder mehrerer Funktionen
                                                          zur Beschreibung quantitativer Zusammenhänge“
                                                         ”
   • die Prinzipien der Explorativen Datenanalyse,       (KMK (2003, S. 15). Die Funktion ist hier ein ideales
     wie sie von Tukey et al. (1982) formuliert und      Muster zur Beschreibung der Realität.
     seitdem in vielen didaktischen Arbeiten zitiert
                                                         An dieser Stelle soll dennoch betont werden, dass der
     und ausgestaltet wurden, sowie
                                                         Lotto-Datensatz kein didaktisch konstruiertes, be-
   • die Phasen des statistischen Denkens, das als       sonders wertvolles Beispiel darstellt, durch das der
     daten- und realitätsorientiertes Pendant des       Gedanke der Funktion als modellhafte Beschreibung
     stochastischen Denkens seit einiger Zeit in der     von Daten herausragend berührt wird. Vielmehr han-
     Stochastikdidaktik diskutiert wird (vgl. Pfann-     delt es sich bei dem Lotto-Datensatz um ein reichhal-
     kuch/Wild (1999)).                                  tiges Entdeckungsfeld, das eben auch die Musterer-
                                                         kennung in Daten bzw. eine Funktionsanpassung in
Diese drei Aspekte sollen im Folgenden kurz präzi-      einer Zeitreihe ermöglicht. Der Gedanke einer Pro-
siert und auf das Lotto-Beispiel bezogen werden.         gnose ist hier als Zusatz zu verstehen, ermöglicht
Standards Die Kultusministerkonferenz veröffent-        aber den Einstieg in eine grundlegendere Behand-
lichte 2003 allgemeinverbindliche Standards für den     lung von Prognosen auf Grund statistischer Daten.
Stochastikunterricht in der Sekundarstufe I, die in      Im Sinne eines Spiralcurriculums tauchen die in den
neu gestaltete Lehrpläne der einzelnen Bundesländer    Standards formulierten Ideen auch in Überlegungen
eingegangen sind bzw. eingehen werden. Zu die-           zum Mathematikunterricht in der Sekundarstufe II
sen Standards, die eine wesentliche Verringerung der     auf (vgl. etwa Borneleit et al. (2000)) und sind damit
Wahrscheinlichkeitsrechnung zugunsten der Daten-         auf der Basis komplexerer mathematischer Betrach-
analyse umfassen, gehören:                              tungsweisen übertragbar.
   • die Planung, Durchführung und Auswertung           Prinzipien der Explorativen Datenanalyse Prin-
     von statistischen Erhebungen,                       zipiell kann die Explorative Datenanalyse im Ge-
   • die systematische Datensammlung und -aufbe-         gensatz zur klassischen Beschreibenden Statistik
     reitung insbesondere mit grafischen Verfahren       als Umkehrung eines Bearbeitungsablaufs Modell–
     unter Verwendung des Rechners,                      Datenerhebung und -auswertung verstanden werden
                                                         (vgl. Borovcnik/Ossimitz (1984)). So geht es um das
   • die Interpretation der Daten mit Hilfe von          detektivische Durchforsten eines Datensatzes mit ei-
     Kenngrößen,                                        ner möglichst flexiblen Verwendung der statistischen
                                                         Methoden, um Besonderheiten und Muster zu entde-
   • die Verbindung von Realität und Mathematik
                                                         cken, die dann Grundlage für das Aufstellen eines
     durch die Interpretation von Argumenten, die
                                                         Modells sein können. Grundlage dieses induktiven
     auf der Datenanalyse beruhen und
                                                         Vorgehens sind (vgl. Tukey et al. (1982))
   • die Beschreibung von Zufallsphänomenen in
                                                            • die zentrale Verwendung grafischer Methoden
     alltäglichen Situationen und deren mathemati-
                                                              (eine Grafik sagt mehr als 1000 Worte),
     sche Modellierung mit Wahrscheinlichkeiten.
                                                            • die Verwendung robuster Methoden, etwa der
Während die Planung der Datenerhebung in diesem
                                                              Einsatz von Median (bzw. Quantilen) sowie
Beispiel keine Rolle spielt, werden die übrigen Stan-
                                                              zugehöriger Streuparameter und
dards offenbar bedient, wobei der Analyseprozess
stets durch die in den Standards zentral genannten          • die Clusterung von Daten, d.h. die Ein-
grafischen Verfahren gesteuert wird. Auch der letz-           schränkung der Datenanalyse aus sachlichen
te Punkt wird angesprochen, da das Ersetzen einer             Gründen auf einen Teil der Daten.

                                                                                                             9
Die Steuerung des Analyseprozesses der Lotto-            Das Erkennen der Notwendigkeit statistischer Daten
Daten geschieht bei dem hier beschriebenen Vorge-        zur Beschreibung und Beurteilung eines Sachkon-
hen offensichtlich auf Grund der grafischen Darstel-     texts ist hier vorweggenommen und prinzipiell eher
lungen. Man untersucht, was man sieht und versucht,      eine Anforderung an allgemeine Problemlöseprozes-
das Gesehene mathematisch bzw. statistisch zu fas-       se, bei der die Bezugnahme auf statistische Daten
sen und mit dem Sachkontext zu verbinden.                nicht offensichtlich ist.

Die Verwendung robuster Methoden als Prinzip der         Die flexible Repräsentation der Daten ist ein wesent-
Explorativen Datenanalyse kann und sollte nicht          liches Moment der Analyse der Lotto-Daten. Dabei
mehr rigider Bestandteil der schulischen Datenanaly-     ist die Analyse geleitet durch die im vorangegan-
se sein. So geht es – insbesondere mit Hilfe des Rech-   genen Abschnitt diskutierten Prinzipien der Explo-
ners – vielmehr um ein verständiges Einsetzen aller     rativen Datenanalyse. Sie umfasst die unterschied-
statistischer Methoden. Dabei meint verständig, dass    lichen grafischen Darstellungen, die Reduktion auf
man unterschiedliche Methoden wie etwa das arith-        statistische Maßzahlen und schließlich die Darstel-
metische Mittel oder den Median im Bewusstsein           lungen ein und desselben Sachverhalts in verschie-
der daraus möglicherweise unterschiedlichen Daten-      dener Form auf Grund von Datentransformationen.
interpretationen einsetzen kann. In der Analyse der      Die Variabilität der Lotto-Daten zum Spieleinsatz
Lotto-Daten sind robuste und nicht-robuste Metho-        bzw. zur Zahl der abgegebenen Tipps ist in jeder
den vermischt. Diese Mischung wird etwa bei der          Phase des Analyseprozesses sichtbar. Im Zusammen-
Anpassung eines Funktionsgraphen an die Punktwol-        hang mit dem Einbinden der Daten in Modelle geht
ken sichtbar, z.B. bei der Frage, ob man versucht,       es um den zentralen Aspekt des statistischen Den-
die Summe der Abweichungsquadrate zu minimie-            kens: Die Aufteilung der statistischen Daten in ein
ren, oder ob man sich von anderen (und damit zu-         Muster (bzw. ein mathematisches Modell) und Resi-
meist robusteren) mathematischen Methoden leiten         duen (bzw. Zufall). Die mathematischen Muster be-
lässt.                                                  stehen etwa in der Reduktion der Datenvielfalt auf ei-
Die Clusterung ist in der Analyse der Lotto-Daten ein    ne Funktion, die prinzipiell Trends der Spieleinsätze
durchgängiges Prinzip. So werden die Cluster von        oder der Tipp-Anzahl beschreiben und zum Teil er-
Spieleinsätzen, die durch unterschiedliche Währun-     klären helfen und damit auch als Gundlage für (vor-
gen entstehen, angeglichen. Gleiches geschieht mit       sichtige) Prognosen dienen kann, die in der Zukunft
den Clustern der Spieleinsätze bzw. der Tipps, die      zu falsifizieren oder auch zu verifizieren sind. Diese
sich hinsichtlich der unterschiedlichen Preisstufen      mathematischen Modelle heben allerdings die Varia-
in der Lottogeschichte ergeben. Schließlich werden       bilität der Daten nicht auf, sondern stellen ein Muster
ganz bestimmte Cluster herausgegriffen und geson-        dar, um die die Daten streuen.
dert untersucht, um ein Modell – hier die Tipp-          Der Einbezug des Sachkontexts ist bei der Analy-
Anzahl beim Ansteigen des Jackpots – zu erstellen.       se des Lotto-Datensatzes unabdingbar. Deutlich wird
Statistisches Denken Das statistsche Denken, das         hier, wie die Veränderung eines normativen Modells
bei Pfannkuch/Wild (1999) in ein umfassenderes           die Daten hinsichtlich der betrachteten Merkmale
Modell des Problemlösens eingebunden ist, enthält      Spieleinsatz und Anzahl der abgegebenen Tipps be-
folgende Phasen oder Katgorien:                          einflusst. D.h. die sich ändernden Spielregeln und
                                                         Tipp-Preise steuern ebenso wie die als zufällig zu
     • Erkennen der Notwendigkeit realer Daten (re-      betrachtenden 0-Serien das Verhalten der Spieler.
       cognition of the need for data),                  Der Sachkontext leitet schließlich die Konstruktion
                                                         der Modelle, in dem etwa trotz der bisher denkbar
     • Flexible Repräsentation der relevanten Daten
                                                         schlechten Datenlage allein aus Plausibilitätsgründen
       und deren Diskussion (transnumeration),
                                                         von einer Sättigungsphase der Tippanzahlen ausge-
     • Einsicht in die Variabilität von und Muster in   gangen wird.
       den Daten (consideration of variation),
                                                         4 Schlussbemerkung
     • Einbinden der Daten in statistische Modelle
       (reasoning with statistical models) und           Die Analyse der Lotto-Daten birgt eine Möglichkeit,
                                                         im Stochastikunterricht reale Daten im Sinne der für
     • Verbinden von Kontext und Statistik (integra-     die Schule geforderten Standards der Leitidee Da-
       ting the statistical and contextual).             ten und Zufall zu behandeln. Wesentliche auf statisti-

10
6   Die Parameter der logistischen Funktion sind hier mit fathom
schen Grundbegriffen aufbauende Methoden können
                                                                          angepasst worden. Vgl. Anmerkung 5.
zur Analyse verwendet werden.                                         7   Beispielsweise ist in Niedersachsen die elementare Behand-
Dabei ist es möglich, die Methoden je nach Klas-                         lung des Lotto-Spiels auf die Klasse 10 beschränkt (vgl.
                                                                          RRL (2003) oder Griesel/Postel (1996)). Unglücklich ist hier
senstufe weitgehend elementar zu halten. Es ist aber
                                                                          die Trennung von Datenanalyse und Wahrscheinlichkeitsrech-
ebenso möglich, mit sehr viel komplexeren mathe-                         nung, wobei die Datenanalyse quasi als kleine Schwester der
matischen bzw. statistischen Methoden zu arbei-                           Wahrscheinlichkeitsrechnung in den unteren Klassen der Se-
ten, wie dies nur im Vergleich der Modelle, die                           kundarstufe I behandelt wird.
                                                                      8   Auch wenn es sicherlich viele Ausnahmen gibt, scheint die
auf einer linearen bzw. logistischen Funktion basie-
                                                                          genannte These auf Grund von Erfahrungen in der Lehrer-
ren, aufgezeigt wurde. Insbesondere die Optimierung                       fortbildung im Rahmen von SINUS sowie der Erforschung
der Funktionsanpassung birgt Möglichkeiten oder                          von Lehrervorstellungen zum Stochastikunterricht (vgl. Eich-
aber auch Probleme, die über die Schule hinauswei-                       ler (2005)) angemessen zu sein.
sen. Darüber hinaus umfasst der Lotto-Datensatz die
Möglichkeit, quasi nebenbei Elemente der Zeitrei-
henanalyse zu behandeln und schließlich einen Ein-
stieg in das Themenfeld Prognose zu leisten.                          Literatur
Von den vielen Untersuchungsmöglichkeiten, die
                                                                      Borneleit, P., Danckwerts, R., Henn, H.-
der Lotto-Datensatz bietet, ist in dieser Arbeit nur
                                                                        W.,     Weigand,       H.-G.    (2000):      Exper-
ein kleiner Aspekt ausgewählt worden, der Appe-
                                                                        tise    zum      Mathematikuntericht      in    der
tit auf mehr machen soll. Die Untersuchung von
                                                                        gymnasialen         Oberstufe.     www.math.uni-
Quoten, den sogenannten Narrenzahlen, kleinen und
                                                                        siegen.de/didaktik/downl/expertise.pdf.
großen Katastrophen und nicht zuletzt die Verbin-
                                                                      Biehler, R. (1997): Auf Entdeckungsreise in Daten.
dung des wahrscheinlichkeitstheoretischen Wissens
                                                                        In: mathematiklehren 97, 1997, 4-5.
zum Lotto mit den empirischen Daten sind zukünf-
                                                                      Eichler, A. (2005): Individuelle Stochastikcurricula
tige Betätigungmöglichkeiten für Datendetektive in
                                                                        von Lehrerinnen und Lehrern. Hildesheim: Franz-
der 50jährigen Geschichte eines Glücksspiels, das
                                                                        becker.
gleichermaßen die Öffentlichkeit wie auch die klei-
                                                                      Griesel, H., Postel, H. (1996, Hrsg): Elemente der
nen und großen Mathematiker in seinen Bann ziehen
                                                                        Mathematik 10, Niedersachsen. Hannover: Schro-
kann.
                                                                        edel.
                                                                      Pfannkuch, M., Wild, C. (1999): Statistical Thinking
Anmerkungen                                                             in Empirical Enquiry. In: International Statistical
1   Stellvertetend für alle Lotto-Artikel kann hier die Fülle der     Review 67(3) 1999, 223-248.
    Arbeiten von Strick (z.B. (2003)) gelten, der sich seit Jahr-
                                                                      Niedersächsisches Kultusministerium (2003, Hrsg.):
    zehnten mit dem Lotto beschäftigt.
2   Diese sind als txt-Datei auf der Webpage von Lotto-
                                                                        Rahmenrichtlinien für das Gymnasium, Klasse 7 –
    Rheinland-Pfalz zu finden (vgl. http://www.lotto-rlp.de).           10 Mathematik. Hannover: Schroedel.
    In diesem Datensatz sind leider manche Inkonsistenzen             Sekretariat der Ständigen Konferenz der Kultusmi-
    enthalten. Einen bereinigten Datensatz im Excel oder                nister der Länder in der Bundesrepublik Deutsch-
    fathom-Format erhält man auf der persönlichen Seite
    des Autors innerhalb folgender Homepage: http://www.tu-
                                                                        land (2003): Bildungsstandards im Fach Mathe-
    braunschweig.de/idm.                                                matik für den Mittleren Schulabschluss. Bonn.
3   Beim Jackpot wird die prozentual festgelegte Gewinnaus-           Tukey, P.A., Gnanadesikan, R., Kettering, J.R., Sie-
    schüttung der Gewinnklasse I (bis zum 7.12.1991 der ’Sech-         gel, A.F. (1982): Themen aus der Datenanalyse:
    ser’, danach der ’Sechser’ mit Superzahl) zu der Gewinnaus-         Begriffe, Methoden, Beispiele und Pädagogik. In:
    schüttung der nächsten Ziehung hinzugefügt, wenn es keinen
    (richtigen) Tipp in der Gewinnklasse I gab.
                                                                        Der Mathematikunterricht 28(1) 1982, 28-56.
4   Die Software fathom unterstützt diesen ersten Analyseprozess
    sehr gut. So können einzelne Datenpunkte markiert und zu
    diesen alle erhobenen Merkmale in einer Infobox angezeigt         Anschrift des Verfassers
    werden. Letztere erlaubt wiederum das leicht handhabbare
                                                                      Andreas Eichler
    Betrachten der Vorgänger- oder Nachfolge-Ziehungen.
5   Die Verwendung von fathom ermöglicht eine sehr einfach           Institut für Didaktik der Mathematik
    zu handhabende Eingabe einer Funktion in ein bestehendes          Universität Bielefeld
    Diagramm. Die zu schätzenden Parameter lassen sich durch         Postfach 10 01 31
    Schieberegler wiederum sehr leicht anpassen. Zudem gibt es        33501 Bielefeld
    die Möglichkeit, sich die Summe der Residuenquadrate zu ei-
                                                                      andreas.eichler@uni-bielefeld.de
    ner eingepassten Funktion anzeigen zu lassen.

                                                                                                                                    11
Sie können auch lesen