Sammelbilderproblem

Sport-Sammelbilder

Das Sammelbilderproblem, Sammler-Problem, Sammelalben-Problem oder Problem der vollständigen Serie (englisch Coupon Collector’s Problem) befasst sich mit der Frage, wie viele Bilder einer Sammelbildserie zu kaufen sind, um ein Sammelalbum vervollständigen zu können.

Beim klassischen Sammelbilderproblem geht man davon aus, dass alle Bilder zufällig gemischt und verdeckt gekauft werden und alle Motive gleich häufig vorkommen. Die letztere Voraussetzung ist aber beispielsweise bei Sammelkartenspielen, auch Trading Card Games genannt, nicht erfüllt, da hier das Vorkommen einzelner Karten stark variiert. Es konnte zudem nachgewiesen werden, dass bei vielen Sammelbilderserien die Bilder nicht zufällig gemischt werden. Eine weitere wichtige Rolle spielt die Möglichkeit des Nachkaufens und Tauschens von Karten. Das klassische Sammelbilderproblem konnte in dieser allgemeinen Problemstellung bisher nicht gelöst werden.

Mit Hilfsmitteln der Wahrscheinlichkeitstheorie sowie Monte-Carlo-Simulationen können Sammelstrategien optimiert werden, um das Sammelalbum möglichst kostengünstig zu füllen. Für eine optimierte Sammelstrategie konnte eine Lösung unter veränderten, praxisrelevanten Annahmen gefunden werden.

Das Sammelbilderproblem ist aufgrund der Beliebtheit der Fußball-Sammelalben eines der wenigen mathematischen Probleme, über die regelmäßig in den Massenmedien berichtet und diskutiert wird.

Geschichte

Historisches Eishockey-Sammelbild

Sammelbilder haben eine lange Tradition, schon im 19. Jahrhundert gab es Sammelbilder als Produktzugaben, z. B. bei Schokolade oder Zigaretten. Eine Variante bestand darin, dass Coupons gesammelt werden mussten und der Sammler nach Einsendung einer vollständigen Serie eine Prämie erhielt.[1] In den 1930er-Jahren erschienen Bilder von Film- oder Sportstars auf der Deckelinnenseite von Eiscremepackungen.[2] Aber es gab auch schon früh andere Sammelobjekte, z. B. Buttons oder Figuren in Cornflakespackungen.[3] Erst in den 1960er-Jahren haben sich vermehrt Sammelalben etabliert, bei denen die Bilder verdeckt in Tüten oder Päckchen verkauft wurden, d. h. ohne dass der Sammler weiß, welche Bilder er erhält. Mit der Einführung von Fußballsammelalben, vorangetrieben durch die Firma Panini, wurde das Sammeln zu einem Massenphänomen, insbesondere zu Welt- oder Europameisterschaften. Mittlerweile sind Sammelalben zu Standard-Merchandising-Artikeln z. B. für Kinofilme geworden.

Die grundlegenden kombinatorischen Betrachtungen gehen bereits auf Markow zurück.[4] Die konkrete mathematische Behandlung begann 1930 mit George Pólya, der das Problem aus Sicht des Herstellers darstellt: „Jede Packung unserer Ware enthält zwei verschiedene Blumenbilder; die volle Kollektion umfasst 72 verschiedene Blumenbilder. Wer eine volle Kollektion sammelt und einsendet, erhält kostenlos eine Prämie. Der Verkäufer, der solche Reklame macht, muss sich vernünftigerweise die Frage vorlegen: Wie groß ist die Durchschnittszahl der verkauften Packungen pro Prämie?“[1] Diese Arbeit prägte daher den Namen als Coupon Collector’s Problem. Teilweise wurde es auch als Dixie Cup Problem[5] bezeichnet (nach den Eiscremebechern, die nach der Herstellerfirma als Dixie Cup bezeichnet wurden). Beginnend mit William Fellers Standardwerk zur Wahrscheinlichkeitstheorie[6] haben sich zahlreiche Mathematiker mit dem Sammelbilderproblem beschäftigt. Dadurch hat sich das Sammelbilderproblem als klassische mathematische Aufgabe etabliert.

Manchmal wird die Aufgabe auch als Sammelbilderparadoxon bezeichnet, weil überraschend viele Bilder benötigt werden, um das Album ohne Tauschen oder Nachkaufen zu vervollständigen. Für Pólyas Blumenbilderkollektion muss man im Durchschnitt 174 Päckchen, also 348 Blumenbilder sammeln (bei nur 72 unterschiedlichen Bildern), für das Sammelalbum zur Fußball-Europameisterschaft 2016 benötigt man sogar 4828 Bilder (bei 680 unterschiedlichen Bildern) – offenbar wächst das Verhältnis der im Mittel benötigten Bilder zur Anzahl der unterschiedlichen Bilder stärker als linear.

Das klassische Sammelbilderproblem

Das klassische Sammelbilderproblem stellt die Frage, wie viele Sammelbilder ein Einzelsammler im Mittel kaufen muss, um eine vollständige Serie von Sammelbildern zu erhalten, wenn er auf Tauschen und Nachkaufen verzichtet und jedes Bild einzeln kauft.[7] Schon Pólya hatte die klassische Aufgabe definiert und wie folgt begründet: „Die Käufer tauschen ihre Bilder aus oder werfen sie fort, der Verkäufer kann ein Bild vorenthalten usw. Wie man sieht, kann die Nichterfüllung der Voraussetzungen sowohl die eine als auch die andere Partei begünstigen und eben deshalb scheint mir die Berechnung der Durchschnittszahl unter den besagten Voraussetzungen zumindest als erste Orientierung einen gewissen Wert zu haben.“[1]

Annahmen

Im klassischen Sammelbilderproblem werden die folgenden Annahmen getroffen:[7][8]

  • A1: Die Bilder werden bei der Herstellung gut gemischt, d. h. rein zufällig auf die Päckchen verteilt.
  • A2: Alle Bilder kommen gleich häufig vor.
  • A3: In einem Päckchen kommt kein Bild doppelt vor.

Der Ergebnisraum kann als Menge der möglichen Sammelbilderfolgen definiert werden:

Urnenmodell des Sammelbilderproblems mit sechs Bildern

Mathematisch entspricht das Sammelbilderproblem einem Urnenmodell mit Zurücklegen, und zwar bedeuten die gezogenen Zahlen die Nummern der Sammelbilder. Gesucht wird die Anzahl der Ziehungen, die nötig ist, bis jede Zahl mindestens einmal gezogen wurde. Dies bedeutet, dass die einzelnen gezogenen Nummern der Sammelbilder eine diskrete Gleichverteilung besitzen.

Wahrscheinlichkeitsverteilung der Füllung eines 4er-Albums

Gesucht ist die Wahrscheinlichkeit mit dem -ten Kauf ein 4er-Album zu füllen. Die Bilder kommen beim Kauf gleich häufig vor. Die Wahrscheinlichkeit, ein bestimmtes Bild zu kaufen, ist also . Wir betrachten die Situation vor dem -ten Kauf, die das Album füllt: ist die Wahrscheinlichkeit einer Multinomialverteilung, dass beim -ten Kauf genau ein Bild fehlt, also jedes der 3 anderen Bilder schon mindestens einmal in der Sammlung vorhanden ist:

Die Summationsindexe , , , geben jeweils die Anzahl der Exemplare der einzelnen Bilder an. ist die Anzahl der Exemplare des 1. Bilds, ist die Anzahl der Exemplare des 2. Bilds usw. Die Summationsindexe sind natürliche Zahlen größer oder gleich 1. Zur Berechnung der ersten Einzelwahrscheinlichkeit wird über alle Darstellungen summiert, sodass die Summe dieser positiven ganzen Zahlen gleich ist. Entsprechendes gilt für die anderen Einzelwahrscheinlichkeiten.

Weil die 4 Einzelwahrscheinlichkeiten für gleich sind, kann man den obigen Ausdruck vereinfachen:

Es fehlt genau ein Bild, d. h. mit dem -ten Kauf wird unabhängig vom fehlenden Bild das Album mit der Wahrscheinlichkeit gefüllt. Daraus ergibt sich die gesuchte Wahrscheinlichkeit:

Dieses Resultat kann leicht auf ein Album mit Bildern verallgemeinert werden. Für gilt dann

Diese Verteilung ist eine Verallgemeinerung der negativen Binomialverteilung[9], mit welcher man das Sammelbilderproblem für den Fall beschreiben kann.

Wenn ist, kann ein Album mit Bildern mit dem -ten Kauf offensichtlich nicht vervollständigt werden. Dann ist , weil dann die durch das Summenzeichen definierte Summe leer, also gleich 0 ist.

Um die Wahrscheinlichkeit, dass das Album nicht mit dem -ten Kauf, sondern nach Käufen, also spätestens mit dem -ten Kauf, vollständig ist, zu bestimmen, muss die Summe gebildet werden. Wegen für ist . Für ist auch die summierte Wahrscheinlichkeit offensichtlich gleich 0.

Die summierte Wahrscheinlichkeit kann auch einfacher mit der Formel

berechnet werden. Die Einzelwahrscheinlichkeit, mit dem -ten Kauf das Album mit Bildern zu vervollständigen, ist also gleich[10][11]

Zahlenbeispiel

Die Wahrscheinlichkeit, dass das 4er-Album nach 12 Käufen vollständig ist, beträgt

Die Einzelwahrscheinlichkeit, das 4er-Album mit dem 12. Kauf zu vervollständigen, ergibt sich als Differenz aus dieser und der Wahrscheinlichkeit, dass das Album schon nach dem 11. Kauf vollständig ist:

Verallgemeinerung für m von N Bildern

Diese Formel lässt sich verallgemeinern. Die Wahrscheinlichkeit, dass nach Käufen, also spätestens mit dem -ten Kauf, der Bilder mindestens einmal vorkommen, ist

Für den Spezialfall ergibt sich die oben erwähnte summierte Wahrscheinlichkeit . Die Wahrscheinlichkeit, dass schon nach Käufen der Bilder mindestens einmal vorkommen, ist nach Definition und die Wahrscheinlichkeit, dass beim nächsten Kauf kein neues Bild hinzukommt, ist . Die Differenz ist also die Einzelwahrscheinlichkeit, mit dem -ten Kauf zum ersten Mal verschiedene Bilder zu erhalten:

Päckchen

Sammelbilder werden in der Regel nicht einzeln, sondern in Päckchen mit Bildern, häufig auch Tüten oder Booster genannt, verkauft. Dabei wird vom Hersteller garantiert, dass innerhalb eines Päckchens kein Bild mehrfach vorkommt.

Es wurde bewiesen, dass Annahme A3 für die Sammelbilder der Firma Panini aufgrund des speziellen Verpackungsprozesses mit der Verpackungsmaschine Fifimatic erfüllt ist.[8]

Die allgemeine Lösung ist komplizierter,[12][7] aber der Vergleich der Ergebnisse ergibt, dass der Effekt der Päckchen eher gering ist, wenn die Päckchengröße im Verhältnis zur Gesamtzahl der Sammelbilder klein ist. Dies bedeutet für die meisten praktischen Anwendungen, dass die Päckchengröße vernachlässigt werden kann, denn die Wahrscheinlichkeit für das Ereignis , dass es in einem Päckchen mindestens ein mehrfach vorkommendes Sammelbild gibt, beträgt wie beim Geburtstagsparadoxon

denn die Wahrscheinlichkeit für das Gegenereignis (siehe Ereignis (Wahrscheinlichkeitstheorie) - Komplement und Differenz), dass jedes Bild der Sammelbilderserie höchstens einmal im Päckchen vorkommt, beträgt

Wartezeit bis zum nächsten neuen Bild

Die Zufallsvariable ordnet jedem Ergebnis die Anzahl der Käufe zu, die gemacht werden müssen, um nach der -ten verschiedenen Karte wieder eine neue, von den bisher gekauften verschiedene -te Karte zu bekommen. Dies entspricht der Wartezeit bis zum nächsten neuen Bild.[13]

Histogramm einer Simulation (100.000 Realisierungen) am Beispiel von Pokémon. Man erkennt die große Streuung: Im schlechtesten Fall mussten 2522 Karten gekauft werden.

Da beim ersten Kauf sicher ein neues Bild kommt, ist die Wahrscheinlichkeit . Beim Kauf des zweiten Bildes ist sie . Diese Zufallsvariable ist geometrisch verteilt. Allgemein ergibt sich:

Als Erwartungswert für ergibt sich:

Dies bedeutet insbesondere, dass man, um das letzte fehlende Bild der Sammlung zu erhalten, im Mittel Bilder kaufen muss. Das sind aber genauso viele Bilder, wie man überhaupt sammeln muss, und erklärt, warum das Sammeln ohne Tauschen und Nachkaufen so teuer ist.

Wahrscheinlichkeitsverteilung für die Anzahl der Käufe

Die Zufallsvariable

gibt an, wie viele Käufe gemacht werden müssen, um alle Karten zu besitzen. Dies ist die Summe der der Wartezeiten (Anzahl der Käufe) für die 1., 2., 3. …, -te Karte, die von den bisher gekauften Karten verschieden ist. Die stochastisch unabhängigen Zufallsvariablen sind jeweils geometrisch verteilt. Ihre Summe besitzt eine diskrete Phasenverteilung. Die Wahrscheinlichkeitsverteilung kann durch Auswertung der zugehörigen Markow-Kette[14] oder rekursiv[15] berechnet werden.

Im allgemeineren Fall gibt die Zufallsvariable

an, wie viele Käufe gemacht werden müssen, um genau der Karten zu besitzen.

Erwartungswert

Mittlere Anzahl S benötigter Bilder (Erwartungswert) für eine vollständige Serie aus n Bildern mit Standardabweichung (grau)

Weil die einzelnen Erwartungswerte existieren, existiert auch der Erwartungswert für die neue Zufallsvariable:

Das folgt aus der Linearität des Erwartungswerts.

Dann gilt:

ist die -te Partialsumme der harmonischen Reihe. ist also der Faktor, der angibt, wie viel mal mehr Bilder man kaufen muss im Vergleich zur Größe des Sammelalbums. Für große gilt die Näherung durch den natürlichen Logarithmus: mit der Euler-Mascheroni-Konstante , also

Der Erwartungswert für die Wartezeit im allgemeineren Fall, dass genau der Karten vorkommen, ist

Varianz

Da die Wartezeiten auf die jeweils nächsten neuen Bilder geometrisch verteilt und unabhängig sind, ergibt sich mit für die Varianz der Anzahl der zu sammelnden Bilder die endliche Summe

Die letzte Ungleichung folgt aus der Konvergenz unendlichen Reihe des sogenannten Basler Problems und der asymptotischen Entwicklung der harmonischen Reihe.

Im abgebildeten Koordinatensystem wächst die Standardabweichung mit stark an.

Anzahl der verschiedenen Bilder

Die Wahrscheinlichkeit, dass der Käufer nach Käufen ein bestimmtes der Bilder besitzt, sei . Am einfachsten ist es, zuerst die Wahrscheinlichkeit zu berechnen, dass das Bild nach Käufen noch nicht vorhanden ist, d. h. dass alle Karten eines der anderen Bilder zeigen. Diese Wahrscheinlichkeit ist . Gesucht ist die Wahrscheinlichkeit für das Gegenereignis, also

Erwartungswert

Ist die Zufallsvariable definiert als die Anzahl der verschiedenen Bilder, die nach Käufen vorkommen, dann ist diese Zufallsvariable binomialverteilt mit der Erfolgswahrscheinlichkeit . Für den Erwartungswert gilt dann

Varianz

Für die Varianz der Anzahl der verschiedenen Bilder nach Käufen gilt

Nachkaufen

Die meisten Hersteller bieten an, eine bestimmte Anzahl von Bildern, häufig 50, nachzukaufen, in der Regel zu einem erhöhten Preis. Außerdem kann man gezielt bestimmte Sammelbilder kaufen, z. B. in speziellen Sammlerbörsen oder Online-Shops. Die wichtige Frage ist, wann sich Nachkaufen lohnt.

Fehlen noch Bilder und ein bestimmtes Bild wird zum Preis von angeboten, so lohnt sich der Kauf, wenn im Mittel die Kosten geringer sind als die Kosten für das nächste Bild beim normalen Sammeln. Sei der normale Preis eines einzelnen Bildes, so lohnt sich der Kauf,[16] wenn

Wenn die Möglichkeit besteht, Bilder nachzukaufen, so lohnt es sich am meisten, diese komplett am Ende nachzukaufen. Man müsste sonst im Mittel[17]

Bilder kaufen, statt Bilder nachzukaufen, und dieser Spareffekt kann sehr groß sein.[18]

Die erwartete Anzahl der zu kaufenden Bilder reduziert sich auf

Dies bedeutet, dass der Faktor drastisch reduziert und in erster Näherung nur noch vom Verhältnis der Albumgröße zur Anzahl der Nachkaufbilder abhängt und nicht direkt von der Albumgröße.[16] Dies ermöglicht eine vereinfachte Berechnung der mittleren Kosten des Sammelalbums.

Tauschen

Eine weitere wichtige Erweiterung ist das Tauschen von doppelt im Besitz befindlichen Karten. Dies geschieht traditionell im Freundeskreis, zunehmend aber auch in organisierten Tauschbörsen z. B. über das Internet. In der mathematischen Modellierung wird in der Regel das faire Tauschen betrachtet, d. h. es wird jeweils ein Bild gegen ein anderes getauscht. Auch wird angenommen, dass die Tauschpartner kooperieren und solange gemeinsam sammeln und fair tauschen, bis jeder Sammler sein Album gefüllt hat. Dies entspricht dem Fall, dass ein Sammler Sammelalben vervollständigt.

Für diesen Fall wurde bisher keine geschlossene Lösung gefunden; am Beispiel des WM-Albums wurde per Simulation gezeigt,[19] dass der Effekt erheblich ist. Asymptotisch gilt für den Mittelwert bei einer festen Anzahl von Tauschpartnern[5]

für

Dies zeigt den Effekt des Tauschens: Während der erste Sammler im Mittel Karten kaufen muss,[20] braucht jeder weitere Sammler im Mittel nur zusätzlich zu kaufen. Mit dieser Formel kann man grob abschätzen, wie viel Geld man durch das Tauschen sparen kann. Z. B. würden sich die Kosten für zwei Tauschpartner durch faires Tauschen auf etwa 60 % der Kosten eines Einzelsammlers reduzieren.

In einem Jugend-forscht-Projekt wurde für das Szenario faires Tauschen mit Nachkaufen der Faktor durch umfangreiche Simulationen untersucht, wobei die mittlere Anzahl insgesamt zu kaufender Bilder aller Tauschpartner ist. Der Faktor gibt mithin an, wie viel mal mehr Bilder jeder Sammler am Ende im Mittel gekauft hat, als das vollständige Album Bilder enthält. Während ohne Tauschen und Nachkaufen der Faktor für einen Einzelsammler gut durch den natürlichen Logarithmus der Anzahl der Sammelbilder angenähert werden kann (bzw. dem doppelten Logarithmus für eine große Anzahl von Tauschpartnern), konnte plausibel experimentell belegt werden, dass bei fairem Tauschen mit Nachkaufen, bei festem Nachkaufprozentsatz, strebt, wenn die Anzahl der tauschenden Sammler strebt.[16]

Kritik der klassischen Annahmen

Die Annahmen des klassischen Sammelbilderproblems werden häufig als unrealistisch kritisiert und insbesondere im Internet kursieren Gerüchte, dass die Hersteller entweder Bilder künstlich verknappen oder die Bilder nicht ordentlich mischen, d. h. zu viele Doppelte vorkommen oder manche Bilder zu selten.

Ein Journalist von Spiegel online untersuchte die Annahme A2 für das Sammelalbum zur Fußball-Weltmeisterschaft 2014 zusammen mit der Website stickermanager.com. Durch die Betrachtung des aufbereiteten Datenbestandes von 8,33 Millionen Einträgen kam der Statistiker Christian Hesse zu dem Ergebnis: „Die gravierenden Unterschiede lassen sich mit dem Wirken des Zufalls allein nicht erklären“. Dabei wurde angenommen, dass die Online-Umfrage repräsentativ ist. Allerdings galt dies nur für die deutsche Edition; z. B. bei der Schweizer Edition, die separat produziert wird und optisch unterscheidbar ist, traten die 2,36 Millionen registrierten Sticker gleichmäßig häufig auf.[21]

In einer Untersuchung des Herstellungsprozesses konnte nachgewiesen werden, dass bei der Verpackung der Sammelbilder von Topps und Panini systematische Abweichungen bzw. Muster entstehen, die sich signifikant vom zufälligen Mischen unterscheiden. Für den Verpackungsprozess der Panini-Sammelbilder konnte nachgewiesen werden, dass statt möglicher verschiedener Päckchen (unter Annahme A1 bei Päckchengröße ) nur maximal verschiedene Päckchen vorkommen können. Dies wirkt sich allerdings nicht nachteilig für den Sammler aus.[8]

Dies bedeutet, dass die Annahmen des klassischen Sammelbilderproblems, insbesondere A1, in der Praxis nicht erfüllt sind.

Optimierte Sammelstrategie

Für die Kombination von Tauschen und Nachkaufen unter den klassischen Annahmen gibt es bisher keine analytischen Ergebnisse. Per Simulation wurde nachgewiesen,[19] dass das Potenzial solcher optimierter Strategien erheblich ist. Es wird allerdings davon ausgegangen, dass in einem Display (das sind Verpackungen für den Handel mit 50 oder 100 Päckchen) keine Doppelten vorkommen. Dies ist allerdings nur in Einzelfällen korrekt. Stattdessen wurde nachgewiesen, dass in einem Display weniger Doppelte vorkommen, als bei zufälliger Mischung erwartet würden.[8] Außerdem sind Displays günstiger als der Kauf einzelner Päckchen.

Die Empfehlung aufgrund der Simulationsergebnisse ist die folgende optimierte Sammelstrategie:

  1. Kauf eines Displays
  2. Kauf weiterer Päckchen und Tausch möglichst vieler Bilder, bis nur noch die möglichen Nachkaufbilder fehlen
  3. Nachkauf am Schluss der maximal erlaubten Zahl von Bildern beim Hersteller

Die optimierte Strategie und die damit verbundenen Kosten wurden in einem öffentlichen Experiment des Göttinger Tageblatts für das Sammelalbum zur Fußball-Europameisterschaft 2016 mit guter Genauigkeit bestätigt.[22]

Sind in einem Display Bilder und kommen darunter unterschiedliche Bilder vor, so gilt[23]

Allerdings ist die klassische Annahme der Sammelgemeinschaften[5] heute nicht mehr realistisch, da überwiegend spontan in Tauschbörsen oder über das Internet getauscht wird.[22] Nimmt man an, dass der Sammler fehlende Bilder nach dem Kauf des Displays vor dem Nachkaufen tauschen kann, so ergibt sich[23] mit dem Anteil der Tauschbilder

Auch die Varianz V der Anzahl der zu sammelnden Bilder kann unter diesen Annahmen bestimmt werden[23]

Damit können die Kosten des Sammelbilderalbums für die optimierte Sammelstrategie unter realistischen Annahmen abgeschätzt werden und das Sammelbilderproblem ist unter diesen Annahmen gelöst.

Das allgemeine Sammelbilderproblem

Im allgemeinen Sammelbilderproblem kann die Wahrscheinlichkeit für jedes Bild unterschiedlich sein, und zwar . Dies ist der allgemeinste Fall einer diskreten Wahrscheinlichkeitsverteilung. Die Lösung ist nicht mehr mit elementarer Wahrscheinlichkeitsrechnung herleitbar, sondern nur mit erzeugenden Funktionen. Für den Mittelwert ergibt sich[17]

Hiermit kann man für einen Sammler ohne Nachkaufen die mittlere Anzahl benötigter Karten für Trading Card Games berechnen.

Beispiele

Würfel

Spielwürfel

Für pädagogische Zwecke wird häufig das Sammelbilderproblem mit Hilfe eines normalen Spielwürfels eingeführt und veranschaulicht.[24] In der Praxis könnte dies z. B. Sammelfiguren entsprechen, die einem Produkt beigemischt sind.

Man muss durchschnittlich 14,7-mal werfen, um jede Augenzahl mindestens einmal zu bekommen,[25] denn es gilt

Nimmt man die Päckchengröße an (dies entspricht Würfeln mit zwei Würfeln unter Ausschluss eines Paschs), so erhält man

Augenzahlen, d. h. man muss im Durchschnitt mal würfeln, da mit einem Wurf zwei Würfel (mit verschiedenen Augenzahlen) geworfen werden. Es gilt , d. h. man kann erwarten, durch das Päckchen im Mittel mindestens ein Bild zu sparen.

Eine einfache Erweiterung besteht darin, mit zwei unterscheidbaren Würfeln zu spielen und damit ein Sammelalbum mit Sammelbildern zu simulieren. Für den Einsatz im Schulunterricht wurde ein entsprechendes Sammelspiel entwickelt, mit dem verschiedene Sammelstrategien ausprobiert werden können.[26] Dies entspricht dem von Rewe herausgegebenen offiziellen DFB-Sammelalbum zur Fußball-Europameisterschaft 2016, wobei die Sammelbilder hier eine Produktzugabe für je 10 € Einkaufswert darstellen und nicht nachgekauft werden können. Hier benötigt man als Einzelsammler zum Vervollständigen schon fast 150 Sammelbilder. Das Tauschen bekommt eine besondere Bedeutung, denn beim fairen Tauschen müsste jeder weitere Sammler dann nur etwa 67 Bilder sammeln, und das wäre gleichzeitig auch der Grenzwert bei sehr vielen Tauschpartnern.[5]

Pokémon

Pokémon-Sammelkarten

Angenommen, es gäbe 150 verschiedene Motive auf den Pokémon-Karten, die man kaufen muss, und die Karten seien einzeln verpackt. Wenn es sich um ein klassisches Sammelalbum handelte, dann müsste ein Einzelsammler ohne Nachkaufen im Mittel ungefähr 839 Karten kaufen.

Allerdings ist Pokémon in Wirklichkeit ein Trading Card Game, d. h. es gibt mehr als 5 unterschiedliche Kartentypen mit unterschiedlichen Seltenheiten, von normal bis extrem selten. Den großen Unterschied kann man schon bei zwei Kartentypen erkennen, bei denen z. B. 30 von 150 Karten halb so häufig auftreten wie im klassischen Sammelbilderspiel. Dann müsste der Einzelsammler schon im Mittel etwa 1213 Karten kaufen. Gibt es 10 sehr seltene Karten, die zehnmal seltener auftreten, dann brauchte er sogar etwa 4372 Karten. Dies bedeutet, dass Nachkaufen und Tauschen noch eine größere Bedeutung besitzen als bei den klassischen Sammelbildern.

Fußball-Sammelbilder

Das Panini-Album zur Fußball-Europameisterschaft 2016 mit 680 Bildern kostet mindestens 95,20 € bei einem regulären Preis von 14 Cent pro Bild. Dies wäre gleichzeitig auch der erwartete Preis für das letzte fehlende Bild, wenn man es normal sammeln würde. Für den Faktor gilt . Dies ergibt für einen Einzelsammler ohne Tauschen und Nachkaufen eine mittlere Anzahl zu kaufender Bilder von etwa 4828 (d. h. 965,5 Päckchen) und entspricht etwa 676 €. Aber auch die Standardabweichung ist groß (869 Bilder), d. h. in etwa 95,4 % aller Fälle müsste ein Einzelsammler zwischen 3090 und 6566 Bilder sammeln. Dies verdeutlicht, dass unbedingt getauscht und nachgekauft werden sollte, um die Kosten zu verringern.

Der Einfluss der Päckchen ist gering, bei Fünfer-Päckchen beträgt nur ungefähr 0,016, d. h. bei etwa jedem 60. Päckchen müsste man ein doppeltes Bild erwarten, wenn die Karten zufällig gemischt würden. Dieser Einfluss wird häufig überschätzt oder falsch eingeschätzt.[27] Bei exakter Rechnung muss man im Mittel etwa 963,2 Päckchen kaufen,[28] d. h. die Ersparnis beträgt im Mittel nur 12 Bilder und kann daher auch in Anbetracht der großen Standardabweichung praktisch vernachlässigt werden.

Kann man 50 Bilder nachkaufen, spart man etwa 3060 Bilder, d. h. dann braucht man näherungsweise im Mittel nur 1768 Karten zu kaufen sowie 50 Nachkaufkarten. Dies kostet dann etwa 257 € bei 20 Cent pro Nachkaufbild (ohne Berücksichtigung des Päckchen-Effekts). Auch die Standardabweichung sinkt auf etwa 82 Bilder, d. h. in etwa 95,4 % aller Fälle müsste ein Einzelsammler zwischen 1604 und 1936 Bilder sammeln.

Bei einer unendlich großen Sammelgemeinschaft wäre der Faktor für jeden Sammler etwa 1,88, d. h. jeder müsste im Mittel etwa 1275 Bilder kaufen, was einem Preis von etwa 179 € entspricht. Für das Album zur Fußball-Weltmeisterschaft 2014 wurde abgeschätzt,[19] dass man mit einer optimierten Sammelstrategie das Sammelalbum für etwa 125 € füllen kann. Berücksichtigt man die Preiserhöhung und die zusätzlichen Sammelbilder des EM-Albums, so ergibt sich mit dieser Strategie ein Preis von etwa 150 €.[29] In einem öffentlichen Sammelexperiment wurde dies mit 155 € Kosten bestätigt.[22] Im Grenzfall des konsequenten Nachkaufens mit einer unendlich großen Sammelgemeinschaft würden sich 98,20 € pro Sammler ergeben.

Das Panini-Album zur Fußball-Weltmeisterschaft 2018 unterscheidet sich mit 682 Bildern praktisch nicht vom Album zur Europameisterschaft.[30] Der wesentliche Unterschied ist der höhere Preis mit 18 Cent pro Bild, d. h. das Album kostet regulär mindestens 122,76 €. Alle anderen klassischen Ergebnisse können durch einfache Umrechnung abgeleitet werden. Unter realistischen Annahmen, z. B. , und einem Preis von 75 € pro Display, ergeben sich für die optimierte Strategie mittlere Kosten von etwa 184 €.[23] Die Streuung ist relativ klein, 99 % der Sammler könnten unter diesen Annahmen das Album für Kosten zwischen 176 € und 193 € füllen. Verzichtet der Sammler auf das Tauschen, muss er dagegen im Mittel 276 € bezahlen. Tauscht er alle Doppelten, so braucht er im Mittel nur 111 €. Ähnliche Ergebnisse wurden per Simulation bestätigt.[31]

Einzelnachweise

  1. a b c George Pólya: Eine Wahrscheinlichkeitsaufgabe in der Kundenwerbung. ZAMM – Zeitschrift für Angewandte Mathematik und Mechanik, Band 10, Heft 1, 1930, S. 96–97.
  2. NewsTimes: Commemorative Dixie cups can be collectibles. Abgerufen am 28. April 2016.
  3. Kellogs Memorabilia and Collectibles. Abgerufen am 28. April 2016.
  4. Andrei Andrejewitsch Markow: Wahrscheinlichkeitsrechnung. Teubner, Berlin, 1912, S. 101–108.
  5. a b c d Donald J. Newman, Lawrence Shepp: The double dixie cup problem. American Mathematical Monthly 67 (1960), S. 58–61.
  6. William Feller: An introduction to probability theory and its applications. Band 1: Wiley, New York 1950, ISBN 0-471-25708-7, S. 225.
  7. a b c Norbert Henze: Stochastik für Einsteiger. 10. Auflage. Springer Spektrum, Wiesbaden 2013, ISBN 978-3-658-03076-6, S. 192ff.
  8. a b c d Niklas Braband, Sonja Braband und Malte Braband: Das Geheimnis der Fifimatic. Junge Wissenschaft, Nr. 114, 2017, S. 26–32.
  9. Negative Binomial Distribution, Marseken, Susan F., Surhone, Lambert M., Timpledon, Miriam T., Betascript Publishing
  10. Steffi Kroll: Kombinatorik
  11. Norbert Henze: Stochastik für Einsteiger. 10. Auflage. Springer Spektrum, Wiesbaden 2013, ISBN 978-3-658-03076-6, S. 187–196.
  12. Wolfgang Stadje: The Collector’s Problem with Group Drawings. Advances in Applied Probability, Vol. 22, No. 4 (Dec., 1990), pp. 866–882.
  13. Elke Warmuth, Walter Warmuth: Elementare Wahrscheinlichkeitsrechnung: Vom Umgang mit dem Zufall. Vieweg + Teubner 1998, ISBN 978-3-519-00225-3, S. 128–129.
  14. Sammelbilderproblem systematisch lösen mithilfe der Schulmathematik (PDF; 358 kB).
  15. Andreas Binzenhöfer, Tobias Hoßfeld: Warum Panini Fußballalben auch Informatikern Spaß machen. In: Hans-Georg Weigand (Hrsg.): Fußball – eine Wissenschaft für sich. Königshausen & Neumann, Würzburg 2006, S. 181–191.
  16. a b c Niklas Braband und Sonja Braband: Nicht mehr über Sammelbilder ärgern! Junge Wissenschaft, Ausgabe Nr. 110, 2016, S. 16–24.
  17. a b Philippe Flajolet, Danièle Gardy, Loÿs Thimonier: Birthday paradox, coupon collectors, caching algorithms and self-organizing search. (GZIP; 77 kB) In: Discrete Applied Mathematics. Vol. 39, 1992, S. 207–229.
  18. Holger Dambeck: EM-Sticker: Mathe-Tricks machen Panini-Sammeln günstiger. Spiegel Online, 31. Mai 2012.
  19. a b c Sylvain Sardy und Yvan Velenik: Paninimania: sticker rarity and cost-effective strategy. Swiss Statistical Society, Bulletin nr. 66 (2010), S. 2–6.
  20. Doron Zeilberger: How Many Singles, Doubles, Triples, Etc., Should The Coupon Collector Expect?
  21. Panini-WM-Sticker: Millionen-Stichprobe zeigt massive Ungleichverteilung. Spiegel online, 19. Juni 2014, abgerufen am 19. Juni 2014.
  22. a b c Andreas Fuhrmann: Fuhrmanns EM-Stickerblog. Abgerufen am 27. August 2016
  23. a b c d Niklas Braband, Sonja Braband, Malte Braband: A Useful Solution of the Coupon Collector's Problem. 26. Februar 2017, arxiv:1702.08874 [math].
  24. Elke Warmuth, Stefan Lange: Mathematik Anders Machen – Eine Initiative zur Lehrerfortbildung. Abgerufen am 30. April 2016.
  25. Holger Dambeck: WM-Album. So teuer kommt der Sammelbildwahn. Spiegel Online, 30. Juni 2011.
  26. Frank Förster: Alle (zwei) Jahre wieder: Fußballbilder. In: Hans Humenberger und Martin Bracke (Hrsg.): Neue Materialien für einen realitätsbezogenen Mathematikunterricht 3: ISTRON-Schriftenreihe (Realitätsbezüge im Mathematikunterricht). Springer, Heidelberg 2016, S. 58–67.
  27. Wales Online: A maths genius worked out exactly how much it will cost to fill your Panini Euro 2016 album. Abgerufen am 4. Mai 2016.
  28. Cross Validated: Expectation of collecting stickers in groups. Abgerufen am 4. Mai 2016.
  29. Das Einmaleins der Panini Sticker. In: dw.com. Deutsche Welle, 12. Mai 2016, abgerufen am 14. Mai 2016.
  30. Presse-Factsheet. Panini Verlags GmbH, 19. März 2018, abgerufen am 27. März 2018 (deutsch).
  31. Laurie Belcher: Football Crazy, Probability Mad: How much does it really cost to complete the World Cup 2018 Sticker album? In: Goodscienceblog. 12. März 2018, abgerufen am 30. März 2018.

Auf dieser Seite verwendete Medien

SteveVair.jpg
Picture of Steve Vair, card by Imperial Tobacco Canada.
Basketball-sammelkarten hg.jpg
Autor/Urheber: Hgrobe, Lizenz: CC BY-SA 3.0
Basket-ball player collection cards
Pokemon collection.jpg
Autor/Urheber: Jarek Tuszyński, Lizenz: CC BY-SA 4.0
Pokemon card collection
Spielwürfel.jpg
Autor/Urheber: Schlurcher Strukturierte Daten auf Commons bearbeiten, Lizenz: CC BY 3.0
Spielwürfel Strukturierte Daten auf Commons bearbeiten
Urn problem 06.svg
Autor/Urheber: Antonsusi, using File:Urn problem qtl4.svg from Quartl., Lizenz: CC BY-SA 3.0
Urnenmodell mit Bezeichnungen der Kugeln
Coupon collectors problem expectation.svg
Autor/Urheber: HilberTraum, Lizenz: CC BY-SA 3.0
Erwartungswert und Standardabweichung beim Sammelbilderproblem