U vraagt zich natuurlijk af, hoe zit dat met die
Pixar kaarten?
Wel, ik ben na wat gepieker uitgekomen op mijn favoriete raadsel: een
paradox. Het resultaat is een langere post, maar blijf hem toch maar geduldig lezen. Wiskunde! Leuk!
Voor die mensen die de vorige maanden op een andere planeet hebben gewoond, even schetsen: de Delhaize gaf - in leuke gesloten pakjes van vijf - een reeks van n=216 verschillende kaartjes uit, die je kon verzamelen. 216 is veel, zodat je er zonder ruilen moeilijk kan komen (ook leuk!), maar toch vraagt elk normaal mens zich af:
Hoeveel kaartjes moeten mijn kinderen gemiddeld hebben om de volledige set te bezitten?
Of anders gezegd: hoe groot moet de ruilbeurs zijn?
In de veronderstelling dat er evenveel kaartjes van elke soort gedrukt zijn, en oneindig in het totaal, kan je stellen dat elke kaart
1/n=1/216=0,46% kans heeft om je volgende te zijn. Dus als je één specifieke kaart zoekt, dan duurt het gemiddeld 216 kaartjes voor je ze hebt. Merk op dat je na 216 kaartjes nog steeds 36,7% kans hebt om je gezochte kaart *niet* te hebben. Op dat moment is de kans dat je ze effectief alle 216 verschillende hebt, 1 gedeeld door
dit getal. En dat is redelijk klein.
Redenering 1: de kans dat je één specifieke kaart met een zekerheid van 215/216de hebt, bereik je bij
1158 kaarten. Omdat dit voor élke kaart geldt, kan je redenen dat dit meteen het gemiddelde benodigde aantal is om de volledige set te bezitten. Als een zekerheid van 215,5/216 nodig is, dan heb je
1308 kaarten nodig.
Om aan zoveel kaarten te komen moest je ongeveer €5000 uitgegeven hebben in de Delhaize, wat ongeveer overeenkomt met het bedrag dat een gezin per jaar besteedt in een grootwarenhuis, een hoog maar haalbaar getal. Wat aangeeft dat ze er goed hebben over nagedacht, bij die winkelketen.
Redenering 2: laten we de oplossing zoeken via inductie. Noem
f(k) het aantal verschillende kaartjes dat je hebt indien je
k kaartjes bezit. Dan is
f(1) gelijk aan 1 (je eerste kaart is altijd een nieuwe) en
f(k+1) kan berekend worden als volgt:
- de kans dat je volgende kaart behoort tot het groepje van f(k) kaartjes die je al hebt, is f(k)/n=f(k)/216;
- de kans dat de nieuwe kaart een écht nieuwe is is (1-f(k)/n)=(216-f(k))/216;
Daaruit haal je onmiddellijk dat het gemiddelde aantal verschillende kaarten
f(k+1)=f(k)*[f(k)/n] + (f(k)+1)*[(1-f(k)/n)]=f(k)(1-1/n)+1.
Als je in deze vergelijking de kans
(1-1/n)=Q stelt, voor het gemak van de formule, dan krijg je:
- f(1)=1
- f(2)=Q+1
- f(3)=Q²+Q+1
- . . .
- f(k)=Qk-1+...+Q²+Q+1
Al mijn studenten kennen deze som als de meetkundige reeks en zij kunnen je makkelijk uitleggen dat
f(k)=[1-Qk]/[1-Q] ofte
f(k)=n*[1-(1-1/n)k]=216*[1-(215/216)k].
Neem je rekenmachine en je zal vaststellen dat
f(k) *nooit* gelijk wordt aan 216, behalve wanneer
k oneindig groot is.
Het aantal verschillende kaarten die je gemiddeld hebt is dus altijd kleiner dan 216. Je hebt gemiddeld oneindig veel kaarten nodig om de volledige set te hebben. Dat is volledig tegen de intuïtie, maar de formule is onweerlegbaar.
Noem het de
Sponzen Paradox. Ofzo.
Omdat er geen halve kaarten bestaan, kan je stellen dat je door afronding gemiddeld gesproken alle kaarten hebt indien
f(k)=215,5 is, en niet 216. Dat aantal bereik je bij
1308 kaarten.
Redenering 3: je kan ook een soort omgekeerde inductie toepassen (ik ben de juiste naam even vergeten). Dat gaat zo.
- Stel dat je nog 1 kaart mist. Dan heb je nog 216 kaartjes nodig om die te krijgen.
- Stel dat je nog 2 kaarten mist, dan heb je gemiddeld nog 216/2 kaartjes nodig om één van die twee te krijgen.
- Wie 3 kaarten mist, heeft er nog 216/3 nieuwe nodig om van 3 naar 2 ontbrekende te gaan.
- . . .
- Wie 216 kaarten mist (en er dus nog geen heeft) heeft inderdaad 216/216=1 kaartje nodig om een nieuw te hebben.
In het totaal heb je dus
216*(1+1/2+1/3+1/4+...+1/216)=1286,2 kaartjes nodig om, gemiddeld gesproken, de volledige set te hebben.
Besluit: Drie correct lijkende redeneringen, drie verschillende antwoorden. Nu gijlie.
Statistiek is leuk, maar soms een beetje verwarrend.