
Datum: 21-12-07
Onans Lemming heeft de bètacanon van De Volkskrant met veel interesse gevolgd en daar uitgebreid verslag van gedaan. Afgelopen zaterdag was de laatste aflevering. In totaal zijn er 50 afleveringen geweest. Door een of andere volstrekt duistere reden heeft hij de afleveringen 28 t/m 33 gemist. En groot gemis, omdat veel canons naar elkaar verwijzen. Daarom gaat hij dat nu inhalen. Vandaag aflevering 30!

CANON 30: DE NORMALE VERDELING
Bron: De Volkskrant
Auteur: Hester Bijl
Datum: 27-07-07
Vormgever: Karel Hageman

Wie nu in de caravan zit, omdat het buiten regent, en bovendien kinderen in de mens-erger-je-niet-leeftijd heeft, weet het: met een dobbelsteen is de kans op een 1 even groot als de kans op een 3 of een 6. Je jongste zoon denkt misschien, dat je vaker een 1 gooit dan een 6, maar als je vaak gooit blijkt dat niet waar te zijn.
Als we gaan ganzenborden met 2 dobbelstenen, wordt het anders. Het gemiddelde gaat nog wel goed: dat verdubbelt keurig van 3½ naar 7. Maar de kans op 7 is veel groter dan de kans op 2 of 12. Als je op ruitjespapier alle getallen van 2 tot en met 12 naast elkaar tekent, en je kleurt steeds een vakje bij de worp, die je gooit, dan ontstaat er een berg. Zou je dit met meer dobbelstenen doen, dan neemt het steeds meer de vorm aan van een klok. Wat is hier aan de hand?
A. de Moivre: The Doctrine of Chances, 1718
Dit verschijnsel is al bekend uit de tijd van voor de caravan. De 18e eeuwse wiskundige Abraham de Moivre kreeg hierover al vragen van gokkers. Wat is de kans op meer dan 60x kop als je 100x een munt gooit? De antwoorden hierop volgen uit lange sommen. De kans uitrekenen op 61x kop, 62x kop … tot en met 100x en dan optellen. Wiskundige berekeningen waar makkelijk een fout insluipt. De Moivre ontdekte een snellere manier. Hij vond een wetmatigheid, die bij dit soort experimenten de kans geeft: de normale verdeling. Door met deze functie te werken, kon hij veel sneller antwoord geven.
Met het begrip ‘verdeling’ beschrijven wiskundigen, hoe vaak elke uitkomst relatief voorkomt. Gooien met 1 dobbelsteen geeft bijvoorbeeld een uniforme verdeling; elke uitkomst komt evenveel voor. De inkomensverdeling is niet uniform, want er zijn meer modale inkomens dan topinkomens (al lijkt dat in de pers vaak niet zo). De normale verdeling is in de wiskunde heel belangrijk. Hij ziet er als wiskundige functie ingewikkeld uit, maar hij duikt overal in de natuur op.
De normale verdeling ontstaat vanzelf, waar toevallige uitkomsten (lengte, gewicht, aantal babymuizen, ogen van dobbelstenen) een optelling zijn van een groot aantal, kleine, onafhankelijke toevallige effecten. Hoe meer effecten (aantal dobbelstenen) en hoe meer uitkomsten (worpen van de dobbelstenen), hoe meer de verdeling op de normale verdeling lijkt: dat is de centrale limiet stelling.
Abraham de Moivre
Deze stelling is heel bruikbaar, omdat in de natuur uitkomsten vaak ontstaan uit een optelsom van een groot aantal, kleine, onafhankelijke toevallige effecten. Naast het gooien van een munt ook bij de intelligentie van groep-8-kinderen, de middagtemperatuur op de camping, of de bloeddruk van een volwassen vrouw. Bloeddruk is namelijk afhankelijk van een groot aantal onafhankelijke factoren zoals erfelijkheid, lichaamsgewicht en leeftijd.
De normale verdeling heeft een aantal bijzondere eigenschappen. Ten 1e is de kans op het gemiddelde het grootst, ten 2e is de kans op een waarde boven het gemiddelde even groot als de kans op een waarde onder het gemiddelde (symmetrie) en ten slotte is de kans op de uiterste waarden het kleinst. Een grafiek van de verdelingsfunctie heeft de vorm van een klok, en wordt daarom in het Engels vaak bell curve genoemd. Die functie kan met slechts 2 getallen worden beschreven: het gemiddelde en de variantie. Dat laatste geeft aan, hoe ver de uitkomsten door de bank genomen van het gemiddelde afliggen, oftewel de breedte van de klok. Zodra je deze 2 gegevens hebt, weet je de hele verdeling. In de afbeelding staan 4 verschillende normale verdelingen met verschillende waarden voor hun gemiddelde (µ) en variantie (s).
Carl Friedrich Gauss
Omdat veel natuurlijke verschijnselen normaal verdeeld zijn, maken natuurwetenschappers en psychologen veel gebruik van de verdeling. Omdat deze al vast ligt als 2 getallen bekend zijn, kunnen we veel uitspraken doen over zaken, waar we relatief weinig van weten. Als je aanneemt, dat een waarneming wordt bepaald door de optelsom van vele, kleine, onafhankelijke effecten, kun je met de normale verdeling allerlei voorspellingen doen, ook al zijn de precieze onderliggende mechanismen onbekend. Zo kan uit een representatieve steekproef het gemiddelde en de variantie van de lengte van de volwassen Nederlandse man worden benaderd. Daarmee kun je dan schatten hoeveel mannen van boven de 2 meter in Nederland wonen.
Het is verleidelijk normale verdelingen ook te zien, waar ze niet zijn. Bijvoorbeeld als de uitkomst wordt bepaald door 1 dominant effect. Dan is de aanname van benadering door een normale verdeling niet meer juist. Dit is het geval voor de bloeddruk van een grote groep mensen. Het geslacht is zo bepalend, dat je de normale verdeling pas ziet als mannen en vrouwen gescheiden worden.
Pierre-Simon Laplace
De Moivres werk werd niet veel gelezen. Daardoor werd de normale verdeling later herontdekt, onder andere door de beroemde wiskundigen Pierre-Simon Laplace en Carl Gauss. Gauss merkte in het begin van de 19e eeuw, dat de fouten bij waarnemingen aan planetenbanen bij benadering normaal verdeeld zijn. De normale verdeling wordt daarom ook wel de Gaussische verdeling genoemd. Nog steeds wordt de normale verdeling gebruikt bij de bepaling van meetfouten. Daarbij wordt aangenomen, dat de meetfouten veroorzaakt worden door een scala aan kleine, onafhankelijke effecten.
De normale verdeling wordt ook gebruikt in het verzekeringswezen en in de sociale wetenschappen. De 19e eeuwse wiskundige Adolphe Quetelet – we kennen hem van de Quetelet-index – was de 1e, die dat met sociale gegevens deed. Uit metingen van de borstomvang van Schotse soldaten en de lengte van Franse soldaten ontdekte hij, dat deze normaal verdeeld waren. Hij was ook een van de eersten, die de verdeling als normatief uitgangspunt hanteerde. Hij ging zo ver, dat hij een ‘gemiddelde-mens’ definieerde. Een afwijking van zo’n gemiddelde beschouwde hij als een ‘fout’, wat op weerstand stuitte.

Adolphe Quetelet
Halverwege de 20e eeuw kwam de computer. Daardoor zijn statistische methoden steeds geraffineerder geworden en is het mogelijk wiskunde en statistiek ver buiten de beperkingen van de normale verdeling te bedrijven. Zo is het in de financiële wereld heel belangrijk om afwijkingen van de normaalverdeling op te sporen, juist in de staart van de verdeling, waar de zeldzame gebeurtenissen zoals beurskrachen zich bevinden. Maar de normale verdeling blijft een krachtig wiskundig instrument om orde te brengen in een onvoorspelbare wereld.
Heeft de auteur iets over het hoofd gezien of kunnen sommige passages beter? Op de website www.vk.nl/betacanon kunnen geregistreerde lezers online meeschrijven aan deze en oude afleveringen van de Volkskrant Bètacanon.

Commentaar van Onans Lemming bij dit artikel:
Gevoelskans
Als Onans Lemming mens-erger-je-niet speelt, dan heeft hij helemaal niet het gevoel dat een kans op een 6 even groot is als de kans op een 1. Vooral niet als hij al z’n pionnetjes op de thuishaven heeft staan, duurt het minstens 20x, voordat hij eindelijk die zo felbegeerde 6 gooit. Ook valt het hem op, dat zijn medespeler achteloos de ene 6 na de andere gooit. Hoezo is de kans op een 6 dan even groot als op een 1? Hij gooit enen bij de vleet, maar zessen homaar. Dit noemen we de zogenaamde gevoelskans en deze is veel realistischer dan de wiskundige kans, dus waarom vervangen ze bij de kansberekening de statistische kans niet door de gevoelskans? Bij allerlei andere wetenschappen gebeurt dat ook en met succes! Zo hebben weerkundigen het veel vaker over de gevoelstemperatuur dan over de werkelijke temperatuur. Nou dan. Bovendien wemelt het van de gevoelskansen in onze maatschappij. Enkele voorbeelden.
Als u meespeelt met de Postcode-Loterij en er zijn 1.000.000 postcodes, dan is uw kans om te winnen veel groter dan 1/1.000.000. Iedereen weet dat. Bovendien kun je deze kans nog aanmerkelijk vergroten als je zelf ook nog eens het eindcijfer mag bepalen! Dan stijgt de kans op winst al gauw naar 1/1.000. Als u vorige keer de hoofdprijs heeft gewonnen, dan moet u natuurlijk meteen uitscheiden, want de kans op 2x de hoofdprijs ligt in de orde van grootte van 1/1.000.000.000.000.000. Als u trouwens niet-meespeelt in de Postcode-Loterij is de kans, dat het winnende lot op uw Postcode valt, veel groter dan als u wel meespeelt.

Als u in de auto stapt, dan is de kans op een dodelijk auto-ongeluk bijna nihil, terwijl alle andere weggebruikers wel een reële kans hebben om het er niet-levend vanaf te brengen. Maar ja, die beschikken nu eenmaal niet over de rijvaardigheid, die u bezit, om nog maar te zwijgen over uw reactievermogen!
Als u in de auto, op een gevaarlijke 2-baansweg, achteloos een shagje zit te rollen, met het stuur tussen de benen geklemd, dan is de kans op een ongeluk verwaarloosbaar klein, omdat uw reactievermogen erg goed is en u dit al talloze malen vaker heeft gedaan!

Als u rookt, dan is de kans dat u longkanker krijgt een stuk kleiner dan alle andere mensen, die ook roken. Maar ja, u heeft wel vaker mazzel, bij u komt het nauwelijks in de familie voor en bovendien rookt u light-sigaretten en uw opa is er ook 92 mee geworden!
Als u 3x achter elkaar een 6 heeft gegooid, hoe groot is dan de kans, dat u de 4e keer weer een 6 gooit? Echt geen 1/6, want hoe groot is nu de kans, dat u 4x achter elkaar een 6 gooit? Nou dan. Die kans ligt dan meer in de orde van grootte van 1/1.000.

Als er net bij u is ingebroken, dan kunt u uw inbraakverzekering wel opzeggen, want de kans dat er voor de 2e keer bij u wordt ongebroken is verwaarloosbaar klein, in wat voor criminele buurt u ook woont.
Ziehier een ruikertje van gevoelskansen, waarvan een ieder weet dat ze kloppen, maar waar de kansberekeking geen boodschap aan heeft. Als ze de wetenschap nu wat dichter bij de mensen wil brengen – zoals deze bètacanon beoogt – dan moeten ze het eens wat meer over gevoelskansen hebben in plaats van dorre statistische kansen.

Statistische kans
Laten we weer teruggaan naar de statistische kansen. De statistische kansberekening kent vaak hele onwaarschijnlijke uitkomsten, die kansberekening tot zo’n intrigerend vak maken. Wederom weer enkele voorbeelden.
Hoe groot is de kans, dat u achter elkaar met een munt 50x kop gooit? Niet groot weet u, maar u heeft al een paar keer 20x achter elkaar kop gegooid, dus met even doorzetten, moet dat wel lukken. Onas Lemming heeft dit eens uitgerekend en is tot het volgende antwoord gekomen. Als 1 miljoen mensen 10x in een minuut een munt opgooien, gedurende 40 uur per week, zal het eens in de 900 jaar voorkomen! Deze kans is veel kleiner dan u dacht, maar reken het maar na, het klopt. Als u toch niet overtuigd bent, laatst gooide u nog 25x achter elkaar kop, dan kunt u Onans Lemming een weekendje uitnodigen en zullen we het proefondervindelijk onderzoeken. Mocht het u lukken in dit weekend 50x kop te gooien, dan garandeert Onans Lemming u, dat hij uw gewicht in goud zal uitbetalen. Mocht het niet lukken, dan brengt hij dubbele reiskosten in rekening.
Als u geblinddoekt bij een lantarenpaal staat en u maakt honderd passen van 1 meter en na iedere pas verandert u van richting en u tracht zo ver mogelijk van de lantarenpaal vandaan te komen, hoeveel meter bent u dan na die 100 stappen van de lantarenpaal maximaal verwijderd? Als u dit uitrekent, bent u dan hoogstens 10 meter van de paal verwijderd, Verbazend en probeer het dus maar uit. Het klopt echt.
Even een simpele tussendoortje om de moed erin te houden. Wanneer uw buurman zegt: ‘1 van mijn 2 kinderen is een jongen’. Hoe groot is dan de kans dat het andere kind ook een jongen is? Helaas, u dacht dat dat 50% is, maar het is slechts 33,33%. Ga maar na: bij 2 kinderen heb je 3 mogelijkheden: jongen-jongen, meisje-jongen, jongen-meisje (meisje-meisje valt af, omdat de buurman al gezegd had, dat 1 van de kinderen een jongen is). Alleen de 1e mogelijkheid is goed, dus 33,33%.
Nog een simpele. U heeft 3 voorwerpen in een grabbelton: een peer, een appel en een tol. U haalt ze alle 3 uit de grabbelton, hoe groot is dan de kans, dat u de volgorde van tevoren juist raad? Het antwoord is 1/6. Misschien had u deze wel goed. Stel u had gegokt op appel, tol, peer. Er zijn dan 6 mogelijke uitkomsten: appel-tol-peer, appel-peer-tol, tol-appel-peer, tol-peer-appel, peer-tol-appel en peer-appel-tol. Aleem de 1e combinatie is goed, dus is de kans 1/6.

Dan nu de allersimpelste. Stel u woont in Bedum en werkt in Groningen. De kans dat u een late trein naar Bedum neemt, omdat u moet overwerken, is 50%. De kans, dat u met een vriendin uitgaat in Groningen en daar blijft slapen is 60%. Hoe groot is de kans dat u in Groningen blijft? Precies, die had u meteen goed: 80%, namelijk 50% + 60% van 50% = 80%. Als u hier 110% geantwoord heeft, dan kunt u maar beter de hele bètacanon niet meer volgen
Tot slot nog enkele kansen voor de pokeraars (5 kaarten) onder ons (rekent u even mee?):
De kans op Royal Flush (5 jaarten van dezelfde kleur op een rij met als hoogste de aas) is 1 : 649.740
De kans op Full House (2 gelijken en 3 gelijken) is 1 : 694
De kans op Flush is (5 kaarten van dezelfde kleur) is 1 : 509
De kans op One Pair (2 gelijken) is 1 : 2,37
De kans op Straight Flush (5 kaarten van dezelfde kleur op een rij) is 1 : 72.193

Nog enkele kansen voor de bridgers (13 kaarten) onder ons:
De kans op 13 hoogste kaarten is 1 : 158.753.389.900
De kans op 13 kaarten van één kleur is 1 : 158.753.389.900
De kans op de 12 hoogsten van één kleur is 1 : 367.484.699
De kans op 16 punten is 1 : 105
De kans op 4 azen is 1 : 379
De kans op helemaal geen plaatjes is 1 : 1.828

Tot slot de uitsmijter:
Op hoeveel verschillende manieren kun je 5 kaarten (pokeren) krijgen?
Antwoord: Op 2.598.960 verschillende manieren.
Op hoeveel verschillende manieren kun je 13 kaarten (bridgen) krijgen?
Antwoord: Op 635.013.559.600 verschillende manieren.
Op hoeveel verschillende volgordes kun je een pak van 52 kaarten leggen?
Antwoord: Dit is een getal, dat u helemaal niet meer kunt bevatten. Het is een getal van 68 cijfers. Om u een indruk te geven hoeveel dit is, dit voorbeeld. Als alle mensen op aarde, 24 uur per dag, elke seconde 1 miljoen volgorden konden samenstellen (dat is wel heeeel snel), dan waren ze na 80 jaar nog niet verder dan tot een miljardste van een miljardste % van alle mogelijkheden!
Rekent u, met de feestdagen, alles nog even na?