Woensdag 18/05/2022

Provocerend boek over hoe statistisch onderzoek ons leven beheerst

Het tijdperk der getallen

De tijd waarin voorspellingen werden gedaan op grond van ervaring en intuïtie is voorbij, aldus Ian Ayres, professor rechten en management aan Yale University. We leven nu in het tijdperk van de 'Super Crunchers' ofte 'getallenkrakers' (uit de titel van het boek), de mensen die alle statistische vergelijkingen controleren en daar conclusies uit trekken.

Terwijl ik deze woorden tik, blaast Miles Davis het 'Concierto de Aranjuez' uit de speakers van de laptop. Daarvoor zong Bob Seger 'We've Got Tonight'. Wat zal volgen, valt af te wachten, maar goed zal het vrijwel zeker zijn. Want My Station onderzoekt de muzikale smaak van de gebruiker en bezorgt hem zo een eigen internet-jukebox-op-maat.

Wie een boek, bijvoorbeeld Super Crunchers, bestelt via de webwinkel Amazon, krijgt van die leverancier te horen welke boeken van eenzelfde genre er op de markt zijn, want ook daar houden ze de smaak van de klant zorgvuldig bij en bieden ze een soort elektronische bibliotheek-op-aanvraag.

Erg handig allemaal, al krijg je soms wel het gevoel dat er wel erg vaak iemand over je schouder kijkt. Maar dat, zo schrijft Ian Ayres, weegt niet op tegen de voordelen. Wat Yahoo en Amazon en vele andere bedrijven en instellingen doen, maakt namelijk deel uit van de manier waarop statistisch onderzoek een steeds belangrijkere rol speelt in alle facetten van ons leven en "thinking in numbers is the new way to be smart".

Anekdotes

'Slim' zoals Orley Ashenfelter, statisticus van beroep, wijnliefhebber in zijn vrije tijd. Hij besloot de kwaliteit van bordeauxwijnen te voorspellen en dat louter op basis van klimatologische gegevens. Tot grote verontwaardiging van de kenners en proevers natuurlijk. Maar hij had het, tot grote tevredenheid van Ayres en andere Super Crunchers, wel heel vaak bij het rechte eind.

Het boek van Ayres bevat veel van dat soort aardige anekdotes, wat het behalve leerrijk ook zeer leesbaar maakt. En ook wanneer de auteur de historiek uitlegt van het kwantitatieve onderzoek waarover dit boek gaat, doet hij echt niet moeilijk.

Het eerste wat bij die achtergrondschets opvalt, is dat twee van de drie sleutelfactoren die meespelen bij het getallenkraken verre van nieuw zijn. De 'moeder van alle Super Crunchingtechnieken' bijvoorbeeld, dateert al van 1877. Want toen berekende Francis Galton, een neef van Charles Darwin trouwens, de grootte van erwten op grond van de omvang van de zaden waaruit zij groeiden. En het gebruik van een historische terugblik voor het maken van ramingen, dat 'statistische regressie' wordt genoemd, is nog springlevend. Hetzelfde geldt voor het cruciale 'randomized testing', waarbij deelnemers aan een onderzoek in twee willekeurige (liefst grote) groepen worden opgesplitst om na te gaan welke aanpak het succesvolst is. Die techniek werd al in 1925 uitgevonden - om meer dan 80 jaar later door Ayres zelf te worden toegepast toen hij Googlegebruikers twee mogelijke titels voor zijn boek voorlegde: The End of Intuition of Super Crunchers. Het resultaat kennen we intussen.

Dat het gebruik van statistische gegevens pas recentelijk op echt grote schaal is doorgebroken, heeft echter, "meer te maken met technologie dan met statistische technieken". Met de digitalisering namelijk, en met de snel toenemende capaciteit om grote hoeveelheden gegevens te verwerken. Want de 'data miners' die zich hiermee bezighouden, denken allang niet meer in mega- of gigabytes, maar in terabytes of de nog straffere petabytes (een miljoen gigabytes).

Schaakmat

Dat Garry Kasparov, tot duidelijke blijdschap van de auteur, schaakmat werd gezet door de computer Deep Blue bijvoorbeeld, komt doordat die laatste beschikte over een database waarin maar liefst 700.000 partijen zaten opgeslagen.

Nu was die schaakmatch vooral een publiciteitsstunt, maar de manier waarop de hedendaagse databanken technieken zoals het 'randomized testing' kunnen verwerken, heeft ook en vooral praktische gevolgen. Dat supermarkten langs deze weg nagaan wát wélke klanten willen, is eigenlijk al bijna ouderwets. Op basis van statistisch onderzoek kunnen luchtvaartmaatschappijen selecteren welke passagiers het snelst moeten worden geholpen na afgelasting van een vlucht: namelijk de meest 'rendabele' klanten. En autoverhuurders gaan de kredietwaardigheid van klanten na, omdat wie slecht scoort, ook vaker bij ongevallen betrokken is. Nadat de wereld van de marketing als eerste doorkreeg welke mogelijkheden het getallenkraken biedt, volgden andere sectoren. Ook de overheid maakt er steeds vaker gebruik van, denk maar aan de 'No Child Left Behind'-wet, een van de weinige lichtpuntjes in het bijna afgesloten Bushtijdperk, waarbij statistische analyses het leerplan dirigeren. In de medische wereld is empirisch onderzoek naar de oorzaken van ziektes niets nieuws, want dat hygiëne levens kan redden, zag de Oostenrijker Semmelstein anderhalve eeuw geleden al met eigen ogen. Maar toen kinderarts Don Berwick enkele jaren geleden met zes simpele aanbevelingen in moderne ziekenhuizen 100.000 sterfgevallen hielp voorkomen, was dat niet het gevolg van wat hij zag, maar van wat de statistieken hem vertelden. Ook bij het stellen van diagnoses zorgen de databanken van de getallenkrakers voor doorbraken en zal de rol van de arts volgens Ayres kleiner worden omdat statistieken keer op keer doeltreffender zullen blijken. Efficiënter ook dan de intuïtieve diagnoses van Amerika's populairste tv-dokter House MD. Want Ayres mag dan een fan zijn van die reeks, "alleen in fictie klopt de mens de machine".

Menselijk ego

Dat komt, zo legt Ayres uit, door de ingebouwde tekortkomingen van het menselijk brein en de neiging om zowel gebeurtenissen als onszelf te overschatten, zoals hij met voorbeelden aantoont. Statistieken en cijfers daarentegen "hebben geen ego en lijden niet aan overdreven zelfvertrouwen". Maar hoe juist dat ook mag zijn, erg goed voor het menselijk zelfvertrouwen is die vaststelling niet en dat verklaart (mede) de bijna instinctief afwijzende reacties op de wijnprognoses of de nederlaag van Kasparov. Ian Ayres voelt dat kennelijk ook aan, want naar het einde van het boek toe wordt hij wat milder voor zijn soortgenoten. Terwijl hij in zijn inleiding botweg stelt dat "intuitie en ervaring het keer op keer moeten afleggen tegen het kraken van getallen", schrijft hij 200 bladzijden later dat het menselijk brein en zijn intuïtie nog bruikbaar zijn om te bepalen welke variabelen kunnen worden verwerkt in statistische analyses. Ook verzekert hij dat getallen kraken "een aanvulling van en geen substituut is voor intuïtie", om daar echter aan toe te voegen dat "als er voldoende data beschikbaar zijn, het kraken van getallen altijd zal winnen".

Dat door technologie gedreven cijfermatige analyses een steeds grotere rol zullen spelen in een steeds meer geautomatiseerde wereld, staat buiten kijf. Dat zal zeker positieve gevolgen hebben, maar of deze binaire nieuwe wereld zo schitterend zal zijn als Ayres lijkt te geloven, is minder zeker. Niet alleen omdat er, zoals Nassim Taleb in De zwarte zwaan schrijft, altijd onvoorziene gebeurtenissen zullen zijn die door kwantitatief onderzoek (waartegen Taleb onlangs in deze krant scherp uitviel) niet worden onderkend. Maar vooral omdat, ondanks de bestaande kraaktechnieken, op Nouriel Roubini en enkele andere visionairen na, niemand wist te voorspellen dat de wereld afstevende op een globale crisis. Sterker nog, Ayres prijst de managers van 'hedge funds' die een grote rol speelden in de huidige economische waanzin als voorbeelden van een "nieuw ras van getallenkrakers". Tja...

Maar overtrokken enthousiasme of niet, Super Crunchers is een belangrijk boek dat, net als Freakonomics van Steven Levitt en - ondanks de diametraal tegengestelde thesis - Talebs De zwarte zwaan, aanzet tot een nieuw soort denken over economie. Levendig, provocerend, toegankelijk. En zo'n frisse wind kan de 'dismal science', zeker nu, goed gebruiken.

Hans Muys

Bantam Books, 260 p., 25 dollar.

Ian Ayres

Super Crunchers, Why Thinking-by-Numbers Is the New Way to Be Smart

In tegenstelling tot de mens, hebben statistieken en cijfers geen ego en lijden ze niet aan overdreven zelfvertrouwen, aldus de auteur

n Een statisticus besloot de kwaliteit van bordeauxwijnen te voorspellen louter op basis van klimatologische gegevens. Tot grote verontwaardiging van de kenners en proevers natuurlijk.

Meer over

Nu belangrijker dan ooit: steun kwaliteitsjournalistiek.

Neem een abonnement op De Morgen


Op alle artikelen, foto's en video's op demorgen.be rust auteursrecht. Deeplinken kan, maar dan zonder dat onze content in een nieuw frame op uw website verschijnt. Graag enkel de titel van onze website en de titel van het artikel vermelden in de link. Indien u teksten, foto's of video's op een andere manier wenst over te nemen, mail dan naar info@demorgen.be.
DPG Media nv – Mediaplein 1, 2018 Antwerpen – RPR Antwerpen nr. 0432.306.234