Maandag 16/09/2019

Pokeren

Pluribus de pokercomputer leerde zichzelf zo goed pokeren, dat zelfs de beste spelers kansloos zijn

Eén voordeel had hij al: een pokerface hoefde de computer zich niet aan te meten. Beeld ANP

Een Amerikaanse computer leerde zichzelf pokeren. Zo goed, dat zelfs de beste pokerspelers kansloos tegen hem zijn.

Eén voordeel had hij al: een pokerface hoefde de computer zich niet aan te meten. Maar dat een machine de beste pokerspelers ter wereld in de pan zou hakken, is toch zeer opmerkelijk. Bij het pokeren komt immers meer kijken dan alleen slimmigheid en kansberekening. Een pokerspeler moet ook kunnen bluffen en misleiden. Ook in die typisch menselijke eigenschappen is een machine nu dus beter.

Al in 2017 claimden wetenschappers dat hun computer beter kon pokeren dan de mens. Dat was een mijlpaal. De computer had eerder gewonnen met spellen als dammen, schaken en go, gecompliceerd door het grote aantal mogelijke zetten, maar nog altijd overzichtelijk. Bij poker weet je niet wat de ander in handen heeft.

Twee jaren geleden had hij dat dus onder de knie, maar dan wel met één tegenstander tegenover zich. Aan een echte pokertafel zitten doorgaans meer mensen en moet een speler zijn strategie op al die onberekenbare opponenten afstemmen. Dan worden de rekenhulpen uit de kanstheorie al snel veel te ingewikkeld.

Computerwetenschappers van de universiteit van Pittsburgh en van Facebook pakten het daarom anders aan. Zij lieten hun computer, die ze Pluribus noemden, eerst vele pokerspelletjes met zichzelf spelen. Zo leerde hij het spel doorgronden, en wat zijn kansen waren bij de kaarten die hij te zien kreeg. Nu wist Pluribus wanneer hij goede kans had om te winnen en wanneer niet. Maar zo win je nog niet met poker. Als iemand alleen met goede kaarten geld inzet en met slechte past, weten de anderen snel waar ze aan toe zijn.

Dus leerden ze Pluribus om zo nu en dan af te wijken van de voor de hand liggende strategie, en er rekening mee te houden dat zijn tegenstanders dat ook doen. Weer lieten ze hem talloze spelletjes met zichzelf spelen zodat hij de balans kon vinden tussen verstandig spelen en onvoorspelbaar blijven.

Donk bet

Pluribus speelde 10.000 spellen tegen vijf professionele pokerspelers. In alle gevallen won de computer glansrijk, schreven de wetenschappers in het vakblad Science. Ze zijn vooral verrast door de strategieën die Pluribus bedacht.

Neem bijvoorbeeld de donk bet: je gaat eerst alleen mee, maar in de volgende biedronde verhoog je de inzet. Dat doen pokerspelers zelden - je sticht er verwarring mee, maar het strategische nut ervan zien ze niet in.

Maar de kern van het succes van Pluribus is dat hij gemengde strategieën weet te gebruiken, zeggen de onderzoekers. Mensen proberen dat ook, maar het is de kunst om dat volledig willekeurig te doen en daar consistent in te zijn. "Dat kunnen mensen niet."

Meer over

Wilt u belangrijke informatie delen met De Morgen?

Tip hier onze journalisten


Op alle verhalen van De Morgen rust uiteraard copyright. Linken kan altijd, eventueel met de intro van het stuk erboven.
Wil je tekst overnemen of een video(fragment), foto of illustratie gebruiken, mail dan naar info@demorgen.be.
DPG Media nv – Mediaplein 1, 2018 Antwerpen – RPR Antwerpen nr. 0432.306.234