Woensdag 06/07/2022

Pokeren

Pluribus de pokercomputer leerde zichzelf zo goed pokeren, dat zelfs de beste spelers kansloos zijn

Eén voordeel had hij al: een pokerface hoefde de computer zich niet aan te meten. Beeld ANP
Eén voordeel had hij al: een pokerface hoefde de computer zich niet aan te meten.Beeld ANP

Een Amerikaanse computer leerde zichzelf pokeren. Zo goed, dat zelfs de beste pokerspelers kansloos tegen hem zijn.

Joep Engels

Eén voordeel had hij al: een pokerface hoefde de computer zich niet aan te meten. Maar dat een machine de beste pokerspelers ter wereld in de pan zou hakken, is toch zeer opmerkelijk. Bij het pokeren komt immers meer kijken dan alleen slimmigheid en kansberekening. Een pokerspeler moet ook kunnen bluffen en misleiden. Ook in die typisch menselijke eigenschappen is een machine nu dus beter.

Al in 2017 claimden wetenschappers dat hun computer beter kon pokeren dan de mens. Dat was een mijlpaal. De computer had eerder gewonnen met spellen als dammen, schaken en go, gecompliceerd door het grote aantal mogelijke zetten, maar nog altijd overzichtelijk. Bij poker weet je niet wat de ander in handen heeft.

Twee jaren geleden had hij dat dus onder de knie, maar dan wel met één tegenstander tegenover zich. Aan een echte pokertafel zitten doorgaans meer mensen en moet een speler zijn strategie op al die onberekenbare opponenten afstemmen. Dan worden de rekenhulpen uit de kanstheorie al snel veel te ingewikkeld.

Computerwetenschappers van de universiteit van Pittsburgh en van Facebook pakten het daarom anders aan. Zij lieten hun computer, die ze Pluribus noemden, eerst vele pokerspelletjes met zichzelf spelen. Zo leerde hij het spel doorgronden, en wat zijn kansen waren bij de kaarten die hij te zien kreeg. Nu wist Pluribus wanneer hij goede kans had om te winnen en wanneer niet. Maar zo win je nog niet met poker. Als iemand alleen met goede kaarten geld inzet en met slechte past, weten de anderen snel waar ze aan toe zijn.

Dus leerden ze Pluribus om zo nu en dan af te wijken van de voor de hand liggende strategie, en er rekening mee te houden dat zijn tegenstanders dat ook doen. Weer lieten ze hem talloze spelletjes met zichzelf spelen zodat hij de balans kon vinden tussen verstandig spelen en onvoorspelbaar blijven.

Donk bet

Pluribus speelde 10.000 spellen tegen vijf professionele pokerspelers. In alle gevallen won de computer glansrijk, schreven de wetenschappers in het vakblad Science. Ze zijn vooral verrast door de strategieën die Pluribus bedacht.

Neem bijvoorbeeld de donk bet: je gaat eerst alleen mee, maar in de volgende biedronde verhoog je de inzet. Dat doen pokerspelers zelden - je sticht er verwarring mee, maar het strategische nut ervan zien ze niet in.

Maar de kern van het succes van Pluribus is dat hij gemengde strategieën weet te gebruiken, zeggen de onderzoekers. Mensen proberen dat ook, maar het is de kunst om dat volledig willekeurig te doen en daar consistent in te zijn. "Dat kunnen mensen niet."

Meer over

Nu belangrijker dan ooit: steun kwaliteitsjournalistiek.

Neem een abonnement op De Morgen


Op alle artikelen, foto's en video's op demorgen.be rust auteursrecht. Deeplinken kan, maar dan zonder dat onze content in een nieuw frame op uw website verschijnt. Graag enkel de titel van onze website en de titel van het artikel vermelden in de link. Indien u teksten, foto's of video's op een andere manier wenst over te nemen, mail dan naar info@demorgen.be.
DPG Media nv – Mediaplein 1, 2018 Antwerpen – RPR Antwerpen nr. 0432.306.234