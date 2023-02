Paul De Grauwe is professor aan de London School of Economics. Zijn column verschijnt tweewekelijks.

Toen ChatGPT op het toneel verscheen, was het even schrikken. In de onderwijswereld, in de journalistiek en op vele andere plaatsen brak zelfs lichte paniek uit. Wat gaat er nu met ons beroep gebeuren als het heilige der heiligen, onze unieke menselijke capaciteit om gedachten op papier te zetten, om verhalen te vertellen en om waarheidsgetrouwe analyses te maken zomaar door een chatbot sneller en beter kan worden ingevuld? Met ons beroep bedoel ik hier zowel de professor-leraar als de columnist die ik ben.

Om de proef op de som te nemen, deed ik de volgende experimenten. Ik stelde eerst een aantal vragen aan ChatGPT in een domein waarin ik enige deskundigheid heb. Zo begon ik met de volgende vraag: wat was het hoogste niveau van de rentevoet die de ECB controleert sinds 2000? Antwoord van ChatGPT: 4,25 procent in 2008. Dat was dus fout. Het hoogste niveau was 4,75 procent in 2001. Ik dacht bij mezelf: raar dat die dat mis heeft. Het is gemakkelijk te controleren op Google. Maar ChatGPT doet dit blijkbaar niet. Ik vertel dus aan ChatGPT dat zijn antwoord verkeerd is. Dan ontdek ik iets merkwaardigs: de chatbot geeft zijn fout ruiterlijk toe en verontschuldigt zich.

Volgende vraag dan maar: voldeed België aan de Maastrichtnormen over begrotingstekort en overheidsschuld toen het land toetrad tot de eurozone? Antwoord: Ja, België voldeed aan de Maastrichtnormen. Opnieuw fout. België zat met zijn overheidsschuld in 1999 ver boven de norm van 60 procent van het bbp. Het land werd toch toegelaten tot de eurozone, zoals een aantal andere kandidaat-landen die ook werden toegelaten ondanks het feit dat ze niet voldeden aan één of andere Maastrichtnorm.

Ik signaleer de fout aan ChatGPT. Opnieuw een onmiddellijke erkenning dat hij zich vergist heeft en een excuus. Maar dan begaat ChatGPT een unprovoked error. De chatbot voegt aan zijn excuus toe dat de Europese Unie vandaag de overheidstekorten en schuldpositie van landen nauwlettend in de gaten houdt en hen aanzet om hun budgettair huis in orde te brengen. Als ik dan opmerk dat de budgettaire regels tijdelijk buitenspel werden gezet sinds de pandemie, erkent de chatbot onmiddellijk (met de nodige excuses) dat hij zich alweer vergist heeft.

Buiten raad over zoveel onnauwkeurigheden stel ik de vraag: wie is Paul De Grauwe? Antwoord: Paul De Grauwe is emeritus professor aan de London School of Economics? De moed zakt me in de schoenen. Waarom word ik nu emeritus verklaard aan LSE? Ik ben wel emeritus aan de KU Leuven maar ik wil nog niet op pensioen gaan in Londen.

Wat kunnen we leren uit al die foutieve informatie die ChatGPT construeert? Wanneer ChatGPT op mijn vragen antwoordt, stelt hij zich niet de vraag wat het correcte antwoord is, maar wel wat het antwoord is dat een voldoende graad van waarschijnlijkheid heeft. De hele methodologie achter de chatbot is gebaseerd op statistische voorspellingen. Op basis van ongelooflijk veel teksten op het internet voorspelt de chatbot wat het meest waarschijnlijke volgende woord is in een zin, en komt op die manier tot de constructie van zinnen die dikwijls heel overtuigend en coherent zijn. Dat levert bevredigende resultaten als we filosofische essays, literatuur en poëzie willen produceren.

Maar wanneer we analyses willen maken doorspekt met factuele informatie, dan stokt ChatGPT. Vele feiten kunnen geconstrueerd worden die plausibel zijn. Daarmee bedoel ik dat het feiten zijn die zich zouden (of hadden) kunnen voordoen, zelfs met een grote graad van waarschijnlijkheid. Neem het antwoord dat ik emeritus professor ben aan de LSE. Dat is hoogst plausibel. Een prof van 76 jaar heeft een veel grotere waarschijnlijkheid emeritus dan niet-emeritus te zijn. En toch is het antwoord factueel fout.

Of neem het antwoord dat België toegelaten werd tot de eurozone ondanks het feit dat het niet voldeed aan één van de Maastrichtnormen. Ook dat is een plausibel antwoord. Vele landen die toegelaten werden voldeden aan die normen. Dus was het voor ChatGPT plausibel dat België dat ook deed. Maar het was geen feit.

Waarom ChatGPT mijn vraag over de rentevoeten miste kan ik niet goed verklaren. Er waren twee pieken in de rentevoeten: één rond 2001, en een tweede rond 2008. ChatGPT pikte de tweede en miste de eerste. Waarom weet ik niet. Misschien vinden deskundigen hierop een antwoord.

Mijn voorlopige conclusie. Mensen die analyses maken op basis van factuele informatie, zoals professoren en journalisten, hoeven zich geen zorgen te maken over ChatGPT. Die is te onbetrouwbaar om een ernstige concurrent te zijn.