Voor de huidige studie, die gepubliceerd werd in het magazine PLOS Digital health, testten onderzoekers van een medisch bedrijf de chatrobot uit op een examen dat geneeskundestudenten in de VS moeten afleggen en waarbij ze bevraagd worden over verschillende domeinen (wetenschappelijke kennis, klinisch redeneren, bio-ethiek,...). Het gaat om het zogenaamde ‘United States Medical Licensing Exam’ (USMLE).

ChatGPT werd getest op 350 van de 376 vragen uit het examen van juni 2022. Vragen gebaseerd op beelden werden buiten beschouwing gelaten. ChatGPT behaalde uiteindelijk een score tussen 52,4 procent en 75 procent goede antwoorden. Over het algemeen is een score van 60 procent nodig om te slagen voor het examen. "ChatGPT komt dus in de buurt van een geslaagd examen", besluit de studie.

Inzicht

“We evalueerden de prestaties van taalrobot ChatGPT op het USMLE, wat in totaal uit drie examens bestaat”, aldus de onderzoekers. “CHATGPT presteerde tegen of bijna tegen de slaagdrempels van alle drie de examens zonder enige specifieke training of uitbreidingen specifiek op medische inhoud. Bovendien maakte ChatGPT correcte redeneringen en toonde de AI-robot een hoog niveau van inzicht in zijn antwoorden. Deze resultaten suggereren dat grote taalmodellen mogelijk kunnen helpen bij medisch onderwijs en mogelijk ook bij klinische besluitvorming.”

Sinds de lancering van ChatGPT eind vorig jaar heeft het systeem voor- en tegenstanders. Sommige opdrachten voert het systeem zo overtuigend uit, dat lesgevers ongerust zijn dat studenten ChatGPT zullen gebruiken voor schoolopdrachten.

Bij ons heeft de Universiteit Antwerpen alvast laten weten zijn evaluatievormen grondig te herbekijken, én eventueel bij te sturen. “Als blijkt dat een paper door ChatGPT kan uitgevoerd worden, kan een mondeling deel aan de evaluatie worden toegevoegd”, klonk het al.