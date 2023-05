Een virtueel consult met een chatbot, AI-systemen die CT-scans ontleden... Artificiële intelligentie duikt in steeds meer medische domeinen op. Maar hoe beloftevol ook, de weg naar betere geneeskunde dankzij de digitale dokter loopt langs enkele valkuilen.

Al geruime tijd heb ik na lange looptrainingen pijn aan de rechterheup. Straalt die pijn uit? Wanneer ondervindt u het meest hinder? Wanneer het minst? Hoe erg is de pijn op een schaal tot tien? Hoe zou u de pijn omschrijven: stekend, pulserend, kloppend...? Het is geen echte arts die mij die vragen stelt, maar chatbot Bingli.

Bingli bereidt patiënten aan de hand van een virtueel consult voor op een consultatie bij de arts. De vragen liggen niet op voorhand vast. Het algoritme stelt de opvolgvragen die een echte dokter zou stellen. De arts krijgt het resultaat van dat online consult te zien, samen met een aantal diagnoses die de computer waarschijnlijk lijken. Op basis van de feedback die artsen daarop kunnen geven, leert het systeem bij. “In 90 procent van de gevallen zit de juiste diagnose tussen de drie die het algoritme het meest waarschijnlijk acht”, zegt Bingli-oprichter Tom Van De Putte.

Door de arts voorbereidend werk uit handen te nemen, houdt die meer tijd over voor menselijk contact met de patiënt, is de redenering. Volgens de Amerikaanse arts Eric Topol, auteur van het boek Deep Medicine, kan meer technologie de geneeskunde op die manier – en ietwat contra-intuïtief – net menselijker maken. Een arts begint bovendien beter geïnformeerd aan het consult. “Het resultaat is een kwalitatievere consultatie, en een grotere kans dat een patiënt optimale zorg krijgt”, zegt Van De Putte.

Ruim duizend artsen en dertien ziekenhuizen in ons land gebruiken Bingli al, onder meer op afdelingen cardiologie, urologie en orthopedie. Het systeem leidt patiënten naar de juiste hulpverlener. Is een bezoek aan de huisarts wel nodig of kan dat nog even wachten? Is het beter om meteen naar een specialist te stappen, of net niet? Patiënten krijgen een ‘triagescore’ die ze zelf niet kunnen zien, maar die de arts wel helpt om in te schatten of hij de patiënt best laat langskomen of elders heen stuurt.

Volgens Stefan Teughels, medisch directeur bij huisartsenvereniging Domus Medica, kan AI in de rol van ‘triagist’ helpen om de onder de hoge werkdruk kreunende huisarts te ontlasten. “Tachtig procent van ons werk bestaat uit mensen geruststellen”, zegt Teughels. “Zo’n systeem kan helpen nodeloze doktersbezoeken te vermijden.”

Ervaring met de triagetool Babylon Health in het Verenigd Koninkrijk illustreert hoe het daarbij ook mis kan gaan. Experten wezen op mogelijke ‘gender bias’ in het systeem. Bij dezelfde symptomen – pijn in de borst en misselijkheid – dacht het algoritme bij oudere mannen wél aan hartproblemen, en suggereerde het hen naar de spoedafdeling te gaan, maar bij vrouwen niet.

“Bovendien bleken gebruikers over het algemeen net vaker een beroep te doen op de spoeddienst, omdat het systeem altijd voor de veiligste optie koos”, zegt Wim Van Biesen, verbonden aan de onderzoeksgroep Verantwoordbare Digitale Gezondheidszorg van het UZ Gent. “Het toont aan dat het bij de grootschalige uitrol van dat soort systemen opletten geblazen is. Het is bovendien nog maar de vraag of zo’n tijdbesparing effectief tot betere zorg zal leiden, of vooral tot meer consulten in dezelfde tijd.”

Wie krijgt een hartaanval?

Er zijn domeinen waarin AI vandaag al uitblinkt. Met stip op één: patronen herkennen. Zoals je zelflerende, intelligente software kunt leren om katten op foto’s te herkennen, kan die ook leren kankercellen of andere afwijkingen te spotten op röntgenfoto’s en scans.

Dat soort systemen wordt vandaag al gebruikt. In het UZ Gent checkt een algoritme bijvoorbeeld de röntgenfoto’s van patiënten die op de spoeddienst belanden op mogelijke hersen-, lever- en wervelletsels. “Het is een extra paar ogen bovenop dat van de radioloog”, zegt Johan Decruyenaere, voorzitter van het Fonds voor Innovatie en Klinisch Onderzoek aan het UZ Gent. “Bovendien werkt het systeem snel, en zet het de dossiers van mensen met een vermoedelijk letsel automatisch bovenaan op de digitale werklijst.”

Een algoritme is nooit moe of afgeleid, en kan in een mum van tijd oefenen met meer beelden dan een radioloog in zijn hele leven kan bekijken. “AI presteert daardoor vaak beter dan de beste radioloog”, zegt Peter Peumans, hoofd gezondheidstechnologie bij onderzoekscentrum Imec. “Daar staat tegenover dat zo’n AI-systeem niet de brede blik van de radioloog heeft, en afwijkingen waar het niet op is getraind zal missen.”

Computers zijn anderzijds soms in staat om te zien wat een mens niet ziet. Onderzoekers van Imec en de UGent werken bijvoorbeeld aan een systeem dat op basis van beelden van prostaatkankertumoren kan inschatten hoe groot de kans op uitzaaiingen is, met als doel nodeloos ingrijpende behandelingen en bijbehorende nevenwerkingen te vermijden. “Het gaat dan om zeer subtiele afwijkingen die een mens moeilijk kan detecteren”, zegt bio-informaticus Kathleen Marchal (UGent). “Maar een computer kan dat wel.”

Wetenschappers zetten AI niet alleen in om te speuren naar wat er al is, maar ook naar wat nog kan komen. Zo werken artsen in het Ziekenhuis Oost-Limburg en experts bij Imec aan software die op basis van subtiele afwijkingen in elektrocardiogrammen kan voorspellen wie een grote kans loopt op voorkamerfibrillatie, zodat die patiënten beter opgevolgd kunnen worden.

Onderzoekers aan de KU Leuven ontwikkelden samen met een internationaal team een AI-systeem dat op basis van oogscans – meer bepaald door analyse van kleine bloedvaatjes in het netvlies – in staat is in te schatten wie binnen het jaar waarschijnlijk een hartaanval zal krijgen.

Het risico bij op preventie en vroege detectie gerichte toepassingen is dat ze te veel zogenoemde vals positieven opleveren. Nederlandse onderzoekers die een app evalueerden om huidkanker te detecteren, stelden bijvoorbeeld vast dat het algoritme in ongeveer één op de vijf gevallen nodeloos alarm slaat, en een onschuldig vlekje als kwaadaardig identificeert.

Het komt er volgens Van Biesen op aan de technologie op de juiste manier in te zetten. Niet als snufje voor iedereen, maar als hulp voor een arts, en bij de patiënten die het grootste risico lopen. “Anders riskeer je niet alleen veel mensen nodeloos ongerust te maken”, zegt Van Biesen. “Je krijgt ook een overbelasting van de zorg wanneer al die mensen vervolgens naar de dokter stappen.”

Zwarte doos

Computers kunnen niet alleen zoeken naar patronen in beelden, maar ook in grote hoeveelheden patiëntendata. Welke patiënten op de afdeling intensieve zorg lopen op basis van hun voorgeschiedenis, bloedwaarden en andere parameters het grootste risico op complicaties? Wat is de meest aangewezen behandeling voor deze specifieke, 78-jarige diabetespatiënt die voor mij zit? “Met AI zou je voor dat soort inschattingen kunnen bogen op ervaringen bij tienduizenden patiënten”, zegt Van Biesen. “Zodat je uitkomsten beter kunt voorspellen.”

De ontwikkeling van dat soort systemen is helemaal niet vanzelfsprekend. Om te beginnen is het niet altijd duidelijk waarom een algoritme dat een patroon in data heeft ontwaard, precies tot een bepaalde conclusie komt. AI wordt dan een soort zwarte doos, waar een in mysterieuze nevelen gehuld resultaat uitrolt. “Computer says no”, maar dan bij de dokter. “Lastig in een medische context, waarbij je als arts toch aan een patiënt wil kunnen uitleggen waarom je een beslissing neemt”, zegt Decruyenaere. “En als je niet snapt hoe zo’n systeem werkt, kan je ook niet goed inschatten wanneer het mogelijk in de fout gaat.”

Een gevaar is dat een algoritme zich gaat concentreren op informatie die helemaal niet relevant is. Dat overkwam Amerikaanse wetenschappers die met zelflerende software probeerden covidpatiënten te identificeren op basis van röntgenfoto’s en CT-scans. De beelden van gezonde personen waarmee ze het systeem trainden, haalden de onderzoekers allemaal uit dezelfde databank. Ze stelden vast dat het algoritme zichzelf had geleerd niet naar de longen te kijken, maar naar letters in de marge van de foto’s, typisch voor het centrum waar ze zijn gemaakt.

Om AI naar behoren te laten werken zijn veel data nodig. Héél veel data. En daar wringt het schoentje vaak. Want patiëntengegevens zitten op verschillende locaties en mogen – terecht – niet zomaar worden gedeeld. Het zou niet de eerste keer zijn dat software die prima blijkt te werken in het ziekenhuis waar hij is ontwikkeld, het laat afweten in een ander. Omdat de patiënten er een net iets ander profiel hebben dan de groep waarmee het systeem is getraind.

Het is volgens Decruyenaere een van de verklaringen waarom er ondanks alle enthousiaste nieuwsberichten nog niet veel toepassingen het tot in de artsenpraktijk hebben geschopt. Daarnaast wijst hij erop dat een belangrijke vraag vaak onbeantwoord blijft. “Het gaat er niet zozeer om wat AI allemaal kan”, zegt Decruyenaere. “Maar of patiënten die met behulp van AI worden behandeld beter af zijn dan patiënten bij wie dat niet zo is.”

Superassistent

Bij Bingli blijft het tot nader order de arts die beslist en communiceert met de patiënt. “Het is niet onze ambitie om de arts te vervangen”, zegt Van De Putte. Maar hoelang zal het duren vooraleer AI dat in principe zou kunnen?

Eerder dit jaar slaagden chatbot ChatGPT en AI-taalmodel Med-PaLM 2 van Google al voor het Amerikaanse artsenexamen. En in een recente studie in het vakblad JAMA Internal Medicine oordelen experten dat de antwoorden van ChatGPT op onlinevragen van patiënten in bijna 80 procent van de gevallen beter zijn dan die van echte artsen. Feilloos zijn de systemen echter (nog) niet. De onderzoekers van Google melden dat hun systeem in 5,9 procent van de gevallen potentieel schadelijke antwoorden geeft, een tikje vaker dan menselijke artsen (5,7 procent).

Een toekomst waarin systemen zoals ChatGPT in de dokterspraktijk de knopen doorhakken, achten experts sowieso onwaarschijnlijk. “Zo’n systeem kan zich geloofwaardig voordoen als expert binnen bepaalde limieten, zoals een examen”, zegt Peumans. “Maar het echte leven is geen examen.”

Teughels verwijst naar het voor huisartsen belangrijke ‘niet-pluisgevoel’. “Je kent je patiënten en dat helpt om in te schatten wat er aan de hand is”, zegt Teughels. “Dat zie ik een computer niet meteen doen.”

Volgens Peumans kan AI wel evolueren tot een soort superassistent van de arts, een doktershulp die het dossier van de patiënt kent en misschien zelfs meeluistert tijdens het consult. Een assistent met een enorme kennis van de laatste wetenschappelijke literatuur. Die op de hoogte is van alle mogelijke aandoeningen, sommige zo zeldzaam dat de arts zelfs nog nooit zo’n patiënt voor zich heeft gehad. Een hyperintelligent hulpje dat voorzetten geeft. Heb je daar al aan gedacht? Zou je die vraag niet eens stellen?

“De arts behoudt de regie”, zegt Peumans. “Maar zo’n systeem kan de kennis van de beste artsen bevatten. Daardoor heeft het het potentieel om van elke dokter een topdokter te maken.”