M. Wakkee, T. Sangers, A.M. Smak Gregoor
Jaargang 2022
, volume 10
In het zorgpad van een persoon met huidkanker zijn er vanaf de diagnostiek tot na afronden van behandeling momenten waarbij kunstmatige intelligentie van toegevoegde waarde kan zijn. In dit artikel bespreken we de laatste ontwikkelingen tot en met de implementatie in de dagelijkse praktijk.
De grote doorbraak op het gebied van kunstmatige intelligentie, of in het Engels artificial intelligence (AI), in de dermatologie was het artikel in Nature in 2017 waarin werd beschreven dat een convolutional neural network (CNN) even goed was en soms nog wel beter dan een groep dermatologen in het herkennen van keratinocyt carcinomen en melanomen op basis van foto’s en dermatoscopische beelden. [1] Machine learning en deep learning, vaak geclusterd onder de term ‘artificial intelligence’, geven ons de mogelijkheid om computers zelf te laten leren op basis van data en op basis daarvan een voorspelling te doen. Dit is een fundamenteel andere wijze dan de manier waarop voorheen met computers werd gewerkt. In het verleden leerde de mens aan een computer welke kenmerken van bijvoorbeeld een huidafwijking verdacht zijn (bijv. conform de ABCDE-regel), tegenwoordig laten we een computer zelf trainen op verdachte kenmerken. Deze fundamentele verschuiving in de manier waarop de mens en computer samenwerken heeft geleid tot een ware revolutie in gezondheidsonderzoek. Nu we 5 jaar verder zijn na de eerste landmark paper is het een goed moment om te bekijken waar we nu staan. We zullen enkele nieuwe ontwikkelingen bespreken van AI in het zorgpad van huidkanker patiënten, we beschrijven de eerste resultaten van de implementatie van AI in mobile Health (mHealth) met de SkinVision app en we bespreken enkele bepalende voorwaarden voor een succesvolle implementatie van AI.
Risicostraficatie door middel van kunstmatige intelligentie
We denken bij AI en huidkanker vaak vooral aan de mogelijkheid een verdachte plek door de computer te laten beoordelen, maar er zijn inmiddels legio andere toepassingen en ontwikkelingen op het gebied van AI en de dermato-oncologie. Een belangrijke uitdaging is bijvoorbeeld hoe we mensen met een hoog risico op huidkanker vroegtijdig kunnen identificeren, zodat we bijvoorbeeld gerichte screening of andere preventieve maatregelen kunnen toepassen. Tot nu toe gebruiken we in studies vooral klassieke kenmerken zoals haarkleur, huidtype, zonblootstelling in het verleden en ook steeds vaker polygenetische risico scores die iemands genetische risicoprofiel inschatten. Naast dat het moeite kost om al deze informatie te verzamelen, blijkt dat we met deze variabelen helaas nog steeds niet heel betrouwbaar kunnen voorspellen wie er huidkanker gaat ontwikkelen. Enerzijds komt dit omdat het bijvoorbeeld toch lastig is om betrouwbaar iemands zonblootstelling in het verleden vast te stellen en anderzijds zijn er wellicht minder voor de hand liggende variabelen die een rol zouden kunnen spelen. Interessant is of je ook op een andere, snellere en mogelijk nauwkeurigere manier via AI kunt voorspellen of iemand een verhoogd risico heeft op huidkanker. In een nog ongepubliceerde studie hebben we onderzocht of het trainen van AI op gezichtsfoto’s van mensen die wel of geen huidkanker ontwikkelen kan worden gebruikt om te voorspellen of iemand huidkanker krijgt. [2] Hierbij vonden we dat AI dit risico minstens even goed en mogelijk zelfs beter kan voorspellen dan op basis van de bekende risicofactoren.
Brug tussen onderzoek en klinische praktijk
Het aantal artikelen over AI voor beeldanalyse van klinische en dermatoscopische foto’s is inmiddels enorm. Andere gebieden in de dermato-oncologie die de komende jaren toenemend met AI te maken zullen krijgen zijn o.a. de pathologie en de systemische behandelingen, waar AI een rol speelt in de predictie van respons. In studies zien we dat CNNs inmiddels al net zo goed melanomen kunnen herkennen als pathologen en dat AI zowel de identificatie van relevante biomarkers als het voorspellen van responders op checkpointremmers bij gemetastaseerd melanoom faciliteert. [3,4] Toch zien we in de praktijk nog weinig terug van de veelbelovende resultaten van deze studies. Een belangrijke reden is dat veel studies worden uitgevoerd onder kunstmatig perfecte omstandigheden. Er wordt vaak gebruik gemaakt van databases waarbij foto’s steeds onder dezelfde goede omstandigheden zijn gemaakt. In de praktijk is er echter vaak verschil in kwaliteit door bijvoorbeeld wisselende camerasystemen, belichting of bewerking van het histopathologisch weefsel. Dit maakt dat gestandaardiseerde data en beelden (denk aan een X-thorax of een dermatoscopische foto) het meest geschikt zijn voor snelle implementatie van AI in de praktijk. In andere situaties, zoals bijvoorbeeld bij de pathologie, wordt daarom ook wel geadviseerd om per pathologie lab een CNN opnieuw te trainen omdat de bewerking van het weefsel overal net wat anders is. Daarnaast kregen we als artsen initieel de indruk dat we vervangen zouden worden door AI, maar wat we in de praktijk (zullen) zien is dat er veel vaker sprake is van samenwerking met een algoritme in plaats van een vervanging. We kunnen AI dus als verrijking van ons vakgebied zien en dit betekent dat een CNN, bijvoorbeeld ingebouwd in een slimme dermatoscoop, ons kan gaan ondersteunen bij het beoordelen van gepigmenteerde laesies of dat een algoritme een eerste triage van verdachte huidlaesies doet. Deze vorm van samenwerking wordt ook wel augmented AI genoemd. In een recente studie van Ba, et al. werden dermatologen gevraagd om 400 foto’s te beoordelen met een multi-class CNN als hulpmiddel. Dit CNN, dat huidtumoren in tien verschillende categorieën kon indelen, zorgde ervoor dat de accuratesse van de dermatologen in deze studie met gemiddeld 14% steeg. [5]
Praktijkevaluatie
Ondanks de vele ontwikkelingen en studies, zijn er tot nu toe nog maar weinig voorbeelden van daadwerkelijk gebruik van AI in de dagelijkse dermato-oncologische praktijk. Een uitzondering hierop is de SkinVision app. Al sinds 2019 wordt deze app gratis aangeboden door CZ aan haar ruim 2,2 miljoen verzekerden. Dit is een unieke situatie: wereldwijd is geen andere vergelijkbare app al zo uitgebreid geïmplementeerd. We hebben een eerste evaluatie gedaan van de impact van het gebruik van deze app door CZ-verzekerden op hun dermatologische zorggebruik. [6,7] Ongeveer 1% (≈24.000) van deze verzekerden bleek uiteindelijk een of meerdere foto’s te hebben gemaakt met de SkinVision app. Deze groep hebben we vergeleken met een groep controles die de app niet gebruikt hadden, gematcht op basis van leeftijd, geslacht, eerdere huidkanker diagnoses, comorbiditeiten, sociaal-economische status, postcodegebied en huisarts. Hieruit bleek dat de groep SkinVision gebruikers ongeveer 30% meer declaraties had voor huidkanker en premaligniteiten. Anderzijds zagen we ook dat app gebruikers drie keer zoveel declaraties hadden voor benigne tumoren en naevi, een ongewenst bijeffect. Er zijn er ook limitaties aan deze eerste evaluatie van de klinische praktijk, want ondanks matching hadden de geselecteerde controlepersonen in deze studie ook toegang tot de app, maar hebben er geen gebruik van gemaakt. Verder hebben we in deze studie ook geen informatie over het type of stadium van de huidkankers. Een belangrijke vervolgstap waarin dit verder onderzocht zal worden is de momenteel lopende gerandomizeerde studie onder circa 20.000 deelnemende verzekerden van DSW, waarbij geïnteresseerde deelnemers direct of na 1 jaar toegang krijgen tot de SkinVision app. [8,9]
Voorwaarden voor succesvolle implementatie
De komende jaren zullen we blijvend worden geconfronteerd met AI. Hoe kunnen we er nu voor zorgen dat deze implementatie succesvol en zinnig is in het zorgpad voor huidkankerpatiënten? Wij zien drie belangrijke factoren voor een geslaagde implementatie (figuur). Allereerst is het belangrijk dat een algoritme accuraat genoeg is en niet alleen in een kunstmatige studiesetting wordt getest, maar juist ook in validatiestudies in de minder ideale klinische praktijk, vergelijkbaar met de fase 4 studies van medicijnonderzoek. De sensitiviteit en specificiteit van een AI tool bepaalt vervolgens waar het van aanvullende waarde is. De SkinVision app zal bijvoorbeeld vanwege de huidige accuratesse niet in de spreekkamer van de dermatoloog van aanvullende waarde zijn in het diagnostisch proces, maar misschien wel in de huisartsenpraktijk. Hierbij kan gedacht worden aan het gebruik van de app door de huisarts zelf of als triagemiddel voorafgaand aan een bezoek aan de huisarts. Anderzijds kan een slimme dermatoscoop waarin een algoritme advies geeft over de mate van atypie bij een melanocytaire naevus juist wel van toegevoegde waarde zijn voor de dermatoloog. Het uitgangspunt hierbij moet zijn dat de diagnostische accuratesse van de huisarts, dermatoloog, of de patiënt zelf wordt verbeterd. Een algoritme hoeft dus niet perfect te zijn om een aanvullende waarde te hebben in het diagnostisch proces, of dit nou bij de patiënt thuis is of in de spreekkamer van de dermatoloog. De tweede voorwaarde is daarom het selecteren van een algoritme met de juiste eigenschappen voor de juiste doelgroep. Wanneer bijvoorbeeld AI in mobile Health apps worden ingezet in een populatie met een lage huidkankerincidentie, zoals bijvoorbeeld bij implementatie in de gehele bevolking, zijn er dus relatief veel vals positieve bevindingen. Deze balans wordt beter als het bijvoorbeeld mensen betreft waarvan we weten dat zij a priori een hoger risico hebben op huidkanker of die met een verdachte plek al naar de dokter willen gaan. Tot slot is het voor succesvolle implementatie belangrijk om alle stakeholders in het huidkanker zorgpad mee te nemen. Zij kunnen immers bij uitstek meedenken over een passende accuratesse en het selecteren van de juiste patiënt of laesie voor een bepaalde toepassing van AI in het zorgpad. Eerder door ons uitgevoerd kwalitatief onderzoek naar de wensen en behoeften op het gebied van AI liet zien dat er zowel onder de algemene bevolking als bij artsen behoefte is aan transparante, betrouwbare algoritmes waarbij samenwerking tussen ontwikkelaars en artsen essentieel is voor optimale implementatie en integratie van AI in het zorgpad. [10] Hoewel deze behoeftes aansluiten bij de ‘Leidraad kwaliteit van AI in de zorg’ die eind vorig jaar werd gepubliceerd door het ministerie van VWS, zijn er aanvullende, specifieke eisen die vanuit zorgverleners en de algemene bevolking als belangrijk worden ervaren binnen het zorgpad huidkanker. Zo identificeerden wij bijvoorbeeld een betrouwbare toepasbaarheid van AI op alle soorten huidtypen en een duidelijke kadering van de aansprakelijkheid in het geval van een foutieve uitslag van een algoritme als voorwaarden voor een succesvolle implementatie, alsmede positieve aanbevelingen in de richtlijnen van de NVDV en NHG. [11]
Samenvattend staan we slechts aan het begin van de implementatie van AI. Als de beloftes die in de huidige literatuur geschetst worden daadwerkelijk ingelost worden in de klinische praktijk dan kan de dermato-oncologische zorg hier de komende decennia enorm van profiteren. Om dit te kunnen bereiken is het onmisbaar om samen een succesvolle implementatie vorm te geven. Niet alleen de dermatologen maar ook de huisartsen en patiënten spelen hier een cruciale rol in. Laten we daarom samen deze kans pakken om succesvol AI in het zorgpad voor patiënten met huidkanker te integreren.
Literatuur
1. Esteva A, Kuprel B, Novoa RA, Ko J, Swetter SM, Blau HM, et al. Dermatologist-level classification of skin cancer with deep neural networks. Nature. 2017;542(7639):115-8.
2. Liu X, Sangers T, Kayser M, Pardo-Cortes L, Nijsten T, Roshchupkin GV, et al. Predicting skin cancer based on facial endophenotypes using a deep neural network: A proof-of-concept study. In preparation. 2022.
3. Brinker TJ, Schmitt M, Krieghoff-Henning EI, Barnhill R, Beltraminelli H, Braun SA, et al. Diagnostic performance of artificial intelligence for histologic melanoma recognition compared to 18 international expert pathologists. J Am Acad Dermatol. 2022;86(3):640-2.
4. Kong J, Ha D, Lee J, Kim I, Park M, Im SH, et al. Network-based machine learning approach to predict immunotherapy response in cancer patients. Nat Commun. 2022;13(1):3703.
5. Ba W, Wu H, Chen WW, Wang SH, Zhang ZY, Wei XJ, et al. Convolutional neural network assistance significantly improves dermatologists’ diagnosis of cutaneous tumours using clinical images. Eur J Cancer. 2022;169:156-65.
6. Smak Gregoor AM, Sangers T, Bakker L, Hollestein L, Uyl-de Groot CN, TEC. , Wakkee M. The impact of an artificial intelligence (AI) based app for skin cancer detection: a first clinical practice evaluation in a population-based setting. In preparation. 2022.
7. Sangers TE, Nijsten T, Wakkee M. Mobile health skin cancer risk assessment campaign using artificial intelligence on a population-wide scale: a retrospective cohort analysis. J Eur Acad Dermatol Venereol. 2021;35(11):e772-e4.
8. Erasmus, MC, Kanker, Instituut. SPOT-studie: Erasmus MC; 2021 [Available from: https://www.erasmusmc.nl/nl-nl/kankerinstituut/patientenzorg/trials/spot-studie.
9. https://trialsearch.who.int/Trial2.aspx?TrialID=NL9586
10. Sangers TE, Wakkee M, Kramer-Noels EC, Nijsten T, Lugtenberg M. Views on mobile health apps for skin cancer screening in the general population: an in-depth qualitative exploration of perceived barriers and facilitators. Br J Dermatol. 2021;185(5):961-9.
11. Sangers T, Wakkee M, Moolenburgh FJ, Nijsten T, Lugtenberg M. Towards successful implementation of artificial intelligence in skin cancer care: an in-depth qualitative study exploring the views of dermatologists and general practitioners. Submitted. 2022.
Correspondentieadres
Marlies Wakkee
E-mail: m.wakkee@erasmusmc.nl