AI kan patronen in CT-scans herkennen dankzij supercomputer
Onderzoekers hebben met behulp van een nieuwe supercomputer van de TU/e een AI-model ontwikkeld om CT-scans mee te analyseren. De technologie kan de basis vormen voor toekomstige toepassingen in kankerdetectie. Dankzij de enorme computerkracht konden de onderzoekers het model trainen met een kwartmiljoen beelden.
Het gaat om een foundation model, een model dat dient als basis voor andere toepassingen. Door het te trainen met een kwartmiljoen CT-scans – soms met bijbehorende radiologierapporten – leert het patronen herkennen in die beelden. “Het heeft nog geen idee waar het naar kijkt”, legt maker van het model Fons van der Sommen uit. Het herkent niet dat iets een orgaan of afwijkend weefsel is, maar wel dat op die plek van het beeld iets bij elkaar hoort. “Je moet het model zien als een stamcel. Het kan van alles worden, maar op zichzelf is het eigenlijk nog niks”, aldus Van der Sommen.
"Het model vormt de basis waarop je verder bouwt om het specifiek toepasbaar te maken”, aldus Van der Sommen, die het onderzoek uitvoert als universitair hoofddocent bij Electrical Engineering, samen met twee promovendi. Die toepassingen betreffen in dit geval het detecteren van verschillende soorten kanker, waaronder longkanker en eierstokkanker.
Nog nooit gehad
Het is volgens Van der Sommen niet gemakkelijk om een foundation model te maken, omdat je daarvoor veel technische kennis, hardware en data nodig hebt. Voorheen was het aan de TU/e niet eens mogelijk om zo’n model te maken. Dankzij supercomputer SPIKE-1 is daar nu verandering in gekomen, vertelt Wim Nuijten, wetenschappelijk directeur van het Eindhoven Artificial Intelligence Systems Institute (EAISI), die het initiatief nam om de computer ‘aan te schaffen’. De TU/e least de computer van het Amerikaanse bedrijf NVIDIA (zie kader).
“De computer heeft niet de grootte van data centers in de Verenigde Staten, met honderdduizend grafische processors (GPU’s), deze computer heeft er, met alle respect, 32. Maar die data centers werken met oudere technologie. En waar men daar de rekenkracht met miljoenen anderen deelt, hebben wij de volledige controle over SPIKE-1. Dat maakt dat we nu rekenkracht hebben die wij nog nooit eerder hebben gehad”, zegt Nuijten. Dat bevestigt promovendus Cris Claessens, promovendus bij het project. Hij denkt dat de rekenkracht van SPIKE-1 zo’n honderd keer groter is dan die van de supercomputer die de TU/e voorheen gebruikte.
SPIKE-1
De universiteit heeft een life cycle management (LCM)-contract voor de supercomputer afgesloten met NVIDIA, een Amerikaanse producent van computerhardware. Dit houdt in dat de computer niet in een aantal jaar wordt afgeschreven, maar elke twee jaar wordt vernieuwd, zodat hij altijd de nieuwste technologie gebruikt. SPIKE-1 staat niet fysiek op de campus, maar in een datacentrum in Kajaani in Finland. Onderzoekers kunnen vanuit Nederland rechtstreeks op afstand met de computer werken. De TU/e is een van de eerste partijen die gebruik maakt van dit systeem van NVIDIA.
Vooral belangrijk aan SPIKE-1 is volgens Van der Sommen dat alle GPU’s aan elkaar gekoppeld zijn, waardoor ze samen kunnen werken. Het maakt dat het AI-model grote batches aan data tegelijk kan verwerken. “Hoe groter de batches, hoe beter het resultaat van het model is”, legt hij uit. “Als je te kleine brokken aan informatie tegelijk aan de computer geeft, dan gaat het leren chaotisch en lukt het minder goed. Zonder deze supercomputer hadden we dit model nooit zo kunnen maken, omdat hij niet efficiënt genoeg had geleerd en te weinig data tegelijk had kunnen ‘zien’.”
Voor de ontwikkeling van het model gebruikten de onderzoekers de methode self supervised learning. “Je labelt daarbij niet voor elk beeld of het bijvoorbeeld wel of geen kanker betreft, zoals gebruikelijk is. In plaats daarvan leert het systeem vanzelf hoe een CT-scan er typisch uitziet, door alle beelden met elkaar te vergelijken”, aldus Van der Sommen.
Hypermodern
Het lijkt misschien simpel: je neemt een krachtige computer, gooit er een grote verzameling data in en wacht tot er iets uitrolt. De realiteit is echter anders. SPIKE-1 is een hypermoderne computer. Zo nieuw zelfs, dat niet voor alle mogelijkheden al software bestaat, vertelt Claessens. “Bij deze computer is het mogelijk om data rechtstreeks in je grafische processors te laden in plaats van eerst naar de CPU (de centrale rekenkern, red.). NVIDIA-engineers weten dat het hardware-technisch kan, maar er is nog geen software voor om het daadwerkelijk toe te passen. Dat soort dingen laten ze vaak aan de community over om te ontwikkelen.”
Om alle software werkend te krijgen, moet je volgens hem upgraden naar een state of the art niveau, omdat de oude software er gewoon niet vanuit gaat dat de capaciteit die de computer heeft beschikbaar is. Het is echt pionieren met zo’n nieuwe computer, voegt Nuijten toe. “Door de technische kennis die bij ons aanwezig was in de groep, konden we dit laten werken. Niet iedereen kan hier zomaar mee overweg. De kennis die we opdoen, delen we binnen de TU/e.”
Je maakt het verschil tussen ‘dat werkt helemaal nooit’ en ‘dit gaat werken’
Een andere uitdaging zat hem niet zozeer in de nieuwigheid van de supercomputer, maar in het feit dat CT-scans driedimensionaal zijn. Modellen worden normaal gesproken getraind met tweedimensionale beelden, legt Claessens uit. Maar die methodes bestonden nog niet voor 3D-beelden.
“Je kunt 3D-data niet zomaar in een 2D-model stoppen, dat past gewoon niet. Je moet vooral veel slimme oplossingen vinden om niet het geheugen van de computer te laten ontploffen. Dat kan zelfs bij een supercomputer gebeuren. We hebben het model zo ontworpen dat het eerst naar kleine 3D-blokjes kijkt en daarna verbanden legt over het gehele volume heen.”
Voor de mensheid
En dan moet je nog 250.000 CT-scans weten te verzamelen. Van der Sommen: “We gebruiken daarvoor publieke datasets die beschikbaar zijn. Sommigen komen voort uit challenges, waarbij onderzoekers allemaal een model ontwikkelen voor een vrijgegeven dataset.” Zonder al die publieke data had het foundation model niet genoeg materiaal gehad om van te leren.
Nu het model er is, willen Van der Sommen en Nuijten op hun beurt iets teruggeven aan de wereld. Ze maken het model dus volledig open-source voor in ieder geval onderzoekers en clinici, die het kunnen finetunen voor specifieke toepassingen. Op die manier kan de technologie sneller de ziekenhuizen bereiken, en dat is waar ze het voor doen.
“Zo kan het model hopelijk ook mensen bereiken die een zeldzame vorm van kanker hebben. Voor die soorten kanker heb je vaak niet genoeg data om een model mee te trainen”, legt Van der Sommen uit. Met dit foundation model kan dat volgens hem wel. Nuijten: “Dat is wat mij zo blij maakt in dit werk. Je maakt het verschil tussen ‘dat werkt helemaal nooit’ en ‘dit gaat werken’.”




Discussie