
Sluitstuk | Van moleculaire taal naar medicijn
Moleculaire taal en slimme wiskundige modellen helpen AI bij snellere medicijnontwikkeling
Medicijnonderzoekers sluiten bijna altijd ‘negatieve’ data uit om AI-modellen te voeden. Toch kunnen deze ook positief uitpakken, zag TU/e-onderzoeker Rıza Özçelik. Hij leerde de taal van moleculen en ontwikkelde een innovatief deeplearningparadigma om efficiënter en sneller nieuwe medicijnen te ontwikkelen. Dinsdag 31 maart verdedigt Özçelik zijn proefschrift aan de faculteit Biomedical Engineering.
Hij is een man van taal. Het etymologisch woordenboek altijd binnen handbereik via een app op zijn telefoon. Laatst nog, toen hij taaltechnisch dieper in zijn favoriete toetje künefe dook, dat afkomstig bleek van het woord ‘omhelzing’. “Misschien een beetje een nerdy hobby”, lacht de in Turkije geboren Rıza Özçelik. “Maar het is een manier om meer inzicht te krijgen in cultuur en geschiedenis. En het doorgronden van een taal helpt om beter te communiceren.”
Zo werkt dat ook in de moleculaire wereld, vervolgt Özçelik. In de afgelopen jaren zorgde de opkomst van AI voor grote veranderingen binnen het medicijnonderzoek. “Wanneer je als onderzoeker op zoek gaat naar een nieuw medicijn, heb je bij de start van een project keuze uit zo’n 10 tot de macht 60 verschillende moleculen. Dat is zelfs veel meer dan het aantal sterren in het universum.” (Ter vergelijking: een miljoen is 10 tot de macht 6, red.)
“Wij noemen dat de chemical space, en die is dus enorm. Maar dankzij wiskundige modellen, en met name de technologische ontwikkelingen binnen deep learning, kunnen we veel efficiënter chemische eigenschappen voorspellen en nieuwe moleculen genereren.”
Kralensnoer
De afgelopen vier jaar onderzocht Özçelik hoe deep learning zo optimaal mogelijk kan worden ingezet in de zoektocht naar nieuwe medicijnen. Het doorgronden van de moleculaire taal hielp hem daarbij.
“Elk molecuul kun je met taal omschrijven door terug te gaan naar de losse bouwstenen. Een molecuul is in feite niets meer dan een string van bouwstenen. Een eiwit in je lichaam kun je omzetten naar een aminozuurvolgorde in letters, een klein medicinaal molecuul kan een reeks atomen worden.”
Stap voor stap leerde Özçelik de taal van moleculen, bijna tegelijkertijd met zijn cursussen Nederlands. Er was nauwelijks twijfel geweest om Istanbul voor Eindhoven te verruilen – “in dit project komen al mijn passies samen” – maar hij stelde zichzelf wel als voorwaarde dat hij zou investeren in de taal van zijn nieuwe omgeving.
“In beide gevallen zie je letters, woorden – maar wat is de ware betekenis van een hele zin? Pas als de semantiek duidelijk is, kun je deeplearningmodellen verbeteren. Die voeden we met moleculaire taal, zodat het systeem steeds beter leert om correcte voorspellingen te doen. Vergelijk dat maar met het slimme toetsenbord op je telefoon, dat aan de hand van eerste letters en woorden jouw zinnen voorspelt.”
Chemisch zoekwerk
Tijdens zijn promotieproject ontwikkelde Özçelik een vijftal deeplearningmodellen, die nu wereldwijd door andere onderzoekers gebruikt kunnen worden. “Elk model heeft weer een andere toepassing. We zijn begonnen met het opstellen van praktische richtlijnen om het voorspellen van chemische eigenschappen te verbeteren en hebben algemene tools gebouwd die daarbij ondersteunen.”
Samen met onderzoekers van de TU/e-vakgroep Chemical Biology en Italiaanse samenwerkingspartners dook hij vervolgens in enkele casestudy’s om het chemische zoekwerk efficiënter te maken. “We hebben een model gemaakt dat met hoge nauwkeurigheid kan aangeven op welke plekken in een klinisch belangrijke eiwitfamilie zich bindingsplaatsen bevinden, belangrijk voor de moleculaire interactie.”
Voor het optimaliseren van wat het lichaam doet met een geneesmiddel – zoals het verbeteren van de opname – kwam Özçelik met een voorspelmodel voor geschikte bindingspartners. “Voor de onderzoekers in het lab betekende dat een veel efficiëntere pipeline, omdat ze alleen een beperkte subset van moleculen hoefden te testen.”
Van negatief naar positief
Het meest enthousiast is hij over een hele nieuwe aanpak om deep learning in de zoektocht naar nieuwe medicijnen te gebruiken. “We zijn het model op een tegenovergestelde manier gaan voeden met data. Want in het farmaceutische veld worden veel meer ‘mislukte’ dan succesvolle moleculen gevonden, en is er dus een overvloed aan ‘negatieve’ data.
Wat een absurd idee leek, bleek verrassend succesvol. “Ook uitvoerige testen in het lab laten zien dat we een zeer accuraat model ontwikkeld hebben, waarin uit negatieve data een positief molecuul naar voor kan komen. Goed nieuws voor medische chemici.”
Natuurlijk moet je oppassen dat je niet alleen bezig bent met het ontwerpen van ‘een zoveelste’ model, benadrukt Özçelik. “Door moleculaire taal als uitgangspunt te nemen en buiten de kaders te denken, willen we ontwikkelingen in het veld robuuster maken. Een solide basis, waarop andere onderzoekers kunnen voortbouwen. En als dat resulteert in state-of-the-artmodellen, is dat zeker een mooie bijvangst.”
PhD in the Picture
Wat zien we op je proefschriftkaft?
“De chemical space, met daarin elementen die voor mij iets betekenen. Enkele verwijzingen naar papers – zoals de raket en de Tarzan-figuur – maar ook de molecuulstructuur van het medicijn dat mijn vrouw dagelijks moet gebruiken om gezond te blijven.”
Je bent op een verjaardagsfeestje. Hoe leg je in één zin uit wat je onderzoekt?
“Ik kijk hoe we AI kunnen gebruiken om de zoektocht naar nieuwe medicijnen te versnellen.”
Hoe blaas je naast je onderzoek stoom af?
“Ik ben een echte huismus: laat mij maar lekker gamen – soms kom je door de sufste spellen het beste tot rust – of een goede serie kijken. Maar daarnaast reis ik ook heel graag, het liefst naar nieuwe steden. Nieuwe culturen, talen, geschiedenis. Nu mijn proefschrift is afgerond, staat binnenkort Florence op de planning. Een stad waar ik via een videogame gefascineerd door ben geraakt.”
Welke tip had je als beginnende PhD-kandidaat willen krijgen?
“Volg je gevoel bij het uitzoeken van je promotieplek. Je begint een uitdagend traject, waarbij je op zekere punten steun goed kunt gebruiken. Aan alleen een fancy promotornaam heb je dan niet zo veel. Ik had een prima eerste indruk van mijn begeleider, die op zoek was naar haar eerste PhD-kandidaten, en dat is een gouden keuze gebleken.”
Wat is je volgende hoofdstuk?
“Al heel lang is mijn droom om ooit professor te worden. Voor nu wil ik eerst graag het bedrijfsleven verkennen voor een breder perspectief. Binnenkort start ik als machine learning engineer in Amsterdam. Mijn voorliefde voor onderzoek, onderwijs en het begeleiden van studenten brengen me op een later moment vast weer terug naar de universiteit.”



Discussie