Onderzoeksgroep

Expertise

Dr. Bittremieux onderzoekt hoe geavanceerde machine learning technieken gebruikt kunnen worden om nieuwe kennis te ontrafelen uit proteomics en metabolomics massaspectrometrie data. Naast zijn hoofdfocus op de toepassing van deep learning voor de analyze van massaspectrometrie data is dr. Bittremieux geïnteresseerd in allerlei bioinformatica problemen. Een belangrijk onderdeel van zijn werk betreft het ontwikkelen van computationele technieke voor de kwaliteitscontrole van biologische massaspectrometrie.

Een holistische benadering voor de beoordeling van milieublootstellingen en hun invloed op endocrien-gemedieerde en metabole aandoeningen (EXPOSOME 2.0). 01/01/2026 - 31/12/2031

Abstract

Achtergrond: Het exposoom omvat het geheel van milieublootstellingen van een individu of organisme gedurende het hele leven (inclusief blootstelling gelinkt aan chemicaliën, voeding, levensstijl, klimaatfactoren, stress,..), en hoe deze blootstellingen de biochemische status (bv. metabolieten, hormonen) en de gezondheid beïnvloeden. In het bijzonder is blootstelling aan hormoonverstorende chemicaliën (EDC's), waaronder metabool verstorende chemicaliën (MDC's), geassocieerd met een breed waaier aan niet-overdraagbare ziekten en gezondheidseffecten. Workflows voor het verzamelen en interpreteren van exposoomgegevens zijn nog in de ontwikkelingsfase en richten zich momenteel op het ophelderen van fysiologische routes die blootstelling koppelen aan schadelijke effecten. Uiteindelijk zal dit leiden tot een holistisch begrip over hoe blootstelling leidt naar negatieve gezondheidseffecten met mogelijk grote maatschappelijke, economische en ecologische impact. Doelstellingen: In Exposome2.0 zullen we innovatieve benaderingen gebruiken om het humane exposoom in kaart te brengen vanaf de vroege kindertijd tot op volwassen leeftijd en de associatie ervan met endocriene-gemoduleerde en metabole stoornissen (EMD's), die leiden tot aandoeningen zoals leverziekte, metabool syndroom, diabetes en obesitas, evenals effecten op andere belangrijke fysiologische processen die meestal worden aangestuurd door endocriene en metabole signalering

Onderzoeker(s)

Onderzoeksgroep(en)

Project type(s)

  • Onderzoeksproject

De Live Mouse Tracker (LMT) als een veelzijdig platform voor het screenen van drugs voor zeldzame neurologische ziekten. 01/01/2025 - 31/12/2025

Abstract

Het ontwikkelen van effectieve therapieën voor zeldzame neurologische ontwikkelingsstoornissen blijft één van de grootste uitdagingen binnen de moleculaire geneeskunde. Hoewel vooruitgang in next-generation sequencing-technologieën in het afgelopen decennium hebben geleid tot de ontdekking van honderden nieuwe genetische syndromen, blijft de ontwikkeling van gepersonaliseerde therapieën achter. Elk syndroom is individueel zeldzaam, maar collectief zijn meer dan 300 miljoen mensen op aarde aangedaan. Iedere aandoening wordt veroorzaakt door mutaties in verschillende genen en elk gen verstoort meerdere cellulaire pathways. Dit illustreert de complexiteit van de ontwikkeling van therapieën: immers voor ieder ziektebeeld moet een overweldigende hoeveelheid gegevens geanalyseerd worden om tot een doeltreffende therapie te komen. Het mag dan ook geen verrassing zijn dat de huidige behandelingen en therapieën slechts zeer beperkt succesvol zijn. Honderden miljoenen individuen op de aarde hebben dus geen toegang tot een rationele therapie voor hun ziektebeeld. De snelle opkomst van AI-technologieën heeft echter de potentie om dit landschap te transformeren. Door AI-gestuurde algoritmen kunnen enorme biomedische datasets steeds beter worden doorgenomen, wat leidt tot de versnelde ontdekking van kandidaat medicijnen voor zeldzame ziekten. Veel startups maken al gebruik van dit potentieel, waardoor er een overvloed aan drugs wordt geprioriteerd voor preklinische evaluatie. Deze toename in kandidaat-therapieën heeft echter de bottleneck verschoven van medicijnontdekking naar preklinische testen. Traditionele muistesten zijn arbeidsintensief, duur, en tijdrovend, wat de noodzaak onderstreept voor een gestandaardiseerd, schaalbaar, en efficiënt platform om te voldoen aan de groeiende vraag naar preklinische screening. Wij stellen hier de ontwikkeling en commercialisering van ons Live Mouse Tracker (LMT) platform voor, een baanbrekend systeem dat is ontworpen om aan deze kritieke behoefte te voldoen. Het LMT-systeem automatiseert gedragsanalyse en is in staat om tot 39 verschillende gedragingen te volgen bij groepen muizen over periodes van 24 uur. Deze high-throughput capaciteit biedt een snelle en uitgebreide beoordeling van de effectiviteit van medicijnen in preklinische modellen. Onze initiële validatie zal zich richten op het fragiele X-syndroom, een veel bestudeerde neurologische ontwikkelingsstoornis waarvoor momenteel geen effectieve behandeling bestaat. Door medicijnen te evalueren die meerdere getroffen routes tegelijkertijd aanpakken, streven wij ernaar een nieuwe benadering van preklinische screening voor zeldzame ziekten te pionieren. Tijdens dit project zullen we de robuustheid van het LMT-platform valideren en het uitbreiden naar een volledig geïntegreerde service, en verkennen we samenwerking met andere partners binnen de UA om uitgebreide en multidimensionale preklinische screeningsmethoden aan te bieden. Dit service platform heeft het potentieel om de preklinische screening te versnellen, zodat door AI gegenereerde kandidaat-medicijnen snel en betrouwbaar kunnen worden beoordeeld, wat het traject van laboratorium naar kliniek versnelt. Met dit initiatief willen we de kloof tussen medicijnontdekking en therapeutische toepassing overbruggen, waardoor miljoenen patiënten met zeldzame neurologische aandoeningen hoop wordt geboden.

Onderzoeker(s)

Onderzoeksgroep(en)

Project type(s)

  • Onderzoeksproject

Deep learning voor ontdekking van kleine moleculen uit ongerichte massaspectrometriegegevens. 01/10/2024 - 30/09/2027

Abstract

Hoewel massaspectrometrie (MS) van kleine moleculen een essentiële techniek is in verschillende domeinen van de levenswetenschappen, wordt het potentieel ervan belemmerd door de lage annotatiemogelijkheden van MS/MS-spectra. Dit onderzoeksproject heeft als doel om de hoeveelheid biologische inzichten die uit MS data verkregen kunnen worden radicaal te verbeteren met behulp van krachtige deep learning technieken. Ik zal verschillende complementaire deep learning-strategieën ontwikkelen voor de identificatie van kleine moleculen. Eerst zal ik een geleerde spectrum-gelijkenisscore ontwikkelen voor de ontdekking van structureel verwante moleculen. Ten tweede zal ik generatieve AI-technieken gebruiken om uitgebreide spectrale bibliotheken te simuleren. Ten derde zal ik een oplossing ontwikkelen voor de novo-identificatie van moleculen rechtstreeks vanuit MS/MS-spectra. Verder zal ik een holistische benadering van MS introduceren door drie diverse gegevensbronnen – MS/MS-spectra, moleculaire structuren, en natuurlijke taal – te integreren in een gedeelde latente ruimte door middel van multimodaal representatieleren. Dit radicaal vernieuwend paradigma zal de semantische interpretatie van MS data mogelijk maken door MS/MS-waarnemingen direct te koppelen aan moleculaire structuren en expertkennis. Ten slotte zal ik verklaarbare AI-technieken gebruiken om de beslissingen van de ontwikkelde modellen te interpreteren en inzicht te verkrijgen in verborgen patronen in MS experimenten.

Onderzoeker(s)

Onderzoeksgroep(en)

Project type(s)

  • Onderzoeksproject

De novo massaspectrometrie peptide sequencing met een transformer groot taalmodel. 01/05/2024 - 30/04/2025

Abstract

De primaire uitdaging in proteomics is het identificeren van aminozuursequenties uit tandem-massaspectra, hetgeen traditioneel gedaan wordt door te zoeken in sequentiedatabanken. Echter, aangezien dit enkel bekende eiwitsequenties kan identificeren, biedt de novo peptide sequencing een interessant alternatief om onverwachte peptiden te ontdekken. Casanovo is een geavanceerd programma voor de novo peptide sequencing, hetgeen vergelijkbare technologieën gebruikt als in grote taalmodellen om massaspectra te vertalen naar aminozuursequenties. Het doel van dit project is om de capaciteiten van Casanovo voor de novo peptide sequencing verder te verbeteren. Dit zal worden bereikt door het samenstellen van een uitgebreide trainingsdataset uit diverse biologische stalen en massaspectrometrie-instrumenten en door het neurale netwerk van Casanovo op te schalen om zijn leercapaciteit te vergroten. Verder zullen we een aangepast model creëren voor de analyse van immunopeptidomics-gegevens door Casanovo te finetunen. Tot slot zullen we een gebruiksvriendelijke webinterface ontwikkelen, waardoor Casanovo gebruikt zal kunnen worden door vele onderzoekers zonder gespecialiseerde voorkennis en zullen hardwarebeperkingen vermeden worden door middel van cloud computing.

Onderzoeker(s)

Onderzoeksgroep(en)

Project type(s)

  • Onderzoeksproject

Bio-informatica netwerk voor proteomics en massaspectrometrie. 01/01/2024 - 31/12/2028

Abstract

Proteomics, de studie van eiwitten en hun functies, is een cruciaal onderzoeksdomein in de biologie en geneeskunde. Met massaspectrometrie (MS) kunnen onderzoekers grote hoeveelheden proteomische stalen analyseren, wat leidt tot waardevolle inzichten in complexe biologische processen. MS-datasets vereisen gespecialiseerde data-analysetechnieken, wat heeft geleid tot de ontwikkeling van verschillende krachtige bio-informatica tools en pijplijnen voor massaspectrometrie-gebaseerde proteomics. Desondanks vormen het toenemende volume en de complexe aard van MS-gebaseerde proteomics data aanzienlijke uitdagingen die de vooruitgang in het veld belemmeren. Om deze aan te pakken, is er behoefte aan een open en collaboratieve wetenschappelijke benadering. Wij hebben vier belangrijke uitdagingen geïdentificeerd die we willen aanpakken via deze Wetenschappelijke Onderzoeksgemeenschap (WOG): - Hoogwaardige bio-informatica tools: Naarmate proteomics datasets groeien in grootte, ontstaan computationele knelpunten. Via deze WOG zullen we de ontwikkeling van hoogwaardige en interoperabele bio-informatica tools en workflows bevorderen om deze datasets efficiënt te verwerken, waardoor snellere en transparantere analyses mogelijk worden. - Integratie van machine learning: Hoewel machine learning veel potentieel heeft voor de analyse van proteomics data, blijft de integratie ervan in praktische workflows complex. Onze WOG zal werken aan het overbruggen van deze kloof, door machine learning technieken toegankelijker en naadloos geïntegreerd te maken in routine analyses. - Effectieve benchmarking: De diversiteit aan analysemethoden maakt het uitdagend om methoden effectief te vergelijken. Ons doel is om gestandaardiseerde benchmarking methoden op te stellen waardoor onderzoekers hun analysepijplijnen systematisch kunnen evalueren en verbeteren. - Gemeenschap en educatieve bronnen: Proteomics data-analyse vereist gespecialiseerde kennis die continu evolueert, waardoor het moeilijk is voor jonge wetenschappers en data science-experts om het veld te betreden. Onze WOG streeft ernaar een ondersteunende gemeenschap op te bouwen voor beginnende onderzoekers en hoogwaardige educatieve bronnen te creëren die de leercurve vergemakkelijken en toegankelijke paden bieden voor nieuwkomers. Met drie onderzoeksgroepen in Vlaanderen die wereldleiders zijn in MS-gebaseerde proteomics, zal deze WOG van Vlaanderen het centrum maken van proteomics bio-informatica. Onze samenwerking met internationale partners zal de zichtbaarheid van Vlaams onderzoek vergroten en bijdragen aan een sterke concurrentiepositie in het internationale onderzoekslandschap, waardoor de regio aantrekkelijk wordt voor ambitieuze en getalenteerde jonge onderzoekers om in te werken. De zes samenwerkende onderzoeksgroepen hebben sterke banden met de proteomics bio-informatica gemeenschap binnen Europa en daarbuiten, die we maximaal willen benutten om onze langetermijndoelen te bereiken. In plaats van deze uitdagingen alleen aan te gaan, is het de bedoeling van elk van de zes onderzoeksgroepen om een leidende rol op te nemen in de bredere onderzoeksgemeenschap om onze doelstellingen te bereiken. Via deze WOG zullen we de bestaande verbindingen tussen de zes partners formaliseren en een duidelijke collaboratieve visie en structuur bieden om vooruitgang te stimuleren en de bredere onderzoeksgemeenschap te mobiliseren. De reikwijdte van onze doelen onderstreept de noodzaak van een inspanning op internationaal niveau. Alle zes partners hebben centrale rollen in bestaande initiatieven, zoals de European Bioinformatics Community for Mass Spectromtry (EuBIC-MS), de Proteomics Standards Initiative van de Human Proteome Organization (HUPO-PSI), de ELIXIR Life Science Infrastructuur, en de Computational Mass Spectrometry (CompMS) groep van de International Society for Computational Biology (ISCB), hetgeen de kritische massa levert die nodig is om onze doelen te bereiken.

Onderzoeker(s)

Onderzoeksgroep(en)

Project type(s)

  • Onderzoeksproject

Referentiegebaseerde metabolomics analyse om de moleculaire samenstelling van Zuid-Afrikaans voedsel te bestuderen. 01/01/2024 - 31/12/2026

Abstract

Het begrijpen van de moleculaire samenstelling van voedsel is essentieel voor het bestuderen van de impact ervan op de menselijke gezondheid. We hebben recent de referentiegebaseerde metabolomics strategie ontwikkeld die gebruikt kan worden om dieet te achterhalen op basis van niet-gerichte metabolomics data. Een probleem hierbij is echter dat er onvoldoende diverse en geografisch representatieve data beschikbaar zijn. Om dit op te lossen zullen we onze moleculaire voedselreferentiedatabase uitbreiden met lokaal geteelde producten uit Zuid-Afrika, een regio met rijke culturele en culinaire tradities, de moleculaire samenstelling hiervan bestuderen met behulp van massaspectrometrie, en deze data integreren in de Global FoodOmics referentiedatabase. Verder zullen we gebruiksvriendelijke bio-informatica toepassingen ontwikkelen om de data-analyse te vereenvoudigen en de moleculaire samenstelling van Zuid-Afrikaans voedsel te bestuderen. Deze samenwerking tussen Zuid-Afrikaanse universiteiten en de Universiteit Antwerpen combineert expertise in analytische chemie, bio-informatica, voeding, en landbouwwetenschappen om geavanceerde metabolomics toepassingen te ontwikkelen, nieuwe wetenschappelijke kennis te vergaren over voedselconsumptie in Zuid-Afrika, en inzichten te bieden voor het verbeteren van voeding en de gezondheid van de Zuid-Afrikaanse bevolking.

Onderzoeker(s)

Onderzoeksgroep(en)

Project type(s)

  • Onderzoeksproject

Computationele massaspectrometrie en artificiële intelligentie om het immunopeptidoom te ontrafelen. 01/10/2023 - 30/09/2027

Abstract

Het adaptieve immuunsysteem is een cruciaal onderdeel van de immuunrespons en is verantwoordelijk voor het herkennen en elimineren van geïnfecteerde of kwaadaardige cellen, evenals bijdrages aan de ontwikkeling van het immunologisch geheugen. Immunopeptidomics is een snel evoluerend veld dat massaspectrometrie gebruikt om immunopeptiden te identificeren en te kwantificeren, die T-cellen in staat stellen om geïnfecteerde of abnormale cellen te herkennen en te elimineren. Ondanks het aanzienlijke potentieel van immunopeptidomics kunnen momenteel slechts voor een minderheid van de spectra die gegenereerd worden tijdens een immunopeptidomics experiments de immunopeptiden geïdentificeerd worden, waardoor een aanzienlijke hoeveel aan biologische informatie verloren gaat. Om dit probleem aan te pakken zullen wij gespecialiseerde bioinformatica-toepassingen ontwikkelen om immunopeptidomics data te analyseren. We zullen een efficiënte en gevoelige open modificatie-zoekmachine ontwikkelen om immunopeptiden die post-translationele modificaties hebben ondergaan te identificeren. Daarnaast zullen we een de novo peptide sequencingen toepassing ontwikkelen die is geoptimaliseerd om immunopeptidomics data te analyseren. De tools die in dit project worden ontwikkeld hebben het potentieel om de hoeveelheid biologische informatie die kan worden verkregen uit immunopeptidomics experimenten aanzienlijk te vergroten, hetgeen zal leiden tot belangrijke doorbraken in het vakgebied.

Onderzoeker(s)

Onderzoeksgroep(en)

Project type(s)

  • Onderzoeksproject

Het mogelijk maken van mobiele en data-gestuurde monitoring van pathogenen door middel van een gekoppelde nanopore squiggle- en genoomsequentie database. 01/05/2023 - 31/12/2024

Abstract

Er is wereldwijd nood aan het monitoren van infectieziekten. De dreiging van bestaande en opkomende pathogenen vormt een grote uitdaging voor de volksgezondheid. Nanopore sequencing is een revolutionaire technologie die draagbare sequencing mogelijk maakt, en heeft zijn waarde bewezen tijdens de COVID-19-pandemie. Deze technologie zou bestaande laboratoria, die geen of beperkte capaciteit hebben voor het monitoren van infectieziekten, in staat kunnen stellen om over te stappen naar monitoring gebaseerd op sequencing. Dit potentieel hangt echter af van het potentieel om te werken in omgevingen met beperkte middelen, hetgeen tot op heden wordt belemmerd door de behoeften aan gegevensopslag en - verwerkingtechnieken. De onbewerkte gegevens, 'squiggles' genoemd, zijn omvangrijk en het decoderen ervan naar DNA-sequenties vereist grafische kaarten (GPU's) die aanzienlijke hoeveelheden energie verbruiken. In dit 'proof-of-concept-project pandemic preparedness' project zullen we voortbouwen op de vorderingen van ons IOF-SBO gefinancierde project LeapSEQ, om belangrijke hindernissen weg te nemen om mobiele en datagestuurde monitoring van pathogenen mogelijk te maken. Deze hindernissen omvatten: (1) een behoefte aan schaalbare data opslag oplossingen voor squiggles, (2) het gebrek aan beschikbare gegevens voor belangrijke pathogenen, en (3) verbeterde computationele oplossingen om met squiggle-gegevens te interageren. We zullen deze problemen aanpakken door een proof-of-concept database te ontwerpen bestaande uit gepaarde nanopore squiggle-genoomsequentiegegevens met behulp van ons draagbare LeapSEQ-lab en door efficiënte datagestuurde algoritmen te ontwikkelen voor snelle pathogeen monitoring. We zullen deze database ontwikkelen met strategische partners van het Instituut voor Tropische Geneeskunde in Antwerpen en de UAntwerpen, en het valorisatiepotentieel van LeapSEQ verder onderzoeken in de context van wereldwijde monitoring van pathogenen.

Onderzoeker(s)

Onderzoeksgroep(en)

Project type(s)

  • Onderzoeksproject

Artificiële intelligentie-gedreven kennisbank van het geobserveerde moleculaire universum. 01/12/2022 - 30/11/2027

Abstract

Ondanks recente doorbraken in artificiële intelligentie (AI) die hebben geleid tot radicale vooruitgang in verschillende wetenschappelijke domeinen zijn AI-technieken nog niet systematisch ingeburgerd in de levenswetenschappen. In het bijzonder de analyse van massaspectrometrie (MS) data van kleine moleculen is nog steeds gebaseerd op vakkennis en handmatig samengestelde regels. Dit project zal een nieuwe, krachtigere manier van data analyse ontwikkelen waarin MS gegevens worden geïnterpreteerd in de context van bestaande informatie die beschikbaar is in publieke databanken. De onderzoekshypothese waarop het voorgestelde project gebaseerd is, is dat geavanceerde AI-technieken verborgen kennis kunnen ontdekken in grote hoeveelheden MS data om een dieper inzicht te verkrijgen in de moleculaire samenstelling van complexe biologische stalen. We zullen machine learning-gebaseerde oplossingen ontwikkelen om het geobserveerde moleculaire universum te onderzoeken en een uitgebreide kennisbank voor kleine moleculen op te bouwen. Deze ambitieuze doelen bouwen voort op onze unieke expertise in zowel AI als MS om geavanceerde datagestuurde softwareoplossingen te ontwikkelen die zullen leiden tot een verbeterde moleculaire ontdekking uit MS data.

Onderzoeker(s)

Onderzoeksgroep(en)

Project type(s)

  • Onderzoeksproject

Bio-informatica en machinaal leren voor de analyse van grote hoeveelheden metabolomics data 01/12/2022 - 30/11/2026

Abstract

Ondanks recente doorbraken in artificiële intelligentie (AI) die hebben geleid tot radicale vooruitgang in verschillende wetenschappelijke domeinen zijn AI-technieken nog niet systematisch ingeburgerd in de levenswetenschappen. In het bijzonder de analyse van massaspectrometrie (MS) data van kleine moleculen is nog steeds gebaseerd op vakkennis en handmatig samengestelde regels. Dit project zal een nieuwe, krachtigere manier van data analyse ontwikkelen waarin MS gegevens worden geïnterpreteerd in de context van bestaande informatie die beschikbaar is in publieke databanken. De onderzoekshypothese waarop het voorgestelde project gebaseerd is, is dat geavanceerde AI-technieken verborgen kennis kunnen ontdekken in grote hoeveelheden MS data om een dieper inzicht te verkrijgen in de moleculaire samenstelling van complexe biologische stalen. We zullen machine learning-gebaseerde oplossingen ontwikkelen om het geobserveerde moleculaire universum te onderzoeken en een uitgebreide kennisbank voor kleine moleculen op te bouwen. Deze ambitieuze doelen bouwen voort op onze unieke expertise in zowel AI als MS om geavanceerde datagestuurde softwareoplossingen te ontwikkelen die zullen leiden tot een verbeterde moleculaire ontdekking uit MS data.

Onderzoeker(s)

Onderzoeksgroep(en)

Project type(s)

  • Onderzoeksproject

Precisiegeneeskunde technologie (PreMeT) 01/01/2021 - 31/12/2026

Abstract

Precisiegeneeskunde staat voor het precies afstemmen van een medische behandeling op basis van het genetisch profiel, levensstijl en omgeving van een patiënt. Het maakt gebruik van technologieën die de artsen de mogelijkheid geven om op een meer accurate manier te voorspellen welke behandeling en preventiestrategie voor een bepaalde aandoening werkzaam zal zijn in welke subgroep van patiënten. De voornaamste drijfveren voor de evolutie naar precisiegeneeskunde zijn de technologische vooruitgang, zoals de nieuwe generatie sequencingtechnologie in genomica, de toenemende beschikbaarheid aan gezondheidsdata en de groei in datawetenschappen en kunstmatige intelligentie. In deze domeinen zullen 6 sterke onderzoeksteams van de UAntwerpen de krachten bundelen om hun onderzoek te vertalen in een technologieplatform voor precisiegeneeskunde (PreMeT) dat aangeboden kan worden aan de industrie, hospitalen, onderzoeksinstituten en onze samenleving. De missie van PreMeT is om precisiegeneeskunde mogelijk te maken via een geïntegreerde aanpak bestaande uit genomica en 'big data analytics'.

Onderzoeker(s)

Onderzoeksgroep(en)

Project type(s)

  • Onderzoeksproject

Transfereerbare deep learning om moleculaire interacties te voorspellen aan de hand van sequenties. 01/10/2019 - 30/09/2023

Abstract

Machine learning kan worden gebruikt om de aanwezigheid of afwezigheid van interacties te voorspellen. Voor biomedisch onderzoek is de voorspelling van moleculaire interacties die ten grondslag liggen aan de mechanica van cellen, pathogenen en het immuunsysteem, een ​​probleem van grote relevantie. In dit project, zullen we een fundamenteel nieuwe technologie ontwikkelen die onbekende interacties kan voorspellen met modellen die zijn getraind in de enorme hoeveelheid moleculaire interactiegegevens die tegenwoordig beschikbaar is dankzij hoge doorvoer experimentele technieken. Dit zal worden bereikt met behulp van een machine learning model dat de patronen in moleculaire sequenties kan leren die bepalend zijn voor de interacties. We zullen dit probleem op een generaliseerbare manier aanpakken met behulp van de nieuwste generatie neurale netwerken, door een generieke codering voor moleculaire sequenties te bepalen die gemakkelijk kan worden vertaald naar verschillende biomedische problemen. Deze codering zal worden ingevoerd in een geavanceerd diep neuraal netwerk om algemene moleculaire interacties te modelleren, die vervolgens kunnen worden afgestemd op specifieke interactietypes. De attributen die voorspellend zijn zullen vervolgens worden vertaald in nieuwe visualisaties om interpretatie door levenswetenschappers mogelijk te maken. We zullen de performantie van dit model valideren met behulp van zowel computationeel gesimuleerde als echte experimentele sequentie- en interactiegegevens uit een breed scala aan relevante interactietypes.

Onderzoeker(s)

Onderzoeksgroep(en)

Project type(s)

  • Onderzoeksproject

Intelligente kwaliteitscontrole voor massaspectrometriegebaseerde proteoomanalyse 01/10/2017 - 31/07/2021

Abstract

De afgelopen jaren is er een steeds grotere nadruk gelegd geworden op kwaliteitscontrole voor massaspectrometrie-gebaseerde proteoomanalyses, hetgeen een noodzakelijke factor is om de validiteit van de experimentele resultaten te verifiëren. Massaspectrometrie is een zeer complexe analytische techniek. Doordat de resultaten hiervan onderhevig zijn aan een grote variabiliteit zijn aangepaste technieken voor kwaliteitscontrole noodzakelijk om de invloed van de variabiliteit op de experimentele data te modelleren. Dit is momenteel echter nog niet mogelijk omdat informatie met betrekking tot de kwaliteit onvoldoende beschikbaar is: deze informatie wordt zelden gerapporteerd samen met de eigenlijke data en indien het toch aanwezig is, is het zeer moeilijk om dit correct te interpreteren. Om het volle potentieel te benutten van massaspectrometrie-gebaseerde proteoomanalyses is het noodzakelijk om op een systematische manier aan kwaliteitscontrole te doen. Daarom zullen we de technische infrastructuur voorzien om als integraal deel van een massaspectrometrie-experiment kwaliteitsmetrieken te genereren. We zullen het qcML standaard bestandsformaat voor kwaliteitsinformatie verder ontwikkelen. Op basis van dit bestandsformaat zullen we ervoor zorgen dat gedetailleerde kwaliteitsinformatie aanwezig is voor alle datasets die in PRIDE, een voorstaande databank voor publieke proteoomdata, zijn opgeslagen. Verder zullen we geavanceerde machine learning algoritmes gebruiken om op basis van deze waardevolle nieuwe kwaliteitsdata nieuwe kennis over de performantie van een massaspectrometrie-experiment te ontdekken. Dit zal ertoe leiden dat experimentele opstellingen verbeterd kunnen worden om de acquisitie van spectra te maximaliseren, het vertrouwen in de gegenereerde resultaten te verhogen, en de toepassingsmogelijkheden van massaspectrometrie-onderzoek uit te breiden.

Onderzoeker(s)

Onderzoeksgroep(en)

Project type(s)

  • Onderzoeksproject