Onderzoek Bart Goethals | Bart Goethals

Fundamenten van bandit algoritmes voor aanbevelingssystemen. 01/11/2024 - 31/10/2026

Abstract

Aanbevelingssystemen gebaseerd op multi-armed bandit-algoritmen worden steeds vaker gebruikt. Echter, hun evaluatiemethoden weerspiegelen vaak niet goed de dynamische aard van aanbevelingsscenario's in de echte wereld en verwaarlozen aspecten zoals, rechtvaardigheid, diversiteit en gebruikerstevredenheid op lange termijn. Dit belemmert de ontwikkeling van algoritmen die goed presteren in de praktijk en heeft invloed op verschillende sectoren, waaronder nieuws, e-commerce en streamingdiensten. In dit project pakken we deze kritieke kwesties aan door een uitgebreid kader te creëren voor het evalueren van bandit-algoritmen in diverse aanbevelingsscenario's en het ontwikkelen van nieuwe algoritmen om huidige tekortkomingen aan te pakken. We stellen voor om de state-of-the-art bandit-algoritmen te beoordelen, hun beperkingen te identificeren en nieuwe methoden te introduceren die zich op die beperkingen richten. Het project zal gebruikmaken van publieke datasets en een nieuw simulatie-omgeving om realistische en reproduceerbare resultaten te waarborgen. Ons onderzoek zal leiden tot fundamentele tools en inzichten, waardoor de ontwikkeling mogelijk wordt van effectievere en verantwoordelijke aanbevelingssystemen die de tevredenheid van gebruikers verbeteren.

Onderzoeker(s)

Promotor: Goethals Bart
Mandaathouder: Daniëls Noah

Onderzoeksgroep(en)

ADReM Data Lab (ADReM)

Project type(s)

Onderzoeksproject

Automatisatie van ontwerpbeslissingen in de aanbevelingssysteem pijplijn. 15/07/2024 - 14/07/2025

Abstract

Aanbevelingssystemen zijn essentieel geworden in domeinen zoals streamingdiensten, sociale mediaplatforms en e-commerce websites. De ontwikkeling van een aanbevelingssysteem omvat echter een complexe pijplijn met voorverwerking, gegevenssplitsing, algoritme- en modelselectie, en nabewerkingsstadia. Elk stadium van de pijplijn van aanbevelingssystemen vereist ontwerpbeslissingen die de prestaties van het aanbevelingssysteem beïnvloeden. Ondanks het succes van automatisering in machine learning (AutoML) bij het vereenvoudigen van machine learning pijplijnen, blijft de adoptie ervan in aanbevelingssystemen beperkt, voornamelijk vanwege de complexiteit van de pijplijnen van aanbevelingssystemen. Bijgevolg streeft ons onderzoek ernaar om de automatisering van ontwerpbeslissingen in pijplijnen van aanbevelingssystemen te creëren en te verbeteren. We richten ons op het ontwikkelen van flexibele automatiseringstechnieken voor algoritmeselectie, modelselectie en nabewerkingsstappen. Door ontwikkelaars in staat te stellen geïnformeerde keuzes te maken en het ontwikkelingsproces van aanbevelingssystemen te vergemakkelijken, verlagen we de inspanning van de ontwikkelaar terwijl we de prestaties van de aanbevelingssystemen verbeteren. Bovendien willen we de kosten-batenverhouding van automatiseringstechnieken in aanbevelingssystemen analyseren, door de computationele overhead en de resulterende verbeteringen in voorspellende prestaties te evalueren. Ons doel is om automatiseringsconcepten te benutten om ontwerpbeslissingen in pijplijnen van aanbevelingssystemen te automatiseren, handmatige inspanningen te verminderen en de algehele prestaties en bruikbaarheid van aanbevelingssystemen te verbeteren.

Onderzoeker(s)

Promotor: Goethals Bart

Onderzoeksgroep(en)

ADReM Data Lab (ADReM)

Project type(s)

Onderzoeksproject

Vlaams Artificiële Intelligentie Onderzoeksprogramma (VAIOP) – tweede cyclus. 01/01/2024 - 31/12/2028

Abstract

Het Vlaams Artificiële Intelligentie Onderzoeksprogramma is een strategisch basisonderzoeksprogramma met een consortium van elf partners: de vijf Vlaamse universiteiten (KU Leuven, Universiteit Gent, Universiteit Antwerpen, Universiteit Hasselt, Vrije Universiteit Brussel) en zes onderzoekscentra (imec, Flanders Make, VIB, VITO, Sirris en ILVO). Het programma brengt 300+ onderzoekers samen op het gebied van nieuwe AI-methoden die kunnen worden gebruikt in innovatieve toepassingen in gezondheid, industrie, planeet en energie en samenleving. Op die manier draagt het programma bij tot een succesvolle adoptie van AI in Vlaanderen. De ambitie is dat Vlaanderen een sterke internationale positie inneemt op het vlak van strategisch basisonderzoek in AI, en dit binnen een sterk en duurzaam Vlaams ecosysteem. Er zijn vijf focusonderzoeksthema's geselecteerd: verantwoorde AI, mensgerichte AI, duurzame AI (energie-efficiënt en performant), productieve en data-efficiënte AI (systemen die weinig data nodig hebben, die presteren door data te combineren met domeinkennis en ervaring van experts) en veerkrachtige en performante AI (robuust tegen veranderingen in de omgeving). De beschrijving van de werkpakketten en hun onderzoekstaken definieert de aspecten binnen deze thema's die in het programma zullen worden onderzocht. De AI-oplossingen worden gedemonstreerd in real-life use cases. Deze resultaten tonen niet alleen de effectiviteit aan, maar inspireren ook bedrijven voor adoptie en onderzoekers voor verder onderzoek. Het Vlaams Artificiële Intelligentie Onderzoeksprogramma maakt deel uit van het Vlaams AI-beleidsplan. Meer info: www.flandersairesearch.be

Onderzoeker(s)

Promotor: Mannens Erik
Promotor: Oramas Mogrovejo José Antonio
Co-promotor: Calders Toon
Co-promotor: Daelemans Walter
Co-promotor: Famaey Jeroen
Co-promotor: Goethals Bart
Co-promotor: Laukens Kris
Co-promotor: Martens David
Co-promotor: Mets Kevin
Co-promotor: Sijbers Jan
Co-promotor: Van Leekwijck Werner
Co-promotor: Verdonck Tim

Onderzoeksgroep(en)

Internet Data Lab (IDLab)

Project type(s)

Onderzoeksproject

Interpreteerbare regelgebaseerde aanbevelingssystemen. 01/11/2023 - 31/10/2026

Abstract

Aanbevelingssystemen helpen om de meest relevante items uit een enorme verzameling te identificeren. In recente onafhankelijke evaluatiestudies is aangetoond dat regelgebaseerde modellen even accuraat zijn dan complexere state-of-the-art modellen. Bovendien hebben op regels gebaseerde algoritmen interessante eigenschappen, zoals het potentieel van interpreteerbaarheid, het vermogen om lokale patronen te identificeren en de ondersteuning van context attributen. Ten eerste willen we bestaande aanbevelingsalgoritmen met verschillende biases en voorspellingsstrategieën onderzoeken en onafhankelijk evalueren. Naast nauwkeurigheid bestuderen we daarbij ook de diversiteit en structuur van de resulterende modellen, die belangrijk zijn voor het kaderen van de interpreteerbaarheid van de resultaten. Ten tweede slagen we een brug tussen aanbevelingssystemen en recente multi-label classificatie methoden die een optimale set van regels leren m.b.t. een verliesfunctie. We onderzoeken of een besluitvormingstheorie de identificatie van de optimale set van regels kan garanderen m.b.t. een verliesfunctie die rekening houdt met nauwkeurigheid, complexiteit en diversiteit. We houden daarbij ook rekening met de karakteristieken van aanbeveling datasets, zoals de ongelijke distributie, impliciete feedback en schaal. Ten slotte gebruiken we nieuwe, op regels gebaseerde algoritmen die nauwkeuriger zijn dan momenteel mogelijk voor intensive care monitoring en online voor e-commerce en nieuws.

Onderzoeker(s)

Promotor: Goethals Bart
Mandaathouder: Feremans Len

Onderzoeksgroep(en)

ADReM Data Lab (ADReM)

Project type(s)

Onderzoeksproject

Onderzoek naar vergeetmethoden om de privacy, veiligheid en bruikbaarheid van aanbevelingssystemen te waarborgen. 01/11/2023 - 31/10/2025

Abstract

De voorbije jaren zijn machine learning-algoritmen zijn zeer effectief gebleken bij het analyseren van grote hoeveelheden gegevens en het vinden van complexe patronen. Een toepassing van machine learning die veel aandacht heeft gekregen, zijn aanbevelingssystemen, dit zijn algoritmen die gebruikersgedrag en andere gegevens analyseren om inhoud voor te stellen waarin een gebruiker mogelijk geïnteresseerd is. Deze systemen kunnen echter onbedoeld gevoelige, verouderde of foutieve informatie bevatten. Dit vormt een risico voor hun privacy, beveiliging en bruikbaarheid. In dit voorstel willen we deze problemen aanpakken door "vergeetmethoden" te onderzoeken, waardoor informatie efficiënt kan worden "vergeten" door een model. Het hoofddoel van dit voorstel is het leggen van de basis voor toekomstige vergeetmethoden. We evalueren eerst de huidige vergeetmethoden en verkennen nieuwe vijandige aanvallen op de verifieerbaarheid, efficiëntie en nauwkeurigheid van deze methoden. Met behulp van onze verzamelde inzichten proberen we nieuwe vergeetmethoden te creëren die verifieerbaar en efficiënt zijn en niet leiden tot een sterke verslechtering van de accuraatheid van een model. Met dit voorstel proberen we een belangrijke bijdrage te leveren aan de theoretische grondslagen van "unlearning", terwijl we ook vergeetmethoden ontwikkelen die kunnen worden toegepast op reële problemen.

Onderzoeker(s)

Promotor: Goethals Bart
Mandaathouder: Leysen Jens

Onderzoeksgroep(en)

ADReM Data Lab (ADReM)

Project type(s)

Onderzoeksproject

Serendipity Engine: naar een verrassende en interessante stadsbeleving. 01/10/2022 - 30/09/2026

Abstract

Er wordt steeds vaker gewaarschuwd voor het sturende en beperkende karakter van aanbevelingssystemen. Hierbij wordt verwezen naar de trend om voornamelijk voorspelbare, populaire en homogene inhoud te promoten, ook wel bekend als "filter bubbels". In een stedelijke context heeft dit tot gevolg dat mensen niet meer worden blootgesteld aan de diversiteit van steden en van hun inwoners, wat negatieve gevolgen heeft voor het open en democratisch karakter van de stad. Dit actueel probleem heeft dringend aandacht nodig en er is dan ook een maatschappelijke vraag voor een transitie naar informatiesystemen die serendipiteit in de stad bevorderen. Vandaag mist er echter een duidelijk begrip van de betekenis en waarde van serendipiteit in stedelijke omgevingen en hoe digitale toepassingen kunnen ontwikkeld worden volgens dit principe. In dit project wordt de betekenis en waarde van serendipiteit uitgeklaard en wordt naar een beleidskader gewerkt om lokale besturen en beleidsmakers te ondersteunen in deze transitie. Daarnaast zal het project onderzoeken hoe ontwikkelaars dergelijke toepassingen kunnen ontwerpen op het vlak van data, algoritmes en design. Deze benadering is geïnspireerd op de theorie van de affordances en de bevindingen dat (digitale) omgevingen kunnen worden ontworpen om serendipiteit te stimuleren. Deze affordances (op het vlak van data, algoritmes en design) zullen worden ontworpen, ontwikkeld en getest aan de hand van de Living Lab methode in drie stedelijke pilootprojecten. Om deze methode te ondersteunen, wordt er tevens een nieuwe onderzoeksmethode ontwikkeld, specifiek gericht op het onderzoeken van de gebruikerservaring van serendipiteit.

Project type(s)

Onderzoeksproject

Onderzoeksprogramma Artificiële Intelligentie. 01/01/2023 - 31/12/2023

Abstract

Het Vlaams AI-onderzoeksprogramma concentreert zich op generieke AI-methodologieën die algemeen inzetbaar zijn voor talloze toepassingen in de gezondheidszorg, de industrie en door de overheid. De noden zijn aangegeven door gebruikers uit deze toepassingsdomeinen.

Onderzoeker(s)

Promotor: Mannens Erik
Co-promotor: Calders Toon
Co-promotor: Daelemans Walter
Co-promotor: Goethals Bart
Co-promotor: Latré Steven
Co-promotor: Laukens Kris
Co-promotor: Martens David
Co-promotor: Sijbers Jan
Co-promotor: Steckel Jan

Onderzoeksgroep(en)

Internet Data Lab (IDLab)

Project type(s)

Onderzoeksproject

Onderzoeksprogramma Artificiële Intelligentie. 01/01/2022 - 31/12/2022

Abstract

Het Vlaams AI-onderzoeksprogramma heeft als doel om het strategisch basis onderzoek omtrent AI aan de Vlaamse universiteiten en kenniscentrums te stimuleren. Dit onderzoek moet toepasbaar en relevant zijn voor de Vlaamse industrie. Concreet werden er 4 grote uitdagingen, met toenemende complexiteit, gedefinieerd: 1. Het ondersteunen van complexe beslissingen: focus op het nemen van complexe beslissingen door AI-systemen gebaseerd op datasets die mogelijks onvolledige of foutieve informatie kunnen bevatten. 2. Het verzamelen en verwerken van informatie in de edge: focus op het gebruik van AI-systemen in de egde i.p.v. de cloud door de integratie van software en hardware en de ontwikkeling van algoritmen die minder energie en andere hulpbronnen nodig hebben. 3. De autonome interactie met andere beslissingsentiteiten: focus op samenwerking tussen verschillende AI-systemen die onafhankelijk van elkaar opereren. 4. Het naadloos communiceren en samenwerken met mensen: focus op de natuurlijke interactie tussen mensen en AI-systemen en de ontwikkeling van AI-systemen die complexe omgevingen kunnen begrijpen en menselijke redeneringen kunnen toepassen.

Onderzoeker(s)

Promotor: Hellinckx Peter
Promotor: Latré Steven
Co-promotor: Calders Toon
Co-promotor: Daelemans Walter
Co-promotor: Goethals Bart
Co-promotor: Laukens Kris
Co-promotor: Martens David
Co-promotor: Sijbers Jan
Co-promotor: Steckel Jan

Onderzoeksgroep(en)

Internet Data Lab (IDLab)

Project type(s)

Onderzoeksproject

Contextual anomaly detection for complex industrial assets (CONSCIOUS). 01/01/2021 - 30/06/2023

Abstract

CONSCIOUS (Contextual aNomaly deteCtIon for cOmplex indUstrial aSsets) focust op het detecteren van contextuele anomalieën in industriële machines en processen. In deze complexe omgevingen blijft het detecteren van anomalieën een grote uitdaging omwille van de zeer dynamische omstandigheden waarin deze assets opereren. De algemene doelstelling van dit voorstel bestaat erin effectieve oplossingen te vinden om anomalieën op een meer nauwkeurige, robuuste, tijdige en interpreteerbare wijze te detecteren in complexe, heterogene data uit industriële assets, waarbij rekening wordt gehouden met contextuele factoren die tot verwarring kunnen leiden. De resultaten zullen worden gevalideerd aan de hand van meerdere concrete use cases in verschillende domeinen. Voor dit project zal Sirris samenwerken met Skyline Communications, Duracell Batteries, I-care, Yazzoom, KU Leuven en de Universiteit Antwerpen.

Onderzoeker(s)

Promotor: Goethals Bart

Onderzoeksgroep(en)

ADReM Data Lab (ADReM)

Project type(s)

Onderzoeksproject

Kwalitatieve Evaluatie van Automatisch Geleerde Modellen. 01/11/2020 - 31/10/2024

Abstract

Een veelvoorkomend en recent algemeen geaccepteerd probleem op het gebied van automatisch leren, is de black box-aard van veel algoritmen. In de praktijk kunnen deze algoritmen bekeken worden in termen van hun invoer en uitvoer, maar zonder enige kennis van hun interne werking. De meest beruchte voorbeelden in deze context, zijn artificiële neurale netwerken en deep learning technieken, maar ze zijn zeker niet de enige technieken die aan dit probleem lijden. Matrixfactorisatie modellen voor gepersonaliseerde aanbevelingen lijdt bijvoorbeeld aan hetzelfde gebrek aan interpreteerbaarheid. Ons onderzoek focust zich op het toepassen en aanpassen van pattern mining technieken om betekenisvolle inzichten te krijgen in big data algoritmen door hun invoer en uitvoer te analyseren, wat ons ook toestaat om verschillende algoritmen te vergelijken en de verborgen fenomenen te vinden die tot de verschillen leiden.

Onderzoeker(s)

Promotor: Goethals Bart
Mandaathouder: De Pauw Joey

Onderzoeksgroep(en)

ADReM Data Lab (ADReM)

Project type(s)

Onderzoeksproject

Interpreteerbare kwalitatieve evaluatie van online aanbevelingssystemen. 01/10/2020 - 30/09/2021

Abstract

Individuen vertrouwen vaak op aanbevelingen van anderen bij het nemen van routinematige, dagelijkse beslissingen. Aanbevelingsalgoritmen die dit gedrag nabootsen, zijn essentieel voor het succes van e-commerce. Een open vraag is waarom algoritmen deze aanbevelingen doen. Dit is problematisch gezien dat de meest nauwkeurige algoritmen voor machine learning black-box-modellen zijn en we een dynamische omgeving hebben waarin mogelijk meerdere modellen worden geïmplementeerd en periodiek opnieuw worden getraind. Aangezien elke organisatie menselijk toezicht en besluitvorming nodig heeft, is er behoefte aan inzicht in gebruikersgedrag en interacties met aanbevelingen van black-box machine learning-algoritmen. Traditioneel worden twee aanbevelingssystemen vergeleken op basis van één statistiek, zoals de click-through-rate na een A/B-test. We zullen de prestaties van online aanbevelingssystemen kwalitatief beoordelen door patronen bloot te leggen die kenmerkend zijn voor de verschillen in beoogde gebruikers en items. We stellen voor om interpreteerbare machine learning toe te passen, waarbij het doel is om verklaringen te produceren die kunnen worden gebruikt om menselijk begrip en beslissingen te ondersteunen. Aan de hand van ontdekte interpreteerbare associatieregels en, mogelijk gegroepeerde, counterfactual verklaringen, genereren we waarom aanbevelingssysteem A beter (of slechter) presteert dan aanbevelingssysteem B.

Onderzoeker(s)

Promotor: Goethals Bart
Mandaathouder: Feremans Len

Onderzoeksgroep(en)

ADReM Data Lab (ADReM)

Project type(s)

Onderzoeksproject

Francqui Leerstoel 2019-2020 Prof. Luc De Raedt (KULeuven). 01/10/2019 - 30/09/2020

Abstract

Op voorstel van de Universiteit, kent de Francqui-Stichting elk jaar twee Francqui-Leerstoelen toe aan de UAntwerpen. Deze zijn bedoeld om de uitnodiging mogelijk te maken van een Professor van een andere Belgische Universiteit of uit het buitenland, voor een reeks van tien lesuren. De Francqui-Stichting betaalt aan de titularis van een Francqui-Leerstoel het honorarium voor deze tien lessen.

Onderzoeker(s)

Promotor: Goethals Bart

Onderzoeksgroep(en)

ADReM Data Lab (ADReM)

Project type(s)

Onderzoeksproject

Onderzoeksprogramma Artificiële Intelligentie. 01/07/2019 - 31/12/2021

Abstract

Het Vlaams AI-onderzoeksprogramma heeft als doel om het strategisch basis onderzoek omtrent AI aan de Vlaamse universiteiten en kenniscentrums te stimuleren. Dit onderzoek moet toepasbaar en relevant zijn voor de Vlaamse industrie. Concreet werden er 4 grote uitdagingen, met toenemende complexiteit, gedefinieerd: 1. Het ondersteunen van complexe beslissingen: focus op het nemen van complexe beslissingen door AI-systemen gebaseerd op datasets die mogelijks onvolledige of foutieve informatie kunnen bevatten. 2. Het verzamelen en verwerken van informatie in de edge: focus op het gebruik van AI-systemen in de egde i.p.v. de cloud door de integratie van software en hardware en de ontwikkeling van algoritmen die minder energie en andere hulpbronnen nodig hebben. 3. De autonome interactie met andere beslissingsentiteiten: focus op samenwerking tussen verschillende AI-systemen die onafhankelijk van elkaar opereren. 4. Het naadloos communiceren en samenwerken met mensen: focus op de natuurlijke interactie tussen mensen en AI-systemen en de ontwikkeling van AI-systemen die complexe omgevingen kunnen begrijpen en menselijke redeneringen kunnen toepassen.

Onderzoeker(s)

Promotor: Latré Steven
Co-promotor: Calders Toon
Co-promotor: Daelemans Walter
Co-promotor: Goethals Bart
Co-promotor: Hellinckx Peter
Co-promotor: Laukens Kris
Co-promotor: Martens David
Co-promotor: Sijbers Jan
Co-promotor: Steckel Jan

Onderzoeksgroep(en)

Internet Data Lab (IDLab)

Project type(s)

Onderzoeksproject

Patroon gebaseerde aanbevelingssystemen 01/04/2019 - 31/03/2023

Abstract

Het doel van dit project is om nieuwe algoritmes te onderzoeken voor aanbevelingssystemen die in het Froomle platform gebruikt kunnen worden. Meer specifiek zal men zich toeleggen op onderzoek naar nieuwe methodes die gebruik maken van recente ontwikkelingen in pattern mining.

Onderzoeker(s)

Promotor: Goethals Bart

Onderzoeksgroep(en)

ADReM Data Lab (ADReM)

Project type(s)

Onderzoeksproject

Gepersonaliseerde zoekmachines. 01/01/2019 - 31/12/2022

Abstract

Het is onze ambitie om een fundamentele bijdrage te leveren aan state-of-the-art gepersonaliseerde zoekmachines - met een focus op e-commerce, e-news en video - door het bestuderen en ontwikkelen van nieuwe gepersonaliseerde zoek-algoritmes die zowel de gebruikte zoektermen alsook de volledige online en offline gebruikerservaring van de bezoeker in rekening nemen. Concreet zullen we dit doen door volgende onderzoeksthema's te behandelen: Eerst, in de context van gepersonaliseerde zoekmachines, hoe meten en evalueren we succes? Gepersonaliseerde zoekmachines zijn een relatief recent onderzoeksdomein en aldus bestaat er nog geen gestandaardiseerd kader en een benchmark dataset op basis waarvan succes gemeten kan worden. In andere, meer mature, onderzoeksdomeinen bestaan deze wel, e.g. LETOR (learning-to-rank) of MovieLens (recommender systems). Het is ons doel om zulk een gestandaardiseerd kader en een benchmark dataset te ontwikkelen die kan gebruikt worden om de prestaties van verschillende algoritmes met elkaar te vergelijken. Concreet is het ons doel om een live test uit te voeren voor retail, voor video en voor nieuws, waarbij we de resultaten evalueren volgens de ontwikkelde KPI's voor het corresponderende domein. Ten tweede, hoe kan gedrag-gebaseerde relevantie en op zoektermen gebaseerde relevantie gecombineerd worden om een optimale ordening van items te bepalen die gepersonaliseerd is voor elk individu? Om de gebruiker relevante zoekresultaten te tonen gerangschikt volgens hun persoonlijke voorkeuren dienen we (minstens) twee "maten" voor relevantie te combineren: relevantie op basis van de zoekterm en relevantie voor de gebruiker als persoon. Beiden kunnen opnieuw samengesteld zijn uit verschillende delen, e.g. pagina's bezocht, items gekocht, etc. als we spreken over persoonlijke relevantie en overeenkomst met de zoekterm, autoriteit of "versheid" van elk van de zoekresultaten voor zoek-gerelateerde relevantie. Het is ons doel te identificeren welke van de voornoemde delen (of "features" in de terminologie) relevant kunnen zijn in het aanbieden van een optimale gepersonaliseerde zoekervaring, bv. bezochte pagina's en versheid, maar niet autoriteit en gekochte items. Dan behandelen we een volgende probleem: hoe moeten we deze scores nu combineren? Dit is allesbehalve een triviaal probleem en statische combinatie van persoonlijke en zoek-gerelateerde relevantie is niet genoeg. Om dit probleem op te lossen dienen we ten minste één ordenings-algoritme te ontwikkelen die verschillende inputs kunnen vertalen in een optimale ranking, gepersonaliseerd op het niveau van het individu. Dit vereist dan ook dat we nieuwe objectieven moeten definiëren die dit persoonlijke aspect van een ordening in rekening kunnen brengen. Ten derde, kunnen we een geïntegreerde ordenings-oplossing ontwikkelen die het gepersonaliseerde zoekprobleem herleidt tot het optimaal bepalen van de intentie van de gebruiker, eerder dan het optimaal combineren van de zoekterm met historisch gedrag? Dit alles leidt dan tot de laatste onderzoeksvraag. In plaats van verder te bouwen op het bestaande kader binnen het learning-to-rank onderzoeksdomein - i.e. een tweestaps aanpak voor ordening: eerst ophalen, dan ordenen -, kunnen we in de plaats hiervan het probleem kaderen als een aanbevelings probleem, waar een zoekterm niet meer is dan een extra indicatie van het onderliggende doel van de gebruiker? Het ontwikkelen van deze nieuwe algoritmes voor gepersonaliseerde zoekmachines en een kader voor evaluatie zal Froomle toestaan om gepersonaliseerde zoekmachines toe te voegen aan hun bestaande aanbod aan aanbevelingssystemen. Dit is een belangrijke stap voorwaarts in het dichten van de kloof tussen de grote technologie giganten en meer traditionele offline bedrijven. 

Onderzoeker(s)

Promotor: Goethals Bart

Onderzoeksgroep(en)

ADReM Data Lab (ADReM)

Project type(s)

Onderzoeksproject

Fundamenten van aanbevelingssystemen. 01/10/2017 - 30/09/2021

Abstract

Aanbevelingssytemen zijn algoritmes die vooral bekend zijn voor hun toepassingen in e-commerce. Gegeven een specifieke klant en een groot aantal producten, vinden zij automatisch de meest relevante producten voor die specifieke klant. Hun mogelijkheden gaan echter veel verder. Zo kunnen ze bijvoorbeeld ook genen aanbevelen die met een grote waarschijnlijkheid verantwoordelijk zijn voor bepaalde ziektes, of woorden die relevant zijn voor bepaalde documenten, tags voor een foto, cursussen voor een student, etc. Huidig onderzoek naar aanbevelingssystemen wordt bijna volledig gestuurd door de (publiek) beschikbare datasets. Daarom blijft de volgende fundamentele vraag grotendeels onbeantwoord:"Gegeven twee datasets, hoe kunnen we bepalen dewelke van de twee kwalitatief de beste aanbevelingen genereert?" Daarenboven is de hoeksteen van aanbevelingssystemen onderzoek de evaluatie van de aanbevelingen die gegenereerd worden. Het meeste bestaande onderzoek is volledig afhankelijk van historische data om de kwaliteit van de aanbevelingen te meten. Er is echter geen overtuigend bewijs dat de performantiemeting van de aanbevelingen op historische data een goede plaatsvervanger is voor hun performantie in real-life situaties. Een tweede fundamentele vraag blijft dus ook tot nu toe onbestudeerd:"In hoeverre zijn real-life performantiemetingen van aanbevelingssystemen gecorreleerd met de metingen die berekend kunnen worden op historische data?" Met dit projectvoorstel willen wij deze twee fundamentele vragen bestuderen en kunnen beantwoorden.

Onderzoeker(s)

Promotor: Goethals Bart
Mandaathouder: Karimi Mozhgan

Onderzoeksgroep(en)

ADReM Data Lab (ADReM)

Project type(s)

Onderzoeksproject

Datamining en continue spraak: Het modelleren van spraakverwerving bij kinderen door het blootleggen van bouwstenen en patronen in gesproken taal 01/10/2017 - 30/09/2019

Abstract

Complex gebruik van taal, en met name spraak, is een van de bepalende kenmerken van mensen, waardoor we ons onderscheiden van dieren. In de afgelopen decennia heeft spraakherkenning veel toepassingen gevonden en is nu bijvoorbeeld een standaardfunctie op moderne smartphones. De flexibele en krachtige leercapaciteiten van menselijke baby's zijn echter nog steeds niet geëvenaard door een machine. Jonge kinderen vinden een manier om alle spraak die ze horen te begrijpen en te generaliseren op een manier dat de patronen in de spraakklanken kunnen worden ontward, begrepen en herhaald. In een aparte onderzoekslijn, op het gebied van machine learning en datamining, zijn algoritmen ontwikkeld om patronen in data te ontdekken. De informatie die uit alle beschikbare gegevens kan worden gehaald, is een belangrijk aspect van het bedrijfsleven geworden, als we kijken naar video-aanbevelingssystemen of de financiële sector. Het idee van mijn onderzoek is het ontwikkelen en bestuderen van technieken die zijn geïnspireerd door deze datamining-algoritmen, om patronen uit spraak te halen. De inherente problemen van continue en luidruchtige spraak moeten worden overwonnen, omdat het niet alleen op dezelfde manier kan worden verwerkt als discrete en exacte gegevens. Na het aanpassen van deze methoden en het toepassen ervan op spraak, zal ik ze gebruiken in het wetenschappelijk onderzoek naar de bouwstenen van spraak, waarbij ze hun relevantie en validiteit evalueren. Verder zal ik, met behulp van deze, onderzoeken welke aspecten van spraak kinderen nodig hebben en vervolgens gebruiken om meer te weten te komen over deze bouwstenen.

Onderzoeker(s)

Promotor: Goethals Bart

Onderzoeksgroep(en)

ADReM Data Lab (ADReM)

Project type(s)

Onderzoeksproject

Sturing van lot netwerken, interactie tussen datascience en modellering. 01/01/2017 - 31/12/2021

Abstract

Netwerken van onderling verbonden autonome rekeneenheden ondersteunen hoe langer hoe meer onze maatschappij, en interageren en beinvloeden mekaar in complexe en op soms onverwachte manieren. Voorbeelden hiervan zijn smart grids, intelligente verkeerslichten, of meer algemeen het zogenaamde Internet of Things. Het bestuderen en verstaan van de karakteristieken en dynamiek van deze systemen, zowel op lokale als op globale schaal, is cruciaal om ze te kunnen sturen in de richting van een gewenste toestand. De partners in dit WOG voorstel bestuderen elk cruciale eigenschappen van zulke complexe systemen, of ze zijn experts in gerelateerde gebieden die complementaire technieken aanbieden om de gigantische hoeveelheden data die gegenereerd worden te analyseren. Het samenbrengen van deze orthogonale expertisegebieden in een onderzoeksgemeenschap belooft tal van opportuniteiten te creëren voor kruisbestuiving en de ontwikkeling van nieuwe analyse en controle technieken.

Onderzoeker(s)

Promotor: Goethals Bart

Onderzoeksgroep(en)

ADReM Data Lab (ADReM)

Project type(s)

Onderzoeksproject

City of Things 01/01/2017 - 31/12/2020

Abstract

Steden maken gebruik van het Internet of Things om een slimme infrastructuur te bekomen en dit door gebruik te maken van sensoren en controle toestellen, met als doel het leven in de stad te verbeteren. Analyse van de verzamelde data zal op een geautomaseerde wijze een meer efficiënte controle van de verschillende processen in een stad mogelijk maken (bv. mobiliteit). Om de slimme stad infrastuktuur te bekomen beschouwen we drie lagen: de network/sensor laag, i.e. een stedelijk communicatienetwerk gebaseerd op een variëteit aan technologiëen en bijhorende protocol stacks waaraan sensoren zijn gekoppeld die de ruwe data verzamelen; een data laag die de continue stroom data opslaat en verwerkt (bv. toepassen van datamining technieken); een applicatie laag verantwoordelijk voor de interpretatie van de verwerkte data teneinde te komen tot een meer optimale controle van de stad. De network/sensor laag wordt behandeld door de MOSAIC onderzoekgsgroep (Dept. Wiskunde en Informatica, Chris Blondia and Steven Latré); de data laag is de verantwoordelijkheid is van de ADREM onderzoeksgroep (Dept. Wiskunde en Informatica, Bart Goethals); de applicatie laag wordt door de onderzoeksgroep Transport en Regionale Economie behandeld (Dept. Transport en Regionale Economie, Eddy Van de Voorde and Thierry Vaneslander). Het uiteindelijk doel van dit project is de expertise aanwezig aan de Universiteit Antwerpen op elk van deze drie lagen samen te brengen, met als bedoeling het onderzoek te bundelen en via intensieve samenwerking te komen tot een globaal raamwerk voor deze drie lagen. In het bijzonder wordt er gestreefd naar een smart city platform, gericht op mobiliteit, dat toelaat de smart city data in het algemeen en m.b.t. mobiliteit in het bijzonder, te capteren, te verwerken, te analyseren en te interpreteren. Als eindresultaat bekomen we een proof-of-concept waar de verschillende resultaten worden gecombineerd in een demonstrator.

Onderzoeker(s)

Promotor: Blondia Chris
Co-promotor: Goethals Bart
Co-promotor: Latré Steven
Co-promotor: Van de Voorde Eddy
Co-promotor: Vanelslander Thierry

Onderzoeksgroep(en)

Internet Data Lab (IDLab)

Project website

https://www.uantwerpen.be/en/research-groups/idlab/infrastructure/city-lab/

Project type(s)

Onderzoeksproject

De Slimme Stad 01/05/2016 - 30/04/2020

Abstract

Meer en meer alledaagse toestellen worden verbonden met het internet. Deze evolutie, die het internet der dingen (IoT) genoemd wordt, heeft een recente boost gegeven aan onderzoek naar grootschalige draadloze sensor netwerken. Meer specifiek worden steden met IoT technologie uitgerust maar echte grootschalige installaties van draadloze sensornetwerken geven nog erg grote onderzoeksuitdagingen. Tegelijkertijd is de stad ook een schat aan belangrijke data indien dit op een goeie manier kan gemonitord worden. Testbeds worden vaak gebruikt om onderzoeksresultaten te valideren maar een grootschalige en multi-technologie slimme stad infrastructuur is momenteel nog onbestaand. De City of Things onderzoeksinfrastructuur wil een multi-technologie en multi-niveau testbed bouwen in de stad van Antwerpen. 100 locaties, verdeeld over de stad, zullen voorzien worden van sensor basisstations. Deze basisstations worden vervolgens verbonden met een reeks van sensoren die informatie verzamelen omtrent mobiliteit, geluid, luchtkwaliteit, enz.

Onderzoeker(s)

Promotor: Blondia Chris
Co-promotor: Blust Ronny
Co-promotor: De Backer Charlotte
Co-promotor: Goethals Bart
Co-promotor: Hellinckx Peter
Co-promotor: Latré Steven
Co-promotor: Poels Karolien
Co-promotor: Samson Roeland
Co-promotor: Vandebosch Heidi
Co-promotor: Vanelslander Thierry
Co-promotor: Walrave Michel
Co-promotor: Weyn Maarten

Onderzoeksgroep(en)

Internet Data Lab (IDLab)

Project website

https://www.uantwerpen.be/en/rg/idlab/research/

Project type(s)

Onderzoeksproject

Validatie van de ADReM personaliseringsalgoritmes als basis van een spin-off. 01/05/2016 - 30/04/2017

Abstract

Personaliseringstechnologie laat een bedrijf toe om aan elke individuele klant een gepersonaliseerde selectie van relevante producten te tonen uit een gigantische catalogus. Als gevolg van hun onderzoek in het domein van recommender systemen, heeft de ADReM onderzoeksgroep kennis en expertise verzameld over personaliseringstechnologie. Dit project is gericht op het oprichten van een spin-off bedrijf om deze kennis en expertise te valoriseren.

Onderzoeker(s)

Promotor: Goethals Bart
Co-promotor: Verstrepen Koen

Onderzoeksgroep(en)

ADReM Data Lab (ADReM)

Project type(s)

Onderzoeksproject

Declaratieve methoden in de informatica. 01/01/2016 - 31/12/2020

Abstract

Om tegemoet te komen aan de nood om steeds grotere en complexere software systemen te bouwen is er een groeiende vraag naar declaratieve methoden, die abstractie maken van onnodige details en zich toespitsen op de functionaliteit van de systemen. De onderzoeksgemeenschap heeft als doel de ontwikkeling van declaratieve methoden te bevorderen, in het bijzonder deze die voortspruiten uit onderzoek in gegevensbanken en functioneel en logisch programmeren.

Onderzoeker(s)

Promotor: Goethals Bart

Onderzoeksgroep(en)

ADReM Data Lab (ADReM)

Project type(s)

Onderzoeksproject

Hypermodelling strategies on multi-stream time-series data for operational optimization (HYMOP). 01/10/2015 - 30/09/2019

Abstract

Het doel van het HYMOP project is de optimalisatie van de operaties en het onderhoud (O&M) van een vloot van industriele machines. Daarbij worden innovatieve modellerings-, dataverwerkings- en analysetechnieken gerealiseerd die in staat zijn om met grote hoeveelheden complexe data om te gaan in reële tijd. Dit zal toelaten om de steeds toenemende hoeveelheid sensors en communicatie tussen industriële toestellen beter te benutten.

Onderzoeker(s)

Promotor: Goethals Bart

Onderzoeksgroep(en)

ADReM Data Lab (ADReM)

Project type(s)

Onderzoeksproject

Datamining en continue spraak: Het modelleren van spraakverwerving bij kinderen door het blootleggen van bouwstenen en patronen in gesproken taal; 01/10/2015 - 30/09/2017

Abstract

Het complexe gebruik van taal, en in het bijzonder spraak, is een van de bepalende kenmerken van de mens, waardoor we ons onderscheiden van dieren. In de afgelopen decennia heeft spraakherkenning veel toepassingen gevonden en is nu bijvoorbeeld een standaardfunctie op moderne smartphones. De flexibele en krachtige leercapaciteiten van menselijke zuigelingen zijn echter nog steeds niet door een machine geëvenaard. Jonge kinderen vinden een manier om een alle spraak die ze horen te ordenen en te generaliseren op een manier dat de patronen in de spraakgeluiden kunnen worden onderscheiden, begrepen en herhaald. In een aparte lijn van onderzoek, het veld van machine leren en data mining, werden algoritmes ontwikkeld om patronen in data te ontdekken. De informatie die uit alle beschikbare gegevens kan worden geëxtraheerd, is uitgegroeid tot een belangrijk aspect van het bedrijfsleven, als we kijken naar videorecommandation systems of de financiële sector. Het idee van mijn onderzoek is het ontwikkelen en bestuderen van technieken die geïnspireerd zijn door deze data mining algoritmes, om patronen uit spraak te extraheren. De inherente moeilijkheden van voortdurende en lawaaierige spraak moeten overwonnen worden, omdat het niet alleen kan worden verwerkt als discrete en exacte gegevens. Nadat deze methoden zijn aangepast en toegepast op spraak, zal ik ze gebruiken in het wetenschappelijk onderzoek over de bouwstenen van spraak, waarbij hun relevantie en validiteit worden beoordeeld. Daarnaast zal ik, met behulp hiervan, onderzoeken welke aspecten van spraak kinderen nodig hebben en vervolgens gebruiken om te leren over deze bouwstenen.

Onderzoeker(s)

Promotor: Goethals Bart

Onderzoeksgroep(en)

ADReM Data Lab (ADReM)

Project type(s)

Onderzoeksproject

Onderzoek in het domein van de pattern mining. 01/10/2015 - 30/09/2016

Abstract

Verder bouwend op mijn expertise, en die van mijn onderzoeksgroep wil ik samen met de onderzoeksgroep van Geoff Webb de principes bestuderen van verschillende conditional pattern set mining technieken. Karakteristiek voor bestaande pattern mining technieken is dat men zoekt naar lokale patronen, wat betekent dat elk patroon onafhankelijk getest wordt van alle andere patronen, en dat het resultaat van de zoekopdracht vaak een (grote, ongestructureerde) verzameling patronen is. Voor gebruikers van datamining systemen is deze situatie alles behalve ideaal, omdat veel tijd en moeite gestopt moet worden in het naverwerken van de patronen om tot een kleinere verzameling patronen te komen die de verworven kennis interpreteerbaar samenvat, en toegepast kan worden voor clustering of voorspellingstechnieken. Veel hedendaagse data mining technieken bieden echter te weinig ondersteuning voor deze naverwerkingstaak.Het onderzoek dat ik wil opstarten tijdens dit project heeft als doel verbetering te brengen in deze situatie door nieuwe technieken te ontwikkelen en te bestuderen voor conditional pattern set mining.

Onderzoeker(s)

Promotor: Goethals Bart

Onderzoeksgroep(en)

ADReM Data Lab (ADReM)

Project type(s)

Onderzoeksproject

Integratie van patroonherkenning in een bedrijf-gerelateerde omgeving. 01/07/2015 - 30/06/2016

Abstract

In dit project willen we het prototype van MIME, een tool voor interactieve patroonanalyse die werd ontwikkeld aan de Universiteit Antwerpen, verder ontwikkelen tot een professioneel inzetbare tool. Op deze manier willen we pattern mining toegankelijk maken voor bedrijven, die door middel van de tool op een snelle manier op zoek kunnen gaan naar interessante patronen die nuttig zijn bij het maken van belangrijke stategische beslissingen.

Onderzoeker(s)

Promotor: Goethals Bart
Mandaathouder: Moens Sandy

Onderzoeksgroep(en)

ADReM Data Lab (ADReM)

Project type(s)

Onderzoeksproject

Datafusie en gestructureerd input- en output- machinaal leren technieken voor geautomatiseerde klinische codering. 01/01/2014 - 31/12/2017

Abstract

Dit project kadert in een onderzoeksopdracht tussen enerzijds UA en anderzijds IWT. UA levert aan IWT de onderzoeksresultaten genoemd in de titel van het project onder de voorwaarden zoals vastgelegd in voorliggend contract.

Onderzoeker(s)

Promotor: Goethals Bart
Promotor: Van den Bulcke Tim
Co-promotor: Daelemans Walter
Co-promotor: Luyten Leon
Mandaathouder: Scheurwegs Elyne

Onderzoeksgroep(en)

ADReM Data Lab (ADReM)

Project type(s)

Onderzoeksproject

Exascience Life Pharma. 01/07/2013 - 31/12/2015

Abstract

Dit project kadert in een onderzoeksopdracht tussen enerzijds UA en anderzijds Janssen. UA levert aan Janssen de onderzoeksresultaten genoemd in de titel van het project onder de voorwaarden zoals vastgelegd in voorliggend contract.

Onderzoeker(s)

Promotor: Goethals Bart
Promotor: Van den Bulcke Tim

Onderzoeksgroep(en)

ADReM Data Lab (ADReM)

Project type(s)

Onderzoeksproject

Fraudedetectie met behulp van data mining. 17/05/2013 - 30/09/2013

Abstract

Met behulp van data mining technieken zal getracht worden om patronen te ontdekken in fraude data. De data bevat onder meer geanonimiseerde transacties en fraude-labels. Hierbij zullen reeds ontworpen technieken getoetst worden aan grote datasets.

Onderzoeker(s)

Promotor: Goethals Bart
Co-promotor: Martens David

Onderzoeksgroep(en)

Project type(s)

Onderzoeksproject

Een geïntegreerd informatica-platform voor op massaspectrometrie gebaseerde eiwitanalyse (InSPECtor). 01/03/2013 - 28/02/2017

Abstract

Verschillende computationele uitdagingen verhinderen momenteel de ruime inzetbaarheid van proteoomanalyses in een industriële en klinische omgeving. De doelstellingen van dit project bestaan uit het aanpakken van deze uitdagingen door het ontwikkelen van nieuwe data-analyse methoden en data mining algoritmen zodat massaspectrometrie gebaseerde eiwitanalyse een volwaardige analytische discipline kan worden.

Onderzoeker(s)

Promotor: Goethals Bart
Co-promotor: Laukens Kris

Onderzoeksgroep(en)

ADReM Data Lab (ADReM)

Project type(s)

Onderzoeksproject

Evoluerende netwerk patronen. 01/01/2013 - 31/12/2016

Abstract

Dit project betreft fundamenteel kennisgrensverleggend onderzoek gefinancierd door het Fonds voor Wetenschappelijk Onderzoek-Vlaanderen. Het project werd betoelaagd na selectie door het bevoegde FWO-expertpanel.

Onderzoeker(s)

Promotor: Goethals Bart
Co-promotor: Laukens Kris

Onderzoeksgroep(en)

ADReM Data Lab (ADReM)

Project type(s)

Onderzoeksproject

Ontwikkeling van een geautomatiseerd software platform voor ondersteuning en kwaliteitsverhoging van het coderen van klinische informatie. 01/01/2013 - 31/12/2013

Abstract

In dit project ontwikkelen we algoritmes en software om de kwaliteit van het coderen van klinische informatie in ziekenhuizen te verhogen en werken we een valorisatieplan uit. De algoritmes gebruiken state-of-the-art machine learning om inconsistenties te identificeren en codes te suggereren. We ontwerpen een business development strategie, trekken potentiële klanten aan en zoeken vervolgfinanciering.

Onderzoeker(s)

Promotor: Van den Bulcke Tim
Co-promotor: Goethals Bart
Co-promotor: Luyckx Kim
Co-promotor: Luyten Leon
Co-promotor: Smets Koen

Onderzoeksgroep(en)

ADReM Data Lab (ADReM)

Project type(s)

Onderzoeksproject

Verifieerbare uitzonderingen vinden. 01/10/2012 - 30/09/2015

Abstract

Dit project betreft fundamenteel kennisgrensverleggend onderzoek gefinancierd door het Fonds voor Wetenschappelijk Onderzoek-Vlaanderen. Het project werd betoelaagd na selectie door het bevoegde FWO-expertpanel.

Onderzoeker(s)

Promotor: Goethals Bart
Mandaathouder: Müller Emmanuel

Onderzoeksgroep(en)

ADReM Data Lab (ADReM)

Project type(s)

Onderzoeksproject

Ontwikkeling van de BioGraph-technologie voor valorisatie in de levenswetenschappen. 01/03/2012 - 28/02/2013

Abstract

BioGraph is een aan de Universiteit Antwerpen ontwikkelde dataminingtechnologie voor ongesuperviseerde biomedische kennisvergaring via het geautomatiseerd ontdekken van hypothesen in geïntegreerde kennisdatabanken. We onderzoeken business-development-mogelijkheden en werken deze technologie uit naar een specifieke off-the-shelf-toepassing voor de interpretatie van microarraystudies.

Onderzoeker(s)

Promotor: Del-Favero Jurgen
Co-promotor: De Rijk Peter
Co-promotor: Goethals Bart
Co-promotor: Liekens Anthony

Onderzoeksgroep(en)

Project type(s)

Onderzoeksproject

Instant Interactieve Data Exploratie. 01/01/2012 - 31/12/2015

Abstract

Dit project betreft fundamenteel kennisgrensverleggend onderzoek gefinancierd door het Fonds voor Wetenschappelijk Onderzoek-Vlaanderen. Het project werd betoelaagd na selectie door het bevoegde FWO-expertpanel.

Onderzoeker(s)

Promotor: Goethals Bart
Co-promotor: Tatti Nikolaj
Co-promotor: Vreeken Jilles

Onderzoeksgroep(en)

ADReM Data Lab (ADReM)

Project type(s)

Onderzoeksproject

BIOMINA 01/01/2012 - 30/06/2015

Abstract

Biomina (Biomedical Informatics Expertise Centre Antwerpen) is een interdisciplinaire onderzoekssamenwerking tussen UA en UZA. Het project heeft tot doel innovatieve technieken te ontwikkelen voor de analyse en interpretatie van heterogene biomedische gegevens. Biomina situeert zich op het integratiepunt van klinische data en 'omics gegevens (genoom, transcriptoom, proteoom, …). Het structureren, integreren en analyseren van deze data vormt de kernactiviteit. Als centraal expertisecentrum en onderzoeksplatform, maakt het systeem biologie en translationele systeem geneeskunde onderzoek mogelijk.

Onderzoeker(s)

Promotor: Goethals Bart

Onderzoeksgroep(en)

ADReM Data Lab (ADReM)

Project type(s)

Onderzoeksproject

Data mining voor privacy in sociale netwerken. 01/01/2011 - 31/12/2014

Abstract

Online sociale netwerken en het uitwisselen van informatie zijn een onderdeel geworden van het dagelijkse leven, wat resulteert in een groot aantal mensen die de meest intieme details van hun privéleven delen op social networking sites zoals Facebook, Netlog of Twitter. Hoewel het onderzoek over Social Network Analysis en privacy aanzienlijk gegroeid is in de afgelopen jaren, blijven veel fundamentele computationele vragen onbeantwoord. Specifiek: Sociale netwerken worden over het algemeen gemodelleerd als grafen waarvan de knopen natuurlijke personen voorstellen, en waarvan de zijden "vriendschap" links vertegenwoordigen. Privacy wordt verondersteld te worden gerespecteerd wanneer bepaalde informatie niet toegankelijk is of indien die kan worden overgedragen tussen knopen zonder verder onthuld te worden. Dit eenvoudige model voldoet echter niet, zowel conceptueel als algoritmisch, het houdt geen rekening met de onderlinge afhankelijkheden tussen individuen als een kernelement van het Social Web, en houdt geen rekening met informatie van derden. Dit project beoogt deze lacune te vullen. We bestuderen: (1) privacy design types, (2) lokaal-globaal dynamiek; (3) intelligente micro-identity management, en (4) privacy voor groepen. We zullen de ontwikkeling van nieuwe technieken voor (i) verkeersanalyse om social-network-gebaseerde interacties en gebruikersgedrag te analyseren; (ii) metrieken om lekken van prive-informatie te meten; (iii) pattern mining om realistische resultaten te identificeren op basis van simulatiemodellen gevalideerd in het toepassingsgebied van web-gebaseerde sociale netwerken.

Onderzoeker(s)

Promotor: Goethals Bart

Onderzoeksgroep(en)

ADReM Data Lab (ADReM)

Project type(s)

Onderzoeksproject

Karakteristieke patroonverzamelingen vinden via compressie. 01/10/2010 - 30/09/2013

Abstract

Bestaande patroonvorsingsalgoritmen genereren met gemak zeer grote aantallen patronen, waardoor de resultaten onhandelbaar en niet te interpreteren zijn. In dit project stellen wij voor om theorie te ontwikkelen om via compressie karakteristieke patroongroepen uit eender welke databank te extraheren. Dit opdat resultaten voor de gebruiker direct te interpreteren en vooral zeer bruikbaar zijn.

Onderzoeker(s)

Promotor: Goethals Bart
Mandaathouder: Vreeken Jilles

Onderzoeksgroep(en)

ADReM Data Lab (ADReM)

Project type(s)

Onderzoeksproject

Database Summarizatie 01/01/2010 - 31/12/2011

Abstract

In dit onderzoek beogen we de ontwikkeling van verschillende technieken om databanken samen te vatten, gebruik makende van de patronen die in de databank voorkomen. Aan de hand van state of the art data mining technieken trachten we kleine verzamelingen patronen te vinden die de data zo goed mogelijk karakteriseert.

Onderzoeker(s)

Promotor: Goethals Bart
Mandaathouder: Mampaey Michael

Onderzoeksgroep(en)

ADReM Data Lab (ADReM)

Project type(s)

Onderzoeksproject

Theoretische fundamenten van het vinden van significanten patronen in data mining. 01/10/2009 - 30/09/2012

Abstract

Dit project betreft fundamenteel kennisgrensverleggend onderzoek gefinancierd door het Fonds voor Wetenschappelijk Onderzoek-Vlaanderen. Het project werd betoelaagd na selectie door het bevoegde FWO-expertpanel.

Onderzoeker(s)

Promotor: Goethals Bart
Mandaathouder: Tatti Nikolaj

Onderzoeksgroep(en)

ADReM Data Lab (ADReM)

Project type(s)

Onderzoeksproject

Analyse van high-throughput data door middel van support vector machines en kernel-gebaseerde technieken: feature selectie en adaptieve modelbouw. 01/10/2009 - 30/09/2011

Abstract

In vele real-life toepassingen is informatie afkomstig van metingen onmisbaar om de kwaliteit van eindproducten te garanderen en controle uit te oefenen op het productieproces. Deze metingen zijn veelal afkomstig van online hardware analysers (bijvoorbeeld thermometers, stroommeters . . . ). Er zijn echter vele karakteristieken die men niet met online apparatuur kan verkrijgen en waarvoor tijdrovende en/of computationeel intensieve analyse noodzakelijk is. Voor die karakteristieken worden vaak modellen gehanteerd om de resultaten van de analyse te voorspellen vanuit de proces variabelen. De analyse wordt nadien gebruikt als bevestiging van het gekozen model. Modellen worden soms ook gebruikt om online hardware analysers te voorspellen, deze laatste zijn immers onderhevig aan corrosie of kunnen gaan afwijken van de optimale configuratie. In dit project willen we een aantal onderzoeksproblemen bestuderen die optreden bij de constructie van modellen met behulp van Support Vector Machines. Onze interesse in het bouwen van modellen met SVMs heeft verschillende redenen. - Het is algemeen geweten dat SVMs hoog dimensionale data aankunnen zonder te lijden aan de "curse of dimensionality". - Het inpluggen van kernels laat toe niet-lineaire modellen op te stellen. - SVMs kunnen ongevoelig gemaakt worden voor ruis en outliers. - Ten slotte, de bekwaamheid van SVMs om "abnormale" data punten te identificeren, maakt ze nuttig in detectie van outliers en anomalieën. De problemen die we in dit project willen onderzoeken zijn de volgende. I. Feature selectie en integratie van domeinkennis Het doel is te onderzoeken of we gelijkaardige resultaten kunnen boeken bij Support Vector Regressie (SVR) en hoe goed deze technieken zich laten vertalen naar single-class problemen. II. Adaptieve modelbouw Technieken die het mogelijk maken de inferentie sensor aan te passen in alle mogelijke gevallen van novelty detectie, en voornamelijk wanneer het wiskundige model deels moet worden heropgebouwd, staan nog steeds in de kinderschoenen en vormen het tweede luik van het onderzoek.

Onderzoeker(s)

Promotor: Goethals Bart
Mandaathouder: Smets Koen

Onderzoeksgroep(en)

ADReM Data Lab (ADReM)

Project type(s)

Onderzoeksproject

Karakteristieke patroonverzamelingen vinden via compressie. 01/10/2009 - 30/09/2010

Abstract

Bestaande patroonvorsingsalgoritmen genereren met gemak zeer grote aantallen patronen, waardoor de resultaten onhandelbaar en niet te interpreteren zijn. In dit project stellen wij voor om algemene technieken te ontwikkelen die compressie gebruiken om kleine karakteristieke patroongroepen te vinden die gezamenlijk de te analyseren gegevens goed beschrijven, en door de gebruiker direct te interpreteren zijn.

Onderzoeker(s)

Promotor: Goethals Bart

Onderzoeksgroep(en)

ADReM Data Lab (ADReM)

Project type(s)

Onderzoeksproject

Fundamenten van Pattern Set Mining voor Gestructureerde data. 01/07/2009 - 31/12/2013

Abstract

In dit project stellen we voor algemene technieken te ontwikkelen en te bestuderen voor het direct zoeken naar verzamelingen van patronen. Zulke verzamelingen moeten alleen hogekwaliteitspatronen bevatten die van belang zijn voor de gebruiker en de toepassing. Door pattern set mining technieken te ontwikkelen hopen we deze technieken van het lokale naar het globale niveau te brengen, wat bijdraagt aan een beter begrip van de rol van pattern mining techieken in datamining en machine learning.

Onderzoeker(s)

Promotor: Goethals Bart
Co-promotor: De Knijf Jeroen

Onderzoeksgroep(en)

ADReM Data Lab (ADReM)

Project type(s)

Onderzoeksproject

Intelligente analyse en data-mining van massa-spectrometrische proteoom-gegevens. 01/07/2009 - 30/06/2013

Abstract

Massa spectrometrie (MS) is een krachtige analytische techniek om de structuur van moleculen, zoals eiwitten, op te helderen. Tot op heden blijft een aanzienlijke fractie van de gegevens die daaruit voortkomen oninterpreteerbaar. In dit project worden state-of-the-art data mining technieken toegepast op een zeer grote MS dataset, met de bedoeling nieuwe patronen terug te vinden die kunnen wijzen op onbekende structuurmodificaties.

Onderzoeker(s)

Promotor: Goethals Bart
Co-promotor: Laukens Kris
Co-promotor: Lemière Filip

Onderzoeksgroep(en)

ADReM Data Lab (ADReM)

Project type(s)

Onderzoeksproject

Machine learning technieken voor datamining en hun toepassingen. 01/01/2009 - 31/12/2013

Abstract

De onderzoeksgemeenschap streeft naar de versterking en de coordinatie van het Vlaamse onderzoek op het gebied van machine learning voor datamining in het algemeen, en bepaalde belangrijke toepassingen zoals bioinformatica en tekstmining in het bijzonder. Vlaamse participanten: Computational Modeling Lab (VUB), CNTS (UA), ESAT-SISTA (KU Leuven), DTAI (KU Leuven), ADReM (UA).

Onderzoeker(s)

Promotor: Goethals Bart

Onderzoeksgroep(en)

ADReM Data Lab (ADReM)

Project type(s)

Onderzoeksproject

Principes van het ontginnen van patroonverzamelingen. 01/01/2009 - 31/12/2012

Abstract

De algemene doelen van dit project zijn 1) het bepalen van een computationeel raamwerk voor pattern set mining, 2) het bestuderen van de computationele eigenschappen van verschillende selectiepredikaten, 3) het ontwikkelen van algoritmen en systemen voor pattern set mining, 4) het onderzoeken van het gebruik van constraint programmeringstechnieken voor pattern set mining, 5) het evalueren van pattern set mining voor het oplossen van standaard datamining en machine learning taken, zowel conceptueel als experimenteel, en 6) het bestuderen van de representatie- en toepassingsaspecten van pattern set mining.

Onderzoeker(s)

Promotor: Goethals Bart

Onderzoeksgroep(en)

ADReM Data Lab (ADReM)

Project type(s)

Onderzoeksproject

Analyse van high-throughput data door middel van support vector machines en kernel-gebaseerde technieken: feature selectie en adaptieve modelbouw. 01/10/2007 - 18/01/2010

Abstract

In vele real-life toepassingen is informatie afkomstig van metingen onmisbaar om de kwaliteit van eindproducten te garanderen en controle uit te oefenen op het productieproces. Deze metingen zijn veelal afkomstig van online hardware analysers (bijvoorbeeld thermometers, stroommeters . . . ). Er zijn echter vele karakteristieken die men niet met online apparatuur kan verkrijgen en waarvoor tijdrovende en/of computationeel intensieve analyse noodzakelijk is. Voor die karakteristieken worden vaak modellen gehanteerd om de resultaten van de analyse te voorspellen vanuit de proces variabelen. De analyse wordt nadien gebruikt als bevestiging van het gekozen model. Modellen worden soms ook gebruikt om online hardware analysers te voorspellen, deze laatste zijn immers onderhevig aan corrosie of kunnen gaan afwijken van de optimale configuratie. In dit project willen we een aantal onderzoeksproblemen bestuderen die optreden bij de constructie van modellen met behulp van Support Vector Machines. Onze interesse in het bouwen van modellen met SVMs heeft verschillende redenen. - Het is algemeen geweten dat SVMs hoog dimensionale data aankunnen zonder te lijden aan de "curse of dimensionality". - Het inpluggen van kernels laat toe niet-lineaire modellen op te stellen. - SVMs kunnen ongevoelig gemaakt worden voor ruis en outliers. - Ten slotte, de bekwaamheid van SVMs om "abnormale" data punten te identificeren, maakt ze nuttig in detectie van outliers en anomalieën. De problemen die we in dit project willen onderzoeken zijn de volgende. I. Feature selectie en integratie van domeinkennis Het doel is te onderzoeken of we gelijkaardige resultaten kunnen boeken bij Support Vector Regressie (SVR) en hoe goed deze technieken zich laten vertalen naar single-class problemen. II. Adaptieve modelbouw Technieken die het mogelijk maken de inferentie sensor aan te passen in alle mogelijke gevallen van novelty detectie, en voornamelijk wanneer het wiskundige model deels moet worden heropgebouwd, staan nog steeds in de kinderschoenen en vormen het tweede luik van het onderzoek.

Onderzoeker(s)

Promotor: Goethals Bart
Promotor: Verdonk Brigitte
Mandaathouder: Smets Koen

Onderzoeksgroep(en)

ADReM Data Lab (ADReM)

Project type(s)

Onderzoeksproject

Fundamenten van inductieve databases voor data mining. 01/01/2006 - 31/12/2009

Abstract

Het project beoogt de ontwikkeling van een inductief database systeem voor de ondersteuning van het iteratieve data mining proces. Bij de realisatie van dit project identificeren we volgende stappen : 1) De ontwikkeling van een adequate theorie voor data mining in de vorm van een representatietaal om zowel data als inductief verkregen kennis op te slaan. Hierbij willen we focussen op eerste-orde logica fragmenten (bvb. conjunctive queries); 2) Het inpassen van bestaande data mining patroon types in dit model, zoals associatie regels, klassificatie, clustering; 3) Het ontwerpen van efficiënte implementaties van de voorgestelde modellen. Hierbij dient onder andere nagegaan te worden in hoeverre bestaande optimalisatietechnieken voor specifieke data mining probelemen en relationele databases veralgemeend kunnen worden naar inductieve databases.

Onderzoeker(s)

Promotor: Paredaens Jan
Co-promotor: Calders Toon
Co-promotor: Goethals Bart

Onderzoeksgroep(en)

ADReM Data Lab (ADReM)

Project type(s)

Onderzoeksproject

Inductive queries for mining patterns and models (IQ). 01/09/2005 - 31/08/2008

Abstract

Gelieve aan te vullen a.u.b

Onderzoeker(s)

Promotor: Paredaens Jan
Co-promotor: Goethals Bart

Onderzoeksgroep(en)

ADReM Data Lab (ADReM)

Project type(s)

Onderzoeksproject