Duidelijkheid brengen in de wereld van eerlijke machine learning.
Abstract
Machine learning wordt steeds vaker ingezet voor cruciale beslissingen op gebieden zoals gezondheidszorg, financiën en justitie. Het is daarom van vitaal belang dat de impact ervan op de samenleving in lijn is met onze ethische waarden. Er bestaan veel voorbeelden van bevooroordeelde en discriminerende machine learning systemen, en om dergelijke scenario's te vermijden, moeten we kunnen begrijpen waarom AI-systemen de beslissingen nemen die ze nemen, en ervoor zorgen dat ze rechtvaardig zijn. Binnen dit postdoctorale project heb ik twee hoofddoelen: ten eerste wil ik methoden ontwikkelen om vooroordelen te detecteren in machine learning modellen die zijn getraind op gedragsgegevens. Dit type data wordt grotendeels genegeerd in het onderzoeksdomein van fair machine learning. Ten tweede streef ik naar transparantie in de werking van methoden voor het verminderen van vooroordelen. Dit zijn technieken die worden ingezet om vooroordelen in machine learning modellen te elimineren, maar ze vertonen een hoog niveau van willekeur, wat een extra laag van onrechtvaardigheid introduceert. Tot slot zal ik mijn bevindingen valideren op gebruikscases in verschillende toepassingsgebieden, wat de brede relevantie van deze methoden aantoontOnderzoeker(s)
- Promotor: Martens David
- Mandaathouder: Goethals Sofie
Onderzoeksgroep(en)
Project type(s)
- Onderzoeksproject
Vlaams Artificiële Intelligentie Onderzoeksprogramma (VAIOP) – tweede cyclus.
Abstract
Het Vlaams Artificiële Intelligentie Onderzoeksprogramma is een strategisch basisonderzoeksprogramma met een consortium van elf partners: de vijf Vlaamse universiteiten (KU Leuven, Universiteit Gent, Universiteit Antwerpen, Universiteit Hasselt, Vrije Universiteit Brussel) en zes onderzoekscentra (imec, Flanders Make, VIB, VITO, Sirris en ILVO). Het programma brengt 300+ onderzoekers samen op het gebied van nieuwe AI-methoden die kunnen worden gebruikt in innovatieve toepassingen in gezondheid, industrie, planeet en energie en samenleving. Op die manier draagt het programma bij tot een succesvolle adoptie van AI in Vlaanderen. De ambitie is dat Vlaanderen een sterke internationale positie inneemt op het vlak van strategisch basisonderzoek in AI, en dit binnen een sterk en duurzaam Vlaams ecosysteem. Er zijn vijf focusonderzoeksthema's geselecteerd: verantwoorde AI, mensgerichte AI, duurzame AI (energie-efficiënt en performant), productieve en data-efficiënte AI (systemen die weinig data nodig hebben, die presteren door data te combineren met domeinkennis en ervaring van experts) en veerkrachtige en performante AI (robuust tegen veranderingen in de omgeving). De beschrijving van de werkpakketten en hun onderzoekstaken definieert de aspecten binnen deze thema's die in het programma zullen worden onderzocht. De AI-oplossingen worden gedemonstreerd in real-life use cases. Deze resultaten tonen niet alleen de effectiviteit aan, maar inspireren ook bedrijven voor adoptie en onderzoekers voor verder onderzoek. Het Vlaams Artificiële Intelligentie Onderzoeksprogramma maakt deel uit van het Vlaams AI-beleidsplan. Meer info: www.flandersairesearch.beOnderzoeker(s)
- Promotor: Mannens Erik
- Promotor: Oramas Mogrovejo José Antonio
- Co-promotor: Calders Toon
- Co-promotor: Daelemans Walter
- Co-promotor: Famaey Jeroen
- Co-promotor: Goethals Bart
- Co-promotor: Laukens Kris
- Co-promotor: Martens David
- Co-promotor: Mets Kevin
- Co-promotor: Oramas Mogrovejo José Antonio
- Co-promotor: Sijbers Jan
- Co-promotor: Van Leekwijck Werner
- Co-promotor: Verdonck Tim
Onderzoeksgroep(en)
Project type(s)
- Onderzoeksproject
Antwerps Centrum voor Text Mining (TEXTUA).
Abstract
Kennis zit meestal opgeslagen in ongestructureerde data zoals tekst, die gestructureerd moet worden vooraleer de kennis toegankelijk gemaakt kan worden. De behoefte aan en mogelijkheden voor deze automatische tekstanalyse zijn de laatste tijd aanzienlijk toegenomen door ontwikkelingen in de kunstmatige intelligentie, niet alleen in de humane en sociale wetenschappen, maar ook in de exacte en medische wetenschappen. Het is de missie van ATMC om schaalbare oplossingen aan te bieden aan onderzoekers uit elke wetenschappelijke discipline die grote hoeveelheden tekstdata willen analyseren en gebruiken. Tekstdata moet hier in brede zin worden gezien, en omvat ook automatisch getranscribeerde spraak, geschreven tekst in afbeeldingen en afbeeldingen die automatisch in tekst worden beschreven. ATMC bundelt de unieke bestaande expertise in digitale tekstanalyse aan de Universiteit Antwerpen met speciale nadruk op "explainable AI", en zal de capaciteit bieden om het groeiende aantal interdisciplinaire vragen dat ons vandaag bereikt te ondersteunen.Onderzoeker(s)
- Promotor: Daelemans Walter
- Co-promotor: Kestemont Mike
- Co-promotor: Martens David
- Co-promotor: Oramas Mogrovejo José Antonio
Onderzoeksgroep(en)
Project type(s)
- Onderzoeksproject
Uitleggen van AI modellen om inzichten te bekomen in de modellen en de wereld.
Abstract
Dit project gaat over het uitleggen van beslissingen van Artificiële Intelligentie (AI) voorspellingsmodellen, en het gebruik ervan voor het bekomen van globale inzichten in de modellen en kennis van de wereld. De vooruitgang van AI onderzoek is voornamelijk gedreven voor zegehete "deep learning" (artificiële neurale netwerken) en de beschikbaarheid van grote hoeveelheden beeld, tekstuele en gedragsdata. Dit heeft geleid tot grote voorspellingsaccuraatheden, met positieve economische en maatschappelijke implicaties, maar ook tot heel complexe modellen. Het uitleggen van de voorspellingen van dergelijke "black box" modellen krijgt steeds meer aandacht binnen AI onderzoek. Het belangrijkste doel van dit voorstel is om de grenzen van het onderzoek te verleggen door de Evidence Counterfactual (EdC) naar voren te schuiven als een paradigma binnen explainable AI. Het project zal onderzoeken hoe de Evidence Counterfactual kan worden gebruikt om verklaringen te genereren die leiden tot nieuwe inzichten in het AI-model en de wereld, en om de nieuwe methodologieën te valideren in een verscheidenheid aan toepassingen, variërend van verzekeringen tot politieke wetenschappen. Proberen uit te leggen hoe dingen werken, is een centrale drijfveer in de wetenschap. In die context is dit project niet alleen een fundamentele maar ook een logische volgende stap in AI-onderzoek.Onderzoeker(s)
- Promotor: Martens David
Onderzoeksgroep(en)
Project type(s)
- Onderzoeksproject
Digitalisatie en belastingen
Abstract
De digitale transformatie heeft wijzigingen veroorzaakt in alle onderdelen van het dagelijks leven. In het DigiTax project worden de fiscale gevolgen onderzocht van deze evolutie vanuit twee perspectieven. Vooreerst worden de uitdagingen onderzocht die de digitalisatie met zich mee brengt voor de fiscaliteit. In de digitale economie hebben multinationals meer mogelijkheden om winsten te verschuiven naar landen met een lage belasting. Waar moeten deze winsten worden belast? Daarnaast dringen robots meer en meer binnen in de arbeidsmarkt, gaande van automatisch rijdende auto's tot chatbots. Moeten zij worden beschouwd als apart belastbare entiteiten, en zo ja, hoe moet deze taxatie dan gebeuren? Meer algemeen zal worden onderzocht (a) welk belastingstelsels er onder druk komen te staan, (b) welke traditionele fiscale concepten moeten worden gewijzigd en welke nieuwe fiscale concepten moeten worden ontwikkeld die bijdragen tot een eerlijke belastingheffing, (c) wie hiertoe bevoegd is en (d) hoe deze wijziging moet worden geïmplementeerd ? Daarnaast onderzoeken we de opportuniteiten die ontstaan door de digitalisatie voor zowel een rechtvaardige belastingheffing als voor de effectiviteit en de efficiëntie van de belastingoverheden. Hoe kunnen bijvoorbeeld verbeterde data mining algoritmes en het toevoegen van nieuwe gegevensbronnen bijdragen tot een meer nauwkeurig, begrijpelijk en niet-discriminatoir fraudedetectiesysteem dat de belastingontduiking of - ontwijking tot een minimum reduceert? Hoe kan blockchain technologie bijdragen tot transparantie, tax compliance en vertrouwen tussen de overheid en de belastingbetaler? In dat kader zullen meer in het bijzonder de opportuniteiten worden onderzocht van data mining, internet of things (IoT) en blockchain technologie voor de fiscaliteit. Dit project vereist een multidisciplinaire benadering, waarbij de technologische, juridische, economische en maatschappelijke implicaties worden onderzocht van digitalisatie en belastingheffing.Onderzoeker(s)
- Promotor: Peeters Bruno
- Co-promotor: Calders Toon
- Co-promotor: Jorissen Ann
- Co-promotor: Martens David
- Co-promotor: Van de Vijver Anne
Onderzoeksgroep(en)
Project website
Project type(s)
- Onderzoeksproject
De ontwikkeling en het gebruik van datamining technieken voor een betere besluitvorming.
Abstract
Het onderzoek behelst het ontwerpen van datamining technieken met toepassingen in het brede bedrijfsdomein. De voornaamste theoretische contributies omvatten de ontwikkeling van regel inductietechnieken (AntMiner+ en ALBA) en data analyse raamwerken. De finale bruikbaarheid van de datamining modellen zijn steeds van primair belang in het onderzoek van deze kandidaat, wat bewerkstelligd wordt door het inbouwen van domeinkennis en eisen van begrijpbaarheid. Toepassingen zijn voornamelijk te vinden in het kredietrisico en marketing domein, met ook innovatieve toepassingen van datamining in de software engineering, auditing en corporate performance domeinen. Het huidige en geplande onderzoek bouwen verder op voorgaande bevindingen, onder andere door de technieken en raamwerken te verschuiven van een classificatie naar regressie context. Verder beoogt de kandidaat een sterk gebruik van netwerk data, één van de voornaamste focuspunten in huidig datamining onderzoek. Het verkrijgen en gebruiken van netwerkdata wanneer geen expliciet sociaal netwerk beschikbaar is, zoals in de bank sector, maakt deel uit van de voornaamste theoretische onderzoeksobjectieven. Marketing toepassingen omvatten het voorspellen van response, churn en wallet share, terwijl een belangrijke risicomanagement toepassing te vinden is in credit scoring, en dit zowel op het retail als corporate niveau.Onderzoeker(s)
- Promotor: Martens David
- Mandaathouder: Martens David
Onderzoeksgroep(en)
Project type(s)
- Onderzoeksproject
Onderzoeksprogramma Artificiële Intelligentie.
Abstract
Het Vlaams AI-onderzoeksprogramma concentreert zich op generieke AI-methodologieën die algemeen inzetbaar zijn voor talloze toepassingen in de gezondheidszorg, de industrie en door de overheid. De noden zijn aangegeven door gebruikers uit deze toepassingsdomeinen.Onderzoeker(s)
- Promotor: Mannens Erik
- Co-promotor: Calders Toon
- Co-promotor: Daelemans Walter
- Co-promotor: Goethals Bart
- Co-promotor: Latré Steven
- Co-promotor: Laukens Kris
- Co-promotor: Martens David
- Co-promotor: Sijbers Jan
- Co-promotor: Steckel Jan
Onderzoeksgroep(en)
Project type(s)
- Onderzoeksproject
Voorspellende modellen uitleggen met het oog op data science ethics in business en society.
Abstract
Artificiële Intelligentie (AI) heeft een steeds grotere impact op de maatschappij en wordt al gebruikt in verschillende high-stakes beslissingsdomeinen zoals in financiën, justitie en gezondheidszorg. Dit betekent ook dat het van groot belang is om ervoor te zorgen dat de beslissingen gemaakt door het AI systeem in lijn zijn met onze ethische doelstellingen. In ons onderzoek zullen we focussen op twee ethische aspecten van fairness en deze linken met Explainable AI, de welke het onderzoeksdomein binnen AI is dat zich bezighoudt met hoe goed beslissingen kunnen begrepen worden door mensen. De twee aspecten van fairness waar we ons op zullen focussen zijn: 1) ervoor zorgen dat het model niet discrimineert tegen een kwetsbare groep (zoals bijvoorbeeld vrouwen of een bepaalde etnische groep) en 2) de privacy beschermen: ervoor zorgen dat de persoonlijke data van de betrokken veilig wordt gehouden en deze niet geïdentificeerd kunnen worden tegen hun wil. De voornaamste bijdrage van ons onderzoek zal het ontwikkelen van nieuwe methodologieën zijn om deze ethische issues te verbeteren wanneer Explainable AI gebruikt wordt. In de laatste fase zullen we onze resultaten en methodologie valideren in toepassingen in HR analytics (het voorspellen van gepaste job kandidaten) en credit scoring (het voorspellen van defaults).Onderzoeker(s)
- Promotor: Martens David
- Mandaathouder: Goethals Sofie
Onderzoeksgroep(en)
Project type(s)
- Onderzoeksproject
Onderzoeksprogramma Artificiële Intelligentie.
Abstract
Het Vlaams AI-onderzoeksprogramma heeft als doel om het strategisch basis onderzoek omtrent AI aan de Vlaamse universiteiten en kenniscentrums te stimuleren. Dit onderzoek moet toepasbaar en relevant zijn voor de Vlaamse industrie. Concreet werden er 4 grote uitdagingen, met toenemende complexiteit, gedefinieerd: 1. Het ondersteunen van complexe beslissingen: focus op het nemen van complexe beslissingen door AI-systemen gebaseerd op datasets die mogelijks onvolledige of foutieve informatie kunnen bevatten. 2. Het verzamelen en verwerken van informatie in de edge: focus op het gebruik van AI-systemen in de egde i.p.v. de cloud door de integratie van software en hardware en de ontwikkeling van algoritmen die minder energie en andere hulpbronnen nodig hebben. 3. De autonome interactie met andere beslissingsentiteiten: focus op samenwerking tussen verschillende AI-systemen die onafhankelijk van elkaar opereren. 4. Het naadloos communiceren en samenwerken met mensen: focus op de natuurlijke interactie tussen mensen en AI-systemen en de ontwikkeling van AI-systemen die complexe omgevingen kunnen begrijpen en menselijke redeneringen kunnen toepassen.Onderzoeker(s)
- Promotor: Hellinckx Peter
- Promotor: Latré Steven
- Co-promotor: Calders Toon
- Co-promotor: Daelemans Walter
- Co-promotor: Goethals Bart
- Co-promotor: Laukens Kris
- Co-promotor: Martens David
- Co-promotor: Sijbers Jan
- Co-promotor: Steckel Jan
Onderzoeksgroep(en)
Project type(s)
- Onderzoeksproject
Voorspellende modellen uitleggen met het oog op data science ethics in business en society
Abstract
Artificiële Intelligentie (AI) heeft een steeds grotere impact op de maatschappij en wordt al gebruikt in verschillende high-stakes beslissingsdomeinen zoals in financiën, justitie en gezondheidszorg. Dit betekent ook dat het van groot belang is om ervoor te zorgen dat de beslissingen gemaakt door het AI systeem in lijn zijn met onze ethische doelstellingen. In mijn onderzoek zal ik me focussen op de ethische gebieden van transparantheid, fairness en privacy. Transparantheid is gelinkt aan hoe goed men het AI model en zijn beslissingen kan begrijpen.. Fairness van een AI model gaat over het niet discrimineren tegen kwetsbare groepen (zoals bijvoorbeeld vrouwen of een bepaalde etnische groep), terwijl privacy respect voor persoonlijke data vereist. Ik zal deze ethische concepten linken aan het domein van Explainable AI, en in specifiek aan Counterfactual Explanations. De voornaamste bijdrage van mij onderzoek zal het ontwikkelen van nieuwe methodologieën zijn om deze ethische issues te verbeteren en te valideren wanneer Explainable AI gebruikt wordt.Onderzoeker(s)
- Promotor: Martens David
- Mandaathouder: Goethals Sofie
Onderzoeksgroep(en)
Project type(s)
- Onderzoeksproject
Verklaren van deep learning modellen voor gedragsdata.
Abstract
Omwillle van digitalisatie worden steeds meer aspecten van ons leven gecapteerd. Dergelijke gedragsdata is zeer voorspellend voor allerlei persoons karakteristieken. Deep learning is een data mining techniek waarvan aangetoond is dat deze performanter is dan andere technieken voor het maken van voorspellingen met gedragsdata. In dit onderzoek, gefinancierd door FWO, zullen we nieuwe algoritmes ontwikkelen die complexe deep learning modellen uitleggen.Onderzoeker(s)
- Promotor: Martens David
- Mandaathouder: Ramon Yanou
Onderzoeksgroep(en)
Project type(s)
- Onderzoeksproject
Onderzoeksprogramma Artificiële Intelligentie.
Abstract
Het Vlaams AI-onderzoeksprogramma heeft als doel om het strategisch basis onderzoek omtrent AI aan de Vlaamse universiteiten en kenniscentrums te stimuleren. Dit onderzoek moet toepasbaar en relevant zijn voor de Vlaamse industrie. Concreet werden er 4 grote uitdagingen, met toenemende complexiteit, gedefinieerd: 1. Het ondersteunen van complexe beslissingen: focus op het nemen van complexe beslissingen door AI-systemen gebaseerd op datasets die mogelijks onvolledige of foutieve informatie kunnen bevatten. 2. Het verzamelen en verwerken van informatie in de edge: focus op het gebruik van AI-systemen in de egde i.p.v. de cloud door de integratie van software en hardware en de ontwikkeling van algoritmen die minder energie en andere hulpbronnen nodig hebben. 3. De autonome interactie met andere beslissingsentiteiten: focus op samenwerking tussen verschillende AI-systemen die onafhankelijk van elkaar opereren. 4. Het naadloos communiceren en samenwerken met mensen: focus op de natuurlijke interactie tussen mensen en AI-systemen en de ontwikkeling van AI-systemen die complexe omgevingen kunnen begrijpen en menselijke redeneringen kunnen toepassen.Onderzoeker(s)
- Promotor: Latré Steven
- Co-promotor: Calders Toon
- Co-promotor: Daelemans Walter
- Co-promotor: Goethals Bart
- Co-promotor: Hellinckx Peter
- Co-promotor: Laukens Kris
- Co-promotor: Martens David
- Co-promotor: Sijbers Jan
- Co-promotor: Steckel Jan
Onderzoeksgroep(en)
Project type(s)
- Onderzoeksproject
Verklaren van deep learning modellen voor gedragsdata.
Abstract
Omwillle van digitalisatie worden steeds meer aspecten van ons leven gecapteerd. Dergelijke gedragsdata is zeer voorspellend voor allerlei persoons karakteristieken. Deep learning is een data mining techniek waarvan aangetoond is dat deze performanter is dan andere technieken voor het maken van voorspellingen met gedragsdata. In dit onderzoek zullen we nieuwe algoritmes ontwikkelen die complexe deep learning modellen uitleggen.Onderzoeker(s)
- Promotor: Martens David
- Mandaathouder: Ramon Yanou
Onderzoeksgroep(en)
Project type(s)
- Onderzoeksproject
Fraudedetectie door het zoeken van patronen in de dynamiek van aandeelhoudersnetwerken.
Abstract
Het gevecht tegen fiscale fraude wordt geconfronteerd met heel wat uitdagingen: personen met frauduleuze intenties gaan steeds georganiseerder te werk, en zetten hierbij meer complexe structuren op. In dit project zullen we nagaan hoe het netwerk van aandeelhouders verandert doorheen de tijd bij legitieme versus frauduleuze gevallen. Datamining technieken zullen hiervoor aangewend worden op een unieke dataset die we bekwamen van een Europese belastingdienst, met data over aandeelhouderschap van 2006 tot vandaag.Onderzoeker(s)
- Promotor: Martens David
- Co-promotor: Peeters Bruno
Onderzoeksgroep(en)
Project type(s)
- Onderzoeksproject
Het ontdekken en exploiteren van interactie patronen in netwerken.
Abstract
De meeste werken in netwerk analyse concentreren zich op statische graafstructuren en zoeken naar patronen om bijvoorbeeld de meest invloedrijke nodes in het netwerk te vinden. Weinig bestaande werken bestuderen dynamische netwerken met herhaalde interacties tussen nodes. Het doel van dit project is om deze lacune weg te werken door nieuwe methoden te ontwikkelen om patronen te ontdekken in de interacties tussen netwerk nodes. Deze interactie patronen kunnen bijvoorbeeld karakteriseren hoe informatie zich verspreidt in sociale netwerken, of geldstromen in financiële netwerken in kaart brengen. In het project beschouwen we drie orthogonale dimensies. De eerste dimensie is het patroon type. We beschouwen onder andere temporele paden, informatie cascades en cycles. Om een gemotiveerde keuze te maken betreffende patroontype om te bestuderen, laten we ons leiden door drie cases: twee interactie netwerken met betaaldata, een met een marketing doel en een ander om betalingsproblemen bij leningen te voorspellen, en een sociaal netwerk met een toepassing in micro-financiering. De tweede dimensie betreft hoe we het patroon type gaan zoeken: is het de bedoeling alle voorkomens van een bepaald patroontype te vinden, of zoeken we top-patronen die vaker voorkomen dan andere. De derde en laatste dimensie betreft het computationele model dat we gebruiken: batch met random access, one-pass, of streaming. Het is belangrijk dat de methodes schaalbaar zijn en kunnen werken met data van grote interactie netwerken. De belangrijkste bijdrage van dit project ligt in de combinatie van streaming technieken, pattern mining en sociaal netwerk analyse, gevalideerd in drie echte use cases.Onderzoeker(s)
- Promotor: Calders Toon
- Co-promotor: Martens David
Onderzoeksgroep(en)
Project type(s)
- Onderzoeksproject
Fraudedetectie Data mining.
Abstract
Fraudedetectie met behulp van data mining voor fiscale fraude. Dit project is een samenwerking tussen Universiteit Antwerpen (Antwerp Tax Academy) en de federale Financiële Administratie van de Belgische overheid.Onderzoeker(s)
- Promotor: Martens David
- Co-promotor: Peeters Bruno
Onderzoeksgroep(en)
Project type(s)
- Onderzoeksproject
De invloed van politiek nieuws op burgers, en van burgers op het politieke nieuws, in tijden van sociale media. Theoretische uitdagingen en empirische mogelijkheden.
Abstract
In een democratie hebben burgers nood aan politieke kennis. De massa media worden traditioneel aanzien als een belangrijke bron om burgers van politieke informatie te voorzien. Studies over agenda-setting en framing hebben veelvuldig aangetoond dat de nieuwsmedia een duidelijke invloed hebben op wat mensen weten, en hoe ze over politiek denken. De vraag is in welke mate deze klassieke inzichten overeind blijven in het digitale tijdperk. Het stijgend belang van het internet en de sociale media in het bijzonder als kanalen van informatie en communicatie hebben de manier waarop mensen leren over de wereld, en de politiek in het bijzonder, drastisch veranderd. Zo staat bijvoorbeeld de rol van de media als agenda-setter en 'framer' onder druk, omdat sociale media het causale verband, van massa media naar publiek, ter discussie stellen. Journalisten worden meer en meer beïnvloed door discussies op blogs, Facebook, Twitter en andere platformen. Bovendien, hebben politici meer mogelijkheden om de traditionele media te omzeilen en het publiek direct te beïnvloeden. Kortom, we bestuderen hoe mensen nieuws consumeren en hoe ze daardoor beïnvloed worden, maar ook hoe journalisten en politici op hun beurt beïnvloed worden door de reacties van mensen op het nieuws. Digitale media stellen niet enkel de klassieke theoretische inzichten in vraag, ze bieden tegelijk nieuwe mogelijkheden om informatiestromen en hoe mensen ermee omgaan te bestuderen. Vandaag is het mogelijk om agenda-setting en framing meer accuraat te bestuderen, gebaseerd op grotere databestanden van mediaboodschappen en de publieke reacties daarop (commentaren, likes, tweets). Bovendien laat het analyseren van digitale teksten toe om demografische profielen en opinies van burgers in kaart te brengen en onze kennis van de modererende factoren van agenda-setting en framing effecten te bestuderen. Om deze ongeziene bron van geschreven taal en digitaal gedrag te interpreteren, kiezen we voor een multi-disciplinaire samenwerking tussen computer linguïstiek, data mining en sociale wetenschappen. De agenda-setting en framing theorie worden in een digitale context getoetst aan de hand van 'big data' analyses. Computer linguïstische technieken zullen worden gebruikt om automatisch de onderwerpen en opinies in sociale media berichten te analyseren. De mogelijkheden van digitale tekst analyse gaan echter nog verder dan het louter testen van bestaande theorieën. Onze ambitie bestaat erin om de nieuwe data mogelijkheden ook te gebruiken om aan theorie ontwikkeling te doen door op een inductieve manier naar onderliggende patronen te zoeken. Door gebruik te maken van data mining technieken op de digitale gebruiker gegevens kunnen we tot inzichten komen over welke gebeurtenissen, personen en onderwerpen burgers 'liken' en willen 'delen'. Concreet, zullen we één belangrijk gepland event bestuderen, de Belgische verkiezingscampagne van 2019, en één niet gepland of onverwacht event in de loop van de volgende jaren. We verwachten dat de informatiestroom voor beide types van events structureel verschillen. Voor elk event plannen we een survey en een grote kwantitatieve data verzameling gedurende vier weken van alle politieke nieuwsberichten van de belangrijkste nieuwswebsites, en sociale mediaplatformen Twitter en Facebook.Onderzoeker(s)
- Promotor: Van Aelst Peter
- Co-promotor: Daelemans Walter
- Co-promotor: Martens David
- Co-promotor: Paulussen Steve
- Co-promotor: Walgrave Stefaan
Onderzoeksgroep(en)
Project type(s)
- Onderzoeksproject
Economische valuatie van Gedragsdata in Predictieve Modellering.
Abstract
Voorgaand onderzoek bevestigt de grote voorspellende waarde van fijnmazige gedragsdata (zoals surf, locatie of betaling gedrag) om voorspellingen te maken over personen. Dit project focust op de vraag: hoe moet de data van iedere data leverancier gewaardeerd worden?Onderzoeker(s)
- Promotor: Martens David
- Mandaathouder: Praet Stiene
Onderzoeksgroep(en)
Project type(s)
- Onderzoeksproject
Innovatief modelleren van kredietscores met gebruik van textuele en sociale netwerk gegevens.
Abstract
Dit FWO onderzoeksproject beoogt het innovatieve kredit risicomodelleren, waarbij gebruik wordt gemaakt van transactionele, sociale netwerk en tekstuele data. Er worden vier onderzoeksobjectieven vooropgesteld.Onderzoeker(s)
- Promotor: Martens David
- Mandaathouder: Tobback Ellen
Onderzoeksgroep(en)
Project type(s)
- Onderzoeksproject
Een index om de perceptie van de communicatie van de ECB te meten.
Abstract
Dit project kadert in een onderzoeksopdracht tussen enerzijds UA en anderzijds de opdrachtgever. UA levert aan de opdrachtgever de onderzoeksresultaten genoemd in de titel van het project onder de voorwaarden zoals vastgelegd in voorliggend contract.Onderzoeker(s)
- Promotor: Martens David
Onderzoeksgroep(en)
Project type(s)
- Onderzoeksproject
Datamining voor het detecteren van fiscale fraude.
Abstract
Binnen een context van globalisering van de economie en steeds veranderende financiële structuren, is fraude een groot financieel probleem voor overheden. Er is een groeiende interesse in geautomatiseerde data mining systemen die fraude-patronen zoeken in data. In dit multidisciplinair project zullen we data mining technieken ontwerpen, toepassen en valideren, om zo accuraat te voorspellen welke entiteiten (bedrijven of personen) waarschijnlijke fraudeurs zijn, door rekening te houden met concepten zoals verschillende data types, privacy, intuiïtie en begrijpbaarheid van de voorspellingen. Dit voorstel zal gebruik maken van bestaande contacten bij de federale overheid, en zal de formele start zijn van een nieuw onderzoeksthema binnen de Antwerp Tax Academy.Onderzoeker(s)
- Promotor: Martens David
- Co-promotor: Peeters Bruno
- Mandaathouder: Vanhoeyveld Jellis
Onderzoeksgroep(en)
Project type(s)
- Onderzoeksproject
Een publiek beschikbare Economische Onzekerheids-Indicator voor de G8 landen m.b.v. tekst mining.
Abstract
In dit project focussen we op de vraag: hoe kunnen we onzekerheid omtrent economisch beleid meten? Recent ontwikkelden we een EPU (Economic Policy Uncertainty) index voor België, door online nieuwsartikels van de grootste kranten te minen. Gegeven de veelbelovende resultaten die we bekwamen, wensen we deze tekst mininggebaseerde methodologie toe te passen voor andere landen (de G8 landen) en zullen we een publieke website creëren waar deze index wekelijks automatisch zal worden geupdate.Onderzoeker(s)
- Promotor: Martens David
- Co-promotor: Daelemans Walter
Onderzoeksgroep(en)
Project type(s)
- Onderzoeksproject
Een index om de perceptie van de communicatie van de ECB te meten.
Abstract
Dit project kadert in een onderzoeksopdracht tussen enerzijds UA en anderzijds ECB. UA levert aan ECB de onderzoeksresultaten genoemd in de titel van het project onder de voorwaarden zoals vastgelegd in voorliggend contract.Onderzoeker(s)
- Promotor: Martens David
Onderzoeksgroep(en)
Project type(s)
- Onderzoeksproject
Predictieve analyse op A-kaart data.
Abstract
Dit project kadert in een onderzoeksopdracht tussen enerzijds UA en anderzijds Stad Antwerpen. UA levert aan Stad Antwerpen de onderzoeksresultaten genoemd in de titel van het project onder de voorwaarden zoals vastgelegd in voorliggend contract.Onderzoeker(s)
- Promotor: Martens David
Onderzoeksgroep(en)
Project type(s)
- Onderzoeksproject
Big data mining voor klantenanalyse.
Abstract
Dit project betreft fundamenteel kennisgrensverleggend onderzoek gefinancierd door het Fonds voor Wetenschappelijk Onderzoek-Vlaanderen. Het project werd betoelaagd na selectie door het bevoegde FWO-expertpanel.Onderzoeker(s)
- Promotor: Martens David
Onderzoeksgroep(en)
Project type(s)
- Onderzoeksproject
Innovatief modelleren van kredietscores met gebruik van textuele en sociale netwerk gegevens.
Abstract
Dit project betreft fundamenteel kennisgrensverleggend onderzoek gefinancierd door het Fonds voor Wetenschappelijk Onderzoek-Vlaanderen. Het project werd betoelaagd na selectie door het bevoegde FWO-expertpanel.Onderzoeker(s)
- Promotor: Martens David
- Mandaathouder: Tobback Ellen
Onderzoeksgroep(en)
Project type(s)
- Onderzoeksproject
Nieuwe kansen in digitale reclame bij uitgevers (DiDaM).
Abstract
Nieuws uitgevers hebben grote hoeveelheden data ter beschikking die momenteel nog niet gebruikt worden. Door het minen van deze grote transactionele datasets met gespecialiseerde "big data analytics" algoritmes kunnen online advertenties op een gepersonaliseerde manier gericht worden.Onderzoeker(s)
- Promotor: Martens David
Onderzoeksgroep(en)
Project website
Project type(s)
- Onderzoeksproject
Fraudedetectie met behulp van data mining.
Abstract
Met behulp van data mining technieken zal getracht worden om patronen te ontdekken in fraude data. De data bevat onder meer geanonimiseerde transacties en fraude-labels. Hierbij zullen reeds ontworpen technieken getoetst worden aan grote datasets.Onderzoeker(s)
- Promotor: Goethals Bart
- Co-promotor: Martens David
Onderzoeksgroep(en)
Project type(s)
- Onderzoeksproject
Bi-grafe gebaseerd sociaal netwerk analyse en leren.
Abstract
Veel sociale netwerken zijn bi-partite van structuur, waarbij de knopen van het netwerk opgesplitst kunnen worden in twee niet overlappende groepen en connecties enkel bestaan tussen knooppunten van verschillende groepen. Bijvoorbeeld, auteurs die gelinkt zijn aan hun papers, of smartphones gelinkt aan de locaties die ze bezoeken. Vaak wordt enkel het geprojecteerde netwerk gebruikt: een netwerk van auteurs, gelinkt als ze samen een paper hebben geschreven, of een netwerk van smartphones, gelinkt als ze samen een locatie hebben bezocht. Dit leidt echter tot een belangrijk verlies van informatie en een groter aantal connecties. Hoewel sociale netwerk analyse en inferentie veel interesse wekken in sociale, computer-, en mens-wetenschappen, is er heel weinig onderzoek verricht naar dit specifiek type van netwerk. In dit project zullen we nieuwe metrieken definiëren om de globale structuur van dergelijk netwerken te analyseren, de evolutie doorheen de tijd ervan bestuderen, aangepaste leeralgoritmes ontwikkelen die voorspellingsmodellen genereren, en de methoden valideren op grote netwerk datasets. We zullen hierbij specifiek focussen op drie real-life cases: het auteur-paper netwerk gebruik makend van publieke data, alsook data van Universiteit Antwerpen, het klant-betalingsontvanger netwerk gebruik makend van data van een grote Europese bank, en het smartphone -locatie netwerk gebaseerd op data van een VS-gebaseerde ad exchange. Onze bevindingen zouden moeten leiden tot nieuwe inzichten in menselijk gedrag, theorievorming en accuratere voorspellingsmodellen in ieder van deze domeinen.Onderzoeker(s)
- Promotor: Martens David
- Mandaathouder: Stankova Marija
Onderzoeksgroep(en)
Project type(s)
- Onderzoeksproject
Sociaal netwerk onderricht voor marketing en boekhouden.
Abstract
Dit project betreft fundamenteel kennisgrensverleggend onderzoek gefinancierd door het Fonds voor Wetenschappelijk Onderzoek-Vlaanderen. Het project werd betoelaagd na selectie door het bevoegde FWO-expertpanel.Onderzoeker(s)
- Promotor: Martens David
Onderzoeksgroep(en)
Project type(s)
- Onderzoeksproject
Analyseren van de impact van nieuws- en beursberichten op Belgische aandeelprijzen via tekst mining.
Abstract
In dit project zullen we nagaan hoe algemene en beursspecifieke nieuwsberichten met geavanceerde text mining technieken gebruikt kunnen worden voor het automatisch voorspellen van het effect op Belgische aandelenprijzen. Inzichten zullen bekomen worden in welke nieuwsleveranciers en welke combinaties van woorden het grootste effect hebben. Het ontworpen systeem zal geëvalueerd worden als trading tool, alsook als beslissingsondersteunend systeem voor investeerders.Onderzoeker(s)
- Promotor: Martens David
- Co-promotor: Daelemans Walter
Onderzoeksgroep(en)
Project type(s)
- Onderzoeksproject
De ontwikkeling en het gebruik van datamining technieken voor een betere besluitvorming.
Abstract
Het onderzoeksvoorstel behelst het ontwerpen van datamining technieken met toepassingen in het brede bedrijfsdomein. De voornaamste theoretische contributies omvatten de ontwikkeling van regel inductietechnieken (AntMiner+ en ALBA) en data analyse raamwerken. De finale bruikbaarheid van de datamining modellen zijn steeds van primair belang in het onderzoek van deze kandidaat, wat bewerkstelligd wordt door het inbouwen van domeinkennis en eisen van begrijpbaarheid. Toepassingen zijn voornamelijk te vinden in het kredietrisico en marketing domein, met ook innovatieve toepassingen van datamining in de software engineering, auditing en corporate performance domeinen. Het huidige en geplande onderzoek bouwen verder op voorgaande bevindingen, onder andere door de technieken en raamwerken te verschuiven van een classificatie naar regressie context. Verder beoogt de kandidaat een sterk gebruik van netwerk data, één van de voornaamste focuspunten in huidig datamining onderzoek. Het verkrijgen en gebruiken van netwerkdata wanneer geen expliciet sociaal netwerk beschikbaar is, zoals in de bank sector, maakt deel uit van de voornaamste theoretische onderzoeksobjectieven. Marketing toepassingen omvatten het voorspellen van response, churn en wallet share, terwijl een belangrijke risicomanagement toepassing te vinden is in credit scoring, en dit zowel op het retail als corporate niveau.Onderzoeker(s)
- Promotor: Martens David
- Mandaathouder: Martens David
Onderzoeksgroep(en)
Project type(s)
- Onderzoeksproject