Onderzoeksgroep

Expertise

Computerlinguïstiek, natural language processing en digitale tekstanalyse. Specifieke interesse in sentiment- en emotieanalyse.

Emoties zonder grenzen: Een crosslinguale aanpak om emotieverbalisatie en automatische emotiedetectie te bestuderen. 01/05/2025 - 30/04/2029

Abstract

Emoties worden sinds lang onderzocht vanuit onderzoeksdisciplines zoals psychologie, socio- en psycholinguïstiek en communicatiewetenschappen. De laatste tien jaar werd ook het automatisch herkennen van emoties in tekst (emotiedetectie) een belangrijk onderzoeksthema binnen de computerlinguïstiek en taaltechnologie. Hoewel onderzoek naar emotiedetectie in de eerste plaats focuste op het Engels, is er dankzij de ontwikkeling van (meertalige) grote taalmodellen vandaag ook een groeiende interesse in multilinguale emotiedetectie. Ondertussen leidde onderzoek in de psychologie tot nieuwe emotietheorieën die ervan uitgaan dat emoties niet universeel zijn: noch in de conceptualisatie, noch in de expressie van emoties. Dit kan gevolgen hebben voor hoe multilinguale emotiedetectiemodellen werken. Daarom is het cruciaal om verschillen in emotioneel taalgebruik te onderzoeken over verschillende talen heen. De meeste studies die de culturele component van emoties onderzoeken beperken zich tot het bestuderen van de vertaalbaarheid van emotiewoorden, of focussen op specifieke gevallen of taalparen. Dit onderzoeksproject overstijgt het woordniveau en specifieke taalparen door emotieverbalisatie te onderzoeken in tien talen, gebruikmakend van methodes uit de computerlinguïstiek. We zullen bovendien onderzoeken hoe de nieuwste emotiedetectiemodellen omgaan met crosslinguale verschillen in emotieverbalisatie.

Onderzoeker(s)

Onderzoeksgroep(en)

Project type(s)

  • Onderzoeksproject

Webcare door de ogen van de bystander: Een crosslinguïstische vergelijking van pragmatisch-retorische kenmerken in antwoorden op hotelreviews. 01/01/2025 - 31/12/2028

Abstract

Webcare, als uiting van digitaal reputatiemanagement, is intussen alomtegenwoordig in de toeristische sector. Het belang van deze online klantenservicecommunicatie, die voor iedereen toegankelijk is, kan niet worden overschat. Deze communicatie zet in op de tevredenheid van de gasten, waardoor het imago van het hotel positief wordt beïnvloed. Webcare kan dus potentiële klanten beïnvloeden die, als bystanders, deze communicatie volgen en vervolgens een specifiek hotel kiezen. Hoewel recente studies suggereren dat gastenbeoordelingen en hotelreacties beïnvloed worden door culturele factoren, zijn interculturele analyses van hotelinteracties beperkt inzake onderzochte talen en culturen. Het doel van dit project is dus om een cross-linguïstische studie uit te voeren op een meertalig corpus van 80,000 hotelbeoordelingen en de bijbehorende antwoorden in het Duits, Frans, Engels (UK/US), Italiaans, Nederlands en Spaans (ES/MX). Specifiek heeft dit project tot doel de cross-linguïstische kenmerken van hotelinteracties in deze talen te onderzoeken. Het wil nagaan welke kenmerken als positief of negatief worden ervaren door de bystander, die uiteindelijk deze reacties te zien krijgt. De kennis uit dit fundamentele onderzoek zal de onderzoeksdomeinen van de pragmatiek en marketingcommunicatie informeren en biedt mogelijkheden voor de ontwikkeling van generatieve AI-systemen, die automatische antwoorden, afgestemd op de taalkundige en culturele context, kunnen genereren.

Onderzoeker(s)

Onderzoeksgroep(en)

Project type(s)

  • Onderzoeksproject

CLARIAH-VL+: op weg naar de 'SSH Open Science Cloud' in Vlaanderen 01/01/2025 - 31/12/2028

Abstract

CLARIAH-VL+ stimuleert digitaal onderzoek in de Humane en Sociale Wetenschappen en bevordert samenwerking om een toegankelijk cloudplatform voor onderzoekers te creëren. Het verbindt onderzoekers in Vlaanderen met bredere Europese onderzoeksgemeenschappen. CLARIAH-VL+ brengt verschillende disciplines samen met dezelfde uitdaging: een breed scala aan bronnen en erfgoed benutten - van oude manuscripten tot moderne digitale gegevens. Het richt zich op 3 grote maatschappelijke vraagstukken: milieuverandering, sociale ongelijkheid, en migratie en culturele diversiteit. Door inzichten uit de Sociale Wetenschappen te integreren met de gedetailleerde analyse typerend voor de Humane Wetenschappen, en deze te koppelen aan vakgebieden zoals ecologie en geografie, streeft CLARIAH-VL+ ernaar omvattende nieuwe inzichten te bieden. Een kernaspect van CLARIAH-VL+ is de focus op het transformeren van oude en vaak verwaarloosde gegevens - zoals weerwaarnemingen en bevolkingsstatistieken - in bruikbare informatie, cruciaal om dringende maatschappelijke uitdagingen aan te pakken. CLARIAH-VL+ zet zich in om infrastructuur te bieden om deze gegevens in de praktijk te gebruiken door de mogelijkheden van grote taalmodellen en generatieve AI te benutten en de duurzaamheid van essentiële digitale diensten te waarborgen. Met deze inspanningen maakt CLARIAH-VL+ onderzoek niet alleen gemakkelijker, maar ook de Humane en Sociale Wetenschappen relevanter en impactvoller voor de samenleving.

Onderzoeker(s)

Onderzoeksgroep(en)

Project type(s)

  • Onderzoeksproject

Classificatie van online multimodale data. 01/01/2025 - 31/12/2026

Abstract

In een wereld die steeds digitaler wordt, worden we geconfronteerd met een informatieaanbod dat niet alleen toeneemt qua schaal, maar waarvan ook de vorm steeds diverser wordt. Het gaat daarbij vaak over multimodale data, waarin tekst, audio, beeld en video hand in hand gaan. De dominantie van multimodale data in de online sfeer biedt interessante kansen én uitdagingen in onderzoeksdisciplines als de computerlinguïstiek en natural language processing (NLP). Aan de ene kant laat de diversiteit van multimodale data toe om een completer beeld te krijgen van menselijke communicatie (bijvoorbeeld op sociale media, fora of op online nieuwsplatforms), inclusief relatief nieuwe communicatievormen zoals memes, vlogs en podcasts. Aan de andere kant zijn echter robuuste automatische classificatiemethodes nodig om een grootschalige en efficiënte analyse van dit type data toe te laten. Binnen de computerlinguïstiek en NLP wordt traditioneel voornamelijk ingezet op de automatische verwerking van tekst. Een belangrijk onderzoeksdomein binnen die disciplines is tekstclassificatie, met als typische voorbeelden sentimentanalyse (waarbij labels als 'positief', 'negatief' of emotiecategorieën worden toegekend aan teksten), haatspraakdetectie, topicclassificatie of de detectie van fake news. In veel gevallen wordt bewust alleen data verzameld die unimodaal is, namelijk alleen tekstueel, zodat een aanzienlijk deel van de online beschikbare data niet benut wordt. In veel andere gevallen wordt alleen het tekstuele deel in multimodale data (bijvoorbeeld getranscribeerde tekst in audio/video, of tekst zonder afbeeldingen op sociale media) meegenomen voor de automatische analyse. Dit leidt ertoe dat potentieel belangrijke informatie uit andere modaliteiten buiten beschouwing gelaten wordt, of – op veel kleinere schaal – manueel geanalyseerd moet worden. Recente ontwikkelingen in machine learning tonen echter aan dat het integreren van meerdere modaliteiten de accuraatheid van classificatiesystemen aanzienlijk kan verhogen. Bij sentimentanalyse op sociale media kan het bijvoorbeeld cruciaal zijn om niet alleen de tekst, maar ook beelden mee te nemen in de analyse, of bij de analyse van spraak en video kan intonatie een belangrijke rol spelen. Voor deze postdoc challenge willen we daarom kandidaten aantrekken die een voorstel voorbereiden waarin onderzoek naar innovatieve en robuuste methodologieën voor de classificatie van online multimodale data centraal staat. Het uiteindelijke doel is om een meer holistisch begrip van communicatie in de digitale wereld mogelijk te maken, wat kan leiden tot verbeterde inzichten in sociale interacties en online communicatie. Dit onderzoek kan bovendien bijdragen aan de ontwikkeling van geavanceerde tools voor het monitoren van online content en het bevorderen van een gezondere digitale communicatieomgeving.

Onderzoeker(s)

Onderzoeksgroep(en)

Project type(s)

  • Onderzoeksproject