Abstract
Het gegeneraliseerde lineaire model (GLM) is een erg populaire en flexibele klasse van regressiemodellen die gewone lineaire regressie generaliseren door bijvoorbeeld niet-normale responsvariabelen toe te staan. Logistische regressie, die veel wordt gebruikt voor binaire classificatie, en Poisson-regressie, vaak gebruikt om telgegevens te modelleren, behoren beide tot deze klasse. De parameters worden meestal geschat via maximum likelihood, maar dit leidt vaak tot verschillende problemen bij het analyseren van echte gegevens uit de praktijk. Ten eerste kunnen uitschieters in de gegevens de klassieke methoden sterk beïnvloeden, wat onbetrouwbare resultaten oplevert. Ten tweede wordt inschatten en interpreteren erg moeilijk of onmogelijk wanneer het aantal variabelen erg hoog wordt. Ten derde vertonen echte gegevens vaak een meer complex verspreidingsgedrag dan verwacht in het GLM-model. Om deze problemen op te lossen, zullen sparse en robuuste schattingsmethoden worden ontwikkeld die gelijktijdig het gemiddelde en het dispersiegedrag in de context van GLMs modelleren. Hun wiskundige eigenschappen zullen grondig worden onderzocht. De nieuw voorgestelde methoden moeten ook computationeel efficiënt zijn, zodat moderne grote datasets gemakkelijk kunnen worden geanalyseerd. Open-access gebruiksvriendelijke software zal worden verstrekt.
Onderzoeker(s)
Onderzoeksgroep(en)
Project type(s)