Voor de beste ervaring schakelt u JavaScript in en gebruikt u een moderne browser!
Je gebruikt een niet-ondersteunde browser. Deze site kan er anders uitzien dan je verwacht.
Het verzamelen van data wordt steeds belangrijker voor onderzoekers, maar het goed publiceren van data voor hergebruik is vaak lastig: data worden vaak verzameld met een specifieke context, die bij publicatie of hergebruik verloren kan gaan. Lise Stork, universitair docent in het Intelligent Data Engineering Lab, ontwikkelt tools om wetenschappers te helpen met hun uitdagingen omtrent datasets. Stork was in 2024 aangenomen als MacGillavry Fellow bij het Instituut voor Informatica (IvI).
Portrait picture
Lise Stork

Wetenschappers werken met steeds complexere datasets. Dit biedt veel nieuwe mogelijkheden voor hun onderzoek, maar brengt ook uitdagingen met zich mee, bijvoorbeeld in het interpreteren van de data, en het delen van de data met de wetenschappelijke gemeenschap. Hoe kunnen onderzoekers hun data optimaler benutten en delen? Dit is een van de vragen waar Lise Stork, universitair docent bij het Instituut voor Informatica en MacGillavry Fellow, zich mee bezighoudt.

Het onderzoek van Stork bevindt zich op het snijvlak van drie onderzoeksgebieden. Stork: ‘Allereerst FAIR data, dat staat voor vindbaarheid, toegankelijkheid, interoperabiliteit en herbruikbaarheid. Dan hybride intelligentie, dat richt zich op de vraag hoe we AI-systemen maken die de capaciteiten van de mens versterken in plaats van overnemen. En als laatste e-Science, wat zich richt op het ondersteunen van wetenschappers in hun werk.'

Uitschieters opsporen

Naast enorm grote datasets werken veel onderzoekers ook met verschillende soorten data, zoals afbeeldingen, teksten en tabellen. Het is vaak een enorme uitdaging om deze data te integreren om er inzichten uit te kunnen halen. Een promovendus in de groep van Stork werkt aan manieren om meer inzichten uit biodiversiteitsdata te kunnen halen.

Deze dataset bestaat uit verschillende soorten data van dieren, zoals afbeeldingen en tabellen met locaties waar ze gevonden zijn. Stork: ‘Er zitten vaak kleine fouten in die tabellen. Mijn promovendus kijkt hoe hij verschillende soorten data kan gebruiken om uitschieters in de tabellen te vinden en aan te kunnen geven waarom het een uitschieter is. Daarna kunnen de onderzoekers met hun domeinkennis zelf bepalen of het een fout is in de data, of dat het nieuwe informatie is.’

Hulp van AI

Wanneer wetenschappers hun datasets delen, is het belangrijk dat ze ook de context beschrijven, zoals hoe de experimenten precies zijn uitgevoerd. Het is volgens Stork vaak lastig voor onderzoekers om te bepalen welke informatie belangrijk is. Stork: 'Een promovendus in mijn groep gaat hiervoor workflows ontwikkelen, waarbij wetenschappers met een AI-model kunnen samenwerken om de context van een dataset beter te beschrijven, zodat hergebruik eenvoudiger wordt.’

De AI kan ook als een facilitator fungeren tussen verschillende onderzoekers. Volgens Stork zou dit het makkelijker maken om met wetenschappers van andere disciplines te praten. ‘Ik merk dat zelfs in projectbesprekingen binnen de informatica iedereen met net andere raamwerken en formalisaties werkt, wat communicatie bemoeilijkt. Met behulp van de AI zou je de data makkelijker kunnen beschrijven voor mensen binnen én buiten je eigen discipline.’

Focus vinden

In 2024 kon Stork bij de UvA beginnen als universitair docent via de MacGillavry Fellowship. Ze heeft de overstap van postdoc naar universitair docent met veel plezier gemaakt. ‘Ik denk dat de vakken die ik geef perfect aansluiten bij mijn onderzoeksinteresses. Ik vond het ook heel leuk om nu mijn focus te verleggen naar het schrijven van voorstellen, en ik begin een weg te vinden in het begeleiden van PhD studenten.’

In de toekomst vindt Stork het belangrijk een duidelijke focus te ontwikkelen. ‘Mijn grootste doel is om, voortbouwend op de studenten die ik nu al begeleid binnen mijn onderzoeksthema, een onderzoekslijn op te zetten binnen het snijvlak van hybride intelligentie, FAIR data en e-Science.’

Dr. L. (Lise) Stork

Faculteit der Natuurwetenschappen, Wiskunde en Informatica

Informatics Institute