15 maart 2024
Privacy en klimaat zijn de laatste jaren twee belangrijke thema’s in Europees beleid – denk bijvoorbeeld aan de Algemene verordening gegevensbescherming (AVG) en de Europese Green Deal. Toch lijken de twee thema’s in sommige opzichten haaks op elkaar te staan, vertelt Ana Oprescu, een van de onderzoeksleiders. ‘De AVG en de Green Deal liggen mijlenver uit elkaar en lijken soms geen deel uit te maken van hetzelfde universum. Met dit onderzoek proberen wij ze wat dichter bij elkaar te brengen.’
Het onderzoek richt zich op de vraag welke techniek voor het beschermen van privacygevoelige data het beste gebruikt kan worden in welke situatie. Er bestaan verschillende technieken voor privacybescherming, maar sommige daarvan verbruiken veel meer energie dan andere. Een veel gebruikte techniek is het vervangen van echte data door synthetische data, waarbij een algoritme ‘nep-data’ genereert die statistisch vergelijkbaar is, maar niet meer tot specifieke personen te herleiden is. Doordat synthetische data wel grotendeels dezelfde eigenschappen heeft als de echte dataset, kan de data nog steeds heel goed worden gebruikt voor allerlei onderzoeksdoeleinden.
De AVG en de Green Deal liggen mijlenver uit elkaar en lijken soms geen deel uit te maken van hetzelfde universum.Ana Oprescu
Synthetische data is een veelbelovende techniek die steeds vaker door bedrijven wordt ingezet, vertelt Oprescu. ‘Synthetische data waarborgt de privacy, terwijl er nauwelijks informatie verloren gaat. In dat opzicht werkt het beter dan andere technieken, zoals k-anonimiteit, waarbij ten behoeve van de privacy informatie wordt weggelaten en de data dus minder bruikbaar is. Toch kleeft er een groot nadeel aan synthetische data: het is een energieslurpende techniek, die dus een relatief grotere impact heeft op het klimaat.’
De onderzoekers buigen zich over de vraag hoe drie belangrijke waarden van data – privacy, bruikbaarheid en duurzaamheid – zich precies tot elkaar verhouden, en hoe ze het beste met elkaar in balans kunnen worden gebracht. Ze gaan een kader voor besluitvorming ontwikkelen aan de hand waarvan per geval bekeken kan worden welke techniek de meest wenselijke is.
Het gaat niet alleen over de technische kant van het probleem, maar ook over waarden, juridische kaders en menselijk gedrag.Ana Oprescu
‘Welke techniek optimaal is, hangt af van verschillende factoren’, vertelt Oprescu. ‘Wat wil je precies doen met de data, welke informatie wil je eruit kunnen halen, en welke mate van privacy heb je nodig? Dat verschilt per situatie. In sommige gevallen is bijvoorbeeld privacy misschien niet zo belangrijk dat het gebruik van energieslurpende synthetische data gerechtvaardigd is, terwijl je bij privacygevoelige gevallen echt niet zonder kunt. Als je een ingewikkelde onderzoeksvraag hebt, bijvoorbeeld als je wil analyseren hoe vrouwen zijn ondervertegenwoordigd in senior-functies aan universiteiten, dan heb je te maken met heel persoonlijke data en relatief kleine aantallen. Dan heb je echt geavanceerde technieken nodig, zoals synthetische data, omdat er bij technieken die minder energie verbruiken te veel relevante data verloren zou gaan.’
In het project werken onderzoekers uit verschillende vakgebieden met elkaar samen: informatica, economie en rechten. Daarnaast werken de onderzoekers samen met partners uit het bedrijfsleven – BlueGen.ai, KLM en GVB – om te leren hoe zij omgaan met privacy, data en energieverbruik. Die interdisciplinaire benadering is belangrijk, legt Oprescu uit. ‘Zo’n ingewikkeld vraagstuk kun je het beste vanuit verschillende invalshoeken bekijken. Het gaat niet alleen over de technische kant van het probleem, maar ook over waarden, juridische kaders en menselijk gedrag. Met ons project willen we de dialoog stimuleren tussen het bedrijfsleven, bestuur en softwareontwikkelaars – want alleen door samen naar het probleem te kijken kunnen we de juiste oplossingen vinden.’
Het spanningsveld tussen digitalisering en duurzaamheid in Europa wordt verder verkend tijdens de ACES-conferentie Sustainable Digitalisation in Europe (21-22 maart), die wordt georganiseerd door de onderzoekers die bij dit project betrokken zijn.