Woensdag 16/10/2019

Vier vragen Technologie

‘Data anonimiseren beschermt onze privacy niet’

Geanonimiseerde data beschermen onze privacy niet. Beeld Pexels.com

Geanonimiseerde data moeten ervoor zorgen dat individuen niet meer te identificeren zijn. Maar onderzoekers van de universiteit van UCLouvain en Imperial College Londen bewijzen in nieuw onderzoek dat deze techniek helemaal niet onze privacy beschermt. ‘We hebben strengere regulering nodig dan de Europese privacywet’, zegt de Belgische professor Yves-Alexandre de Montjoye (Imperial College Londen).

Wie de moeite neemt om af en toe de privacyvoorwaarden van websites of applicaties te doorploegen, leest meestal iets als: “Om onze dienst te verbeteren, analyseren en verwerken wij uw gegevens. De gegevens worden geanonimiseerd.” Professor Yves-Alexandre de Montjoye (Imperial College Londen) en zijn collega’s bouwden zelf een model om te bewijzen dat het anonimiseren van gegevens niet voldoende is om de privacy van burgers te beschermen.

Wat moeten we verstaan onder geanonimiseerde data?

“Bedrijven of onderzoekers verwijderen persoonlijke gegevens zoals naam, adres en andere gevoelige gegevens uit datasets vooraleer ze ermee aan de slag gaan. In de meeste gevallen wordt er ook zogenaamde ‘noise’ toegevoegd, dat zijn elementen die identificatie van individuen in theorie moeilijker moet maken. Deze techniek wordt al van in de jaren 90 veelvuldig gebruikt in onderzoek en de bedrijfswereld. Wij stellen nu vast dat die techniek vandaag niet volstaat om de privacy van burgers te beschermen.”

Hoe deed u dat?

“We hebben een algoritme gebouwd dat machine learning gebruikt om te evalueren of een persoon correct werd geïdentificeerd in een geanonimiseerde dataset. In de VS hebben onze algoritmes slechts 15 attributen nodig om iemand in 99,98 procent van de gevallen correct te identificeren in om het eender welke dataset.”

Hoe komt dat?

“Ergens is dat logisch. Er mogen in Brussel heel veel mannelijke dertigers wonen. Maar als je naar alle dertigers in Brussel zoekt die op 5 januari geboren zijn, twee dochters hebben en rondrijden in een rode sportwagen, dan maakt het niet zoveel meer uit of privacygevoelige gegevens gewist werden of niet. We kunnen haast met zekerheid zeggen om wie het dan gaat.”

Waarom is dat erg?

“We gaan er nog te veel van uit dat anonimiseren van data gelijkstaat aan het beschermen van privacy. Ons model bewijst dat die stelling niet klopt. Dat is een opzienbarende vaststelling als je weet dat dataverhandelaars niks anders doen dan verschillende stukjes data van ons verkopen om profielen op te bouwen om advertenties en diensten op af te stellen. Je moet weten dat data – zodra die in theorie geanonimiseerd werden – niet meer beschermd worden door de Europese privacywetgeving.”

Hoe kunnen we dit probleem aanpakken?

“We zullen altijd data nodig hebben om artificiële intelligente toepassingen te bouwen. We moeten vooral de standaard om onze persoonsgegevens te beschermen verhogen. En dat is niet onmogelijk. Er bestaan al heel wat toepassingen die onze privacy beter kunnen beschermen. Maar eerst moet de mindset veranderen. Vandaag leeft nog te veel het idee dat we in Europa een deel van onze privacy moeten opgeven om China en de Verenigde Staten bij te benen. Dat is nonsens. Privacy is net de kern van innovatie, het is een belangrijke spil in de vertrouwensband die je nodig hebt om een gezonde dataeconomie op te bouwen.”

Meer over

Wilt u belangrijke informatie delen met De Morgen?

Tip hier onze journalisten


Op alle verhalen van De Morgen rust uiteraard copyright. Linken kan altijd, eventueel met de intro van het stuk erboven.
Wil je tekst overnemen of een video(fragment), foto of illustratie gebruiken, mail dan naar info@demorgen.be.
DPG Media nv – Mediaplein 1, 2018 Antwerpen – RPR Antwerpen nr. 0432.306.234