Verantwoord datagebruik
Overheden moeten verantwoord omgaan met de data die hun algoritmes gebruiken. De data moet voldoen aan regels voor bijvoorbeeld privacy. De kwaliteit van de data moet goed zijn. En overheden moeten deze gegevens goed beheren. Anders is het algoritme niet betrouwbaar.
Wat is verantwoord datagebruik?
Verantwoord datagebruik betekent:
- Rechtmatig gebruik van gegevens
- Goede datakwaliteit
- Goed databeheer
Rechtmatig gebruik van data
Net als organisaties mogen algoritmes niet zomaar gegevens verzamelen en gebruiken. Dit moet rechtmatig gebeuren: volgens de wettelijke regels. Zo moet je rekening houden met auteursrechten. Ook vóórdat het algoritme in gebruik is, moet je rechtmatig omgaan met data. Dus tijdens het trainen, valideren en testen.
Andere belangrijke regels gaan over privacy. Zo mag je algoritme alleen de minimale persoonsgegevens gebruiken die nodig zijn om het doel te bereiken. Technieken om dit te doen zijn:
- Anonimiseren: data zoveel mogelijk anoniem maken
- Pseudonimiseren: data moeilijker herleidbaar maken naar personen
- Aggregeren: data zoveel mogelijk combineren of samenvoegen tot 1 waarde, zoals een totaal of gemiddelde
Goede datakwaliteit
Hoe slechter de datakwaliteit, hoe onbetrouwbaarder de uitkomsten van je algoritme.
Je bepaalt en controleert zelf de kwaliteit van je dataset. Check bijvoorbeeld of alle gegevens juist, compleet en actueel zijn. En herken bias in je data.
Goed databeheer: datagovernance en datamanagement
Goed databeheer betekent dat je organisatie duidelijke afspraken maakt over het:
- opslaan en verwerken van data
- gebruik van data: welke data mag je waarvoor gebruiken?
- beveiligen van data
- bewaken van de datakwaliteit, zoals het actueel houden van de gegevens
- eigenaarschap van data, bijvoorbeeld de partij die het algoritme ontwikkelt
- documenteren en labelen van data (metadata)
Leg de processen en afspraken hierover vast in de datagovernance van je organisatie. In een datamanagementstrategie beschrijf je hoe je organisatie data verzamelt, ordent en gebruikt. Zo kan je organisatie optimaal gebruikmaken van data.
Hoe goed je organisatie data beheert, check je met datavolwassenheidsmodellen uit de Toolbox verantwoord datagebruik van de Interbestuurlijke Datastrategie (IBDS). Of gebruik de beslishulp datavolwassenheid.
Belang van verantwoord datagebruik
Algoritmes kunnen veel schade veroorzaken in de maatschappij als ze de verkeerde gegevens gebruiken.
Met verantwoord datagebruik voorkom je:
- verkeerde beslissingen doordat je algoritme resultaten baseert op data van slechte kwaliteit
- discriminerende effecten van algoritmes doordat je data bias bevat
- lekken van privacygevoelige informatie, zoals persoonsgegevens
- gebruik van data die niet rechtenvrij zijn, zoals teksten met auteursrechten
- dat resultaten niet te reproduceren zijn, doordat de data niet goed is opgeslagen
Bescherming van cruciale infrastructuurdata
Niet alleen persoonsgegevens, maar ook gegevens over de Nederlandse infrastructuur vragen om verantwoord datagebruik. Dit omvat zowel fysieke infrastructuur, zoals wegen, bruggen, tunnels en energievoorzieningen, als digitale infrastructuur, zoals datakabels en datacentra.
Het ongecontroleerd delen of gebruiken van deze gegevens, bijvoorbeeld voor het trainen van buitenlandse AI-toepassingen, kan risico’s opleveren voor de nationale veiligheid en de continuïteit van vitale systemen. Overheden en organisaties moeten deze data goed beveiligen en duidelijke kaders opstellen om verantwoord gebruik te waarborgen.
Vereisten
Aanbevolen maatregelen
Hulpmiddelen
- Toolbox verantwoord datagebruik, Interbestuurlijke Datastrategie (IBDS)
- Richtlijnen voor ‘FAIR’ data, GO FAIR Foundation