Ga naar inhoud

Dataverkenning en datapreparatie

In deze fase worden relevante datasets geïdentificeerd en wanneer nodig wordt nieuwe data verzameld. In deze fase zal ook de ontwikkelomgeving (verder) worden ingericht indien nodig. Het is van belang dat voorafgaand aan verzameling is vastgesteld dat de benodigde data mag worden verwerkt en dat de juiste maatregelen worden getroffen, zodra de data kan worden verwerkt. Denk hierbij aan het anonimiseren, pseudonimiseren of aggregeren van persoonsgegevens. De data zullen vervolgens worden opgeschoond, geanalyseerd en voorbereid voor verdere verwerking.

Het is van belang dat dataverzameling op de juiste manier gebeurt, en dat datasets die gebruikt gaan worden van goede kwaliteit zijn. In deze fase is het van belang om de datakwaliteit en eventuele bias in de dataset te onderzoeken. Indien er risico's optreden door bijvoorbeeld missende data of niet representatieve data, is het belangrijk om te kijken wat voor effecten dit heeft op het oorspronkelijke ontwerp van het algoritme of AI-systeem. Dit kan betekenen dat nieuwe keuzes moeten worden gemaakt in het ontwerp en eventueel eerste deze fase van ontwerp (deels) opnieuw moet worden doorlopen.

Met voorgaande handelingen wordt het fundament gelegd om het algoritme of AI-systeem te kunnen ontwikkelen. In de praktijk zal bijvoorbeeld het analyseren van de data niet stoppen na deze fase, maar terugkerend zijn in alle fasen die volgen. Als de verzamelde data van voldoende kwaliteit is en de vereiste maatregelen zijn getroffen, dan kan worden gestart met het ontwikkelen van het algoritme of AI-systeem.

Vereisten

idVereisten
aia-05Data van hoog-risico ai moet voldoen aan kwaliteitscriteria
aia-06Technische documentatie voor hoog-risico AI
aia-29Beoordeling van grondrechten
aia-35Verdere verwerking van persoonsgegevens in AI-testomgevingen
aut-01Auteursrechten mogen niet worden geschonden
avg-01Verwerking van persoonsgegevens moet rechtmatig plaatsvinden
avg-02Beperkte bewaartermijn van persoonsgegevens
avg-03Persoonsgegevens verzamelen voor specifieke doeleinden
avg-05Juistheid en actualiteit van gegevens
avg-06Verantwoordingsplicht voor de rechtmatigheid van de verwerking
avg-07Transparantie bij verwerking persoonsgegevens
avg-08Wettelijke uitzondering nodig voor verwerken bijzondere categorieën persoonsgegevens
avg-09Privacyrechten
avg-11Privacy door ontwerp
avg-13Een DPIA is verplicht bij hoog risico voor de rechten en vrijheden van natuurlijke personen
dat-01Verbod op schenden databankenrechten
grw-02AI-systemen en algoritmes mogen niet discrimineren

Maatregelen

idMaatregelen
Bescherm persoonsgegevens die mogen worden verwerkt voor het ontwikkelen en gebruiken van algoritmes en AI-systemen.
Beschrijf de rollen en verantwoordelijkheden voor het ontwikkelen en gebruiken van algoritmes en AI-systemen en pas een RACI-matrix toe.
Betrek belanghebbenden
Controleren eigen data op schending auteursrechten
Data is van voldoende kwaliteit
Het doel voor het verwerken van persoonsgegevens met een algoritme of AI-systeem is welbepaald en omschreven.
Zorg ervoor dat logbestanden worden gecreëerd waarin informatie wordt geregistreerd over gebruikersactiviteiten, uitzonderingen en informatiebeveiligingsgebeurtenissen
Persoonsgegevens die worden verwerkt voor het ontwikkelen en gebruiken van algoritmes en AI-systemen zijn beschreven en onderbouwd.
Pas het principe van security by design toe
Tref (technische) maatregelen waarmee het gebruik van het algoritme of AI-systeem kan worden stopgezet.
Uitvoeren risicoanalyse en formuleren mitigerende maatregelen voor privacyrisico's
Stel vast dat wetgeving en (lokaal) beleid correct is vertaald naar de uitvoering van het te ondersteunen werkproces en de onderliggende systemen.

Disclaimer

Het Algoritmekader is nog volop in ontwikkeling. Op deze plek willen we vooral aan de slag gaan op een open en transparante wijze. Het is dus niet definitief. Dat betekent dat er dingen opstaan die niet af zijn en soms zelfs fout. Mocht er iets niet kloppen, laat het ons weten via GitHub.