Fase 3: Dataverkenning en datapreparatie
In deze fase verzamel en analyseer je de data die nodig zijn voor het ontwikkelen van het algoritme of AI-systeem. Je voert een dataverkenning uit, waarin je onderzoekt welke datasets geschikt zijn. Via datapreparatie maak je deze gegevens bruikbaar.
Belangrijke stappen
Het proces van data onderzoeken en voorbereiden bestaat in elk geval uit deze stappen:
- vaststellen welke data geschikt en beschikbaar zijn
- onderzoeken hoe je deze data rechtmatig gebruikt
- verzamelen van de data
- opschonen van de data
- analyseren van de datakwaliteit
Ontstaan er risico's door bijvoorbeeld bias in de dataset, missende data of niet-representatieve data, dan onderzoek je het effect op het ontwerp van je algoritme of AI-systeem. Mogelijk moet je het ontwerp aanpassen.
Is je data van voldoende kwaliteit en ga je hier rechtmatig mee om, dan kun je het algoritme of AI-systeem (laten) ontwikkelen.
Tip
Vanaf deze fase blijf je de data analyseren, ook in alle volgende fases.
Vereisten dataverkenning en datapreparatie
Aanbevolen maatregelen dataverkenning en datapreparatie
Help ons deze pagina te verbeteren
Deel je idee, suggestie of opmerking via GitHub of mail ons via algoritmes@minbzk.nl.