Maak waardevolle data vindbaar, toegankelijk, interoperabel en herbruikbaar (FAIR) binnen en buiten de eigen organisatie.
dat-02Dataverkenning en datapreparatieOntwikkelaarData
Maatregel
Maak waardevolle data vindbaar, toegankelijk, interoperabel en herbruikbaar (FAIR) binnen en buiten de eigen organisatie.
Toelichting
De internationale FAIR-principes zijn richtlijnen voor de manier van beschrijven, opslag en publicatie van data.
- Findable (vindbaar): Metadata moet gemakkelijk te vinden zijn voor zowel mensen als computers.
- Accessible (toegankelijk): Gebruikers moeten weten hoe toegang tot de data verkregen kan worden (autorisatie en authenticatie)
- Interoperable (uitwisselbaar): Data moet meestal geïntegreerd worden met andere data en bijbehorden applicaties, opslag en processen.
- Reusable (herbruikbaar): Het uiteindelijke doel van FAIR is om hergebruik van data te optimaliseren.
Wanneer je voldoet aan de 15 principes is je data 'machine actionable'. Dit maakt het mogelijk dat de data effectief gebruikt kan worden voor verschillende algoritmes.
FAIR data betekent niet per definitie dat data open data is. Juist ook voor (privacy) gevoelige data (gesloten data) kan het heel zinvol zijn om te voldoen aan de principes voor FAIR data, om juist daarmee specifieke geautoriseerde toegang tot gevoelige data mogelijk te kunnen maken.
15 principes voor FAIR data
Er zijn 15 principes voor FAIR data geformuleerd:
Findable (vindbaar)
-
F1: Aan (meta)data wordt een wereldwijd unieke en permanente identifier toegevoegd
Voorbeeld
Met behulp van Persistent Identifiers (PID) zorg je ervoor dat jouw data (bijvoorbeeld onderzoeksdata) altijd vindbaar blijft. PID's kun je vergelijken met het ISBN-nummer bij boeken. Het idee is dat ook als de locatie of de onderliggende infrastructuur verandert, de verwijzing intact blijft.
-
F2: Data wordt beschreven met rijke metadata
Voorbeeld
Het team van data.overheid.nl heeft de metadata standaard DCAT-AP-DONL ontwikkeld die speciaal voor de uitwisseling van dataset informatie voor de Nederlandse situatie is ingericht. Dit is gebaseerd op de Data Catalog Vocabulary (DCAT) versie die de Europese Unie heeft opgesteld. Je kan hierover meer lezen op de site van data.overheid.nl.
-
F3: Metadata bevat duidelijk en expliciet de identificatie van de data die ze beschrijven
- F4: (Meta)data worden geregistreerd of geïndexeerd in een doorzoekbare bron
Accessible (toegankelijk)
- A1: (Meta)data zijn opvraagbaar op basis van hun identificatiecode met behulp van een gestandaardiseerd communicatieprotocol
- A1.1: Het protocol is open, vrij en universeel implementeerbaar
- A1.2: Het protocol maakt waar nodig een authenticatie- en autorisatieprocedure mogelijk
- A2: Metadata zijn toegankelijk, ook als de data niet meer beschikbaar zijn
Interoperable (uitwisselbaar)
- I1: (Meta)data gebruikt een formele, toegankelijke, gedeelde en breed toepasbare taal voor kennisrepresentatie
-
I2: (Meta)data gebruikt gegevenswoordenboeken of vocabulaires die FAIR-principes volgen
Voorbeeld woordenboek
In het woordenboek Hitte staan ongeveer 230 definities van termen rond het thema hitte die gebruikt worden in het klimaatadaptatieveld. Dit woordenboek is ontwikkeld in opdracht van het ministerie van Infrastructuur en Waterstaat door overheidsstichting Geonovum.
-
I3: (Meta)data bevat gekwalificeerde verwijzingen naar andere (meta)data
Reusable (herbruikbaar)
- R1: (Meta)data wordt rijkelijk beschreven met een veelheid aan nauwkeurige en relevante attributen
- R1.1: (Meta)data wordt vrijgegeven met een duidelijke en toegankelijke licentie voor datagebruik
-
R1.2: (Meta)data wordt geassocieerd met gedetailleerde herkomst
Voorbeeld
PROV-DM is een conceptueel datamodel dat gebruikt kan worden voor de herkomstinformatie (provenance) van data.
Vereisten
Opmerking
Artikel 5b van de Wet hergebruik van overheidsinformatie stelt dat dnderzoeksgegevens in overeenstemming met de FAIR-beginselen actief beschikbaar moeten worden gesteld voor hergebruik door een publiek gefinancierde onderzoeksorganisatie. Dit geldt voor zover:
- die documenten zijn geproduceerd in het kader van geheel of gedeeltelijk met overheidsmiddelen gefinancierde wetenschappelijke onderzoeksactiviteiten;
- die documenten openbaar zijn gemaakt via een institutionele of thematische databank als bedoeld in artikel 10, tweede lid, van de richtlijn; en
- rechtmatige handelsbelangen, activiteiten inzake kennisoverdracht en reeds bestaande intellectuele eigendomsrechten zich hiertegen niet verzetten.