DCAT-AP-NL documentatie

Date:2017-06-01
Authors:Hans Overbeek, Jeffrey Cafferata
Version:v1.1
Contact:info@jcid.nl
Organization:Kennis- en Exploitatiecentrum Officiële Overheidspublicaties (KOOP)

De documentatie is open source en beschikbaar op GitHub. De informatie is onderverdeeld in de volgende hoofdstukken:

Inleiding

Deze documentatie specificeert een standaard voor de online uitwisseling van metadata tussen Nederlandse data-catalogi, zoals: data.overheid.nl, het Nationaal Georegister (NGR) en bijvoorbeeld ook de (open) data catalogi van gemeenten en provincies. Deze documentatie is opgesteld in opdracht van het Kennis- en Exploitatiecentrum Officiële Overheidspublicaties (KOOP) van het Ministerie van Binnenlandse Zaken en Koninkrijksrelaties (BZK) in het kader van de doorontwikkeling van data.overheid.nl: het open dataportaal van de Nederlandse overheid (DONL). Het beschrijft het Nederlands toepassingsprofiel van de Data Catalogue Vocabulary van het W3C (DCAT) dat is gebasseerd op de Europese versie van DCAT (DCAT-AP-EU v1.1) [2].

Bij het vaststellen van het Nederlands toepassingsprofiel voor datasets is er rekening gehouden met internationale standaarden. Drie standaarden spelen een centrale rol:

  1. DCAT [1] is een toonaangevende W3C standaard voor metadata van data catalogi. Binnen de EU (DG connect, ISA program en het EU publication office) is een toepassingsprofiel [2] voor DCAT opgesteld. ISA zegt zelf over het EU toepassingsprofiel:
    The DCAT Application profile for data portals in Europe (DCAT-AP) is a specification based on the Data Catalogue vocabulary (DCAT) for describing public sector datasets in Europe. Its basic use case is to enable a cross-data portal search for data sets and make public sector data better searchable across borders and sectors. This can be achieved by the exchange of descriptions of data sets among data portals.
  2. ISO 19115 en ISO 19119 zijn standaarden voor metadata van Geo-informatie en geo-services. Deze standaarden worden gehanteerd door het NGR volgens het Nederlandse toepassingsprofiel van ISO 19115 en ISO 19119 [3].
  3. OWMS 4.0, de Overheidbrede Web Metadata Standaard is het Nederlandse toepassingsprofiel van Dublin Core. Het is een standaard voor metadata van informatieobjecten van de Nederlandse overheid op internet.

Het Nederlands toepassingsprofiel

Het Nederlands toepassingsprofiel bevat:

  • Een keuze voor welke entiteiten en attributen uit het DCAT model overgenomen worden;
  • Een invulling van het waardebereik van de attributen (zoals bijvoorbeeld OWMS waardelijsten voor organisaties);
  • Een mapping van het metadata model van de Nederlandse metadataprofielen op ISO 19115 en ISO 19119 naar DCAT;
  • Een mapping van OWMS (Dublin Core) naar DCAT.

Methodologie

Uitgangspunten

  • Waar mogelijk worden de specificaties van DCAT en DCAT-AP-EU gevolgd.
  • Het toepassingsprofiel houdt rekening met specificaties in andere standaarden voor Datasets, met name die van het Nederlands toepassingsprofiel voor Geo-data: ISO 19115.
  • DCAT-AP-NL moet zo eenvoudig mogelijk toepasbaar zijn door data-portalen, catalogi van datasets en metadata-brokers in Nederland.
  • Op data.overheid.nl, het Open Data portaal van de Nederlandse overheid worden referentiegegevens beschikbaar gesteld. Toepassers maken gebruik van deze referentiegegevens.
  • Applicaties die conform DCAT-AP-NL zijn opgezet kunnen onderling beschrijvingen van Datasets aanbieden en ontvangen zoals beschreven in de sectie ‘Terminologie’. In combinatie met informatie op data.overheid.nl kunnen applicaties conform DCAT-AP-EU data aanbieden. Dit betekent dat bijvoorbeeld de datacatalogus op data.overheid.nl wel DCAT-AP-EU compliant kan zijn, maar dat er ook DCAT-AP-NL compliant applicaties kunnen zijn die niet DCAT-AP-EU compliant zijn.

Gevolgde werkwijze

Bij het opstellen van DCAT-AP-NL zijn we als volgt te werk gegaan:

  1. Neem de classes en properties uit DCAT-AP-EU als uitgangspunt.
  2. Deel alle classes die als datatype geïmplementeerd kunnen worden in als ‘Datatype’.
  3. Deel alle classes die als referentiegegevens op data.overheid.nl of standaarden.overheid.nl beschikbaar zijn, in als ‘Reference’.
  4. Neem de overige classes van DCAT-AP-EU over in DCAT-AP-NL.
  5. Geef aan of deze in DCAT-AP-NL verplicht of optioneel zijn.
  6. Loop alle verplichte eigenschappen uit ISO 19115 na en probeer deze te mappen op DCAT-AP-EU.
[1]Data Catalog Vocabulary (DCAT); W3C Recommendation 16 January 2014.
[2](1, 2) DCAT Application Profile for data portals in Europe; version 1.1, February 2015.
[3]Nederlands metadataprofiel op ISO 19115 geografie, 1.3.1.
[4]Waardelijsten op standaarden.overheid.nl.

Terminologie

Deze terminologie is gebaseerd op die DCAT-AP-EU. @TODO beschreven wordt in Hoofdstuk 5 van DCAT-AP-EU

In DCAT-AP-NL worden classes en properties gegroepeerd onder de kopjes ‘Mandatory’, ‘Recommended’, ‘Optional’, ‘Referenced’ en ‘Datatype’. Deze termen hebben de volgende betekenis:

Classes

  • Mandatory

    een aanbieder van een beschrijving van een Dataset moet informatie over instanties van de class verstrekken.

    een ontvanger van een beschrijving van een Dataset moet informatie over instanties van de class kunnen verwerken

  • Recommended

    een aanbieder van een beschrijving van een Dataset moet informatie over instanties van de class verstrekken als deze beschikbaar is.

    een ontvanger van een beschrijving van een Dataset moet informatie over instanties van de class kunnen verwerken

  • Optional

    een aanbieder van een beschrijving van een Dataset mag informatie over instanties van de class verstrekken, maar is daartoe niet verplicht.

    een ontvanger van een beschrijving van een Dataset moet informatie over instanties van de class kunnen verwerken

Property

  • Mandatory

    een aanbieder van een beschrijving van een Dataset moet informatie voor die property verstrekken.

    een ontvanger van een beschrijving van een Dataset moet informatie voor die property kunnen verwerken

  • Recommended

    een aanbieder van een beschrijving van een Dataset moet informatie voor die property verstrekken als deze beschikbaar is.

    een ontvanger van een beschrijving van een Dataset moet informatie voor die property kunnen verwerken

  • Optional

    een aanbieder van een beschrijving van een Dataset mag informatie voor die property verstrekken, maar is daartoe niet verplicht.

    een ontvanger van een beschrijving van een Dataset moet informatie voor die property kunnen verwerken

Properties

Datasets

description

Property: description

Verplichting: mandatory

URI: dct:description

Range: Vrije tekst

Waardelijst:

Usage note: This property contains a free-text account of the Dataset. This property can be repeated for parallel language versions of the description.

Cardinality: 1..n

identifier

Property: identifier

Verplichting: mandatory

URI: dct:identifier

Range: Vrije tekst

Waardelijst:

Usage note: This property contains the main identifier for the Dataset, e.g. the URI or other unique identifier in the context of the Catalogue.

Cardinality: 0..n

language

Property: language

Verplichting: mandatory

URI: dct:language

Range: xml:lang

Waardelijst: http://publications.europa.eu/mdr/resource/authority/language/html/languages-eng.html

Usage note: This property refers to a language of the Dataset. This property can be repeated if there are multiple languages in the Dataset.

Cardinality: 0..n

Registratiehouder

Property: Registratiehouder

Verplichting: mandatory

URI: overheid:authority

Range: donl:Agent

Waardelijst: http://api.data.overheid.nl:8000/v2.0.0/organisations.json

Usage note: De organisatie die eindverantwoordelijk is voor het tot stand komen van de dataset. De registratiehouder is ook verantwoordelijk voor de relatie met de verstrekker.

Cardinality: 0..1

title

Property: title

Verplichting: mandatory

URI: dct:title

Range: Vrije tekst

Waardelijst:

Usage note: This property contains a name given to the Dataset. This property can be repeated for parallel language versions of the name.

Cardinality: 1..n

update/ modification date

Property: update/ modification date

Verplichting: mandatory

URI: dct:modified

Range: xsd:date

Waardelijst:

Usage note: This property contains the most recent date on which the Dataset was changed or modified.

Cardinality: 0..1

dataset distribution

Property: dataset distribution

Verplichting: recommended

URI: dcat:distribution

Range:

Waardelijst:

Usage note: This property links the Dataset to an available Distribution.

Cardinality: 0..n

keyword/tag

Property: keyword/tag

Verplichting: recommended

URI: dcat:keyword

Range: Vrije tekst

Waardelijst:

Usage note: This property contains a keyword or tag describing the Dataset.

Cardinality: 0..n

landing page

Property: landing page

Verplichting: recommended

URI: dcat:landingPage

Range: url

Waardelijst:

Usage note: This property refers to a web page that provides access to the Dataset, its Distributions and/or additional information. It is intended to point to a landing page at the original data provider, not to a page on a site of a third party, such as an aggregat

Cardinality: 0..n

licence

Property: licence

Verplichting: recommended

URI: dct:license

Range: Vrije tekst of Waardelijst

Waardelijst: http://api.data.overheid.nl:8000/v2.0.0/licences.json

Usage note: This property refers to the licence under which the Distribution is made available.

Cardinality: 0..1

publisher

Property: publisher

Verplichting: recommended

URI: dct:publisher

Range: donl:Agent

Waardelijst: http://api.data.overheid.nl:8000/v2.0.0/organisations.json

Usage note: This property refers to an entity (organisation) responsible for making the Dataset available.

Cardinality: 0..1

spatial/ geographical coverage

Property: spatial/ geographical coverage

Verplichting: recommended

URI: dct:spatial

Range: overheid:Spatial

Waardelijst:

Usage note: This property refers to a geographic region that is covered by the Dataset.

Cardinality: 0..n

temporal coverage

Property: temporal coverage

Verplichting: recommended

URI: dct:temporal

Range: overheid:Period

Waardelijst:

Usage note: This property refers to a temporal period that the Dataset covers.

Cardinality: 0..n

theme/category

Property: theme/category

Verplichting: recommended

URI: dcat:theme

Range: overheid:TaxonomieBeleidsagenda

Waardelijst: http://standaarden.overheid.nl/owms/terms/TaxonomieBeleidsagenda.html

Usage note: This property refers to a category of the Dataset. A Dataset may be associated with multiple themes.

Cardinality: 0..n

access rights

Property: access rights

Verplichting: optional

URI: dct:accessRights

Range:

Waardelijst:

Usage note: This property refers to information that indicates whether the Dataset is open data, has access restrictions or is not public. A controlled vocabulary with three members (:public, :restricted, :non-public) will be created and maintained by the Publication

Cardinality: 0..1

conforms to

Property: conforms to

Verplichting: optional

URI: dct:conformsTo

Range: Vrije tekst

Waardelijst:

Usage note: This property refers to an implementing rule or specification.

Cardinality: 0..n

contact point

Property: contact point

Verplichting: optional

URI: dcat:contactPoint

Range:

Waardelijst:

Usage note: This property contains contact information that can be used for sending comments about the Dataset.

Cardinality: 0..n

documentation

Property: documentation

Verplichting: optional

URI: foaf:page

Range:

Waardelijst:

Usage note: This property refers to a page or document about this Dataset.

Cardinality: 0..n

Doel

Property: Doel

Verplichting: optional

URI: overheidds:doel

Range: Vrije tekst

Waardelijst:

Usage note: Doel waarmee de dataset is samengesteld. Waarschuwingen voor bepaalde interpretaties of andere vormen van gebruik. Indien concrete wetsartikelen van toepassing zijn dienen die hier ook te worden vermeld.

Cardinality: 0..1

frequency

Property: frequency

Verplichting: optional

URI: dct:accrualPeriodicity

Range: overheid:Frequentie

Waardelijst: http://standaarden.overheid.nl/owms/terms/Frequentie

Usage note: This property refers to the frequency at which the Dataset is updated.

Cardinality: 0..1

Grondslag

Property: Grondslag

Verplichting: optional

URI: overheid:grondslag

Range: overheid:Regeling

Waardelijst:

Usage note: Wettelijke grondslag op basis waarvan de dataset is opgesteld.

Cardinality: 0..n

has version

Property: has version

Verplichting: optional

URI: dct:hasVersion

Range:

Waardelijst:

Usage note: This property refers to a related Dataset that is a version, edition, or adaptation of the described Dataset.

Cardinality: 0..n

is version of

Property: is version of

Verplichting: optional

URI: dct:isVersionOf

Range:

Waardelijst:

Usage note: This property refers to a related Dataset of which the described Dataset is a version, edition, or adaptation.

Cardinality: 0..n

Kwaliteit

Property: Kwaliteit

Verplichting: optional

URI: overheidds:kwaliteit

Range: Vrije tekst

Waardelijst:

Usage note: Compleetheid van de dataset en eventuele evidente fouten.

Cardinality: 0..1

LODStars

Property: LODStars

Verplichting: optional

URI: overheidds:LODStars

Range: overheidds:Stars

Waardelijst: http://api.data.overheid.nl:8000/v2.0.0/stars.json

Usage note: Aantal LOD-sterren (1-5), leeg is 0 sterren betekent onbekend. LOD = Linked Open Data, http://5stardata.info

Cardinality: 0..1

other identifier

Property: other identifier

Verplichting: optional

URI: adms:identifier

Range:

Waardelijst:

Usage note: This property refers to a secondary identifier of the Dataset, such as MAST/ADS18, DataCite19, DOI20, EZID21 or W3ID22.

Cardinality: 0..n

provenance

Property: provenance

Verplichting: optional

URI: dct:provenance

Range:

Waardelijst:

Usage note: This property contains a statement about the lineage of a Dataset.

Cardinality: 0..n

release date

Property: release date

Verplichting: optional

URI: dct:issued

Range: xsd:date

Waardelijst:

Usage note: This property contains the date of formal issuance (e.g., publication) of the Dataset.

Cardinality: 0..1

rights

Property: rights

Verplichting: optional

URI: dct:rights

Range: Vrije tekst of URL

Waardelijst:

Usage note: This property refers to a statement that specifies rights associated with the Distribution.

Cardinality: 0..1

sample

Property: sample

Verplichting: optional

URI: adms:sample

Range:

Waardelijst:

Usage note: This property refers to a sample distribution of the dataset

Cardinality: 0..n

source

Property: source

Verplichting: optional

URI: dct:source

Range:

Waardelijst:

Usage note: This property refers to a related Dataset from which the described Dataset is derived.

Cardinality: 0..n

type

Property: type

Verplichting: optional

URI: dct:type

Range:

Waardelijst:

Usage note: This property refers to the type of the Dataset. A controlled vocabulary for the values has not been established.

Cardinality: 0..1

Versie

Property: Versie

Verplichting: optional

URI: adms:version

Range: Vrije tekst

Waardelijst:

Usage note: Versieaanduiding

Cardinality: 0..1

version

Property: version

Verplichting: optional

URI: owl:versionInfo

Range:

Waardelijst:

Usage note: This property contains a version number or other version designation of the Dataset.

Cardinality: 0..1

version notes

Property: version notes

Verplichting: optional

URI: adms:versionNotes

Range: Vrije tekst

Waardelijst:

Usage note: This property contains a description of the differences between this version and a previous version of the Dataset. This property can be repeated for parallel language versions of the version notes.

Cardinality: 0..n

Distributie

access URL

Property: access URL

Verplichting: mandatory

URI: dcat:accessURL

Range: URL

Waardelijst:

Usage note: This property contains a URL that gives access to a Distribution of the Dataset. The resource at the access URL may contain information about how to get the Dataset.

Cardinality: 1..n

description

Property: description

Verplichting: recommended

URI: dct:description

Range: Vrije tekst

Waardelijst:

Usage note: This property contains a free-text account of the Distribution. This property can be repeated for parallel language versions of the description.

Cardinality: 0..n

download URL

Property: download URL

Verplichting: recommended

URI: dcat:downloadURL

Range: URL

Waardelijst:

Usage note: This property contains a URL that is a direct link to a downloadable file in a given format.

Cardinality: 0..n

format

Property: format

Verplichting: recommended

URI: dct:format

Range: overheid:FileFormat

Waardelijst: http://publications.europa.eu/mdr/resource/authority/file-type/html/filetypes-eng.html

Usage note: This property refers to the file format of the Distribution.

Cardinality: 0..1

update/modification date

Property: update/modification date

Verplichting: recommended

URI: dct:modified

Range: xs:date

Waardelijst:

Usage note: This property contains the most recent date on which the Distribution was changed or modified.

Cardinality: 0..1

byte size

Property: byte size

Verplichting: optional

URI: dcat:byteSize

Range: Vrije tekst

Waardelijst:

Usage note: This property contains the size of a Distribution in bytes.

Cardinality: 0..1

checksum

Property: checksum

Verplichting: optional

URI: spdx:checksum

Range:

Waardelijst:

Usage note: This property provides a mechanism that can be used to verify that the contents of a distribution have not changed

Cardinality: 0..1

documentation

Property: documentation

Verplichting: optional

URI: foaf:page

Range:

Waardelijst:

Usage note: This property refers to a page or document about this Distribution.

Cardinality: 0..n

language

Property: language

Verplichting: optional

URI: dct:language

Range:

Waardelijst:

Usage note: This property refers to a language used in the Distribution. This property can be repeated if the metadata is provided in multiple languages.

Cardinality: 0..n

linked schemas

Property: linked schemas

Verplichting: optional

URI: dct:conformsTo

Range:

Waardelijst:

Usage note: This property refers to an established schema to which the described Distribution conforms.

Cardinality: 0..n

media type

Property: media type

Verplichting: optional

URI: dcat:mediaType

Range:

Waardelijst:

Usage note: This property refers to the media type of the Distribution as defined in the official register of media types managed by IANA.

Cardinality: 0..1

release date

Property: release date

Verplichting: optional

URI: dct:issued

Range: xs:date

Waardelijst:

Usage note: This property contains the date of formal issuance (e.g., publication) of the Distribution.

Cardinality: 0..1

status

Property: status

Verplichting: optional

URI: adms:status

Range: overheid:Status

Waardelijst: http://localhost:8000/v2.0.0/donl-status.json

Usage note: This property refers to the maturity of the Distribution

Cardinality: 0..1

title

Property: title

Verplichting: optional

URI: dct:title

Range: Vrije tekst

Waardelijst:

Usage note: This property contains a name given to the Distribution. This property can be repeated for parallel language versions of the description.

Cardinality: 0..n

Namespaces

De URIs zijn gespecificeerd als q-names ([namespace alias]:[term]). Daarbij zijn de volgende namespace aliassen als prefix gebruikt:

Alias Namespace
adms: http://www.w3.org/ns/adms#
dcat: http://www.w3.org/ns/dcat#
dcterms: http://purl.org/dc/terms/
foaf: http://xmlns.com/foaf/0.1/
overheid: http://standaarden.overheid.nl/owms/terms/
dcatnl: http://standaarden.overheid.nl/ds/terms/
rdfs: http://www.w3.org/2000/01/rdf-schema#
schema: http://schema.org/
skos: http://www.w3.org/2004/02/skos/core#
xsd: http://www.w3.org/2001/XMLSchema#
v: http://www.w3.org/2006/vcard/ns#

Namespace lookup - prefix.cc

De bedoeling van deze dienst is het vereenvoudigen van een gemeenschappelijke taak in het werk van RDF-ontwikkelaars: het onthouden en opzoeken van URI-voorvoegsels.

Je kunt de prefixen opzoeken in het zoekvak op de homepage of direct door URL’s in de browserbalk te typen, zoals https://prefix.cc/foaf of https://prefix.cc/foaf,dcterms,dcat.file.json.