Velden dataset huidig vs. nieuw
Er zijn nogal wat velden in de oude plugin, die ik niet terug zie komen in de nieuwe. Dat ligt er bij sommige velden misschien aan dat de veldnamen gewijzigd zijn, maar misschien ook niet. Dat kan ik eigenlijk niet zeggen, daar zou Hans Overbeek en/of Jeffrey waarschijnlijk meer over kunnen zeggen.
De velden die ik (nog) niet terug zie komen op dataset-niveau:
- high_value_dataset (ja/nee)
- dataset_status (beschikbaar/in onderzoek/niet beschikbaar/gepland)
- subtheme
- landingpage
- lod_stars
- md_uri
- md_uitgiftedatum
- md_titel
- md_omschrijving
- md_soortwijziging (:updated/:created/..)
- accessibility
- date_planned
- access_restrictions_reuse
- features
- grondslag
- grondslag_citeertitel
- tags
Volgens mij worden ze niet allemaal even actief gebruikt, maar ze waren wel onderdeel van de DCAT-DONL 1.0 specificatie.
Verder zie ik hernoemde velden, is dit echt gewenst (kan ik me overigens, vooral qua taal, wel voorstellen)?
- contact_point -> contact_email
- temporal_from -> temporal_start
- temporal_to -> temporal_end
- spatial -> spatial_scheme, spatial_value
- accrual_periodicity -> frequency
Er zijn enkele velden waar de betekenis heel duidelijk van moet zijn:
- maintainer (huidig: data-eigenaar)
- author (huidig)
- authority (nieuw)
- publisher (nieuw)
Wat is hier wat?
Er zijn ook enkele velden die we in de huidge plugin gebruiken voor faceting / display:
- maintainer_displayname
- theme_displayname
- maintainer_facet
- theme_facet
- subtheme_facet
Daarnaast zijn er diverse velden die CKAN zelf aan het model toevoegt:
- license_id
- license_title
- license_url
- type (dataset/...)
- private (true/false)
- maintainer_email
- author_email
- id
- revision_id
- state
- num_tags
- num_resources
- metadata_created
- metadata_modified
- owner_org
- creator_user_id
- isopen (true/false)
- groups ([])
- relationships_as_object ([])
- relationships_as_subject ([])
Tenslotte zijn er enkele velden die voor linkchecker en/of importdoeleinden gebruikt worden in de huidige plugin:
- source_deleted_datum (om pas na een aantal dagen daadwerkelijk te deleten bij een import)
- dataset_quality (o.b.v. validiteit links)
- duplicate_resources (t.b.v. het detecteren van duplicaten in de resources)
De velden bij resources zal ik in een los issue benoemen.