Rene Van den Heuvel, expert produit, Axiell :
Que sont les identifiants pérennes (Persistent Identifiers – PID) et quel est leur lien avec les données ouvertes liées (Linked Open Data – LOD) ?
De nos jours, de plus en plus d’organisations partagent leurs données avec d’autres organisations et des systèmes externes. Le partage des données est devenu si important que le fait de se référer à des données gérées ailleurs peut rendre inutile, voire indésirable, la création de copies redondantes de ces même données.
Pour faire appel à des données ouvertes et gérées ailleurs, un identifiant pérenne et sans ambiguïté est nécessaire. Il s’agit d’un identifiant permanent (PID). Ce PID ne doit jamais changer une fois attribué car d’autres organisations utiliseront ces PID pour faire référence à des objets, des métadonnées, des concepts, des détails de personnes, etc. qui sont gérés dans le système d’une organisation ou d’une tierce partie.
Le fait de rendre les données « liées » et « ouvertes » n’est pas seulement pertinent pour les objets d’une collection, mais aussi pour les noms, les descripteurs et la terminologie normalisée qui sont utilisés pour décrire ces objets.
En réalité, toute donnée peut être partagée en tant que donnée ouverte. Par exemple, lorsque des ressources de vocabulaire ouvertes telles que le Getty AAT sont utilisées pour décrire un objet, les PID des termes/concepts utilisés peuvent être stockés dans la base de données Axiell Collections. Lors de la publication d’enregistrements d’objets en tant que données ouvertes liées, ces enregistrements contiendront des références à ces concepts du Getty AAT.
Cela signifie non seulement que la signification et le contexte de chaque terme/concept sont clairs, mais cela permet également de créer des liens avec des données provenant d’autres ensembles de données qui utilisent les mêmes concepts/termes identifiables comme descripteurs. Par exemple, si un mot-clé utilisé pour indiquer le lieu de création est « Londres », ce serait un descripteur ambigu car il existe de nombreux endroits dans le monde qui s’appellent Londres. Mais si, en plus (ou même à la place) du terme « Londres », son ID source du TGN de Getty était listé (http://vocab.getty.edu/tgn/7011781), alors nous saurions de quel Londres il s’agit ici.
Par conséquent, il est pertinent de pouvoir gérer les PID dans toutes les entités du système. Dans certains cas, les PID sont les ID de l’organisation, dans d’autres cas, les PID de parties externes sont stockés dans le système.
Les PID sont la base même de la mise en relation des données.
Coopération entre NDE, Packed et plusieurs musées
Pour discuter de la manière dont les PID et la technologie Linked Open Data pourraient être mis à disposition et accessibles au plus grand nombre de clients d’Axiell, une coopération unique a été lancée avec le NDE (Réseau néerlandais du patrimoine numérique aux Pays-Bas), le Packed (Patrimoine numérique des Flandres, Belgique, maintenant appelé Meemoo) et un certain nombre de musées et d’organisations patrimoniales qui utilisent les systèmes de gestion des collections d’Axiell.
Au cours de divers ateliers, le groupe de travail a discuté de la manière dont une mise en œuvre des PID et des LOD serait la plus bénéfique pour le secteur du patrimoine et comment cela pourrait être mis à la disposition du secteur.
Cette coopération a abouti à une mise en œuvre de la gestion des PID dans Axiell Collections qui est flexible et facile à utiliser et qui est maintenant disponible pour toute organisation qui souhaite l’utiliser.
En outre, le groupe de travail a créé des modèles pour la publication des données dans les formats LOD (par exemple, EDM-Europeana Data Model et DC-Dublin Core) qu’Axiell a adoptés et a intégré aux solutions standardisées d’Axiell Collections pour garantir leur maintenance et leur mise à jour dans les futures versions du logiciel.
Mise en œuvre du PID dans Axiell Collections
La dernière version de l’application Axiell Collections (V5.0) comprend une fonctionnalité de gestion du PID. Cette implémentation contient des champs PID pour toutes les entités de la base de données Axiell Collections.
Il est possible de configurer des URI et des URL par défaut/initiaux qui seront attribués automatiquement par le système lors de la création des enregistrements, en utilisant éventuellement un GUID (Globally Unique Identifier) unique, également appelé UUID (Universally Unique Identifier).
Les URI peuvent se référer à votre propre domaine Internet mais peuvent également être enregistrés auprès de fournisseurs de services externes en utilisant le Handle System. Cela permet de garantir que si le nom de votre organisation change à l’avenir, et par conséquent que votre nom de domaine internet est également modifié, les NID/URI qui sont liés à vos données restent inchangés.
Les URI du Handle System utiliseront le domaine handle.net et, avec un identifiant unique du musée/archive, appelé préfixe, pourraient par exemple ressembler à ceci : https://hdl.handle.net/11259/collection.20356, où 11259 est le préfixe du musée d’Amsterdam et la section après le préfixe est l’identifiant interne d’un objet de la collection du musée.
Lorsque l’on fait appel à des fournisseurs de services externes pour l’enregistrement du PID, ces URI externes doivent être transmis à l’URL réelle qui renvoie à l’objet ou à d’autres données. Par conséquent, l’URI externe doit être associé à l’URL réelle. Cette association se fait en enregistrant la paire URI/URL auprès d’un fournisseur de services externe tel que SurfSARA.
Lorsque l’URI (avec le domaine handle) est référencé, le fournisseur de services s’assure qu’il renvoie à l’URL réelle. Ainsi, lorsqu’à l’avenir l’URL change (par exemple en raison d’un changement de nom entraînant une modification du nom de domaine internet), il s’agit simplement de mettre à jour l’enregistrement de la nouvelle URL à l’URI permanent dans le système du prestataire de services.
La mise en œuvre actuelle de l’enregistrement PID dans Axiell Collections utilise Handle.net et SurfSARA comme fournisseur de services, mais d’autres systèmes peuvent également être mis en œuvre.
Le processus d’enregistrement URI/PID dans Axiell Collections permet à l’utilisateur autorisé de sélectionner un nombre quelconque d’enregistrements prêts à être publiés en tant que données ouvertes liées ou nécessitant une mise à jour.
Publication/présentation des données ouvertes liées
Pour que vos données soient disponibles sous forme de données ouvertes liées, il faut que vos données soient exprimées dans un format que d’autres systèmes peuvent interpréter. Alors qu’une page web html d’un objet peut être lue par un humain, un système voudrait recevoir les données d’une manière technique et non ambiguë.
C’est pourquoi diverses normes ont été développées pour exprimer les données sous une forme que d’autres systèmes peuvent comprendre. Il s’agit généralement des formats RDF (Resource Description Framework). Le RDF est un modèle standard pour l’échange de données sur le web. Les formats actuellement disponibles dans la mise en œuvre de la LD d’Axiell Collections comprennent Dublin Core, Europeana Data Model, Linked-Art (basé sur CIDOC-CRM) et Schema.org
Les feuilles de style XSLT pour ces formats peuvent être liées à l’Axiell WebAPI pour transformer vos données dans ces formats. D’autres formats peuvent être ajoutés si nécessaire.