Recent is het aantal koppelingen dat door de producten uit het V-portfolio wordt ondersteund fors uitgebreid.
Al decennia ondersteunen de producten uit het V-portfolio (zie hier voor een korte beschrijving) mechanismes die bibliotheken in staat stellen in elkaars collectie te zoeken en metadata daaruit over te nemen. In en breder perspectief heeft deze problematiek heeft twee kanten: enerzijds records overnemen uit andere collecties en anderzijds (delen van) de eigen collectie elders opnemen, respectievelijk tijd besparen door gebruik te maken van het werk van anderen en de zichtbaarheid van de eigen collectie vergroten. We nemen beide aspecten hier onder de loep met enkele specifieke voorbeelden, – oude en nieuwe.
Ook al hebben de posts van deze maand met elkaar gemeenschappelijk dat ze dergelijke (bibliografische) koppelingen behandelen en dat diverse toegelichte standaarden, protocollen en interfaces aan elkaar gekoppeld zijn, toch kunnen ze ook los van elkaar worden gelezen. De onderwerpen zijn:
- Termennetwerk : een netwerk van termen, een netwerk van bibliotheken
- Z39.50 en SRU : niet nieuw, wel waardevol
- Sentinelle : zonder meerwerk uw collectie verrijken
- SPARQL : verbinden via het web
- Europeana : erfgoed nu nog vollediger
- LODS : uw collectie in Google en Bing
Termennetwerk : een netwerk van termen, een netwerk van bibliotheken
Termennetwerk is een toepassing van netwerk NDE (Nationaal Digitaal Erfgoed) met als doel erfgoed zo goed mogelijk te conserveren. Van hun website (https://termennetwerk.netwerkdigitaalerfgoed.nl/nl): “In het Netwerk Digitaal Erfgoed werken uiteenlopende organisaties en gemeenschappen samen. Het gezamenlijke doel: geschiedenis digitaal toegankelijk maken voor iedereen.”
De doelstellingen worden op allerlei manieren gerealiseerd, van kennisdeling over het opschonen van collecties tot het simultaan ondervragen van online thesauri. Er worden dus geen fysieke werkzaamheden door NDE uitgevoerd, maar er worden wel allerlei diensten en producten aangeboden die met elkaar gemeenschappelijk hebben dat ze samenwerking en informatiespreiding bevorderen. Een opvallend voorbeeld daarbij is Termennetwerk, wat het mogelijk maakt met een enkele zoekvraag diverse thesauri te ondervragen.
Voor V-smart is bij Rozet (Bibliotheek Arnhem) een koppeling met Termennetwerk gerealiseerd op basis van de ondersteuning voor het hierna toegelichte SPARQL. Kort door de bocht is het dit: Termennetwerk werkt volgens de principes van Linked Data wat inhoudt dat informatie wordt aangeboden in RDF en ondervraagd wordt via SPARQL (zie hierna).
Z39.50 en SRU : niet nieuw, wel waardevol
Z39.50 is een zoekprotocol om in “andere” databases te zoeken. Deze NISO- en ISO-standaard heeft een web-gebaseerde opvolger SRU (Search/Retrieve via URL). Bij beide protocollen is de betrokkenheid van The Library of Congress groot. (Meer over NISO leest u onderaan op deze pagina.)
Beide (basale) standaarden worden in diverse contexten gebruikt, zowel voor het zoeken in externe databases als voor het overnemen van zowel bibliografische als authority-data daaruit. Een volledig geautomatiseerd voorbeeld van dat laatste is de hierna toegelichte Sentinelle.
De ondersteuning van beide standaarden illustreert ons streven -waar mogelijk- standaardprotocollen (als onder andere SIP2, NCIP, OAI-PMH, SRU, ISO2709 of MarcXML te gebruiken). Wat zoeken betreft is dat dus de ondersteuning van zowel een relatief oud (Z39.50) als een relatief nieuw (SRU) protocol. (Een uitgebreider overzicht van ondersteunde standaarden, protocollen en interfaces vindt u hier en hier.)
Sentinelle : zonder meerwerk uw collectie verrijken
Records kunnen worden gekopieerd / overgenomen uit externe catalogi . Naast het traditionele online kopiëren, kan dit ook via verrijking. Dit principe heet Sentinelle, wat -na de initiële configuratie- een volledig geautomatiseerd mechanisme om lokale records “overschrijven” met een betere (rijkere) versie elders is. Dit kan niet alleen gebeuren voor bibliografische metadata, maar ook voor authorities. Het werkt zo: lokaal wordt er een voorlopig (kort, beknopt, “arm”) record ingevoerd; ’s nachts (eigenlijk: op een later tijdstip) worden deze overschreven door een “beter” (lang, volledig, ”rijk”) record uit een externe catalogus. In Frankrijk wordt dit veel gebruikt voor automatische verrijking via de BNF, de nationale bibliotheek van Frankrijk (een voorbeeld volgt hierna), in Nederland zou dit de GGC kunnen zijn. Het principe is gebaseerd op Z39.50. ‘s Nachts (bijvoorbeeld) kunnen lokale systemen (catalogi) worden bijgewerkt met “betere” versies uit de centrale catalogus. Die verrijking gebeurt op basis van een unieke identifier (bijv. ISBN) en verloopt via een laadprofiel (kortom: gebruikt dus de standaardprincipes van “vergelijken en samenvoegen” [“matching & merging”], wat gesofisticeerde mogelijkheden biedt om zowel records als individuele velden daarbinnen te overschrijven, af te wijzen of -in het geval van velden- data toe te voegen). Gegevens worden uit het externe systeem opgehaald via Z39.50 of SRU.
Sentinelle is een standaardfunctie van V-smart. Indien gewenst kunnen records van het proces worden uitgesloten.
Een voorbeeld van verrijking door BNF:
Het grote voordeel van Sentinelle is uiteraard de eenvoud van het proces: beperkte lokale werkzaamheden kunnen toch “rijke” metadata opleveren.
Sentinelle kan ook worden gebruikt voor het kopiëren van authoritydata.
SPARQL : verbinden via het web
SPARQL Protocol and RDF Query Language (SPARQL) is een gestandaardiseerde taal om vragen te stellen aan gegevens die in RDF-formaat zijn opgeslagen. RDF (Resource Description Framework) is een manier om informatie op te slaan in de vorm van tripletten: een structuur van subject-predicaat-object in het kader van het semantische web. Een voorbeeld van een triplet is. De doelstelling ia dat databases worden opgeslagen als zogenaamde triplestores en dan kunnen worden ondervraagd via deze SQL-achtige taal, – en elkaar daarbij nog begrijpen ook. Neem dit voor mensen begrijpelijke voorbeeld: het boek “De waanzinnige boomhut van 13 verdiepingen” is geschreven door de auteur “Andy Griffiths”. De triplet bestaat dus uit drie onderdelen, subject (De waanzinnige boomhut van 13 verdiepingen) , predicaat [het onderdeel dat de relatie tussen subject en object uitdrukt] (heeft auteur) en object (Andy Griffiths).
Enkele andere -nog meer basale- voorbeelden: Ik – drink – koffie, Piet – houdt van – Annie, Breda – ligt in – Nederland, Erwin – is collega van – Eric.
In RDF zou de data als volgt weergegeven kunnen worden (we gebruiken het voorbeeld van het boek):
<http://voorbeeld.org/boek/boomhut13>
<http://voorbeeld.org/kenmerk/heeftAuteur>
“Andy Griffiths”
Dit maakt het machineleesbaar en koppelbaar met andere gegevensbronnen. Die machineleesbaarheid heeft grote voorbeelden: de data is nu gestructureerd op een manier die door computers begrepen wordt: de inhoud (de betekenis) is toegankelijk geworden voor programma’s (dit wordt ook: “het semantische web” genoemd). (Heel basaal: vroeg je in een ver verleden aan een computer “hoe warm wordt het morgen in Amsterdam?”, dan kreeg je pagina’s waarin die woorden voorkwamen; nu krijg je als antwoord: 27 graden. Computers en software begrijpen elkaar, o.a. dankzij triplets.)
Voor LODS-installaties (zie hierna) bestaat de mogelijkheid een SPARQL-koppeling te activeren. Bij Rozet/Sambis kunnen gebruikers zo de Gelderse Trefwoorden opvragen. Hiervoor werd (technisch) gebruik gemaakt van Apache Jena Fuseki (https://jena.apache.org/documentation/fuseki2/) als SPARQL-server die gekoppeld werd aan V-smart. Die koppeling is vooral voor gebruik achter de schermen door geïnteresseerde partijen. Het is ook mogelijk de SPARQL-server direct te ondervragen via een eigen zoekinterface (front-end) die gekoppeld is aan de LODS-interface (zie hierna voor LODS).
Europeana : erfgoed nu nog vollediger
Europeana.eu is de portaalsite van de Stichting Europeana met hoofdkantoor in Den Haag waarop gedigitaliseerde collecties van Europese culturele en wetenschappelijke instellingen te vinden zijn.
Een groot aantal Europese culturele erfgoedobjecten wordt gedigitaliseerd door verschillende gegevensleveranciers uit de bibliotheek-, museum-, archief- en audiovisuele sector, die allemaal verschillende metadatastandaarden gebruiken. Deze gegevens moeten op een zinvolle manier worden weergegeven in een interculturele, meertalige context zoals Europeana.
Wereldwijd bestaan talrijke culturele erfgoedbronnen, zoals specifieke thesauri, die bij hergebruik waardevolle inhoud kunnen toevoegen. Daarbij moet echter dubbel werk worden vermeden. Linked Open Data (en daardoor ook de Linked Open Data-koppeling van V-smart; zie hierna) mist -door de voorgeschreven formaten (bijv. JSON-LD) van dit standaardprotocol- enkele gezaghebbende gegevens van de culturele erfgoedgemeenschap om bij te dragen aan de ontwikkeling van nieuwe kennis. Om deze hiaten in de context van Europeana te overbruggen is daartoe het Europeana Data Model (EDM) ontwikkeld.
Dit EDM-formaat werd in het V-portfolio toegepast in het kader van DAM Iguana.
Een voorbeeld van zo’n EDM record bij het Gelders erfgoed van Rozet Arnhem ziet u hier: https://www.sambis.nl/webopac/oai2.CSP?verb=GetRecord&identifier=oai:sambis.nl:VUBIS:2:100694&metadataPrefix=edm
LODS : uw collectie in Google en Bing
De LODS-interface is operationeel bij Vrije Universiteit Brussel en bij Rozet Arnhem. LODS staat voor Linked Open Data Services en biedt simpel gezegd het antwoord op de vraag “hoe krijg ik records uit mijn lokale collectie in Internetzoekmachines als Google Search en Bing?”. De werkwijze is eenvoudig: u hoeft alleen maar in V-smart een bewaarlijst te maken met daarin de records die aangeboden moeten worden aan de bots van de zoekmachine; deze bots zullen dan de aangeboden metadata oogsten en de records indexeren en opnemen in hun zoekinterface. Simpeler kan bijna niet: u maakt gebruik van eenvoudige en vertrouwde mogelijkheden in V-smart en wij regelen de achterliggende techniek. Of de records daadwerkelijk worden opgenomen en welke positie ze krijgen in de ranking, wordt niet door ons bepaald. Meer dan aanbieden kunnen wij technisch namelijk niet.
Dankzij LODS is misschien wel de belangrijkste Heilige Graal van de IT geregeld: uw collectie is nu vindbaar via de zoekmachines waar uw klanten dag-in-dag-uit mee zoeken en zit niet langer opgesloten in een silo. Als zij in Google of Bing klikken op een link, leidt dat weer naar uw lokale Iguana: kortom, zo ontstaat een ideaal middel om gebruikers naar uw lokale website toe te trekken.
En u heeft de controle: u bepaalt welke records wel of niet worden aangeboden.
Meer over LODS leest u hier.
Commercieel
Z39.50 en SRU zijn geïntegreerd in V-smart (client-zijde).
De link met Europeana is onderdeel van de OAI-PMH-koppeling.
Voor SPARQL gelden separate licentie- en installatiekosten.
LODS is een standaardonderdeel van een toekomstige versie van Iguana, maar kan ook nu al worden geïnstalleerd.
Neem contact op met uw accountmanager voor meer details.