Laat AI u helpen en word een slimmere bibliotheek

AI, artificiële intelligentie, was de afgelopen periode in het nieuws een nauwelijks te missen trend. AI zorgt voor een revolutie in de technologiesector en als zodanig heeft Axiell de potentiële toepassingen van AI voor bibliotheken en voor onze oplossingen onderzocht. In deze blog geven we een overzicht van de proof of concept die we hebben uitgevoerd en stippen we zowel voordelen als risico’s van deze technologie aan.

IT-trends gaan en komen, maar AI is net als “cloud” bijvoorbeeld, een “blijvertje”. AI kent vele verschijningsvormen. Om er enkele opvallende te noemen: Deepfake, zelfrijdende auto’s, “text to image” (je tikt een tekst en op basis van de input wordt een plaatje gemaakt) en -in onze context de meest relevante- ChatGPT.

In dit geval gaat het om tekstuele AI, die gebaseerd is op een taalmodel. Al snel komt dan het begrip “semantische triplets” (bijv. Harry – vertelt – een verhaal) om de hoek kijken.

AI staat dus voor artificiële, “kunstmatige” intelligentie. De wat rare term (onze huizen of auto’s noemen we ook niet “artificieel”) slaat concreet op “niet rechtstreeks uit het menselijke brein ontstane intelligentie”. Maar uiteindelijk toch menselijke intelligentie dus. Wat bij AI voortdurend wordt toegepast is “machine learning”: een computerprogramma analyseert (doorgaans door mensen gecreëerde) informatie en komt op basis van (o.a.) tekstuele analyse en patroonherkenning tot een antwoord op een gestelde vraag.

Ook al zou je AI een hype, een alomtegenwoordige trend, kunnen noemen, toch zijn er in onze producten aI tijden diverse toepassingen van AI: “Wie dit leent, leent ook”, autocomplete, “best match” en trefwoordvoorspelling zijn sprekende voorbeelden.

 

De POC met ChatGPT

ChatGPT is een chatbot. Op basis van een taalmodel wordt beschikbare data (doorgaans is dat: data op het Internet) geanalyseerd en worden vragen beantwoord. ChatGPT is ontwikkeld door OpenAI, een bedrijf dat ook bekend is van DALL-E, een tekst-to-image-toepassing. Elon Musk is één van de oprichters van het bedrijf. OpenAI is ook bekend vanwege de grote kapitaalinjectie door Microsoft in 2023 en ChatGPT is ook de basis van diens Copilot (dat nu opgenomen is in o.a. Office365 en Bing).

Wij hebben in 2023 diverse POC’s met ChatGPT uitgevoerd. Die POC’s (proof of concept) waren erop gericht te onderzoeken wat ChatGPT kan bieden. De doelen waren (o.a.): ervaring opdoen, de bruikbaarheid in de productportfolio analyseren, evalueren of de principes ook werken voor recente materialen, of versies van ChatGPT uitmaken, wat de kosten zijn, of je bron van de informatie kunt achterhalen en of je de response moet beschouwen als een “voorstel” ter inspiratie en eventueel correctie of dat je er volledig automatisch op kunt vertrouwen.

Onderzocht is de bruikbaarheid voor het automatisch genereren van een samenvatting, suggesties (“mogelijk interessant” / “lijkt op”), stemming (vrolijk, “donker”, …), complexiteit (moeilijk, makkelijk, …) en kwaliteit (uitgedrukt als rapportcijfer, van 1-10). Ook trefwoordvoorspelling en het creëren van metadata op basis van een cover zijn geëvalueerd.

Simpel gesteld was dit de POC: we stelden via een API zoekvragen aan ChatGPT met metadata uit bibliografische records (uit V-smart) als input. Er waren meer dan vijf tests (met verschillende soorten databases / records, met verschillende versies van ChatGPT, soms meerdere keren met dezelfde versie, enz.).

De voorbeelden die u hier ziet zijn een samenvatting en een zoekactie met het facet “complexiteit” (de rode kaders zijn toegevoegd omwille van de duidelijkheid):

De tests zijn nog niet afgerond en de bruikbaarheid is soms moeilijk te beoordelen, maar er kunnen wel al voorzichtige conclusies worden getrokken. ChatGPT lijkt bruikbaar. Wat te beoordelen is lijkt redelijk OK, al zijn er zeker ook “minpunten”. Dat zijn dan het met name het optreden van “ruis” (fouten, de “hallucinaties”) en het gegeven dat resultaten niet gelijk zijn bij meerdere “runs” met dezelfde versie (wat begrijpelijk is omdat het om “machine learning” gaat: de hoeveelheid input-data maakt wel degelijk uit). Het lijkt verstandig een disclaimer op te nemen (en dus enig voorbehoud te maken).

 

De baten en de risico’s

Hoe dan ook lijkt ChatGPT inzetbaar, minimaal als hulp bij diverse taken. De potentiële tijdwinst lijkt groot. Het is dan ook ons plan om (waarschijnlijk optioneel -dus configureerbaar- AI meer te gaan inzetten in onze producten, – met name in Iguana). Sowieso lijkt het essentieel dat wordt vermeld dat het om resultaten gaat die via AI zijn gegenereerd.

Er is natuurlijk de afweging tussen die baten en de potentiële risico’s. Er is het risico dat de vooroordelen, de stereotiepen, het racisme, etc. van de makers overgaan in de programmatuur, in de AI dus. Er zijn morele issues. Willen wij dat ChatGPT de speech van de president schrijft? Is het acceptabel dat Harry van de Broek eigenlijk Mark Rutte is? Willen wij dat Mark Rutte een kapsalon aanprijst? Willen wij behandeld worden door een dokter die haar samenvattingen liet maken door ChatGPT?

Of hoeven we ons daar niet druk om te maken? Is het niet artificieel, niet fake, maar is het “blenden”, – wat we al vele decennia lang doen in ons eten (“fusion”), ons eten (de letter “E” in vele producten), onze cultuur (denk aan samples in muziek), onze films, etc.

Of gaat het hier om iets fundamenteel anders en duikt de vraag “Wat is waarheid?” hier wel erg pertinent op? Kortom: is AI een hulpmiddel waarmee we de creativiteit en de werkelijkheid een handje helpen of is het een groot risico waarmee we een ongekende bedreiging introduceren en waarmee het aura van neutraliteit en betrouwbaarheid van bibliotheken wordt aangetast?

 

 

 

 

 

Geïnteresseerd in het werk dat we doen met AI voor musea en archieven? Dit project is uitgevoerd in samenwerking met enkele van Europa’s toonaangevende collectie-instellingen. Luister naar Stephen McConnachie van het British Film Institute over het gebruik van AI om mensen, plaatsen en organisaties te identificeren aan de hand van televisietranscriptiegegevens. Luister hier naar deze lezing (of andere) van ons Digital Days-evenement: https://www.axiell.com/digital-days-24-museums-archives/ (Engelstalig, registratie is noodzakelijk).

Abonneer u nu op onze maandelijkse nieuwsbrief