Les mégadonnées (big data) et moi…
Les mégadonnées vont ouvrir des horizons inexploités dans des domaines aussi différents que la pertinence des campagnes de marketing, la qualité des prévisions dans toutes les activités, de la météo aux risques d’apparition d’une maladie, la précision dans l’évaluation des besoins de toute sorte. Et bien sûr, le dernier de ces horizons n’est pas la question cruciale du respect de l’intimité de la vie privée des individus…
Le principe de la « fouille » ou de l’extraction de connaissances à partir de textes et de données (Text and data mining – TDM) consiste en un accès généralisé aux données provenant de tous les services possibles, particulièrement les services publics. Mais ce principe exclut absolument toute trace permettant de lier les données aux individus. On doit pouvoir croiser toutes sortes de mégadonnées et en extraire quasi-instantanément des conclusions et des prévisions à tous niveaux, de la recherche la plus pointue au tableau de bord interprétable par tout un chacun.
Les bibliothèques pourraient être au cœur de ces expériences et du contrôle du respect de l’anonymat des personnes. Les données, anonymisées, pourraient être maniées ensuite pour améliorer le service offert. L’analyse statistique, la gestion intelligente des résultats de recherche et leur affichage pertinent, des taxonomies adaptées, des acquisition améliorées, des services plus appropriés pourraient naître de ces usages… Les bibliothèques pourraient également fouiller d’autres données que les leurs et faciliter la connaissance et la mise à disposition des très nombreuses sources de mégadonnées… En quelque sorte créer une « fouille des fouilles » de mégadonnées, redonnant ainsi vie au rêve borgésien…
La notion de système ouvert et de données accessibles à tous et pour toutes sortes d’usages, sera au cœur de la conception des futurs systèmes de bases de données… Des web services intelligents seront développés pour interagir avec d’autres services, publics et commerciaux. Que ce soit dans un congrès de hackers, dans un projet de recherche, pour illustrer un programme politique ou pour vérifier la pertinence d’une offre commerciale… Et les bibliothèques pourront aussi avoir accès à tous ces données, pour les proposer, certes, mais aussi pour s’en servir afin d’améliorer leur stratégie ou leurs offres.
En améliorant la qualité des métadonnées, de leur structuration, des web services et des tableaux de bords utilisés dans les bibliothèques et par les bibliothécaires, on améliorera le fonctionnement et l’offre des bibliothèques, des musées, des archives et l’on contribuera à faire évoluer ces institutions vers un avenir de plus en plus numérique…
//Sven Totté