Publiée une fois par année, la Revue électronique suisse de science de l'information (RESSI) a pour but principal le développement scientifique de cette discipline en Suisse.
Présentation de la revue
Contenu du site
Se connecter
OPAC
Utilisabilité des interfaces de recherche à facettes proposées par les opac de nouvelle génération
Ressi — 1 décembre 2011
Claire Dugast, Institut Pasteur, Paris
Résumé
Le but de cet article est de présenter différents systèmes de navigation à facettes offerts par les opac de nouvelle génération, en s’intéressant essentiellement à la question de leur utilisabilité. Depuis 2006, le renouveau des catalogues informatisés de bibliothèques met en avant la volonté de mieux répondre aux besoins des utilisateurs et surtout de s’adapter à leurs nouveaux comportements informationnels. Après un rapide état de l’art de tests effectués sur l’utilisabilité des interfaces de recherche à facettes, cette étude présente un panorama des caractéristiques de ces outils. L’article est suivi d’une liste des différentes solutions d’opac NG équipées de facettes existant à ce jour et d’une liste de bibliothèques à travers le monde ayant adopté ces solutions.
Utilisabilité des interfaces de recherche à facettes proposées par les opac(1) de nouvelle génération
1. Introduction
Les catalogues de bibliothèque se sont informatisés autour des années 1970 et se sont dotés, génération après génération, de fonctionnalités de recherche d’information en ligne. Néanmoins, restés en marge de la révolution technique qui a fait entrer le monde dans l’ère du web au milieu des années 1990, ils n’ont finalement rien su offrir de plus qu’un catalogue papier informatisé.
Depuis le lancement d’Endeca en 2006 par les North Carolina State University Libraries, un espoir réside dans l’opac de troisième génération, ou opac nouvelle génération (NG). L’opac NG est un catalogue dont les fonctionnalités développées visent à répondre aux attentes et aux besoins des utilisateurs, à conserver le meilleur de l’opac classique et à en pallier les manques en s’inspirant du meilleur des moteurs de recherche. En plus de permettre l’accès au document sous sa forme numérique quand cela est possible, l’opac NG peut s’apparenter à un véritable moteur de recherche en interrogeant un ensemble d’informations disponibles sur le site web d’une bibliothèque, dans les bases de données auxquelles cette dernière est abonnée ou directement sélectionnées sur le web. Ses fonctionnalités peuvent être regroupées selon deux principes : un principe d’immédiateté, définissant un outil intuitif et simple d’usage, et un principe de participation, faisant référence aux fonctionnalités du web 2.0. Et puisque l’opac de nouvelle génération est conçu pour les usagers de bibliothèques, son développement s’accompagne d’une méthodologie d’évaluation orientée vers ces derniers.
1.1. Une fonctionnalité de la nouvelle génération : la navigation à facettes
L’un des principes de l’opac NG est d’éviter le silence en favorisant une requête bruyante qui sera affinée au fur et à mesure grâce notamment à une navigation à facettes. Ce type de navigation permet de limiter sa recherche par étape et a posteriori sans risquer d’aboutir à « 0 résultat » car les options à sélectionner sont proposées en fonction des réponses disponibles (contrairement aux filtres existant déjà dans les opac de deuxième génération).
Chaque facette correspond à un type d’information concernant le document, généralement une zone ou sous-zone de catalogage (langue, auteur, subdivision géographique de la vedette matière, etc.). Après la saisie d’un terme de requête, il est possible de visualiser les résultats regroupés en fonction des différentes facettes disponibles, chacune d’entre elles présentant une liste de métadonnées accompagnées du nombre de documents qu’elles décrivent. L’usager peut alors sélectionner une de ces métadonnées, que nous appellerons descripteur, ce qui aura pour conséquence de réduire le nombre de résultats et surtout d’en rendre la liste plus pertinente pour l’usager. Les facettes sont donc simplement des critères de restriction permettant d’établir une « cartographie dynamique des résultats » (Tosca Consultants, 2008).
Dans le contexte des recherches par vedette-matière, Michael Buckland (1999) constate qu’il est plus facile pour une personne de reconnaître un terme pertinent que de le deviner. Il est possible d’étendre ce constat au document : il est plus facile de reconnaître un document pertinent que de le deviner. Or les catalogues traditionnels nécessitent qu’un utilisateur qui ne connaitrait pas la collection soit en mesure d’en deviner le contenu. Comment échapper autrement aux réponses telles que : « Il n’y a pas de résultat à votre requête » ? L’intérêt de la navigation à facette est que celle-ci ne nécessite aucune connaissance préalable ni de la collection ni de la façon dont celle-ci est décrite dans le catalogue, ni d’aucune syntaxe pour formuler sa requête. L’usager se voit présenter un aperçu de la collection et a le sentiment d’exercer une certaine liberté dans sa recherche d’information. Un autre intérêt est que ce type de navigation est utilisé depuis quelques années dans plusieurs sites web très populaires. Les usagers d’Internet sont donc tout à fait familiers avec ce type d’outil (Breeding, 2007).
1.2. Importance de l’utilisabilité
L’accès à une ressource doit satisfaire trois critères : fiabilité, utilité, et moindre coût. Le coût ne se limitant pas à l’argent dépensé mais s’appliquant aussi au temps passé et à l’effort fourni, notamment pour apprendre à utiliser l’interface. Une recherche d’information, motivée en premier lieu par un manque de connaissance, se prête difficilement à l’élaboration préalable d’une stratégie de recherche. C’est au cours de la recherche, que l’usager va progressivement pouvoir se faire une idée de ce qu’il cherche et de ce qu’il ne cherche pas. Dès lors, le coût d’une recherche est plus élevé dans un catalogue de bibliothèque que sur un moteur de recherche.
L’utilisabilité est un néologisme utilisé pour traduire le terme anglais « usability ». Jakob Nielsen (2003) la définit comme une qualité jugeant de la facilité d’utilisation d’une interface. Le terme fait également référence aux méthodes permettant d’améliorer cette facilité d’utilisation. Une interface facile à utiliser, c’est une interface :
- qu’un usager est capable d’utiliser même pour la première fois, même sans rien en connaitre ;
- avec laquelle l’usager peut effectuer une tâche rapidement dès qu’il est familier avec l’interface ;
- dont l’usager retrouve facilement la maitrise même après une période sans utilisation ;
- dans laquelle l’usager fait peu d’erreurs et le cas échéant, des erreurs faciles à corriger ;
- dont l’utilisation est plaisante.
Le processus de recherche est identifié comme le premier problème d’utilisabilité des sites web. Outre la fragilité du système lui-même, le manque de connaissance des stratégies de recherche peut être une explication aux difficultés rencontrées par les usagers pour trouver une information (Uddin, 2007). La navigation à facettes apporte la flexibilité et le sentiment de contrôle et de liberté nécessaires à l’utilisabilité d’une interface (Nielsen, 2005).
2. Etudes sur les interfaces de navigation à facettes
De sa revue de littérature publiée en juin 2010 sur les études d’utilisabilité des systèmes de navigation à facettes, Jody C. Fagan tire un certain nombre de recommandations pour conduire dans les meilleures conditions une étude efficace. Il a regroupé la littérature en deux catégories, les études portant sur les systèmes de navigation à facettes et les études portant sur les catalogues de bibliothèque offrant une navigation à facettes. Dans le premier cas, il s’agit de tester des systèmes afin d’étudier les comportements des utilisateurs ou d’évaluer les améliorations à apporter au système en cours de développement. Dans le second cas, il s’agit plutôt d’aider une bibliothèque à une prise de décision concernant l’acquisition d’un tel catalogue. Dans ce dernier cas, J. C. Fagan constate que les études sont rarement spécifiquement sur l’utilisabilité des facettes mais plutôt sur l’utilisabilité générale du produit et sont moins rigoureusement scientifiques que les précédentes.
2.1. Accueil favorable du principe de facettes
En 2008, une étude est menée pour comparer le système de recherche et le système de navigation des bibliothèques numériques de trois institutions : the Association for Computing Machinery Digital Library, the Institute of Electric and Electronic Engineering Computer Society Digital Library, the Institute of Electric and Electronic Engineering Xplore Digital Library. Cette étude montre qu’entre un système de recherche et un système de navigation, de nombreux usagers préfèrent la combinaison des deux et qu’il faut favoriser une interaction riche entre l’interface et l’usager. L’interface à facettes offre flexibilité et l’interaction, répondant ainsi à la diversité des approches cognitives des usagers (Zhang, 2008).
Toujours en 2008, Tamar Sadeh présente comment la société Ex Libris développe les fonctionnalités de son nouvel opac Primo grâce à des test d’utilisabilité menés par l’université du Minnesota. Il en résulte que la navigation à facettes est considérée comme l’un des outils qui fait la différence avec d’autres interfaces (Sadeh, 2008).
2.2. Evaluation de l’utilisabilité
En 2003, une étude compare l’interface à facettes Flamenco à une interface classique pour chercher des images dans une collection qui en compte 35 000 (Yee, 2003). En 2007, Tod A. Olson décrit une étude menée pour comparer un ancien système de recherche avec la navigation à facettes et le nuage de mots d’Aquabrowser. Son objectif est de savoir si le catalogue à facettes et à nuages de mots aide l’usager dans la découverte de documents (Olson, 2007). En 2007 encore, Uddin décrit une étude menée pour comparer le prototype d’un système de recherche proposant trois interfaces dont deux à facettes avec un système classique. L’objectif est alors d’évaluer l’efficacité de l’accès et de la recherche, la compréhension du contenu de l’information, la commodité de la navigation, la pertinence des résultats et la satisfaction générale de la recherche. (Uddin, 2007). En 2008 enfin, une étude est menée à l’université de Sheffield pour évaluer, parmi les différentes fonctionnalités d’un opac NG, quelles sont celles que préfèrent les usagers (Tam, 2009).
Ces différents tests sont relativement similaires et consistent à demander à un groupe de participants d’effectuer des tâches sur plusieurs systèmes. Leurs réactions sont enregistrées et à l’issue du test, leur expérience fait l’objet d’un questionnaire. Tous les participants viennent du milieu universitaire, ont des expériences différentes de l’Internet et des niveaux d’étude et de recherche différents. Il résulte pour tous les systèmes testés que l’approche à facettes est très appréciée par les usagers. 90% des participants ayant testé Flamenco déclarent préférer l’approche à facettes, car elle est perçue comme permettant d’en apprendre plus sur la collection, plus flexible et plus facile d’utilisation (Yee, 2003). Dans le cas de l’université de Sheffield, non seulement les usagers trouvent l’approche utile, efficace, facile, permettant de gagner du temps et d’avoir une idée générale claire des résultats de la recherche, mais elle ressort comme la fonctionnalité préférée des participants, avant même le tri par pertinence, le correcteur d’orthographe et les fonctionnalités du web 2.0 (Tam, 2009). De plus, l’approche à facettes n’est pas seulement source de satisfaction au regard de l’efficacité de la recherche, son utilisation est une expérience, qualifiée d’agréable (Uddin, 2007). Malheureusement, les résultats, même positifs, ne permettent pas toujours de distinguer l’apport de la navigation à facettes de celui des nuages de mots (Olson, 2007).
Ces études montrent principalement ce que ceux qui les ont conduites au départ voulaient montrer : l’intérêt de mettre en place un système de classification à facettes. En revanche, elles ne révèlent pas ce à quoi doit ressembler le système. Nous avons donc cherché des études d’évaluation de l’utilisabilité de certains prototypes.
Figure 1 - Flamenco : Fine Arts Museum of San Francisco
Figure 2 – TALIS Plus : State Library of Tasmania
Flamenco (FLexible information Access using MEtadata in Novel COmbinations) est un projet d’interface de recherche mettant en avant la présentation des métadonnées hiérarchisées en facettes. Son développement (Fig. 1) et celui de TALIS Plus (Fig. 2) ont donné lieu à des tests et des observations qui ont permis de faire un certain nombre de choix que nous présentons ici. Le peu d’études que nous avons trouvées sur le sujet nous amène à envisager ces choix comme d’éventuelles idées et non comme des recommandations.
Nous avons réparti les différentes questions inhérentes à l’utilisabilité des systèmes à facettes en quatre catégories :
- comment l’usager devrait-il pouvoir accéder aux facettes ?
- à quoi l’espace de navigation à facettes devrait-il ressembler ?
- comment devraient être organisés facettes et descripteurs ?
- comment devrait fonctionner la navigation ?
2.2.1. Comment l’usager devrait-il pouvoir accéder aux facettes ?
Les facettes peuvent apparaître après le lancement d’une première requête, mais leur présence dès la page de départ, sous le cadre de saisie de la recherche par mot-clé permet de visualiser l’ensemble de la collection et suscite une impression positive d’organisation en plus de donner des idées de recherche (Yee, 2003)
2.2.2. A quoi l’espace de navigation devrait-il ressembler ?
Combien faut-il montrer de facettes à l’usager ?
Nous n’avons pas trouvé de préconisation quantitative sur la question. D’après Marti Hearst (2006) il est pertinent de montrer toutes les facettes disponibles car la découverte multidimensionnelle de l’ensemble d’une collection est, nous l’avons vu, une possibilité appréciée par les usagers.
Sous quelle forme afficher les facettes ?
Les enquêtes d’utilisabilité sont unanimes sur le fait qu’il est indispensable de montrer immédiatement les résultats d’une requête, quel que soit le type d’interface. Il peut donc sembler plus pertinent d’afficher les facettes sur le côté de l’écran car si elles sont en haut de l’écran, il faut alors descendre pour voir les résultats. Si les facettes sont nombreuses et qu’elles possèdent beaucoup de descripteurs, pour éviter d’avoir à descendre longuement en bas de la fenêtre, une solution peut être d’afficher un nombre limité de facettes (celles dont il a été montré qu’elles suscitent le plus grand intérêt) et de proposer les autres, sans les développer, sur une ligne en-dessous. (Hearst, 2006) En outre, M. Hearst préconise de continuer de faire apparaître les noms des facettes même quand celles-ci n’ont plus de descripteur disponibles.
A l’époque de la rédaction de son article, M. Hearst manifeste un certain intérêt pour une solution similaire adoptée par eBay Express et apparemment bien accueillie par les usagers. L’originalité de cette présentation réside dans le fait que lorsque l’usager sélectionne un descripteur, la facette correspondant disparaît (pour apparaître dans le fil d’Ariane) et laisse la place à une des facettes listées en-dessous. Il faut cependant noter qu’eBay Express a fermé ses portes en 2008 et que nous ne savons pas si ce type de présentation a été développé ailleurs.
Ambigüité de la transparence
Notons qu’une étude menée en 2009 à la bibliothèque de l’Université de York, sur le système VuFind montre l’ambiguïté que peut susciter la transparence d’un système à facettes. En effet, en voyant le nombre d’occurrences pour chaque descripteur, certains utilisateurs se demandent pourquoi la somme des nombres indiqués ne correspond pas toujours au nombre total de résultats et ont alors tendance à remettre en cause la fiabilité du système (Denton, 2011).
2.2.3. Comment devraient être organisés facettes et descripteurs ?
Quelles sont les facettes utiles ?
Les études montrent que la réponse varie d’un participant à un autre et que chacun est capable d’évaluer ce qui lui semble utile et ce qui lui semble inutile. Il est néanmoins constaté que le format est une catégorie qui revient à plusieurs reprises parmi les facttes utiles (Olson, 2007). En revanche, celle de la cote n’est jamais utilisée et celle du sujet l’est plus ou moins avec des résultats plus ou moins satisfaisants (Bauer, 2008). D’après W. Denton (2011), les utilisateurs ne font pas la distinction entre « subjects » (qui renvoient à la classification) et « topics » (qui renvoient aux vedettes-matières). De plus, une confusion existe à propos des facettes de périodes et de lieux car les utilisateurs ne savent pas toujours s’il s’agit des périodes et lieux de publication ou du sujet. De même lorsqu’un descripteur apparaît sous plusieurs catégories, comme par exemple « musique » qui peut apparaître dans la facette « format » et « sujet » (Olson, 2007).
Dans quel ordre afficher les facettes ?
Les facettes peuvent être regroupées avec d’autres facettes avec lesquelles elles peuvent partager des caractéristiques communes. L’agence Getty Images (Fig. 3) utilise cette technique en regroupant par exemple sous une thématique « Personnes » les facettes « Nombre de personnes », « Age », « Sexe », etc.
Figure 3 - Getty Images
Figure 4 - Yelp
Le site web Yelp (Fig. 4), un site de critiques à San Francisco retient l’attention de M. Hearst (2006) : la saisie d’un mot-clef au cours de la recherche détermine l’ordre des descripteurs montrés dans les facettes afin de correspondre à des concepts liés au mot-clé saisi. La fonctionnalité de tri par pertinence vient alors soutenir celle des facettes.
Comment présenter les descripteurs ?
Figure 5 - Flamenco : Fine Arts Museum of San Francisco (Facette simple)
Au sein d’une facette, les descripteurs peuvent être triés par ordre alphanumérique, par occurrence ou selon une logique thématique. Dans le cas de facettes dites plates (la facette « Peintre » contient les descripteurs ‘Paul Klee’, ‘Jean Monet’, etc.), des études montrent que les usagers préfèrent les tris prévisibles comme le tri alphanumérique (Hearst, 2008). Cependant si le nombre de descripteurs est trop important pour les faire apparaître tous, il devient plus pertinent de les afficher par ordre d’occurrence et d’insérer un lien permettant d’en voir plus. Flamenco permet aux usagers de choisir entre le tri alphanumérique et le tri par d’occurrences. Néanmoins, T. A. Olson (2007) constate que l’organisation des descripteurs par ordre de fréquence ne semble pas pertinente aux participants.
En revanche, dans le cas de facettes dites hiérarchiques (par exemple, la facette « Lieu » contient un descripteur ‘Europe’ qui donne lieu à des sous-catégories comme ‘Autriche’, et ainsi de suite jusqu’à ‘Vienne’), comment montrer les différents niveaux de catégories sans surcharger la présentation, ni troubler l’usager ? Une première solution, d’après M. Hearst (2006), consiste à montrer l’ensemble de la hiérarchie de la facette lorsque l’usager fait glisser la souris dessus. L’avantage est de permettre de voir l’ensemble des descripteurs pour en sélectionner un. L’inconvénient est que cette solution supporte mal un grand nombre de descripteurs. La solution adoptée pour Flamenco est finalement celle d’une exploration pas à pas : à côté du titre de la facette apparaît un fil d’Ariane (ex : « LOCATION : All > North America) et en dessous les étiquettes disponibles pour cette sélection : Canada, Mexico, United States, etc. En passant la souris sur les étiquettes, les sous-catégories supplémentaires apparaissent (California, etc.). Il est montré que non seulement les usagers se familiarisent facilement avec un système de hiérarchies multiples, mais aussi qu’une large majorité préfère ce système qui procure un sentiment de contrôle et évite de se sentir perdu.
Pour ce qui est de l’agencement des descripteurs, les avis des participants d’études menées ne sont pas unanimes (Hearst, 2008). Néanmoins une préférence se dessine pour une présentation en colonnes. M. Hearst souligne que si le nombre de colonnes est fixe, on risque de perdre de la place. La solution choisie est donc une génération automatique du nombre adéquat de colonnes en fonction de la longueur maximale des descripteurs.
Pour un certain nombre de choix, M. Hearst (2006) recommande de suivre les conventions qui permettent de rendre les interfaces plus prédictibles. Il propose par exemple d’indiquer les noms des facettes en gras, de souligner les descripteurs qui sont des liens hypertexte, de mentionner le nombre de documents correspondant à un descripteur entre parenthèses et de tronquer les listes longues en les faisant suivre de la mention « More… ». Ces pratiques sont selon lui devenues des normes dans le design de sites web.
Figure 6 - Flamenco : Fine Arts Museum of San Francisco (Facette hiérarchique)
Lors du développement de TALIS Plus, la State Library of Tasmania a mené des tests d’utilisabilité pour déterminer les options qui permettraient d’aider le lecteur à obtenir un document, plus encore qu’à en trouver les références. Deux facettes ont été créées : « Disponibilité » et « Localisation » (Denholm, 2009). La facette « Disponibilité » regroupe les options : ‘prêt’ (qui peut être emprunté), ‘référence’ (qui peut être consulté sur place) et ‘en ligne’. Les études effectuées montrent que cette facette est très utilisée par les lecteurs, majoritairement intéressés par l’option ‘prêt’ (mais les deux autres ont également beaucoup de succès).
La facette « Localisation » est à valeur unique : si l’option ‘en ligne’ se trouve dans cette facette, la sélection d’une bibliothèque exclut des résultats les références en ligne. Il a donc été choisi de présenter cette option dans la facette « Disponibilité ». Il a aussi été ajouté dans la liste des résultats une indication pour distinguer parmi les ressources en ligne celles qui peuvent être consultées de chez soi de celles qui doivent être consultées depuis la bibliothèque. Cette distinction se fait par la mention « Exemplaires : x prêt ; y référence ».
De plus, la facette « Disponibilité » ne prend pas en compte le fait que le document est peut-être en prêt car la mise à jour en temps réel de cette information serait trop lourde, et la mise à jour chaque nuit trop imprécise. Mais il a été remarqué que dans 80% des cas, les lecteurs effectuent leurs réservations d’ouvrage dès la page de résultats sans consulter la notice détaillée ni vérifier si le document est en rayon.
Les statistiques d’usage des facettes de TALIS Plus ont été analysées. La facette la plus utilisée est « Format » (31%), suivie par « Public » (12%), « Sujet » (11%), « Disponibilité » (11%), « Auteur » (10%), « Localisation » (7%), « Collection » (7%), « Fiction / Non fiction » (6%) et « Genre » (4%). De plus, au sein de la facette « Disponibilité » qui est parmi les plus utilisées, on note que les usagers choisissent à 77% l’option ‘prêt’, à 19% l’option ‘en ligne’ et à 4% l’option ‘référence’. (Denholm, 2009)
Il apparaît enfin intéressant de rappeler l’importance de la terminologie utilisée pour nommer les facettes, quelles qu’elles soient. Des tests d’utilisabilité montrent par exemple que les usagers ne font pas la distinction entre « subject » et « keyword » (Antelman, 2006).
2.2.4. Comment devrait fonctionner la navigation ?
Les descripteurs peuvent être à valeur unique (par ex. « Année de publication » : ‘1852’) ou à valeurs multiples (par ex. « Interprètes » : ‘Audrey Hepburn’, ‘Gary Cooper’ et ‘Maurice Chevalier’) (Yee, 2003) et le site web Yelp fait la distinction entre ces deux types : les descripteurs des facettes à sélection unique sont présentés sous forme de liens hypertexte s’excluant l’un l’autre : si après avoir sélectionné un lien, l’usager clique sur un autre lien de la même facette, cela annule la sélection précédente. Les descripteurs des facettes à sélection multiple, en revanche, sont précédés d’une case à cocher. Après une sélection, la liste des résultats est mise à jour, puis l’usager peut cocher un autre descripteur de la même facette, ce qui engendre une requête coordonnée par l’opérateur booléen OU. (Hearst, 2008). Parmi les améliorations à apporter suggérées par l’étude de T. A. Olson, figure la possibilité de pouvoir limiter plusieurs langues simultanément, en effectuant par exemple une recherche sur des ouvrages disponibles en allemand ou en chinois (ce qui revient à l’emploi de l’opérateur booléen OU) ou de spécifier un champ d’années plutôt qu’une année précise (Olson, 2007).
Parmi les fonctionnalités d’une interface à facettes ressenties comme les plus utiles par les usagers on trouve la possibilité de combiner les facettes entre elles et de pouvoir suivre la trace des actions effectuées grâce à un historique des sélections appelé fil d’Ariane. M. Hearst (2008) recommande de garder chaque élément de l’historique dans des composants visuels indépendants, ce qui permet d’éliminer facilement une facette en cliquant sur l’icône X ou le lien ‘delete’. Dans le cas de facettes hiérarchiques, le fil d’Ariane devrait également permettre de remonter d’une catégorie.
Enfin, pour M. Hearst (2008), un élément clé d’une interface de recherche à facettes réussie est la possibilité d’utiliser la recherche par mot-clé à n’importe quel moment. C’est la fonction communément appelée en anglais « search within results ». Il propose la possibilité d’une recherche auto-suggérée qui permet à l’usager en train de taper une requête de se voir proposer une liste de mots, sous l’espace de saisie, en lien avec ce qu’il est en train de taper et qui ont été recherchés par des usagers antérieurs. Peu d’études ont été menées, mais par observation, il semble que cette fonction apporte beaucoup à l’utilisabilité d’un système.
3. Exemples de navigations à facettes
Nous avons tenté de comparer différents modules de navigation à facettes utilisés dans des opac de nouvelle génération en observant les caractéristiques et les fonctionnalités dont l’usager peut directement faire l’expérience. Le but de cette étude n’étant pas de faire un état des lieux des logiciels disponibles sur le marché, mais plutôt un états des lieux des interfaces, telles qu’elles se présentent aux utilisateurs, nous avons fait le choix de ne pas préciser pas si les caractéristiques décrites relèvent de formats imposés par les logiciels ou de choix faits par les bibliothèques.
Nous avons exclu de ce travail, les systèmes qui ne permettent pas de combiner plusieurs facettes ou qui ne laissent pas l’usager choisir l’ordre dans lequel il peut les combiner.
3.1. Comment accéder aux facettes ?
Nous avons comparé les différents modes d’accès à la navigation à facettes, en partant de la page d’accueil de la bibliothèque (et non de la page d’accueil du catalogue). En lançant une recherche, presque tous les catalogues observés, font apparaître leur navigation à facettes dans la fenêtre de la liste des résultats. Certaines pages d’accueil de bibliothèques proposent explicitement d’accéder à un outil de navigation (« browse ») sans recherche préalable (Fig. 7).
Figure 7 - Blacklight : Historical State. North Carolina State University (US, Universitaire)
3.2. A quoi ressemble l’espace de navigation à facettes ?
3.2.1. Facilement repérable dans la fenêtre
En général, la navigation apparaît dans un cadre vertical sur la gauche (Fig. 8) ou la droite (Fig. 9) de la fenêtre, qui peut se distinguer de l’espace central par une couleur de fonds propre ou par un simple encadrement.
Figure 8 - Bibliocommons : Edmonton Public Library (CA, Publique)
Figure 9 - AFI-Opac 2.0 : Astrolabe. Médiathèque et Archives de Melun (FR, Publique)
Figure 10 - KUG = Kölner UniversitätsGesamtkatalog (DE, Universitaire)
Le Kölner UniversitätsGesamtkatalog (Fig. 10), est un catalogue fédéré qui présente les resultats de sa recherche par bibliothèque interrogée. Pour chaque bibliothèque, le nombre de facettes varie de 0 à 7.
3.2.2. Un intitulé pour comprendre de quoi il s’agit
Figure 11 - Aquabrowser : Médiathèque de l’Ecole Supérieure de Commerce de Lille (FR, Universitaire)
Figure 12 - Encore : Westerville Public Library (US, Publique)
Figure 13 - Koha : Médiathèque Intercommunale Ouest Provence (FR, Publique)
Figure 14 - Primo : Jean and Alexander Heard Library. Vanderbilt University (US, Universitaire)
Dans la plupart des cas, le cadre réservé aux facettes est introduit par un titre, invitant généralement l’usager à effectuer une action : « Affinez » (Fig. 11), « Refine by » (Fig. 12). L’objet de cette action peut être la recherche effectuée ou son résultats et l’interface peut s’adresser à l’utilisateur par le biais de la première ou de la deuxième personne : « Affiner le résultat… » (Fig. 9), « Affinez votre recherche » (Fig. 13), « Refine my results » (Fig. 14). Dans le cas des catalogues WorldCat Local, la facette « Format » est mise en valeur en précédant le titre « Affiner votre recherche » (Fig. 15).
Figure 15 - WorldCat Local : MIT Libraries (US, Universitaire)
3.2.3. Un nombre variable de facettes disponibles
Le nombre de facettes proposées à l’utilisateur varie d’un catalogue à un autre. Les interfaces que nous avons consultées offrent en moyenne 8 facettes. La navigation peut aller de seulement 4 (Koha : FR – Médiathèque intercommunale Ouest Provence) facettes à 17 (par ex, Aquabrowser : US - Queens library).
3.2.4. Présentation dynamique des facettes
Le navigateur à facettes se présente sous forme d’une succession d’intitulés de facettes sous chacun desquels sont listés des descripteurs. Le nombre de facettes tout comme le nombre de descripteurs variant d’un catalogue à un autre, les interfaces proposent des solutions différentes pour permettre à l’usager de prendre connaissance de l’ensemble des facettes (car l’intégralité des informations prend trop de place pour être visualisée dans une simple hauteur d’écran). Quelques navigateurs à facettes sont fixes (Fig. 9), mais la plupart offrent des solutions de mobilité.
La majorité des catalogues présentent une liste de facettes dépliées par défaut, et offrent la possibilité de les replier (Fig. 12). D’autres présentent les facettes sous la forme d’une liste repliée (Fig. 16), ce qui permet de les faire toutes apparaître à l’écran quel que soit leur nombre et de prendre connaissance en un coup d’œil de l’ensemble des facettes disponibles. Il suffit de cliquer dessus pour voir apparaître les descripteurs associés à chaque facette. Enfin quelques catalogues proposent des solutions mixtes : une liste dont certaines facettes sont repliées tandis que d’autres sont dépliées (Fig. 17).
Figure 16 - Blacklight : Northwest Digital Archive (US, Autre)
Figure 17 - LS2 PAC : Dallas Independent School District (US, Autre)
3.2.5. Le nombre d’occurrences
Généralement, chaque descripteur est accompagné de la mention du nombre de documents dans la notice desquels il apparaît parmi les résultats. Ce nombre est le plus souvent montré à côté du descripteur, entre parenthèses (Fig. 17) ou peut apparaître en info-bulle lorsque la souris glisse sur le descripteur (Fig. 18). Le catalogue Prism 3 n’apporte aucune indication sur le nombre d’occurrences d’un descripteur (Fig. 19).
Figure 18 - Scriblio: Hong Kong University of Science and Technology Library (HK, Universitaire)
Figure 19 - Prism 3 : Manchester Metropolitan University Library (GB, Universitaire)
3.3. Comment sont organisés facettes et descripteurs ?
Nous ne nous sommes pas penchés sur le contenu des facettes et l’utilité de ce contenu et nous en sommes tenus à la façon dont l’interface se présentait à l’usager pour accompagner ses interactions avec le catalogue.
3.3.1. Intitulés des facettes
Une même facette peut être nommée différemment d’un système à un autre et d’un catalogue à un autre. Cette diversité reflète un désir de la part des bibliothèques de proposer des dénominations directement compréhensibles par les usagers en se démarquant du jargon professionnel. Cependant, les ambiguïtés ne sont pas toujours évitées : la facette « Disponibilité » ne permet pas de savoir si le document est effectivement disponible. Les usagers sont-ils conscients qu’une date d’édition ne correspond pas nécessairement à une date de création ? La facette « Collection » fait-elle référence à une collection éditoriale ou au fond documentaire d’une bibliothèque ? Comment l’usager comprend-il la coexistence d’une facette « Sujet » et d’une facette « Matière » ? etc.
3.3.2. Organisation des facettes
Figure 20 - Aquabrowser : Washington University Libraries (US, Universitaire)
Tous les catalogues consultés présentent des facettes plates. Un semblant de hiérarchie se présente parfois lorsque les dates de publication sont regroupées par périodes et se détaillent au fur et à mesure de la sélection (Fig. 20).
Il est intéressant d’étudier le traitement des vedettes matières. Bien que les règles de la Bibliothèque du Congrès ou de Rameau pour créer des vedettes matières soient méconnues des usagers, on trouve dans certains catalogues des facettes « sujets » construites selon cette syntaxe. Néanmoins, dans la plupart des cas, les vedettes, sont déconstruites pour permettre la sélection d’un sujet, d’un lieu, d’une période, ou d’une forme. Le résultat de cette déconstruction se retrouve sous forme de facettes distinctes « Période », « Lieu », « Sujet », « Forme ». Dans le cas de WorldCat Local, la facette « Format » présente une hiérarchie directement accessible sous forme d’arborescence (Fig. 15).
3.3.3. Présentation des listes de données relatives à chaque facette
Les descripteurs de certains catalogues sont présentés graphiquement. Il peut s’agir notamment du type de ressource (Fig. 21) ou de l’année de publication (Fig. 22).
Figure 21 - Blacklight : Stanford University Libraries (US, Universitaire)
Figure 22 - Summon : Drexel University Library (US, Universitaire)
Il est difficile de montrer par défaut la totalité des descripteurs disponibles, au risque pour les facettes d’être tout à fait illisibles. La grande majorité des catalogues présentent une liste abrégée de 4 à 6 descripteurs pour chaque facette. L’opac de Stanford University Libraries en montre jusqu’à 16 (Fig. 21). Dans le cas de la Bibliothèque Royale du Danemark (Fig. 23), lorsqu’une facette a jusqu’à 4 descripteurs, ils sont tous présentés (donc jusqu’à 4). En revanche, si la facette a plus de 4 descripteurs, le navigateur n’en montre que 3.
Figure 23 - Primo : Kongelige Bibliotek (DK, Nationale)
Lorsque les opac n’affichent pas l’intégralité des descripteurs disponibles, il est alors possible d’en voir un peu plus, en cliquant par exemple sur le terme « more », largement décliné : « More… » (Fig. 19), « more options » (Fig. 22), etc. D’autres opac préfèrent une fois de plus s’adresser à l’usager par le biais d’un verbe pour indiquer une action : « Afficher plus de facettes… » (Fig. 9), « En voir plus » (Fig. 13), « Show More » (Fig. 24). Enfin, d’autres opac indiquent le nombre de descripteurs auquel il est possible d’avoir accès : « Show n more » (Fig. 14), « n more… » (Fig. 25), « +see all » (Fig. 26).
Figure 24 - Koha : Horowhuena Library (NZ, Publique)
Figure 25 - Aquabrowser : Queens Library (US, Publique)
Figure 26 - Encore : Syracuse University Libraries (US, Universitaire)
Que se passe-t-il alors ? La liste apparaît dans une nouvelle page (Fig. 27), sous forme d’une liste déroulante dans un encart (Fig. 28) ou s’allonge sur place tout simplement. Il est alors possible de prendre connaissance soit de tous les descripteurs disponibles soit d’un nombre limité. En cliquant sur l’option « More… » du catalogue Prism 3, la fenêtre active est remplacée par une nouvelle fenêtre présentant un nuage de mots (Fig. 29).
Figure 27 - Aquabrowser : Queens Library (US, Publique)
Figure 28 - Blacklight : Stanford University Libraries (US, Universitaire)
Figure 29 - Prism 3 : Manchester Metropolitan University Library (GB, Universitaire)
Certains opac présentent les descripteurs de leurs facettes triés par nombre d’occurrences (Fig. 14), d’autres alternent un tri par nombre d’occurrences et un tri alphanumérique pour quelques facettes (les années de publication par exemple).
Dans la majorité des cas, le tri appliqué à une facette présentée sous sa forme abrégée est le même que le tri appliqué à la même facette sous sa forme élargie. Mais il arrive dans certains cas qu’une liste initialement triée par nombre d’occurrence apparaisse, une fois élargie, triée par ordre alphanumérique (Fig. 30). Il est enfin parfois possible de choisir le mode de tri des données : par occurrence ou alphanumérique (Fig. 27).
Figure 30 - Endeca : North Carolina State University Libraries (US, Universitaire)
3.4. Comment fonctionne la navigation ?
3.4.1. La sélection des données
La sélection d’une facette se fait presque toujours en cliquant sur le descripteur, associé à un lien hypertexte, mais quelques catalogues proposent une liste de cases à cocher (Fig. 22). Il arrive aussi que, non pas toutes, mais quelques facettes d’un opac se présentent sous forme d’un menu déroulant (Fig. 8).
3.4.2. Actualisation des données
La sélection d’un descripteur entraîne systématiquement la réactualisation de la page ce qui permet de mettre à jour la liste des résultats et les facettes disponibles. En général, si une facette n’a plus de descripteur disponible, elle disparaît.
3.4.3. Que devient un descripteur qui vient d’être sélectionné ?
Il peut selon les catalogues être toujours visible tout en étant rendu inactif (ex : Encore), être toujours visible et rester actif (ex : AFI-Opac 2.0) ou disparaître de la navigation (ex : Bibliocommons). Le Kölner UniversitätsGesamtkatalog présente une particularité : l’ensemble des facettes disparaît dès que la liste de résultats est réduite à moins de dix documents.
3.4.4. Le fil d’Ariane
Presque tous les opac affichent un fil d’Ariane, au fur et à mesure de la sélection des facettes. Cet historique peut prendre une apparence allant du plus visible au plus discret et du plus explicit au plus obscur pour l’usager (ex : le fil d’Ariane du KUG consiste en une formule dans la barre de recherche comme celle-ci : « ddper:stone_michael_h( stone) »). Il peut être placé en tête de la liste des résultats (Fig. 31), en tête des facettes (Fig. 32), directement à côté des descripteurs (Fig. 33), ou mixte (Fig. 34) (à la fois en tête de la liste des résultats et dans le bloc des facettes). Certains opac montrent également clairement à quelle facette correspond le descripteur sélectionné (Fig. 34), tandis que d’autres se contentent de mentionner seulement le descripteur (Fig. 32).
Figure 31 - Blacklight : Stanford University Libraries (US, Universitaire)
Le fil d’Ariane n’a pas seulement une valeur informative. Même si certains opac n’offrent pas de fil d’Ariane intéractif (ex : AFI-Opac 2.0, Koha), la plupart d’entre eux permettent à l’utilisateur de revenir en arrière de sa recherche en désélectionnant un ou plusieurs descripteurs sélectionnés (Voir à ce propos le paragraphe 3.4.6. Modifier sa requête en supprimant une donnée sélectionnée).
Figure 32 - Bibliocommons : Edmonton Public Library (CA, Publique)
Figure 33 - Summon : Drexel University Library (US, Universitaire)
Figure 34 - Blacklight : Northwest Digital Archive (US, Autre)
3.4.5. Modifier sa requête en supprimant une donnée sélectionnée
Tous les opac ne le proposent pas, mais il est néanmoins courant de pouvoir supprimer les options sélectionnées et le cas échéant, l’usager peut généralement choisir quelle option supprimer sans avoir à respecter l’ordre inverse de celui dans lequel celles-ci ont été sélectionnées. Cette fonctionnalité se reconnaît par l’emploi de l’icône « X » ou par l’indication textuelle « remove ». Dans le cas où la sélection effectuée est visible à la fois en en-tête et à côté des descripteurs, on peut alors bénéficier de différentes façons de supprimer un critère, et dans le cas où la sélection des critères s’est faite en cochant des cases, il suffit de les décocher. Il arrive que parmi les options pouvant être désélectionnées, se trouve le mot clé initial de la recherche (Fig. 30).
3.4.6. La syntaxe booléenne
Les opac que nous avons retenus pour ce comparatif permettent tous de combiner la sélection de plusieurs facettes lors d’une même requête. Dans ce cas, il résulte systématiquement, une conjonction opérée par ET. Pour ce qui est de la sélection de plusieurs descripteurs au sein d’une même facette, certains catalogues ne la permettent tout simplement pas. Lorsqu’elle est possible, elle est généralement régie, elle aussi, par l’opérateur ET. Une exception : les catalogues gérés par Summon combinent les descripteurs entre eux avec les opérateurs OU et SAUF (Fig. 35).
Figure 35 - Summon : Drexel University Libraries (US, Universitaire)
3.4.7. Nouvelle requête et fonction “Search within”
En général, lorsque l’usager entre un nouveau mot-clé en cours de requête, cela lance une nouvelle recherche sans garder en mémoire les filtres appliqués jusque-là. Néanmoins, certains opac offrent des possibilités alternatives.
Figure 36 – VuFind : Falvey Memorial Library. Villanova University (US, Universitaire)
Blacklight conserve par défaut les facettes dernièrement sélectionnées (sans conserver le mot-clé de la recherche initiale) et il faut cliquer sur le bouton « Start over » pour pouvoir lancer une nouvelle requête (Fig. 31). Au contraire, Endeca lance par défaut une nouvelle requête, mais propose de cocher l’option « search within results » (Fig. 30), ce qui permet d’enrichir une requête d’un nouveau mot clé au lieu de la relancer. Sur le même principe, VuFind propose l’option « Retain my current filters » (Fig. 36) et Summon laisse le choix entre les options « Keep search refinement » et « New search » (Fig. 33).
4. Conclusion
En conclusion de cette étude, il nous apparaît que les opac NG suscitent un enthousiasme profond que ce soit parmi les professionnels et visiblement parmi les usagers. Le paysage du catalogue en ligne est en pleine ébullition pour offrir aux usagers des outils qui sauront non seulement répondre à leur demande première de trouver une information mais aussi représenter pour eux une expérience agréable. Des études d’utilisabilité sont réalisées et l’intérêt de telles entreprises fait l’unanimité. Mais ces études, quand elles ont lieu pour le compte de bibliothèques, ont souvent pour objet la comparaison d’un opac d’ancienne génération avec un système de nouvelle génération et leurs résultats vont assez logiquement dans le sens du renouveau. Ne risque-t-on pas ainsi de se conforter dans l’idée que les outils en cours de développement ne peuvent qu’avoir du succès ? Ne risque-t-on pas en continuant de parler de « next-generation catalogs » d’oublier d’envisager ce qui peut, ce qui doit venir après ?
Les systèmes de navigation à facettes sont un succès. Nous avons constaté, lors de notre comparaison, que l’ensemble des différentes interfaces réunissent un certain nombre de critères qui rendent ces systèmes faciles et agréables à utiliser. Aucun d’entre eux, néanmoins, ne regroupe tous ces critères. Il pourrait être intéressant de mener des études d’utilisateurs permettant de comparer de façon empirique tous les critères et d’en faire une synthèse du meilleur des facettes. Et si les interfaces de navigation à facettes sont perfectibles, il faut aussi et surtout envisager déjà pour elles de nouvelles directions. Alors que la majorité des interfaces conçues par les fournisseurs de SIGB se ressemblent finalement beaucoup, l’équipe de Marti Hearst à Berkeley, semble manifester une certaine énergie pour tester des solutions originales, curieux de la façon dont les interfaces à facettes pourraient être adaptées aux téléphones mobiles par exemple.
Annexe
Télécharger les références d’opac de nouvelle génération offrant des navigations à facettes
Bibliographie
Références citées
Antelman, K., E. Lynema, et al. (2006). "Toward a twenty-first century library catalog". Information technology & libraries 25(3): 128-139.
Bauer, K. (2008) “Yale University Library VuFind test – undergratuates”. Usability and assessment studies of Yale University Library projects (Yufind). https://collaborate.library.yale.edu/usability/reports/Forms/public.aspx (consulté le 14.09.2011)
Breeding, M. (2007). "Next-generation library catalogs." Library technology reports: 5-42.
Buckland, M., A. Chen, et al. (1999). “Mapping entry vocabulary to unfamiliar metadata vocabularies”. D-Lib Magazine. 5(1). http://www.dlib.org/dlib/january99/buckland/01buckland.html
Denholm, C., L. Kauler, et al. (2009) “Making the new OPAC seamless: dealing with the transition from “finding” to “getting””. Library hi tech 27(1): 13-29.
DOI: 10.1108/07378830910942883
Denton, W. et S. J. Coysh (2011). "Usability testing of VuFind at an academix library". Library Hi Tech 29(2): 301-319. DOI: 10.1108/07378831111138189.
Fagan, J. C. (2010). "Usability studies of faceted browsing: a literature review”. Information technology and libraries. 29(2):58-66. http://www.ala.org/ala/mgrps/divs/lita/publications/ital/29/2/fagan.pdf (consulté le 14.09.2011)
Hearst, M. (2006) Design recommendations for hierarchical faceted search interfaces. ACM SIGIR Workshop on Faceted Search. http://flamenco.berkeley.edu/papers/faceted-workshop06.pdf
Hearst, M. (2008) Uls for faceted navigation recent: recent advances and remaining open problems. Workshop on Computer Interaction and Information Retrieval, HCIR 2008, Redmond, WA. http://flamenco.berkeley.edu/papers/hcir08.pdf
Nielsen, J. (2003) “Usability 101: introduction to usability”. Jakob Nielsen’s Alertbox. http://www.useit.com/alertbox/20030825.html
Nielsen, J. (2005) Ten usability heuristics. http://www.useit.com/papers/heuristic/heuristic_list.html
Olson, T. A. (2007). “Utility of a faceted catalog for scholarly research”. Library Hi Tech. 25(4):550-561. DOI: 10.1108/07378830710840509.
Sadeh, T. (2008) “User experience in the library: a case study”. New library world 109(1/2): 7-24. DOI: 10.1108/03074800810845976
Tam, W., A. M. Cox, et al. (2009) “Student user preferences for features of next-generation OPACs: a case study of University of Sheffield international students”. Program: electronic library & information systems 43(4): 349-374. DOI: 10.1108/00330330910998020
Tosca Consultants (2008). Le catalogue de la bibliothèque à l'heure du Web 2.0 : étude des opacs de nouvelle génération. – Etude réalisée par Marc Maisonneuve. - Paris : ADBS éditions.
Uddin, M. N. and P. Janecek (2007). "Performance and usability testing of multidimensional taxonomy in web site search and navigation." Performance measurement & metrics 8(1): 18-33.
Yee, K.-P., K. Swearingen, et al. (2003). Faceted metadata for image search and browsing. Proceedings of the SIGCHI conference on Human factors in computing systems, Ft. Lauderdale, Florida, USA, April 5-10, 2003. http://flamenco.berkeley.edu/papers/flamenco-chi03.pdf
Zhang, X., Y. Li, et al. (2008) "Effects of interaction design in digital libraries on user interactions". Journal of documentation 64(3) : 438-463. DOI: 10.1108/00220410810867623
Références utiles non citées
Borgman, C. L. (1986). "Why are online catalogs hard to use? Lessons learned from information-retrieval studies." Journal of the American society for information science 37(6): 387-400.
Borgman, C. L. (1996). "Why are online catalogs still hard to use?" Journal of the American society for information science 47(7): 493-503.
Burke, T., (2004).”Burn the catalog”. http://www.swarthmore.edu/SocSci/tburke1/perma12004.html
Butterfield, K. (2010). “Online public access catalogs (OPACs)”. Encyclopedia of library and information sciences. – 3rd ed. – London: Taylor & Francis.
Calhoun, K. (2006). The changing nature of the catalog and its integration with other discovery tools. Final report, Prepared for the Library of Congress. http://www.loc.gov/catdir/calhoun-report-final.pdf
Covey, D. T. (2002). Usage and usability assessment: library practices and concerns. Washington, D.C. : Digital Library Federation; Council on library and information resources.
Frost, C. O. (1994). "Next-generation online public access catalogs: redefining territory and roles." Advances in library automation and networking 5: 1-41.
Gavin, P. (2008). Une nouvelle génération d’opacs : le paradis retrouvé ? : histoire biblique en 4 épisodes... Exposé présenté initialement dans le cadre du Workshop « opacs, utilisateurs, interfaces » le 19 mars 2008, à la Bibliothèque nationale suisse. – Version complétée présentée à Luxembourg le 2 juin 2008. http://www.pierregavin.ch/catalogage-et-catalogues/7-opac-ng/une-nouvelle-generation-dopacs-le-paradis-retrouve/at_download/file
Hildreth, C. R. (1987). “Beyond boolean: designing the next generation of online catalogs”. Library trends. 35: 647-667.
Julien, C.-A. et F. Bouthillier (2008). "Le catalogue réinventé." Documentation & Bibliotheques 54(3): 229-239.
Lehman, T. and T. Nikkel (2008). Making library web sites usable. - New York; London: Neal-Schuman publ. – (LITA guide)
Maisonneuve, M. and C. Touitou (2007). "Une nouvelle famille d'Opac: navigation à facettes et nuages de mots." Bulletin des bibliothèques de France 52(6): 12-19.
Markey, K. (2007) “The online library catalog: paradise lost and paradise regained?” D-Lib Magazine 13(1/2). http://www.dlib.org/dlib/january07/markey/01markey.html
Merčun, T. and M. Žumer (2008) “New generation of catalogues for the new generation of users: a comparison of six library catalogues”. Program: electronic library & information systems 45(3): 243-261. DOI: 10.1108/00330330810892668
OCLC (2005). Perceptions of libraries and information resources: a report to the OCLC membership. - Dublin, OH: OCLC.
Schneider, K. G. (2006a) “How OPACs suck, Part 1: Relevance rank (or the lack of it)”. ALA techsource. http://www.alatechsource.org/blog/2006/03/how-opacs-suck-part-1-relevance-rank-or-the-lack-of-it.html
Schneider, K. G. (2006b) “How OPACs suck, Part 2: The checklist of shame”. ALA techsource. http://www.alatechsource.org/blog/2006/04/how-opacs-suck-part-2-the-checklist-of-shame.html
Schneider, K. G. (2006c) “How OPACs suck, Part 3: The big picture”. ALA techsource. http://www.alatechsource.org/blog/2006/05/how-opac-suck-part-3-the-big-picture.html
Soules, A. (2010) “New e-sources, new models: reinventing library approaches to providing access”. Library hi tech news (2): 10-14. DOI: 10.1108/07419051011011050420
Tennant, R. (2001). "Cross-database search: one-stop shopping." Library journal, "Digital libraries" columns 126(17): 29. http://roytennant.com/column/?fetch=data/69.xml
Tennant, R. (2005). "Digital libraries: "lipstick on a pig"." Library journal 130(7): 34-34. http://www.libraryjournal.com/article/CA516027.html
Note
(1) Remarque préliminaire sur l’orthographe et la flexion du terme opac. Dans la littérature anglophone, l’usage de cet acronyme impose l’emploi des lettres majuscules et l’ajout d’un -s minuscule aux formes plurielles. Pour ce qui est de l’utilisation du même terme en français, les règles sont plus floues. Nous avons fait le choix, comme il est généralement d’usage pour les acronymes, d’écrire opac en lettres minuscules, y compris l’initiale car il s’agit d’un terme à usage de nom commun, et de l’utiliser de façon invariable au pluriel.
- Vous devez vous connecter pour poster des commentaires
Les catalogues des bibliothèques : du web invisible au web social (I)
Ressi — 29 mars 2007
Isabelle de Kaenel, CHUV, Lausanne
Pablo Iriarte, CHUV, Lausanne
Résumé
Les catalogues des bibliothèques sont rentrés dans une phase critique. Les dernières évolutions du web, avec l’entrée en jeu enfin de XML, des nouveaux usages et nouveaux outils, ainsi que le déplacement du centre de gravité qui s’est fortement rapproché des utilisateurs, ouvrent de nouvelles voies et de nouveaux champs d’application pour les catalogues en ligne. Le catalogue n’est plus un outil isolé du monde : dans un mouvement à double sens, il doit s’ouvrir à Internet autant pour tirer parti des services web externes, de plus en plus importants, que pour l’alimenter en contenu et fournir des informations structurées et validées tout en permettant aux utilisateurs d’apporter du contenu et du sens, ainsi que de s’approprier les données du catalogue en lui offrant des nouvelles possibilités de réutilisation à travers les réseaux. Cet article fait un inventaire de ces nouveaux champs d’application possibles et analyse les conditions de base qu’un catalogue devrait remplir pour pouvoir quitter le web invisible et investir pleinement les possibilités actuelles du web social pour devenir enfin un « OpenCatalog ».
Les catalogues des bibliothèques : du web invisible au web social (I)
Introduction
Les catalogues des bibliothèques sont tombés en disgrâce (Markey, 2007). Délaissés, ignorés, critiqués (1) et, dans le pire des cas, ridiculisés(2) , ils nous lancent un dernier cri d’alarme avant de tomber dans le tiroir des outils oubliés. Or, les dernières évolutions du web(3) , avec l’entrée en jeu enfin de XML(4) , des nouveaux usages et nouveaux outils, ainsi que le déplacement du centre de gravité qui s’est fortement rapproché des utilisateurs, ouvrent de nouvelles voies et de nouveaux champs d’application pour les catalogues en ligne. Le temps est donc venu d’aider ces outils de recherche à sortir de cette image négative liée à une complexité, certes inévitable mais jamais compensée par un aspect créatif. Peu armés pour affronter la rapidité des changements de l’ère Internet au cours de ces dix dernières années, les bibliothécaires se sont plus ou moins contentés d’un fonctionnement qui semblait avoir fait ses preuves, avec de promesses d’améliorations, sans vouloir se rendre compte que, tout autour, le monde de l’information numérique expérimentait plusieurs révolutions. Il est bien connu que celui qui n’avance pas…
La tendance est pourtant depuis quelque temps vers la flexibilité et l'ouverture : « Open Source(5) » (ouverture du code source des logiciels), « Open Access(6) » (accès ouvert aux publications et données issues de la recherche scientifique et technique) et « Open Archives Initiative(7) » (ouverture et interopérabilité entre serveurs institutionnels dépositaires de cette production), « OpenURL(8) » (liens ouverts grâce aux métadonnées encodées dans l'URL(9) ), « OpenSearch(10) » (syntaxe des requêtes et format des résultats ouverts), sont des exemples concrets des réalisations qui ont modifié le monde de la documentation numérique. Le but de cet article est donc de faire un petit inventaire de ces nouveaux champs d’application possibles et d’analyser les conditions de base qu’un catalogue devrait remplir (sans devoir tout remettre en question et sans renoncer aux acquis qui font sa spécificité et sa richesse), afin d’investir pleinement les possibilités actuelles et devenir enfin un « OpenCatalog(11) ».
Plusieurs raisons peuvent expliquer ce retard en dépit d’une communauté de bibliothèques bien structurée et dynamique. Les contraintes physiques et matérielles importantes imposées aux catalogues (catalogues papier reliés en volumes, format des cartes pour les cardex ou limitations de mémoire pour les premiers systèmes informatisés) ont probablement joué un rôle majeur (Calhoun, 2006, p. 36). Ainsi, le catalogue a pris l’option d’être un système autoréférentiel, autarcique, dans le sens où il s’autosuffisait, ne citant pratiquement pas de ressources externes en dehors de son propre univers informationnel. Par conséquent, la bibliothèque de type universitaire ou encyclopédique, utilisant ce modèle de catalogue, qui a parfaitement fonctionné et perduré pendant des siècles, complété par d’imposantes bibliographies, des répertoires des périodiques, des services de commandes et de prêt entre bibliothèques, pouvait alors prétendre à une très large exhaustivité.
La combinaison de ces deux aspects a engendré des méthodes de travail : le catalogage, et un produit : le catalogue, qui ont peu évolué en comparaison avec le reste des outils informatiques dans le domaine de l’édition commerciale qui, eux, ont dû faire face et s’adapter plus rapidement aux changements radicaux survenus depuis l’arrivée du web et des NTICs(12). Les bibliothèques ne se sont pas mobilisées pour faire évoluer leurs catalogues face à ces bouleversements. Les évolutions restent très lentes, avec beaucoup d'expérimentations et des réalisations partielles(13).
Si nous remontons dans le temps, nous pouvons constater que les bibliothèques ont été très actives dans la période d’informatisation des catalogues au cours des années 70-80, dont l’un des meilleurs exemples est le système de catalogage et de gestion SIBIL(14) développé à la BCU(15) de Lausanne (Gavin, 1997). Cette étape a apporté le format MARC(16) utilisé actuellement dans la plupart des bibliothèques, malgré une remise en question récurrente. Les bibliothèques ont aussi participé activement au projet du WWW. Par exemple, il est significatif que le premier site web en dehors du CERN(17) fût créé par Louise Addis, bibliothécaire du Stanford Linear Accelerator Center (SLAC)(18), qui devenait ainsi la première bibliothécaire–webmaster de l’histoire(19). Aussi, dès les premiers temps du web, les catalogues des bibliothèques sont devenus accessibles sur la Toile de manière libre et gratuite pour la plus grande satisfaction des utilisateurs du monde entier. Ces OPACs (« Online Public Access Catalog ») ont été aussi l'une des premières réalisations à grande échelle du principe de la séparation entre contenu et mise en page, principe popularisé plus tard pour les systèmes de gestion de contenu (CMS)(20). L’aspect collaboratif du travail de catalogage partagé (chaque notice du catalogue peut en principe être corrigée ou améliorée par n’importe quel autre catalogueur du réseau) était aussi en avant par rapport à son temps. Cependant, ce sont les wikis(21) qui, en donnant cette possibilité d’édition des données à tout un chacun, ont poussé le concept de travail collaboratif à l’extrême et l’ont popularisé dans l’univers du web. De la même façon, le protocole de communication Z39.50(22) , développé et maintenu depuis plus de 20 ans par la Library of Congress(23) , fut l’un des précurseurs d’Internet et, malgré un déclin important dû à son « incompatibilité » avec les technologies web(24) , il est toujours utilisé par un bon nombre de logiciels (bibliographiques ou de pompage des notices) et de plateformes de métarecherche comme le KVK(25).
Lorsque les catalogues informatisés (souvent gérés, comme dans le cas de SIBIL, avec des outils développés localement) ont atteint une taille trop importante, ils ont dû migrer sur des outils devenus propriétaires et développés par des entreprises commerciales internationales. Cette évolution a peut-être tué une bonne partie de l’initiative des bibliothèques qui se sont peu à peu tournées vers d’autres fronts (Open Access et serveurs institutionnels pour lutter contre la crise des prix des périodiques et gérer les publications institutionnelles par exemple) et vers d’autres outils destinés au web et venant compléter le catalogue (portails, CMS, blogs(26) et wikis, podcasts(27) , outils de gestion de liens(28) et de recherche fédérée…), laissant un peu pour compte son outil principal de travail dont on annonce régulièrement plus ou moins la fin ou la désintégration.
Ainsi, la publication web des catalogues reflète encore passablement cet ancien esprit autarcique, et les OPACs restent souvent « déconnectés » du reste des ressources en ligne(29) et sont, encore aujourd’hui, conditionnés par d’anciennes limitations qui n’ont plus de sens dans l’environnement culturel et technologique actuel.
Le catalogue n’est plus un outil isolé du monde. Dans un mouvement à double sens, il doit s’ouvrir au web autant pour tirer parti des services web externes, de plus en plus importants, que pour alimenter le web en contenu et fournir des informations structurées et validées. L’enjeu est de taille : comment rester fidèle à son sens premier (répertorier de manière cohérente les ressources mises à disposition du public et aider à la recherche, découverte, localisation, et gestion des collections) tout en permettant aux utilisateurs d’apporter du contenu et du sens, ainsi que de s’approprier les données du catalogue en lui offrant des nouvelles possibilités de réutilisation à travers le web. Sans se pervertir, le catalogue doit évoluer rapidement pour pouvoir rester dans la course où il a déjà pris un retard considérable.
La conclusion d’un rapport commandé par la Library of Congress en 2006 ne laisse pas de doutes sur le chemin qui reste à parcourir : “The future will require the kind of catalog that is one link in a chain of services enabling users to find, [pick], and obtain the information objects they want. One requirement of this future catalog is thus to ingest and disperse data from and to many systems inside and outside the library. It would be helpful to reconsider what needs to be part of catalog data —and where catalog data needs to be present— to facilitate the user’s process of discovering, requesting, and getting the information they need.” (Calhoun, 2006, p. 38).
Dans les pages suivantes, nous essayerons d’explorer les possibilités de mise en place de ces deux ouvertures souhaitables du catalogue : l'ouverture à l'intégration des nouveaux contenus (internes ou externes) et, d'autre part, l'ouverture à de nouvelles formes d'utilisation de ses propres données par des tiers.
1ère partie : ouverture du catalogue à l'intégration des nouveaux contenus
1. Intégration de l’hypertexte : deux modèles à suivre
Grâce aux logiciels libres et surtout au couple PHP/MySQL(30), l’architecture de la Toile a changé et repose désormais sur un vaste ensemble de bases de données. Le Web est devenu une véritable plateforme de travail, autonome, indépendante des contraintes spatiales ou matérielles liées à des systèmes d’exploitation, des versions des logiciels, etc. De la même façon que la messagerie peut être utilisée depuis n’importe quel ordinateur relié à Internet à l’aide d’un simple navigateur, il sera bientôt possible de travailler avec un minimum de logiciels et clients lourds installés sur les postes, car la plupart des outils seront disponibles en version 100% web(31).
A l’image des développements réalisés pour les autres outils de gestion et de diffusion de l’information, la logique et les mécanismes de fonctionnement du catalogue sont de plus en plus orientés vers le web, au détriment des autres formes de consultation ou de publication (clients professionnels en mode OPAC installés sur les postes de consultation, bulletins de nouvelles acquisitions, bibliographies nationales…). Si cette tendance suit un certain effet de mode, elle correspond aussi à un changement dans le mode de fonctionnement de la société occidentale, de plus en plus relié à Internet à haut débit, et qui dédie de plus en plus de temps à la « consommation » de médias numériques, qui dépassent déjà chacun des autres médias traditionnels (TV, radio, journaux et revues papier, cinéma, etc.)(32) . Cette évolution qui semble pour l’instant irréversible, nous pousse à repenser le catalogue comme un outil fait par et pour le web, intégrant ainsi de manière véritable ce média dont la caractéristique et l’avantage principal réside dans l’immédiateté et dans la navigation à travers les liens hypertexte. Les deux outils principaux de publication web actuels, les blogs et les wikis, sont des bons exemples de la façon dont cette dimension hypertextuelle peut être ajoutée à l’information de manière simple et rapide.
Les blogs
Tout comme la messagerie web, le blog, né directement dans l’univers de l’Internet, a adopté le HTML comme langage principal. Il utilise toutefois un intermédiaire pour aider les non initiés à la saisie : le code HTML est généré et caché automatiquement par un outil d’édition de type WYSIWYG(33) . Pour les courriels, le code HTML est encapsulé dans le corps du message. Dans les blogs, il est enregistré dans la base de données et re-proposé à nouveau tel quel sur le web(34) :
Les wikis
Dans les wikis, le code HTML est simplement produit à la volée(35) au moment de l’affichage de la page. Les balises HTML sont créées dynamiquement en fonction de la syntaxe propre au wiki. On assiste alors à la transformation d’une syntaxe arbitraire et plus ou moins proche du HTML vers la syntaxe HTML. Par exemple :
La syntaxe wiki étant plus facile à retenir que les balises HTML, les textes peuvent être alors écrits rapidement et on peut utiliser l’aide des boutons de l’éditeur qui effectuent les mêmes fonctions que les éditeurs WYSIWYG, mais sans cacher le code et sans faire la transformation en HTML. Seul le texte avec la syntaxe propre au wiki est alors enregistré dans la base de données et non pas du code HTML.
Cette intégration du code au message, en HTML ou selon une syntaxe propre, permet d’apporter les améliorations suivantes avec peu d’efforts :
- Disposer du véritable hypertexte, avec des liens internes ou externes intégrés au message sans devoir à chaque fois afficher l’URL en clair.
- Ajouter une mise en page simple à l’intérieur du texte (courriel, corps d’un billet sur un blog, page entière d’un wiki) : gras, italique, souligné, listes numérotées ou à puces, tableaux, ajout d’images.
Extraire certaines parties (titres) dans le cas du wiki, pour créer des tables des matières à la volée.
Ces applications peuvent être utiles aussi aux catalogues dans les zones destinées aux notes, commentaires, résumés ou tables des matières, qui souffrent aujourd’hui du manque de mise en page et d’hypertexte :
Source : http://opac.rero.ch/get_bib_record.cgi?rero_id=R003636602
Source : http://www.saphirdoc.ch/permalien.htm?saphirid=41062
Cependant, avant d’appliquer l’un ou l’autre modèle au catalogue, il faut évaluer en profondeur les utilisations pour lesquelles cette introduction des balises ou des syntaxes pourrait être nuisible (impression des catalogues sur papier, maintenance à long terme des tables de conversion entre la syntaxe ou les balises et la mise en page…).
Malgré l’absence encore du véritable hypertexte dans les catalogues, il faut noter que le format MARC prévoit la zone 856(36) pour les URLs en admettant un sous-champ pour ajouter un commentaire qui permet de le qualifier ou de lui donner un contexte sommaire. Ces URLs sont alors transformés à la volée en hyperliens par le système au moment de l’affichage qui, trop souvent encore, se fait uniquement au niveau de la notice complète(37).
La présence des URLs dans la notice (champ 856 mais aussi dans le champ du titre, des notes, du résumé…) est un pas important, mais il n’est pas tout. Pour être vraiment utiles à l’internaute, ces URLs doivent impérativement être transformés en lien hypertexte dans la page HTML de l’OPAC, faute de quoi ils seront affichés comme du simple texte qui ne peut pas « être cliqué », et l’utilisateur doit faire recours au copier/coller pour placer cet URL dans l’adresse du navigateur. Pour éviter cela, les logiciels de gestion tentent systématiquement d’effectuer cette transformation URL -> hyperlien en scrutant chaque champ au moment de l’affichage, à la recherche d’un URL. Certains le font mieux que d’autres, car si en principe il est simple pour une machine de trouver le début et la fin d’un URL bien formé au milieu d’une chaîne de caractères (commence par « http:// » et fini par un espace), il est plus complexe de tester toutes les autres variantes possibles (l’URL ne commence pas par « http:// » mais directement par « www. » ; ou ne finit pas par un espace mais par un point, une virgule ou la fin d’une parenthèse…). Ce problème, récurrent aussi dans le cas des courriels qui portent des URLs dans le corps du message, est de difficile solution sans l’utilisation d’un codage à priori comme ceux utilisés par les blogs et les wikis.
Dans le cas du catalogue de RERO(38), le système convertit automatiquement à la volée chaque champ contenant « http:// » (856 mais aussi les champs de titre et des notes) en lien hypertexte, au moment de l’affichage sur l’OPAC. Cependant cette conversion se limite au premier URL trouvé dans le champ(39), et elle ne se fait pas pour les URLs qui ne commencent pas par « http:// » mais par exemple « www.»(40) , ce qui limite l’utilisation des liens dans un même champ. Dans le réseau SAPHIR(41), étant donné que le nombre des URLs est plus important à l’intérieur d’un seul champ comme le résumé, la transformation a été étendue à tout URL contenu dans ce champ, et aussi pour ceux qui commencent par « www. ».
Si cette génération à la volée des hyperliens est possible grâce aux caractéristiques reconnaissables des URLs, pour les autres points utiles du codage à priori (mise en page, gras, italique, listes…) il n’y a pas de solution automatique à posteriori. Par conséquent, pour améliorer la mise en page et faciliter la lecture pour les longs résumés correspondant à certains dossiers thématiques, le catalogue SAPHIR a adopté le modèle du wiki de façon encore informelle comme nous le montre la copie d’écran ci-dessous.
Source : http://www.saphirdoc.ch/permalien.htm?saphirid=45776
De son coté, le logiciel Alexandrie(42), SIGB utilisé par ce réseau, a aussi introduit une possibilité de mise en page dans les résumés des documents, en suivant le modèle du blog : trois boutons permettent d’ajouter les balises HTML pour appliquer au texte les styles gras, italique et souligné. Deux autres boutons permettent d’ajouter des liens hypertexte sur des pages externes ou des documents internes à la base, et encore deux pour ajouter des images du serveur :
Dans le champ de logiciels de gestion bibliographiques, le système RefWorks(43), qui fonctionne entièrement sur le web, a aussi introduit un éditeur WYSIWYG pour ajouter certains styles (gras, italique, souligné, exposant ou indice) aux champs titre, notes et commentaire :
Le code HTML introduit dans la base est correctement supprimé dans tout format d’export sauf pour les bibliographies de type HTML ou RTF, dans lesquelles l’enrichissement graphique est utile et peut être conservé.
2. L'enrichissement des catalogues
Les systèmes automatisés mis au point pour la recherche d'informations textuelles sur le web, moteurs de recherche, annuaires, méta moteurs, rivalisent en performance et en innovations et montrent le chemin en matière de fonctionnalités et d'enrichissements possibles pour les catalogues. Plusieurs niveaux sont concernés : le graphisme, l'ergonomie de l'affichage, l’intégration d’informations complémentaires (résumés, commentaires, tables des matières), l'aide à la recherche, les possibilités de tri des résultats, etc.
Images de couverture, résumés et tables des matières des livres
Les catalogues de bibliothèques sont des mines d'information librement disponibles. Mais les données sont très dépouillées et certaines informations importantes manquent encore terriblement à l'appel, comme les tables des matières et les résumés.
Depuis plusieurs années, les moteurs de recherche et les sites commerciaux comme Amazon(44) ont montré une très grande inventivité en enrichissant de plus en plus leur contenu qui, en devenant plus étendu, attire de plus en plus d'utilisateurs qui à leur tour le complètent, dans un phénomène de cercle vertueux qui s’auto-génère une fois dépassée une certaine masse critique. Des fournisseurs de services sont alors apparus permettant aux bibliothèques de s'offrir ce que d’autres avaient réussi à intégrer : tables des matières, résumés et images de couverture sont maintenant vendus ou loués par des sociétés comme Electre(45) ou Syndetics(46). Il est ainsi possible de les ajouter au catalogue à la demande (au moment de la visualisation de la notice complète par exemple) à partir de l'ISBN(47) du document.
Avec une autre logique commerciale visant plutôt à étendre son rayon d’influence et à promouvoir son site grâce aux liens hypertexte, les services web mis en place par Amazon(48) , permettent depuis l’année 2002 d'utiliser gratuitement le contenu en provenance de sa propre base (images des couvertures, revues des lecteurs, prix, etc.) sur n'importe quel autre site Internet qui respecte les conditions légales d’utilisation. Ainsi plusieurs catalogues utilisent déjà les services web d’Amazon pour enrichir les pages du catalogue : Dreiländerkatalog(49) , Lamson Library(50), etc.
Le catalogue SAPHIR, qui a toujours repris dans ses notices des résumés et éléments de tables des matières, utilise maintenant aussi ces services web pour afficher l’image de couverture sur la page de la notice complète des livres. En utilisant de façon contextuelle l’ISBN et le code de la langue du document introduits au catalogage, la technique AJAX(51) permet d’appeler les services web d’Amazon.fr, Amazon.de ou Amazon.com du côté client (c’est le navigateur qui fait le travail) sans aucune charge supplémentaire du coté serveur(52) :
Source : http://www.saphirdoc.ch/permalien.htm?saphirid=44787
Si l’affichage à la demande dans l'OPAC de contenus externes est intéressant et relativement facile à mettre en place, il a le désavantage de ne pas enrichir le contenu de la base de données. Si les tables des matières et les résumés ne sont pas indexés comme les autres champs, il ne sont pas recherchables en même temps que les données du catalogue. D'autres services permettent de remédier à cet inconvénient en permettant d'importer dans la base de données des résumés et tables des matières qui sont alors vendus, et non plus simplement accessibles sous licence comme dans le cas précédent.
Echanges des notices entre catalogues
Avec l’utilisation des AACR2(53) comme règles communes de catalogage et, grâce à des outils simples de pompage(54), intégrés au système de gestion et qui utilisent le protocole Z39.50 mais aussi des techniques d’extraction à partir de pages web, les bibliothèques ont commencé plus que jamais à réutiliser des notices en provenance d’autres catalogues.
En dépit de la réticence de certains catalogueurs qui voient là un risque de perte de créativité (Gavin, 2006), cet usage est devenu très courant et soutenu(55) par la plupart des bibliothèques des réseaux suisses (RERO, IDS(56), etc.).
Importation et syndication des notices d’articles
L’explosion de la production scientifique a poussé depuis quelques années les producteurs de bases de données bibliographiques à développer des partenariats forts avec les éditeurs. Par exemple, la NLM(57), qui produit une base de la taille et de l’importance de PubMed(58), a cessé en 2006 d’introduire manuellement les métadonnées dans sa base, grâce au développement à grande échelle de l’importation des notices d’articles en format XML fournis par les éditeurs(59). Cette technique d’importation des flux XML permet à PubMed de diffuser très rapidement l’information reçue, car les contrôles et les améliorations successives des notices (corrections, indexation…) se font progressivement sans entraver la diffusion des références, qui gardent le même identificateur quel que soit le stade du traitement dans le système. Lorsque les éditeurs ne sont pas à même de fournir les notices dans ce format XML, un système de numérisation puis d’OCR(60) est utilisé pour importer les références avec les résumés dans la base.
Ces partenariats ont toujours fait défaut dans le domaine des bibliothèques, où la relation avec les éditeurs n’est pas de toute évidence, car l’un des rôles subversifs de la bibliothèque provient du fait qu’elle donne accès, à moindre coût, à des contenus soumis au droit d’auteur (Le Moal, 2004) et surtout aux lois du commerce. Du moment où l’hypertexte entre en jeu, les bibliothèques ont un argument pour la négociation, car elles peuvent rendre service aux éditeurs en ajoutant des liens vers leurs plateformes de commerce électronique (ou via des librairies en ligne), ce qui pourrait permettre de développer des collaborations plus importantes.
Une autre possibilité à explorer pour les bases qui ont des ressources plus modestes est d’utiliser les flux RSS(61) offerts par les éditeurs comme source pour l’importation des données dans le catalogue. Le projet TOCRRoS(62) va dans ce sens, en permettant d’ajouter automatiquement et périodiquement les articles publiés par les revues pour lesquelles la bibliothèque dispose d’un abonnement en cours. Le logiciel de gestion Alexandrie permet depuis la version 6 d’importer automatiquement des contenus en provenance des flux RSS externes.
Sans arriver à l’intégration de ces informations dans le catalogue lui-même, une dernière possibilité consiste à afficher le contenu du dernier numéro d’un périodique proposant un flux RSS, au moment de l’affichage de la notice complète dans l’OPAC (Iriarte, 2006). Cette possibilité nécessite l’enregistrement préalable de l’adresse du flux RSS dans le catalogue, pour ensuite pouvoir utiliser de façon contextuelle des services de conversion RSS -> Javascript offerts par différents sites(63).
Importation des notices en provenance des archives ouvertes : utilisation du protocole OAI-PMH(64)
De la même façon qu’aujourd’hui nous pouvons importer dans le catalogue des informations en provenance des flux XML (en format ONIX(65), RSS ou autre) proposés par les éditeurs, il serait possible d’utiliser le protocole OAI-PMH pour ajouter des références en provenance des archives ouvertes ou des dépôts institutionnels comme e-prints(66), arXiv(67), HAL(68), RERO DOC(69), Infoscience(70), etc.
Cette possibilité de moissonner des serveurs de documents à partir du catalogue ne semble pas, à notre connaissance, avoir été exploitée dans les bibliothèques. C’est plutôt dans le sens inverse, c’est-à-dire l’intégration des notices du catalogue dans une base externe, que nous pouvons trouver des réalisations, comme dans les cas des notices de l’OPAC intégrées au serveur institutionnel du CERN (CERN Document Server(71)) ou dans la plateforme Infoscience de l’EPFL (72).
Cette intégration des références provenant de sources hétérogènes dans une couche supplémentaire, permet une plus grande souplesse : il n’y a pas le risque de toucher aux notices qui servent en même temps à la gestion, et éviter d’appliquer aux données importées les mêmes critères de qualité et de sécurité que pour les notices du catalogue. La base de données située dans cette couche (par exemple WorldCat(73), Dreiländerkatalog, TEL(74), etc.) peut alors proposer de nouveaux services et peut être ouverte aux contenus générés par les utilisateurs, dans la ligne des outils sociaux ou web 2.0(75). Dans ce sens il y a un nouveau marché qui se développe, avec des nouveaux outils orientés web 2.0 qui sont proposés aux bibliothèques comme RLG(76), Primo(77), etc.
Texte intégral
L’année 2006 a vu le développement de la campagne de numérisation de livres à grande échelle, « Google Books(78) » , entreprise par la société Google en 2004 en collaboration avec deux groupes de partenaires : d’un côté certains éditeurs et de l’autre un groupe restreint de bibliothèques(79) . D’abord appelé « Google Print », le nom du programme est devenu « Google Books » en 2006, pour palier entre autres aux tensions entre Google et certains éditeurs.
Sans complexe, Google Books affiche l’ambition « de travailler avec des éditeurs et des bibliothèques pour créer un catalogue virtuel complet de tous les livres et dans toutes les langues, dans lequel les internautes pourront effectuer des recherches. »
Si ce projet reste encore très controversé (Salaün, 2005), il a eu le mérite de réveiller la communauté des bibliothèques qui, avec le Président de la Bibliothèque Nationale de France M. Jeanneney à la tête, a réagi de façon active en donnant une impulsion plus forte au projet de la bibliothèque numérique européenne(80) . D’autres bibliothèques ont aussi annoncé des projets de numérisation à large échelle. La British Library(81) a conclu un partenariat avec la société Microsoft(82). De leur côté Yahoo! et la fondation Internet Archive(83) ont aussi annoncé le début de sa propre campagne « Open Content Alliance(84) » . La Library of Congress est, quant à elle, en discussion avec l’UNESCO pour amorcer le lancement d’une Bibliothèque numérique mondiale(85).
Le projet de Google a aussi commencé à porter ses fruits et une grande quantité d’information contenue dans ces bibliothèques est devenue accessible, même si la qualité de numérisation peut être jugée décevante(86). A l’heure actuelle, 10'000 éditeurs et 13 bibliothèques font partie du projet dans son ensemble et, selon les chiffres donnés par Google, le nombre des livres dans son index avoisine le million(87).
Selon le contrat que les bibliothèques participant au volet « Google Books for Libraries » ont signé avec la société Google(88), les fichiers issus de la numérisation ne pourront pas être diffusés par la bibliothèque sans l’accord de Google, ce qui limite leur utilisation dans le catalogue. Malgré cette entrave commerciale, la bibliothèque de l’Université de Michigan(89) propose de visualiser le document numérisé(90)en format image, texte ou pdf dans sa propre plateforme digitale(91) par le biais d’un lien figurant dans la notice complète du catalogue, parallèlement au lien sur le même document dans la plateforme de Google :
Source : http://mirlyn.lib.umich.edu/F?func=find-b&find_code=MDN&local_base=MIU01_PUB&request=39015014807104
Selon ce même principe, les bibliothèques établissent aujourd’hui de plus en plus des liens vers le texte intégral des documents situés sur des serveurs externes au catalogue : articles de périodiques électroniques (en open access ou payants), documents disponibles en libre accès dans les bibliothèques numériques nationales ou internationales (Gallica(92), Projet Gütenberg(93), Biblioteca Virtual Cervantes(94) …), e-prints et thèses des archives ouvertes, etc. Cependant, dans la plupart des cas, ce lien est créé uniquement manuellement (avec les risques que cela comporte, comme la faible pérennité des liens quand on sort du cadre du DOI(95)) et facultativement au moment de la création d’une nouvelle notice et non pas de façon rétrospective. Vu le rythme des campagnes de numérisation en cours, cela signifie que de plus en plus de notices dans nos catalogues resteront sans lien hypertexte avec la version électronique disponible pourtant quelque part sur Internet. Seul un outil performant de gestion des liens peut servir de solution à ce problème, comme nous l’évoquerons dans la deuxième partie, seulement. Après les difficultés rencontrées au moment vouloir intégrer les revues en format électronique au catalogue, nous risquons de nouveau de voir s’agrandir le fossé entre catalogue et ressources en texte intégral en ligne.
Concernant la recherche sur le texte intégral, étant donné que le stockage des documents numériques se situe généralement sur des serveurs déconnectés du catalogue, la recherche simultanée dans les métadonnées et dans le texte intégral des documents ne peut pas être proposée dans l’OPAC, sauf si c’est le catalogue lui-même qui rejoint cette plateforme des documents numériques, comme nous l’avons vu plus haut dans l’exemple du CERN et de l’EPFL.
Dans le cas de l’Université de Michigan, de même que dans le service « Search Inside » d’Amazon(96), la recherche dans le texte intégral ne peut se réaliser que sur un seul document à la fois. Il faut alors passer par Google Books pour pouvoir effectuer une recherche sur l’ensemble du texte intégral de la collection en même temps que sur les métadonnées fournies par la bibliothèque.
Liens profonds : le rôle des identificateurs
Comme nous venons de constater plus haut, les catalogues de bibliothèques introduisent de plus en plus de liens profonds pointant sur le texte intégral du document répertorié ou sur la notice bibliographique résidant sur une base de données externe comme PubMed, dans le but de donner à l’utilisateur le plus grand nombre d’informations disponibles et de source sure, concernant le document catalogué : résumé et liens offerts par PubMed, texte intégral ou résumé offert par l’éditeur de la revue ou sur une plateforme Open Access, nombre de fois que l’article est cité, offerts par une base de données comme Google Scholar, etc.
L’utilisation de ces liens profonds pose de nouveaux problèmes et de nouveaux défis aux catalogues, qui devraient en plus les maintenir à jour à l’aide des méthodes plus ou moins automatisés. Dans cette recherche de stabilité, seulement les liens profonds basés sur des identificateurs pérennes comme le DOI(97) , le PMID(98) ou un identificateur OAI-PMH(99) , ont de garanties de perdurer dans le temps. Il est donc évident qu’il faut utiliser ces identificateurs de façon préférentielle pour établir des liens dans le catalogue, et que nous devons les prendre en charge avec le même soin que nous appliquons à l’ISBN : dans un champ à part bien identifié et avec une syntaxe cohérente et normalisée de type URN(100) . Par exemple il serait préférable d’enregistrer le DOI ou le PMID dans un champ ad hoc et de générer l’URL à la demande, au lieu d’enregistrer cette adresse directement dans le champ dédié aux liens Internet :
- doi:10.1000/182 -> http://dx.doi.org/10.1000/182
- pmid:1234 -> http://www.ncbi.nlm.nih.gov/entrez/query.fcgi?cmd=retrieve&db=pubmed&list_uids=1234
La raison de cette préférence réside dans le fait qu’il est possible d’utiliser cet identificateur à d’autres fins que celui de construire un URL, comme par exemple l’utiliser dans un OpenURL destiné à trouver d’autres services associés au document ou bien dans un format d’export destiné à des logiciels bibliographiques. Bien qu’il soit toujours possible d’extraire automatiquement l’identificateur à partir de l’URL, c’est bien le cas contraire qui est plus aisé et canonique, d’autant plus que les URLs utilisés par CrossRef(101) et par PubMed, bien que garantis pour un bon nombre d’années, ne sont pas des liens pérennes et peuvent varier dans le futur (on peut imaginer par exemple un nouveau protocole qui remplacerait le http, etc.).
Dans la même optique, le catalogage des notices d’articles (aussi appelées notices analytiques) devraient incorporer autant que possible ces identificateurs pérennes ainsi que l’ISSN(102), seul élément d’identification fiable de la revue à laquelle ils appartiennent. Si ces informations, ainsi que la date de publication, le numéro du périodique, du volume, la page de début et celle de fin de l’article étaient codées de façon structurée dans ce type de notices, ce qui est loin d’être le cas aujourd’hui dans la plupart de catalogues de bibliothèques(103), l’utilisation d’un outil de gestion de liens serait beaucoup plus efficace et permettrait une plus grande précision à l’heure d’identifier l’existence du texte intégral ou de proposer des services associés via un OpenURL en provenance de l’OPAC.
Contenu généré par les utilisateurs
Suivant l’exemple des sites commerciaux comme Amazon et des outils sociaux de plus en plus nombreux (Wikio(104), del.icio.us(105), Flickr(106), Connotea(107) …), il est grand temps que les lecteurs puissent déposer des annotations, des tags ou des commentaires par rapport aux livres disponibles dans les catalogues des bibliothèques et, pourquoi pas, les laisser intervenir sur l'indexation des documents avec des tags, sans utiliser les ressources du SIGB, mais en offrant des applications s’appuyant sur des services web comme le fait par exemple HubMed(108).
Cette possibilité de commenter ou tagger l’information est déjà implémentée dans certains catalogues ou archives ouvertes : WorldCat, Lamson Library(109), Dreiländerkatalog, CERN Document Server… Cependant, elle est absent de la plupart des OPACs classiques gérés par un SIGB.
Utilisation des données de gestion
En s’inspirant d’Amazon, les catalogues ont commencé à exploiter les données générées par l’activité des utilisateurs pour effectuer des suggestions de lecture :
- à partir des données anonymisées en provenance des emprunts, comme le fait la Ann Arbor District Library (AADL)(110) : « Les utilisateurs qui ont emprunté ce document ont aussi emprunté…»
- à partir des données en provenance de la consultation web, comme le fait RERO DOC : « Les utilisateurs qui ont vu cette page ont aussi vu… »
La possibilité d’exploiter de façon dynamique et pondérée les données du document en cours de visualisation, peut aussi conduire à des suggestions de type « Related articles » de PubMed ou « Related Books » de WorldCat.
Autres services web bibliographiques
En dehors des services web d’Amazon, il y a malheureusement un choix très restreint pour le moment :
- XISBN(111) (OCLC) : ISBNs en relation avec l’ISBN envoyé (utilisé par le Dreiländerkatalog)
- CrossRef(112) : Métadonnées à partir d’un DOI et vice-versa
- PubMed(113) : une des applications les plus avancées dans ce domaine, il met à disposition de la communauté plusieurs services web : métadonnées à partir d’un ou plusieurs PMIDs ou vice-versa, ainsi que les articles liés ou les informations des bases de données connexes (génétique, moléculaire, etc.) à partir de l’identificateur d’une ou de plusieurs références. Il offre aussi par service web la correction orthographique des termes de recherche.
D’autres services web généralistes pourraient être aussi exploités, comme par exemple l’affichage des localisations géographiques des bibliothèques d’un réseau qui possèdent un document en particulier, en utilisant l’API de Google Maps(114). Un service web de ce type pourrait aussi être utilisé pour afficher l’emplacement précis dans lequel une image ou un film du catalogue a été prise. Ceci nécessiterait l’ajout des métadonnées géographiques (ou « geotagging »(115) ) au catalogage des images fixes ou animées, comme cela se fait déjà sur des plateformes de partage des photos comme Flickr(116).
Conclusion
Après cette énumération de services, d’outils et d’informations externes au catalogue dignes d’être incorporés dans cet outil, la question de la surcharge informationnelle pourrait être posée. Toutes ces options ne risquent-elles pas d’engendrer confusion et désorientation ? La force du catalogue résiderait-elle alors dans son dépouillement ? Nous pouvons en douter. Les catalogues offrent actuellement peu de possibilités pour que les utilisateurs, y compris les professionnels de l’information eux-mêmes, s’approprient cet outil, ce qui est indispensable pour qu’il puisse trouver une place importante dans l’ensemble du paysage informationnel du web, devenu aujourd’hui notre plateforme de travail.
Certes, le risque est grand de se retrouver noyé sous une masse impressionnante d'applications et d'informations. Mais en offrant des données riches, bien structurées et ouvertes à l’extérieur, ainsi qu’une interface ergonomique, simple d’utilisation et d’appropriation par les usagers, le catalogue peut prouver à nouveau son utilité et redevenir ainsi un élément fort dans l’univers d’Internet. Pour y arriver, nous avons parcouru quelques pistes qui vont dans le sens d’une maîtrise des technologies du web par les bibliothèques et dans l’intégration d’éléments externes au catalogue. L’autre aspect clé de la question, la face opposée de la même monnaie, réside dans l’ouverture du catalogue à de nouvelles formes d'utilisation de ses propres données par des tiers, dans un changement de mentalité qui considérerait « le web » comme un utilisateur à part entière.
Dans la deuxième partie de cet article, nous traiterons donc les aspects suivants liés à cette ouverture du catalogue vers la réutilisation de ses données :
- Citabilité et Permaliens
- OpenURL et COINS
- RSS
- Sitemaps
- Indexation par des moteurs de recherche
- Export XML pour Google Scholar
- Open search et SRU/SRW
- Services web et APIs
Notes
(1) Quelques exemples sortis de la « biblioblogsphère » : Burn the catalog http://www.swarthmore.edu/SocSci/tburke1/perma12004.html ; Disintegration, disenchantment, distrust, and development http://www.polarislibrary.com/forums/blogs/techtidbits/archive/2006/12/0...
(2) If amazon sucked like our old opac http://library2.csusm.edu/amazon/index.htm
(3) Caractérisés par le phénomène connu sous le nom du « web 2.0 »
(4) eXtensible Markup Language http://www.w3.org/XML/
(5) http://www.opensource.org
(6) http://openaccess.inist.fr
(7) http://www.openarchives.org
(8) http://openurl.info/registry
(9) Uniform Resource Locator http://www.w3.org/Addressing/URL/Overview.html
(11) http://www.opensearch.org
(12) Si ce terme est complètement nouveau, le concept ne l’est pas. Voir par exemple le projet « eXtensible Catalog (XC) » de l’Université de Rochester à New-York http://www.extensiblecatalog.info/ et http://www.rochester.edu/news/show.php?id=2518 Nouvelles Technologies de l’Information et la Communication
(13) Pour suivre l’évolution et les nouveaux OPACs innovateurs, vous pouvez utiliser la liste de diffusion « NGC4Lib - Next Generation Catalogs for Libraries » et ses archives : http://dewey.library.nd.edu/mailing-lists/ngc4lib/
(14) SIBIL était à l’origine l’acronyme de « Système intégré pour les bibliothèques universitaires de Lausanne » (Gavin, 1997)
(15) http://www.unil.ch/bcu
(16) MAchine-Readable Cataloging http://www.loc.gov/marc/
(17) Conseil Européen pour la Recherche Nucléaire. Aujourd'hui le nom CERN désigne l'Organisation européenne pour la Recherche nucléaire http://www.cern.ch
(18) http://www.slac.stanford.edu
(19) http://news-service.stanford.edu/news/2001/april11/addis-411.html
(20) Content Management System
(21) Outil de publication web instantanée et ouvert aux modifications des utilisateurs. Il est utilisé par exemple pour le projet Wikipédia http://fr.wikipedia.org/wiki/Wiki
(22) Devenue norme ISO 23950 en 1998, ce protocole s’appelait dans sa version d’origine « Information Retrieval (Z39.50); Application Service Definition and Protocol Specification, ANSI/NISO Z39.50-1995 ». Il s’agit d’un protocole antérieur au web et qui spécifie des structures de données et les règles d’échange qui permettent à une machine client (nommé « origin ») de chercher des données dans un serveur (nommé « target ») et de d’obtenir les entrées résultant de cette recherche http://www.loc.gov/z3950/agency/resources/
(23) http://www.loc.gov
(24) La norme Z39.50, malheureusement très peu utilisée en dehors du domaine des bibliothèques, n’est pas exploitable à travers le protocole HTTP et il faut donc un logiciel spécifique pour l’utiliser. L’apparition de XML et les services web associés qui se développent un peu partout, sont en train de précipiter son déclin.
(25) Karlsruher Virtuelle Katalog http://www.ubka.uni-karlsruhe.de/kvk.html
(26) Outil de publication web personnelle appelé aussi weblog, carnet web, joueb… Pour plus d'information voir l’article de Wikipédia : http://fr.wikipedia.org/wiki/Blog
(27) Contraction de « iPod » et de « broadcasting ». Forme de flux RSS auquel on ajoute des fichiers sonores qui sont alors disponibles directement à partir du lecteur RSS ou téléchargeables automatiquement dans un baladeur numérique. Voir aussi la définition de Wikipédia : http://fr.wikipedia.org/wiki/Podcasting
(28) Aussi appelés « Link resolvers », ces outils permettent de générer dynamiquement une liste de liens cibles à partir des métadonnées de la source : lien vers le texte intégral ou vers le formulaire de commande, recherches par ISSN, auteur, titre ou descripteur dans les catalogues, etc. En Suisse l’outil le plus utilisé reste SFX http://www.exlibrisgroup.com/sfx.htm commercialisé par la société Ex.libris qui possède aussi le SIGB Aleph utilisé par le réseau suisse alémanique IDS.
(29) Les catalogues donnent pour le moment très peu des liens externes. Par exemple pour le catalogue collectif du réseau romand (RERO) seulement le 1% de notices portent un URL (environ 30.000 sur 3 millions)
(30) PHP est l'acronyme récursif de « PHP Hypertext Preprocessor ». PHP est un langage de script qui est très utilisé pour créer des sites web dynamiques. Site officiel : http://www.php.net. MySQL est un logiciel libre de gestion de bases de données de type SQL (Structured Query Language). Site officiel : http://www.mysql.com
(31) « Google Docs & Spreadsheets » http://docs.google.com et « Think free » http://www.thinkfree.com sont déjà des bons exemples de cette évolution. Les SIGB open source disponibles sur le marché (PMB http://www.sigb.net, Koha http://www.koha.org, OpenBiblio http://openbiblio.sourceforge.net…) sont pour la plupart déjà des systèmes « full-web » car, autant la gestion, le paramétrage, le catalogage que la consultation se font à travers le navigateur sans utiliser des clients lourds comme dans les systèmes propriétaires actuels, où seules la consultation et certaines options liées à la gestion des prêts et des lecteurs (inscriptions, réservations, prolongations, PEB, etc.) passent à travers le web
(32) Voir les statistiques publiées par l’OFS « Utilisation d'Internet dans les ménages en Suisse : Résultats de l'enquête 2004 et indicateurs » et qui montrent l’augmentation très forte de l’utilisation d’internet au sein de la population suisse ces dernières années : http://www.bfs.admin.ch/bfs/portal/fr/index/themen/kultur__medien__zeitv.... Ces chiffres suivent la tendance générale annoncée par l’UIT dans son rapport « digital.life » http://www.itu.int/digitalife et qui donnent, pour une personne entre 18 et 54 ans, une consommation moyenne hebdomadaire de médias numériques de 16 heures, tandis que de 13 heures pour la TV, 8 pour la radio, 4 pour les journaux et quotidiens papier et 1 pour le cinéma
(33) WYSIWYG est l’acronyme de la locution anglaise « What You See Is What You Get ». Les interfaces de ce type sont utilisées dans les logiciels de mise en page et surtout dans les plateformes de blogging comme outil pour pouvoir écrire facilement pour le web sans connaître le langage HTML
(34) Le fait de copier/coller du contenu en provenance d'une page web dans le corps d'un billet d'un blog peut poser des problèmes d'affichage car l'éditeur WYSIWYG cache le code HTML. Ce dernier peut pourtant contenir des balises pouvant interférer avec le code de la page du blog
(35) Généré automatiquement au moment de l’affichage
(36) http://www.rero.ch/page.php?section=zone&pageid=856
(37) C’est encore le cas des catalogues du réseau IDS et ce fut aussi le cas pendant longtemps pour les catalogues du réseau romand. Cependant, RERO a changé son approche et dans la nouvelle version de son OPAC http://opac.rero.ch, introduite depuis le 8 janvier 2007, les liens de la zone 856 sont désormais affichés déjà au niveau de la liste de résultats
(38) RERO est l’acronyme de « REseau Romand », et désigne le réseau des bibliothèques de Suisse occidentale majoritairement de langue française http://www.rero.ch
(39) Par exemple http://opac.rero.ch/get_bib_record.cgi?rero_id=R277678560
(40) Par exemple http://opac.rero.ch/get_bib_record.cgi?rero_id=R003636602
(41) SAPHIR (Swiss Automated Public Health Information Ressources) http://www.saphirdoc.ch. Base documentaire suisse spécialisé en santé publique et dont le CDSP est le responsable.
(42) http://www.gbconcept.com/pro_alexandrie.html
(43) http://www.refworks.com
(44) http://www.amazon.com
(45) http://www.electre.com
(46) http://www.syndetics.com
(47) « International Standard Book Number ». l’ISBN est un identificateur international, défini par la norme ISO 2108, et qui sert à identifier sans ambiguïté chaque livre. Existant depuis 1972, les ISBN son attribués et gérés par un réseau d’agences reparties dans 166 pays, avec une centrale à Londres. En suisse romande, c’était l'agence francophone pour la numérotation internationale du livre (AFNIL) qui gérait les numéros ISBN jusqu’à 1994. Depuis cette date, la gestion est assuré par la « Schweizer Buchhändler- und Verleger-Verband SBVV » ttp://www.swissbooks.ch/prestations/isbn/uebersicht.shtm. D’abord constitué par 10 chiffres significatives, il a passé à 13 depuis janvier 2007 devenant ainsi compatible avec les codes-barre de la norme EAN 13 http://isbn-international.org
(48) http://www.amazon.com/AWS-home-page-Money/b/ref=sc_iw_l_0/103-1555994-97...
(49) http://suchen.hbz-nrw.de/dreilaender/
(50) Projet expérimental d’OPAC http://www.plymouth.edu/library/opac/ basé sur la plateforme de blogging WordPress http://wordpress.org
(51) Asynchronous JavaScript And XML. C’est un ensemble de techniques qui permet à une page web d’échanger des informations externes sans devoir être actualisée. Voir l’article fondateur de Jesse James Garrett « Ajax: A New Approach to Web Applications » http://www.adaptivepath.com/publications/essays/archives/000385.php
(52) La technique est expliquée en détail sur le blog de la BiUM http://www.bium.ch/blog/?p=106
(53) Anglo-American Cataloguing Rules, 2nd Edition http://www.aacr2.org
(54) Comme par exemple « EZPump (EZP) » http://www.ngscan.com/easypump/index.htm, logiciel de pompage des notices bibliographiques avec client Z39.50, développé par un bibliothécaire de la Médiathèque Valais et utilisé par les bibliothèques de RERO
(55) Voir La Lettre de RERO, 2006-4 http://www.rero.ch/pdfview.php?section=lalettre&filename=LaLettre2006_04...
(56) IDS est l’acronyme de « Informationsverbund Deutschschweiz » et désigne le réseau des bibliothèques de Suisse orientale, majoritairement de langue allemande http://www.informationsverbund.ch
(57) http://www.nlm.nih.gov
(58) http://www.pubmed.org
(59) http://www.nlm.nih.gov/bsd/bsd_key.html
(60) Optical Character Recognition
(61) RSS est utilisé comme acronyme de « Really Simple Syndication », « Rich Site Summary », « RDF Site Summary » ou une autre variante de ces termes. Pour plus de détails, voir la page explicative faite par l'ADBS : http://www.adbs.fr/site/repertoires/outils/rss.php
(62) TOCRoSS http://www.jisc.ac.uk/whatwedo/programmes/programme_pals2/project_tocros...
(63) Par exemple http://itde.vccs.edu/rss2js/build.php ou http://www.rss-to-javascript.com
(64) « Open Archive Initiative and Protocol for Metadata Harvesting » http://www.openarchives.org/pmh/
(65) http://www.editeur.org/onix.html
(66) http://www.eprints.org
(67) http://arxiv.org
(68) http://hal.archives-ouvertes.fr
(69) http://doc.rero.ch
(70) http://infoscience.epfl.ch
(71) http://cdsweb.cern.ch
(72) http://www.epfl.ch
(73) http://www.worldcat.org
(74) The European Library : http://www.theeuropeanlibrary.org
(75) Voir par exemple l’article de wikipedia http://en.wikipedia.org/wiki/Web_2 et l’article fondateur de Tim O’Reilly « What Is Web 2.0 : Design Patterns and Business Models for the Next Generation of Software » http://www.oreillynet.com/pub/a/oreilly/tim/news/2005/09/30/what-is-web-.... Version française : http://web2rules.blogspot.com/2006/01/what-is-web-20-par-tim-oreilly-ver...
(76) http://www.rlg.org
(77) Primo http://www.exlibrisgroup.com/webinar_1144862525.htm
(78) http://books.google.com et depuis quelque temps seulement aussi consultable sur http://books.google.ch
(79) D’abord limité à 5, maintenant ce sont 13 bibliothèques qui fournissent les documents en échange des données obtenues par la numérisation : la bibliothèque de l'Université de Virginie, de Californie, de Harvard, de Stanford, du Michigan, du Wisconsin-Madison, de Texas, de Princeton, de Madrid, d’Oxford ainsi que la bibliothèque publique de New York et les bibliothèque de Catalogne et de Bavière. La bibliothèque du Congrès américain (Library of Congress) fait l'objet d'un autre projet à part : http://www.washingtonpost.com/wp-dyn/content/article/2005/11/21/AR200511...
(80) Voir le communiqué de presse de la commission européenne : http://europa.eu/rapid/pressReleasesAction.do?reference=IP/06/253&format... et la page du programme de l’UE « i2010: Digital Libraries Initiative » : http://ec.europa.eu/information_society/activities/digital_libraries/ind...
(81) http://www.bl.uk
(82) http://www.microsoft.com
(83) http://www.archive.org
(84) http://www.opencontentalliance.org. Voir aussi l’article de CNET News.com : « Yahoo to digitize public domain books » http://news.com.com/Yahoo+to+digitize+public+domain+books/2100-1038_3-58...
(85) Voir l’annonce fait par l’UNESCO : http://portal.unesco.org/fr/ev.php-URL_ID=35949&URL_DO=DO_TOPIC&URL_SECT...
(86) Voir par exemple l’article et le billet de Lorcan Dempsey « Fingering volumes » http://orweblog.oclc.org/archives/001122.html, « Le travail bâclé de Google Print » http://www.dsi-info.ca/moteurs-de-recherche/2005/11/le-travail-bcl-de-go... ou « Digitized by Google » http://e-benedictins.blogspot.com/2006/09/digitalized-by-google.html
(87) http://librariancentral.blogspot.com/2007/03/checking-in-with-google-boo...
(88) Voir l’article de LibraryJournal.com « Release of Google Contract with UC Sparks Criticism » http://www.libraryjournal.com/article/CA6367340.html
(89) http://lib.umich.edu/
(90) Par exemple, la page 7 du document « Versuch schweizerischer Gedichte » : http://mdp.lib.umich.edu/cgi/m/mdp/pt?seq=7&size=100&id=39015014807104&v.... Voir aussi à ce sujet l’article de The Chronicle of Higher Education : « U. of Michigan Adds Books Digitized by Google to Online Catalog, but Limits Use of Some » http://chronicle.com/free/2006/08/2006083101t.htm
(91) « Mbooks » : http://www.lib.umich.edu/mdp/
(92) http://gallica.bnf.fr
(93) http://www.gutenberg.org
(94) http://www.cervantesvirtual.com
(95) Document Object Identifier : http://www.doi.org
(96) http://www.amazon.com/Search-Inside-Book-Books/b?ie=UTF8&node=10197021
(97) http://www.doi.org
(98) http://en.wikipedia.org/wiki/PMID ou http://pmid.us/
(99) http://www.openarchives.org/OAI/openarchivesprotocol.html#UniqueIdentifier
(100) http://fr.wikipedia.org/wiki/Uniform_Resource_Name
(101) Organisation chargée de gérer les DOI http://www.crossref.org
(102) L'ISSN (International Standard Serial Number) est un numéro à huit chiffres non significatives de la forme 1234-5678 et qui identifie les périodiques, y compris en format électronique. La gestion des ISSN, qui compte plus d'un million aujourd’hui, est effectuée par un réseau mondial de 80 centres nationaux (dont la Bibliothèque Nationale Suisse) coordonnés par un centre international à Paris http://www.issn.org/fr En effet dans la majorité de notices analytiques présentes dans les catalogues des bibliothèques universitaires, l’ISSN de la revue est absent.
(103) Les autres éléments clés pour identifier un article, tels le volume, et les pages de début et de fin, sont répertoriés dans une zone « In » peu normalisée et difficilement exploitables sans un traitement informatique
(104) http://www.wikio.com
(105) http://del.icio.us
(106) http://flickr.com
(107) http://www.connotea.org
(108) Interface alternative à PubMed utilisant les services web de cette dernière en ajoutant des nouvelles fonctionnalités comme le « tagging » ou la catégorisation par facettes : http://www.hubmed.org
(109) http://www.plymouth.edu/library/opac/
(110) http://www.aadl.org/catalog
(111) http://www.oclc.org/research/projects/xisbn/
(112) http://www.google.com/apis/maps/
(115) Voir l’article de Wikipedia http://en.wikipedia.org/wiki/GeoTagging
(116) http://www.flickr.com/groups/geotagging/
Bibliographie
BBF (2005). Dossier : Mort et transfiguration des catalogues. BBF : Bulletin des Bibliothèques de France [en ligne], [consulté le 15 janvier 2007], T. 50, n° 4. http://bbf.enssib.fr/sdx/BBF/frontoffice/2005/04/sommaire.xsp
BEARMAN, David (décembre 2006). Jean-Noël Jeanneney's Critique of Google: Private Sector Book Digitization and Digital Library Policy. D-Lib Magazine [en ligne], [consulté le 15 janvier 2007], vol. 12, n°12. http://www.dlib.org/dlib/december06/bearman/12bearman.html
BIBLIOGRAPHIC SERVICES TASK FORCE (décembre 2005). Rethinking How We Provide Bibliographic Services for the University of California [en ligne]. The University of California Libraries [consulté le 15 janvier 2007]. http://libraries.universityofcalifornia.edu/sopag/BSTF/Final.pdf
BROUDOUX, Evelyne, GRESILLAUD, Sylvie, LE CROSNIER, Hervé, LUX-POGODALLA, Véronika (18 septembre 2005). Construction de l’auteur autour de ses modes d’écriture et de publication. H2PTM'05 [en ligne], [consulté le 15 janvier 2007]. http://archivesic.ccsd.cnrs.fr/sic_00001552
CALHOUN, Karen, (2006). The Changing Nature of the Catalog and its Integration with Other Discovery Tools [en ligne]. Final report prepared for the Library of Congress, March 17, [consulté le 15 janvier 2007]. http://www.loc.gov/catdir/calhoun-report-final.pdf
ÇELIKBAS, Zeki (novembre 2004). What is RSS and how it can serve libraries. E-prints in Library and Information Science [en ligne], [consulté le 15 janvier 2007]. http://eprints.rclis.org/archive/00002531/
CHUDNOV, Daniel, CAMERON, Richard, FRUMKIN, Jeremy, SINGER, Ross,YEE, Raymond (avril 2005). Opening up OpenURLs with Autodiscovery. Ariadne [en ligne], issue 43, [consulté le 15 janvier 2007]. http://www.ariadne.ac.uk/issue43/chudnov/
DEMPSEY, Lorcan (2006). The Library Catalogue in the New Discovery Environment: Some Thoughts. Ariadne [en ligne], issue 48, [consulté le 15 janvier 2007]. http://www.ariadne.ac.uk/issue48/dempsey/
DEMPSEY, Lorcan (22 fevrier 2005). The integrated library system that isn't. Lorcan Dempsey's weblog On libraries, services and networks [en ligne], [consulté le 15 janvier 2007]. http://www.ariadne.ac.uk/issue48/dempsey/
DUCHEMIN, Pierre-Yves (2005). L’enrichissement des catalogues ? Et après ? BBF [en ligne], n° 4, p. 21-27 [consulté le 15 janvier 2007]. http://bbf.enssib.fr
GARREAU, Angélina (19 septembre 2005). Les blogs entre outil de publication et espace de communication : un nouvel outil pour les professionnels de la documentation [en ligne]. Maîtrise des sciences de l'information et de la documentation, CAOA, Université, [consulté le 15 janvier 2007]. http://memsic.ccsd.cnrs.fr/mem_00000273.html
GAVIN, Pierre (1997). SIBIL : un bilan pour le passé, et quelques jalons pour le futur [en ligne]. Lausanne : Nouvelle Association REBUS (Réseau des bibliothèques utilisant SIBIL), [consulté le 15 janvier 2007]. http://www.pierregavin.ch/documents/Sibil-bilan-jalon.pdf
GAVIN, Pierre (2006). Les AACR2 : menace ou chance ?. Hors texte, n° 80, p. 16-18
HAMMOND, Tony, HANNAY, Timo, LUND, Ben (décembre 2004). The Role of RSS in Science Publishing : Syndication and Annotation on the Web. D-Lib Magazine [en ligne], vol. 10, n°12, [consulté le 15 janvier 2007]. http://www.dlib.org/dlib/december04/hammond/12hammond.html
IRIARTE, Pablo (2006). La diffusion de l'information documentaire et des actualités en format RSS. In CHARTRON, Ghislaine [dir.], BROUDOUX, Evelyne [dir.]. Document numérique et société : actes de la conférence organisée dans le cadre de la semaine du document numérique à Fribourg (Suisse) les 20 et 21 septembre 2006 [imprimé]. Paris : ADBS, [consulté le 15 janvier 2007]. P. 123-148. http://archivesic.ccsd.cnrs.fr/sic_00079211
LEBOEUF, Patrick (2004). Le jour d’après : où serez-vous ?… [en ligne]. Journée d’étude Médiadix (Jeudi 21 Octobre 2004) : La fin du catalogage ?! [consulté le 15 janvier 2007]. http://netx.u-paris10.fr/mediadix/archivesje/leboeufweb.pdf
LE MOAL, Jean-Claude [coord.], HIDOINE, Bernard [coord.], CALDERAN, Lisette [coord.] (2004). Publier sur Internet : séminaire INRIA, 27 septembre - 1er octobre 2004, Aix-les-Bains [imprimé]. Paris : ADBS. ISBN 2843650720
MARKEY, Karen (janvier 2007). The Online Library Catalog : Paradise Lost and Paradise Regained?. D-Lib Magazine [en ligne], [consulté le 15 janvier 2007], vol. 13, n°1/2. http://www.dlib.org/dlib/january07/markey/01markey.html
MOFFAT, M (Mars 2006). “Marketing” with Metadata : How Metadata Can Increase Exposure and Visibility of Online Content [en ligne], version 1.0, 8 [consulté le 15 janvier 2007] http://www.icbl.hw.ac.uk/perx/advocacy/exposingmetadata.htm
SALAÜN, Jean-Michel (décembre 2005). Bibliothèques numériques et Google-Print. Version non révisée par l'éditeur de l’article pour la revue Regard sur l'actualité [en ligne], [consulté le 15 janvier 2007], n° 316. http://archivesic.ccsd.cnrs.fr/sic_00001576
SCHNEIDER, Karen G (20 Mai 2006). How OPACs Suck, Part 3: The Big Picture. ALA TechSource [en ligne], [consulté le 15 janvier 2007]. http://www.techsource.ala.org/blog/2006/05/how-opacs-suck-part-3-the-big...
STEPHENS, Michael (2006). Web 2.0 & Libraries : Best Practices for Social Software. Library Technology Reports, vol. 42, no. 4. ISSN 0024-2586
TENAILLEAU, Willy (14 mars 2006). Les services à distance d'une médiathèque - synthèse 3 : Les notices bibliographiques. LaConjuration/notes [en ligne], [consulté le 15 janvier 2007]. http://www.laconjuration.net/notes/?2006/03/14/33-les-services-a-distanc...

La revue Ressi
- N° Spécial DLCM
- N°21 décembre 2020
- N°20 décembre 2019
- N°Spécial 100ans ID
- N°19 décembre 2018
- N°18 décembre 2017
- N°17 décembre 2016
- N°16 décembre 2015
- N°15 décembre 2014
- N°14 décembre 2013
- N°13 décembre 2012
- N°12 décembre 2011
- N°11 décembre 2010
- N°10 décembre 2009
- N°9 juillet 2009
- N°8 décembre 2008
- N°7 mai 2008
- N°6 octobre 2007
- N°5 mars 2007
- N°4 octobre 2006
- N°3 mars 2006
- N°2 juillet 2005
- N°1 janvier 2005