Dossiers

Archives : des ressources en ligne sous-exploitées

2.png

D’un site à l’autre, des intitulés différents et des pictogrammes méconnus peuvent dérouter le chercheur.

En octobre 2019, nous vous avons sollicités pour répondre à une enquête lancée par l’Association des archivistes français (AAF) sur votre usage des ressources en ligne proposées par les sites d’Archives départementales. Près de 1 400 d’entre vous ont répondu aux sept questions qui étaient posées. Analysons maintenant ces résultats.

Un plébiscite pour les documents numérisés

En tout premier lieu, on découvre que les répondants sont de vrais « accros » aux sites des Archives départementales : 92,6 % d’entre eux les fréquentent « souvent » et 6 % « occasionnellement » . Dans la quasi-totalité des cas (99,1 %), c’est pour consulter directement un document numérisé disponible en ligne. Déception en revanche pour les directeurs d’Archives qui souhaiteraient que leur site soit une antichambre préparatoire à des recherches sur place : moins d’un quart des internautes (21,8 %) fouillent les pages virtuelles pour trouver une référence, de document d’archive ou de livre, en prévision d’un déplacement en salle de lecture. Et ils sont seulement 7,1 % à y chercher une référence en vue d’une demande de reproduction.

Corroborant ces premiers résultats, une autre réponse à l’enquête montre que seulement 19,1 % des personnes interrogées font « souvent » une recherche pour trouver autre chose que des images numérisées disponibles en ligne, plus d’un quart (25,3%) n’en faisant jamais. Enfin, quand on leur demande s’ils ont déjà utilisé un formulaire de recherche dédié aux ouvrages imprimés conservés dans la bibliothèque des Archives, 17,1 % répondent par l’affirmative, 55,7 % indiquent qu’ils n’en ont pas besoin et 22,3 % affirment qu’ils ne l’ont pas trouvé.

Cette enquête montre également que les internautes ont bien appréhendé la richesse variée des sites d’Archives départementales. En effet, 98,6 % d’entre eux savent qu’il existe d’autres contenus numérisés que l’état civil (recensements de population, registres matricules militaires, hypothèques, cartes postales,…). En revanche, ils ne sont plus que 82,6 % à savoir qu’ils peuvent trouver sur ces pages des références d’archives non numérisées, sous forme d’inventaires. Quant aux outils d’aide à la recherche (fiches méthodologiques, tutoriels,…), plus d’un quart des répondants n’en connaissent pas l’existence (27,7 %).

La dernière question de cette consultation des chercheurs invitait à classer par degré d’importance leurs attentes fonctionnelles pour effectuer des recherches sur ces sites. Les résultats montrent que la première exigence est la facilité pour trouver une référence, une cote ou accéder à un document numérisé, immédiatement, suivie par la clarté de l’affichage des résultats d’une recherche. Non loin derrière, on trouve également la pertinence des résultats par rapport à la recherche alors que la possibilité d’utiliser des filtres dans les résultats n’arrive qu’en quatrième position parmi les besoins exprimés, représentant au total moins d’un tiers des réponses. Enfin, en bout de liste, on trouve le besoin d’aide en ligne sur le site.

Des sites Internet tournés vers l’utilisateur

À l’issue de cette première partie de l’étude menée par l’AAF, en collaboration avec La Revue française de Généalogie, on peut affirmer que le réflexe n’est pas encore acquis d’utiliser les sites des Archives départementales comme des outils préparatoires à une exploration des sources complémentaires à celles qui sont présentées en ligne. Ces chiffres montrent en effet que les sites des Archives départementales sont d’abord vus comme des banques d’images disponibles en ligne et pas encore comme des salles de lecture virtuelles où le chercheur consulterait autant d’instruments de recherches que d’archives originales.

On note également une déception modérée des internautes en constatant que 37,6 % des interrogés considèrent que le site qu’ils ont consulté a répondu « partiellement » à leurs attentes, un chiffre légèrement supérieur à celui des « complètement » satisfaits (31,8 %). La dernière part des participants à l’enquête, prudente, répond que « cela dépend des sites » (30,4 %). À la décharge des internautes, le Web est encore loin d’être un parfait miroir de la richesse des inventaires et autres outils qu’on trouve dans les salles de lecture physiques. Et sans tirer de conclusions hâtives, on peut s’interroger sur la responsabilité partagée de ce déficit : les internautes manqueraient-ils de curiosité ou les archivistes devraient-ils mieux travailler l’attractivité des fonds moins visibles ?

Les résultats de cette enquête en ligne ont été présentés par Isabelle Homer, directrice des Archives départementales de la Marne, lors des dernières Rencontres annuelles de la section des archivistes départementaux (RASAD) – dont elle assure la vice-présidence – les 6 et 7 février 2020, à Lyon. Ils constituaient un des trois piliers d’une étude beaucoup plus large comprenant une analyse de l’existant par un groupe de travail d’archivistes et une étude de cas soumise à un panel de chercheurs. L’objectif de ce travail, qui a commencé en septembre 2018 et s’étale sur plusieurs années, s’inscrit dans une démarche globale qui consiste à créer demain des sites résolument tournés vers les utilisateurs.

« Nos travaux n’ont pas pour but de changer l’archivistique française ni d’abolir le cadre de classement en vigueur depuis plus de deux siècles. La hiérarchie analogique héritée de nos pairs est destinée aux humains. Pour qu’elle devienne compréhensible par une machine nous devons inventer et mettre en place une description qui permettra de tisser une toile d’araignée, c’est-à-dire d’établir plus de liens entre les ressources. Ainsi les utilisateurs auront plus de réponses pertinentes quand ils interrogeront nos sites à partir de mots-clés saisis dans un moteur de recherche. Tout cela sans abandonner la hiérarchie classique à laquelle sont habitués les archivistes et les chercheurs les plus aguerris », précise Isabelle Homer.

Une analyse de l’existant

En faisant l’analyse de nombreux sites d’Archives départementales, le groupe de travail dédié a été surpris d’un premier constat concernant les pages d’accueil : les dénominations utilisées sont très variées (plus de 70 variantes) pour désigner des rubriques identiques d’un site à l’autre. Bien sûr, le registre lexical est le même mais néanmoins on trouve, par exemple pour désigner le moteur de recherche, les mots « chercher » , « rechercher » , « recherche » , « moteur de recherche » , « recherche globale » , etc. Pour l’accès aux documents numérisés, certains sites ont créé une rubrique « archives en ligne », d’autres « archives numérisées », « ressources numérisées » , d’autres encore « ensemble des fonds », « état des fonds », ou « rechercher dans nos fonds » … et parfois même plusieurs de ces formulations sont utilisées sur la même page d’accueil ! De quoi dérouter utilisateurs néophytes tout autant que chercheurs avertis. Lors des RASAD de février, un groupe d’archivistes a été mis au travail avec pour but de définir un vocabulaire commun et des pictogrammes communs afin de produire un guide pratique pour les directeurs qui voudraient refondre leur site, sous forme de fiches d’aide à la décision.

Autre preuve d’hétérogénéité, la recherche cartographique n’est par exemple proposée que par un tiers des sites analysés dans le cadre de cette étude. Peu utilisée par les internautes, elle permet pourtant dans 69 % des cas d’avoir accès à un ensemble d’instruments de recherche permettant notamment de balayer toutes les sources en ligne liées à une commune ainsi qu’à des informations de géographie historique, de type dictionnaire par exemple. Plus rares encore sont les sites proposant une recherche chronologique. Le principe de celle-ci est d’obtenir un aperçu des sources disponibles pour une période donnée. La recherche peut s’effectuer par grandes périodes déterminées à l’avance (Antiquité, Moyen Âge, Ancien Régime, Révolution, etc.) ou via un histogramme sur lequel le chercheur vient positionner sa demande chronologique. L’avantage de cette dernière présentation est de montrer la volumétrie des documents pour chaque époque.

recherche_geographique


Un exemple de recherche cartographique utilisant GoogleMaps : les archives départementales de la Marne

recherche_chronologique


Certains sites proposent une recherche chronologique. Les documents sont accessibles soit par grandes périodes identifiées, comme dans le Rhône, soit en sélectionnant une fourchette de dates sur la frise temporelle pour une série particulière, comme pour les registres matricules de la Haute-Marne.

L’affichage des résultats 

Le groupe de travail s’est enfin penché sur l’affichage des résultats proposés après une recherche. Ceux-ci peuvent se présenter sous forme de liste par pertinence ou par cote, en arborescence ou encore sous forme de mosaïque de vignettes. L’internaute a parfois la possibilité de modifier l’apparence de cette présentation selon plusieurs critères mais la personnalisation ou l’affinage de celle-ci reste rare. Seulement 15 % des sites autorisent le paramétrage du nombre de résultats affichés par page et à peine plus de la moitié (57 % précisément) autorisent un affinage des résultats. Quand celui-ci est possible, il se réalise plutôt par des filtres qui sont prédéfinis et ne varient pas quels que soient les résultats plutôt que par des facettes qui s’adapteraient en fonction des réponses obtenues. Autrement dit, c’est pour le moment trop souvent à l’internaute de se plier aux contraintes du site. Demain, il faudra que ce soit le site qui s’adapte aux demandes des internautes.

On constate en revanche que les notices sont très majoritairement contextualisées car, dans 80 % des cas, il est possible de remonter vers l’instrument de recherche d’origine et dans 62 % des cas il existe un fil d’Ariane. En revanche, 21 % des sites seulement, soit moins d’un quart, proposent des permaliens vers les instruments de recherche. Enfin, 88 % des sites étudiés permettent de revenir à la page d’accueil ou à une autre page depuis la page des résultats, 76 % offrent la possibilité de réinitialiser la recherche depuis la page des résultats et la moitié mettent en surbrillance dans les résultats le terme recherché initialement.

Une étude de cas

Le troisième volet de ce travail consistait quant à lui en une étude de cas soumise à des utilisateurs recrutés et rassemblés dans plusieurs dépôts d’Archives départementales. Une étape indispensable, selon les responsables de l’AAF, pour associer complètement les utilisateurs à l’évolution du site. Une démarche qualifiée de « design thinking » ou « design collaboratif » en français, qui s’appuie en grande partie sur un processus de co-créativité impliquant des retours de l’utilisateur final. Ce sont 110 testeurs (étudiants, historiens locaux, généalogistes, archivistes…) représentatifs des publics des Archives départementales qui ont ainsi été réunis sur douze sites différents. Il leur a été demandé de réaliser sept recherches en 1 h 30, permettant de tester différentes fonctionnalités de recherche et d’affichage des réponses.

Il s’agissait, par exemple, de retrouver tout ce qui existe sur l’histoire d’une commune pendant la Révolution ou encore de rechercher l’ensemble des documents relatifs à l’implantation des tramways dans telle ville ou encore établir la liste des sources disponibles localement sur la reconstruction après la Seconde Guerre mondiale. Les testeurs étaient chacun face à un ordinateur, totalement autonomes pour répondre à l’objectif qui leur était demandé, et des analystes les observaient pour comprendre la méthodologie et suivre les chemins qu’ils employaient. Non seulement les membres de ce panel devaient atteindre l’objectif fixé mais en outre il était indispensable de tester leur compréhension des résultats, d’évaluer leur pertinence par rapport à la recherche, de vérifier que les chercheurs savaient situer ces résultats et comprendre les éléments de contextualisation.

Quand l’hétérogénéité est la règle

De toute évidence, le public auquel s’adressent les sites des Archives départementales est hétérogène dans ses pratiques du Web et dans ses recherches et il a du mal à appréhender le contenu des sites étudiés. Malgré l’aisance de certains testeurs à utiliser Internet et des sites d’archives, ils ont tous rencontré les mêmes types de difficultés. Le vocabulaire utilisé, très « professionnel » donc technique les trouble : « article » , « inventaire » , « instrument de recherche », « état des fonds » , « cadre de classement » , « contexte »… autant de mots auxquels ils ne sont pas habitués et dont ils ne perçoivent pas les subtilités, voire le sens.

De plus, comme l’a constaté l’analyse faite par les archivistes eux-mêmes, l’hétérogénéité des modes de navigation d’un site à l’autre ou le vocabulaire utilisé pour désigner les rubriques ne donnent aucun repère à l’internaute lambda. « Nous avons même parfois créé des icônes proposées par les éditeurs mais qui n’existent nulle part ailleurs sur le Web. Elles sont censées aider au repérage mais comme elles n’évoquent rien de connu elles ne remplissent pas leur fonction ! » se désole Isabelle Homer. Et de poursuivre : « Quand le public vient visiter nos dépôts, on explique que dans les services on travaille de la même façon dans tous les départements, que nous avons des missions communes. Alors pourquoi nos sites ne reflètent-ils pas cette harmonisation professionnelle ? C’est aberrant puisque les fonds sont les mêmes. »

La question du moteur de recherche

Autre constat réalisé par les observateurs lors des tests : le moteur de recherche, présent sur 29 % des pages d’accueil, n’est pas utilisé correctement par les internautes. En effet, une grande majorité d’entre eux pense qu’il fonctionne comme celui d’autres sites auxquels ils sont habitués, par exemple pour retrouver un patronyme ou un nom de lieu dans une base de données qui indexerait les documents numérisés en ligne. Il y a donc un gros effort pédagogique à faire de la part des Archives départementales pour expliquer que ce type de moteur de recherche n’interroge que le contenu éditorial et les instruments de recherches qui ont été mis en ligne. Sans oublier de préciser que de nombreux inventaires ne sont pas encore accessibles par ce moyen et donc que les réponses fournies ne sauraient être exhaustives. Si on n’y trouve pas quelque chose, cela ne signifie pas pour autant que cela n’existe pas !

Dans la même veine, lorsqu’un chercheur utilise le moteur de recherche d’un site d’archives et qu’il parvient à une page de résultat, il n’utilise quasiment jamais le fil d’Ariane (lorsqu’il existe) pour remonter la hiérarchie du document qui lui est présenté. En effet, il n’imagine pas que des ressources puissent également exister à d’autres niveaux. Plus globalement, il s’agit sans doute d’une méconnaissance des ressources et du cadre de classement. Les internautes ne savent pas sur quel corpus d’inventaires peuvent porter leurs recherches, certains ne faisant même pas le lien entre les inventaires papier qu’ils ont l’habitude de consulter en salle de lecture et la version informatisée sur le site. Là encore, la pédagogie envers l’internaute semble indispensable.

Il reste maintenant aux Archives départementales, dans la diversité de leurs présentations mais l’unicité de leurs collections, à préparer les sites Web de demain en fonction de ces constats et analyses. Les nouvelles versions devraient voir le jour dans les années à venir, en fonction des capacités humaines et financières de chaque dépôt. Les chercheurs que nous sommes peuvent être optimistes car, fort de leur expertise métier, les archivistes sont maintenant convaincus que leurs outils doivent être plus ergonomiques et résolument tournés vers l’utilisateur.

Retrouvez ce dossier dans nos publications