Sommaire du numéro
N°78 (2-2005)

L’indexation spatiale des archives ethnographiques inédites:
les documents sonores et audiovisuels des pays andins

Hugues Sicard

Institut français d’études andines, Lima

Résumés  
Version en pdf



Introduction

Depuis le début des années 1950, certaines recherches effectuées dans le cadre de l’Institut français d’études andines (IFÉA) ont donné lieu à la création de documents sonores et audiovisuels uniques, témoignant des traditions orales et musicales des pays de la communauté andine (Bolivie, Pérou, Équateur et Colombie). Ce patrimoine, constitué pour l’essentiel de négatifs et de bandes magnétiques, reste peu référencé et souvent enfoui dans les archives des chercheurs et dans celles d’institutions où ils sont inexploités et parfois menacés. En 2002, l’IFÉA a lancé un projet en faveur du référencement et de la sauvegarde des collections de documents sonores ou audiovisuels ethnographiques inédits des pays andins.

Ce type de matériel ethnographique ne peut être utilisé comme source scientifique que si les données spatio-temporelles qui aident à sa compréhension et à son analyse sont disponibles. Or, pour que l’indexation géographique des documents soit efficace, elle doit permettre une définition univoque des lieux, contourner les limitations linguistiques et rendre possibles des recherches par ensembles et sous-ensembles logiques (structures administratives, aires culturelles ou espaces naturels).

Nous verrons dans cet article que l’élaboration d’une telle indexation suppose de résoudre de nombreux problèmes techniques et nous présenterons les méthodes auxquelles les archivistes ont recours pour y répondre.

1. Problématiques techniques de référencement géographique

L’indexation des documents ethnographiques a notamment pour objet de permettre aux personnes qui consultent les archives d’identifier les documents qui les intéressent. Elle doit permettre la détermination d’un lieu sans équivoque et offrir aux utilisateurs des outils de recherche pertinents.

De multiples graphies possibles pour une même entité géographique

On distingue plusieurs types de variantes de graphies des toponymes:

  • les allomorphes: variantes d’un morphème, se produisant en fonction de contextes phonologiques, morphologiques ou historiques (ex. : «Cuzco», «Cusco») ;
  • les allonymes: noms propres, d’origines différentes, servant à désigner un même objet topographique (ex. «La Paz», «La Paz de Ayacucho», «Pueblo Nuevo de Nuestra Señora de la Paz») ;
  • les exonymes: noms géographiques utilisés dans une langue pour désigner un lieu situé en dehors du territoire dont cette langue est la langue officielle (ex. «Aix-la-Chapelle» et «Aquisgrán» sont les exonymes français et espagnol de l’endonyme allemand «Aachen»; expressions toponymiques exonymes: «Lago Titicaca», «Lac Titicaca»).

La multiplicité de dénominations ou de graphies d’un même lieu est un obstacle majeur à la synchronisation et à l’analyse d’informations issues de différentes sources. Cette question se pose autant au niveau national qu’international. Les Nations unies ont d’ailleurs mis en place dès 1959 un groupe de travail d’experts visant à la standardisation des noms géographiques (GENUNG) et dont l’activité se concentre sur la production de recommandations générales destinées aux États membres, qui restent responsables de l’élaboration de leurs nomenclatures géographiques nationales (1).

Ces travaux de standardisation sont particulièrement ardus dans les pays andins où la diversité culturelle et linguistique est très grande. De surcroît, ces pays font face à une situation économique et politique défavorable à la mise en place de programmes nationaux de longue haleine.

À ce titre, les conclusions de l’atelier de l’Infraestructura de Datos Espaciales del Perú (2) (une structure qui regroupe l’essentiel des institutions publiques péruviennes utilisant des données géographiques) qui s’est tenu en avril 2004 à l’Instituto Geográfico Nacional sont éloquentes. Y est présenté un inventaire des actions à entreprendre qui donne la priorité maximale à l’élaboration d’une nomenclature toponymique nationale, jusqu’à présent inexistante.

Par ailleurs, la toponymie, qui se situe à la frontière de la linguistique et de la géographie et qui contribue notablement aux études anthropologiques, ethnologiques ou encore historiques, s’enrichit des variantes d’appellation des lieux. Ainsi, malgré la nécessité d’utiliser une graphie la plus consensuelle possible comme référence géographique, il y a un réel intérêt à garder trace des graphies particulières.

Enfin, l’utilisation d’exonymes (variantes du nom d’un lieu dans plusieurs langues) ne peut être écartée, en particulier dans le cas de référencement de documents ethnographiques des pays andins: de nombreuses langues sont parlées dans chacun de ces pays et les ethnographes ayant collecté les documents sont eux-mêmes d’origines très diverses. Par exemple, dans quelle langue devrait être écrit le lieu d’enregistrement d’un document produit par un chercheur du CNRS en Amazonie brésilienne et archivé dans son laboratoire de linguistique en France ? Dans la langue vernaculaire ? En portugais ? En français?

Catégoriser l’espace

1. Localisation des 15 villes et villages péruviens dénommés Accopampa
(source : Base de Datos de los Centros Poblados del Perú (3), INEI, 2002)

La normalisation de la graphie des toponymes n’est qu’une première étape: il existe de nombreux homonymes parmi les toponymes d’un pays. Plus de 6 000 des 65 500 villes et villages péruviens ont au moins un homonyme péruvien, soit près de 10% (carte 1). La palme revient à «Santa Rosa», stricte dénomination partagée par 240 villes et villages péruviens…

Une manière de différencier ces homonymes est de s’appuyer sur la maille administrative du pays en précisant les divisions administratives auxquelles appartient le lieu (tableau 1).

Catégoriser les lieux permet à la fois de les différencier et de les regrouper. L’utilisateur d’archives qui ne connaît pas les noms des lieux de la zone géographique qui l’intéresse ni les critères de graphie retenus par les archivistes peut alors effectuer des recherches par ensembles administratifs, affinant progressivement ses requêtes.

2. Principales zones dialectales Quechua de l’Amazonie équatorienne et du Nord du Pérou
(source : Ethnologue : Languages of the World (4), 4th ed., 2000)

 

Tableau 1

Cependant les divisions administratives ne sont pas toujours les ensembles géographiques les plus pertinents dans le cadre de recherches en sciences sociales: une indexation des lieux par ensembles naturels (ex. bassin, versant, cordillère) qui transcendent les frontières administratives ou nationales peut fournir des critères de recherche particulièrement efficaces. Ainsi, la carte suivante (carte 2) met en valeur la correspondance entre la distribution des dialectes Quechua et les fleuves Napo et Santiago, de part et d’autre de la frontière Équateur-Pérou et la pertinence qu’il y a à combiner, pour des documents ethnographiques collectés dans cette zone, un référencement géographique administratif avec un référencement s’appuyant sur le réseau hydrographique.

Mais l’utilisation de catégories de lieux suppose à nouveau la mise au point d’index hiérarchisés et standardisés de toponymes, ce qui nous renvoie aux questions de normalisation mentionnées plus haut.

L’espace fonction du temps

Un degré supplémentaire de complexité provient de la dynamique des sociétés (les structures rurales, urbaines ou administratives qui se créent, disparaissent ou changent d’identité) et de certaines entités naturelles (ex. côtes, fleuves amazoniens, écosystèmes). Une actualisation d’une nomenclature basique de toponymes et de ses hiérarchies conduit à effacer les informations périmées et ainsi à gommer les traces d’une réalité géographique passée, limitant par là même leur champ d’application.

Les nomenclatures plus élaborées, telle celle de l’Archivo de la Nación en Colombie, sont constituées de champs descriptifs indexés sur le temps qui permettent de conserver les informations propres à des périodes spécifiques tout en préservant la cohérence des données. Elles permettent la constitution de systèmes d’informations géographiques et historiques.

2. Les méthodes de référencement géographiques dans les centres d’archives

Les descripteurs géographiques textuels

À notre connaissance, tous les centres d’archivage de documents sonores et audiovisuels ethnographiques des pays andins ont recours pour le catalogage des documents à un référencement géographique par descripteurs textuels contenus dans un unique champ et qui ne fait pas appel à des listes d’autorité toponymiques.

Cette méthode ne résout aucun des problèmes évoqués dans la première partie: graphies aléatoires, utilisation non contrôlée d’allonymes ou d’exonymes, catégorisations précaires et figées des lieux, etc. Outre le fait qu’elle offre des possibilités de recherche limitées, elle rend difficile la compatibilité de différents fonds.

Les coordonnées géographiques

Le recours à des coordonnées géographiques pour référencer les documents est extrêmement efficace, en particulier s’il vient en complément d’un référencement effectué avec des descripteurs géographiques textuels. De nombreux sites Internet (5) permettent maintenant de retrouver facilement les coordonnées géographiques de n’importe quel lieu sur le globe en utilisant une interface cartographique ergonomique.

L’utilisation de coordonnées géographiques permet une localisation univoque du lieu et d’associer au système de consultation des archives un système d’information géographique (figure 3) soit comme illustration géographique, soit comme système complémentaire de recherche.

De surcroît, il est possible d’utiliser ultérieurement ces données pour en déduire les informations hiérarchiques (division administrative, bassin, etc.) qui n’auraient pas été saisies initialement. Même si cela ne peut se faire à l’heure actuelle que manuellement ou à partir de systèmes d’information géographique professionnels, nous pouvons raisonnablement espérer que se développent rapidement des systèmes d’information en ligne permettant une synchronisation automatique des informations.

3. Exemple d’utilisation d’un système d’information géographique
pour la consultation d’archives
(http://www.ifeanet.org/multimedia)

 

Les atlas nationaux

Les instituts géographiques nationaux normalisent et standardisent des atlas nationaux qui sont régulièrement publiés sous forme papier ou dans différents formats électroniques intégrables dans les systèmes d’information des centres d’archivage afin de constituer des listes d’autorité de toponymes hiérarchisés.

Ces atlas ne résolvent pas les problématiques d’exonymie, d’indexation sur le temps ou de hiérarchisation des lieux selon des ensembles naturels transcendant les frontières administratives. Cependant, ils offrent une structure relativement cohérente et exhaustive des toponymes et nous en recommandons vivement l’utilisation, en particulier pour des centres d’archives strictement nationaux.

Les index internationaux de toponymes

Pour répondre aux besoins de référencement géographique dépassant les frontières d’un pays, plusieurs organismes élaborent et maintiennent des index internationaux de toponymes plus ou moins exhaustifs.

Le thésaurus ISOC de toponymes en espagnol (6). Le Conseil supérieur de la Recherche scientifique (CSIC) est un organisme de recherche public espagnol dépendant du ministère des Sciences et des technologies dont fait partie le Centre d’information et de documentation scientifique (CINDOC). Ce centre élabore et met à jour depuis 1987 un thésaurus, en espagnol, hiérarchisé, de toponymes du monde entier, avec un niveau de précision allant prétendument jusqu’aux municipalités pour les pays de la péninsule Ibérique et d’Amérique latine. Ce thésaurus de près de 25 000 termes reste cependant assez incomplet, toutes les divisions administratives des pays andins n’y figurent pas et il semble qu’il n’ait pas été actualisé depuis 1995. On peut noter que seulement 8 des 240 «Santa Rosa» de l’atlas national péruvien figurent dans ce thésaurus.

Le thésaurus Getty de noms géographiques L’institut de recherche du Getty Trust (fondation américaine issue du Musée Jean Paul Getty et spécialisée en arts visuels) gère trois bases de vocabulaire, dont le Getty Thesaurus of Geographic Names (TGN). C’est une nomenclature hiérarchisée de 1,3 million de toponymes du monde entier et où figurent pour chaque lieu les dénominations vernaculaires et historiques, les coordonnées géographiques, une typologie ainsi qu’une note descriptive (figure 4). Cette nomenclature, actualisée mensuellement, est accessible en ligne (7).

4. Référence TGN pour la ville de Quito, Équateur

Par sa capacité à gérer pour un même lieu plusieurs dénominations et classifications indexées sur le temps, cette nomenclature résout beaucoup des problèmes techniques mentionnés dans la première partie. Depuis la fin 2004, les institutions intéressées par une utilisation intensive du TGN dans leur propre système d’information peuvent adresser une demande au Getty Trust qui, au cas par cas, définit les conditions de licence et d’utilisation d’une copie informatique de son thésaurus. Cependant, l’accès et l’utilisation du thésaurus en ligne reste libre.

Il est à noter que les standards les plus avancés en matière d’échanges de références documentaires tel que le Dublin Core (8) (ensemble de descripteurs qui permettent de décrire n’importe quel type de ressource documentaire: textes, audio, vidéo, etc.) recommandent l’utilisation de cette liste d’autorité pour donner le contexte géographique des documents.

On peut néanmoins regretter l’absence de référence aux langues des exonymes répertoriés ce qui empêche une utilisation réellement multilingue de la nomenclature. Par ailleurs la hiérarchie d’ensembles physiques ou naturels est très peu développée.

Enfin et surtout, cette nomenclature est loin de contenir l’ensemble des toponymes des pays andins: un seul des 240 «Santa Rosa» péruviens est référencé dans ce thésaurus.

Conclusion

Aussi indispensable soit-il, le référencement géographique des documents ethnographiques des pays andins reste problématique et, en attendant qu’un index du type TGN ne parvienne à plus d’exhaustivité, aucune solution n’est à elle seule satisfaisante.

Cependant, il existe des alternatives à l’utilisation encore trop répandue de simples champs textuels contenant pêle-mêle des descripteurs géographiques non indexés. Sans que cela n’engendre pour le documentaliste un travail de saisie considérable, il est tout à fait possible de réaliser un catalogage géographique performant en utilisant des listes d’autorité de noms de lieux issus par exemple des atlas nationaux, en intégrant un module externe pour l’identification et la saisie des coordonnées spatiales d’un lieu, ou encore en indiquant la référence TGN du lieu lorsqu’elle existe.

Notes

1. Groupe d’experts des Nations unies pour les noms géographiques: http://unstats.un.org/unsd/geoinfo/ungegn.htm

2. Infraestructura de Datos Espaciales del Perú (IDEP):
    IDEP.
    

3. Instituto Nacional de Estadísticas e Información del Perú (INEI, Perú): http://www.inei.gob.pe

4. Base de données linguistiques Ethnologue de SIL: http://www.ethnologue.com

5. Pour la France, site de l’IGN: http://www.ign.fr
    Interfaces cartographiques internationales: http://plasma.nationalgeographic.com/mapmachine/
    http://www.expedia.com (onglet «Maps»)

6. Thésaurus en espagnol de toponymes (CSIC / CINDOC / ISOC, Espagne:
    http://pci204.cindoc.csic.es/tesauros/Toponimo/Toponimo.htm

7. Site Getty – Vocabularies program: http://www.getty.edu/research/conducting_research/vocabularies

8. Description des champs du Dublin Core: http://dublincore.org/documents/dcmi-terms/