Attributs spatiaux des notices du WoS

L’élément de base du WoS (ou de Scopus), autrement dit la brique à partir de laquelle il faut raisonner, est la notice. Cette donnée primaire recense pour un article donné:

  • un (ou plusieurs) auteur(s);
  • leur(s) affiliation(s) institutionnelle(s);
  • leur(s) adresse(s);
  • la date de parution (année bibliographique);
  • le résumé, le titre de l’article, le nom de la revue, etc.

À partir de ces éléments, les informations localisées dans la base sont:

  • un ensemble de lieux repérés par les adresses fournies par les auteurs;
  • le nombre de publications des équipes de ce lieu pour chaque année;
  • le nombre de relations entre lieux pour chaque année, révélé par les cosignatures d’articles;
  • les citations d’autres articles et ouvrages, puisque les références citées font aussi partie de la base et peuvent donc être localisées.

On a donc des données quantitatives. Elles deviennent spatialement sommables si l'on fait l'effort d'un comptage proportionnel* et que l’on «fractionne» une publication pour l’attribuer à un équipe de recherche et un lieu**.  Par exemple, un article cosigné par 4 équipes (1 de Paris, 2 de Madrid, et 1 de Toulouse) ne peut compter qu’une fois dans la base globale: il est donc nécessaire de l’attribuer pour ¼ à Paris, ½ à Madrid et ¼ à Toulouse. La valeur «1» dans le Web of Science sera décomposée en:

  • Toulouse et Paris: 0,25 chacun;
  • Madrid: 0,5.

Si l’on regroupe les données à l’échelle nationale, la France et l’Espagne compteront chacune pour 0,5. Ce procédé de fractionnement, assez simple dans son principe, permet donc toute agrégation ultérieure des données primaires*.

L’unité spatiale élémentaire qui correspond à chaque ligne du tableau de base (fig. 1) correspond à la localisation la plus précise possible de l’adresse de l’auteur.

On peut imaginer que les données relatives à un lieu soient exhaustives pour une année (toutes les publications attribuables à ce lieu, toutes les relations de ce lieu à d’autres lieux).

Mais on peut évidemment procéder à toutes sortes des élections et d’extractions en fonction de critères variables. On peut choisir de s’intéresser seulement à certains articles scientifiques, comme ceux issus de certaines revues ou correspondant à des critères de contenu particuliers, de s’intéresser, ou non, aux citations, aux cosignatures…

*Il est particulièrement pertinent pour les variables «nombre de publications» et «nombre de cosignatures»; car la somme globale de ces variables a un sens (nombre d’articles à l’échelle mondiale, nombre total de cosignatures). Il est moins important pour les citations.

**Les bases ne permettent pas d’aller systématiquement jusqu’à l’auteur individuel et de le relier à un lieu: on raisonne donc en affiliations. L'entité primaire, «l’auteur» si l’on veut, est pour nous l’équipe de recherche avec son affiliation institutionnelle et son adresse, et non l'individu.