La rubrique Internet

Sommaire

GapMinder World: un outil d’exploration graphique et cartographique de données statistiques

Présentation

GapMinder, selon sa présentation officielle, est une organisation non gouvernementale à but non lucratif, dont le but est la promotion du développement durable et des objectifs du millénaire pour le développement de l'ONU. La démarche est originale : l’ONG veuty contribuer à sa manière, par la popularisation d’un outil de visualisation statistique. Son créateur, Hans Rosling, professeur et chercheur suédois en médecine et santé publique, a longtemps travaillé sur les problèmes sanitaires dans les pays en voie de développement. Il est d’ailleurs co-fondateur de la branche suédoise de Médecins sans frontières et a travaillé en tant qu’expert auprès de l’Organisation mondiale de la santé et de l’UNICEF.

GapMinder.org est au départ une affaire familiale: l’ONG a été fondée en 2005 par H. Rosling, son fils Ola et sa belle-fille Anna Rosling Rönnlund. Le but était le développement et la valorisation d’un outil original de présentation graphique de statistiques: le Trendalyser (compression de trend analyser, «analyseur de tendance»), une application en ligne réalisée en Flash©. Ce Trendalyser a connu la célébrité en 2006 grâce à sa présentation aux journées TED (Technology, Entertainment, Design), rencontres annuelles très médiatisées. La vidéo mise en ligne sur le site TED a été à ce jour vue par environ 500 000 personnes. Hans Rosling s’y révèle grand conférencier, et sa performance relève presque du show, un qualificatif rarement associé à la présentation de graphiques statistiques. Cette manifestation fut aussi l’occasion pour Hans Rosling de rencontrer les fondateurs de Google, qui ont été intéressés au point de racheter l’outil pour le développer et faciliter sa diffusion. Il vient d'ailleurs d’être mis à la disposition des concepteurs de sites Internet sous la forme d’un «gadget» Google (un composant réutilisable et personnalisable).

C’est une application de cet outil, GapMinder World, que nous voulons décrire ici, du fait de l’intérêt qu’il offre pour la présentation et l’exploration de nombreux indicateurs mondiaux, qui, plus est, sur une plage temporelle souvent très étendue.

GapMinder World, pour les explorateurs de contrées statistiques difficiles d’accès

Le principe fondateur de cet outil est l’accès graphique simplifié et interactif à une grande quantité de données statistiques, dans leurs dimensions spatiale et temporelle, et leur croisement à l’aide de graphiques de type «nuages de points».

L’innovation majeure est la très grande interactivité du graphisme, ainsi que sa souplesse: l’outil permet de présenter des indicateurs sous plusieurs formes. L’interactivité aide à repérer des tendances, des situations originales, et à vérifier des hypothèses par sélection.

L’outil se présente sous la forme de deux onglets : «Chart», pour la fonction de visualisation graphique, et «Map», pour la carte. La partie centrale de la fenêtre est occupée par la visualisation choisie, entourée d’une interface permettant de la paramétrer en choisissant les indicateurs, les types d’échelles, ainsi que d’autres options.

Les fonctions cartographiques nous intéressent plus particulièrement; ajoutée récemment, cette fonctionnalité a d’ailleurs des défauts, que l’on suppose de jeunesse. On présentera donc d’abord la partie graphique, qui est la présentation d’origine.

La présentation par défaut est celle du croisement de l’espérance de vie à la naissance et du PIB par habitants (selon une échelle logarithmique), pour une grande majorité des États du monde en 2005. Les pays sont donc placés sur les deux axes selon leurs valeurs, et représentés par un cercle proportionnel à leur population pour l’année donnée. Une quatrième dimension d’information est apportée par la couleur de ces symboles qui, par défaut, signifie l’appartenance du pays à un continent. Lorsque l’on promène le curseur de la souris sur les symboles, les valeurs des indicateurs apparaissent (sur le symbole lui-même et en projection sur les deux axes).

On décrit ici l’outil tel qu’il apparaît à l’ouverture de sa fenêtre, sous forme statique. Mais il est beaucoup plus intéressant lorsque l’on se rend compte que la majorité des paramètres sont aisément modifiables, et qu’une cinquième dimension d’information peut être ajoutée en lançant l’animation chronologique.

L’action la plus évidente consiste, pour le visiteur, à changer les indicateurs représentés pour réaliser d’autres croisements de données, puis ensuite d’en visualiser l’évolution dans le temps.

L'essentiel de la présentation d’Hans Rosling sur le développement lors de ces fameuses journées TED de 2006, consiste justement à montrer des croisements judicieusement choisis, dont on observe l’évolution depuis les années 1950 jusqu’à nos jours. D’où une présentation très dynamique, avec une forme d’animation qui apporte de l’eau au moulin du conférencier. L’évolution diachronique est très bien rendue visuellement, et les grands gestes du présentateur accompagnent les mouvements à l’écran de façon très parlante.

Pour aller plus loin dans la manipulation de cet outil, on peut aussi modifier l’indicateur représenté par les symboles proportionnels et celui qui détermine la couleur de ces symboles, l’animation étant toujours temporelle, ce qui représente réellement quatre dimensions rendues sur un plan classique en deux dimensions. On peut sélectionner un ou plusieurs pays et les suivre dans le temps : ils tracent alors un sillage sur le graphique et les autres pays voient la couleur de leur symbole atténuée. Il est possible d’agrandir une partie du graphique, ce qui est souvent utile lors de superpositions de symboles. Enfin, point important, les métadonnées relatives aux indicateurs sélectionnés (source, qualité des données) sont disponibles et s’affichent dans une fenêtre à part.

La grande force de GapMinder World est de rendre toutes ces manipulations possibles sans les complications usuelles inhérentes à la réalisation de graphiques statistiques: il suffit de choisir les indicateurs, classés par grandes familles thématiques, de déplacer le curseur temporel, pour que la configuration des axes et le dessin des symboles soient réalisés instantanément, avec une visualisation optimisée (bornes, types d’échelles, tailles de symboles).

Naturellement cela implique des choix arbitraires de présentation graphique, hors de contrôle de l’utilisateur:

  • un ratio taille de cercle/valeur est précalculé, avec une proportionnalité pas toujours linéaire, pour préserver la lisibilité
  • un dégradé de couleurs est précalculé, et il est fixe, basé sur les valeurs de 2006.

On peut critiquer ces choix dans l’absolu, car ils vont venir perturber l’objectivité de la représentation. Si l’on considère, par exemple, la taille des symboles relatifs à la population par pays, on se rend compte qu’il est impossible d’avoir lisiblement sur le même graphique la Chine et les Îles Malouines (3 000 habitants). Les concepteurs ont préféré une lisibilité plus grande au réalisme sémiologique (il faut aussi que le plus petit symbole reste sélectionnable à la souris). Le dégradé de couleurs unique qui est utilisé pose des problèmes plus importants: il s’agit d’un arc-en-ciel (color ramp) que l’on réserve plutôt au domaine de l’optique qu’aux sciences sociales, et son caractère fixe, non évolutif chronologiquement (puisque calé sur les valeurs des indicateurs pour 2006) surprend.

Une autre limite de l’outil est liée à la qualité des données. Il est difficile de rassembler des données fiables sur l’ensemble des pays du monde. Les efforts de recensement et la mesure d’indicateurs sociaux, économiques et environnementaux sont en certaines parties du monde relativement récents, et présupposent une stabilité et un niveau d’organisation administrative minimaux des États. En outre, ce sont bien des États qui sont représentés, et l’on mesure bien la différence entre une statistique d’État et la réalité géographique: certains territoires dont le statut international n’est pas assuré ne sont pas couverts. En effet, comme les données utilisées proviennent essentiellement de sources ONU, nous n’y retrouvons pas d’informations spécifiques sur Taïwan, les territoires palestiniens, contrairement au Sahara occidental, par exemple. Mais on peut rendre hommage à l’effort de prise en compte de l’évolution géopolitique du monde: un travail important à été réalisé pour prendre en compte la dissolution et la recréation d’États (cf. les évolutions récentes dans les Balkans).

La version cartographique

L’outil cartographique de Trendalyzer soulève moins l’enthousiasme. Comme on ne dispose plus que d’une seule dimension du plan pour la représentation des données (les deux autres étant bien sûr occupées par les latitudes et longitudes), l’outil est plus limité. Il n’est plus possible de faire figurer des croisements d’indicateurs, mais on peut tenter d’explorer les structures géographiques qui émergent pour chaque indicateur, et l’animation temporelle reste possible.

Premier défaut: l’indicateur représenté par défaut au travers de la couleur des symboles est... la répartition des pays par continents. Utile dans l’onglet graphique, il perd évidemment son sens dans la partie carte.

Deuxième défaut: la possibilité d’agrandir une partie de la carte a disparu, contrairement à ce qui est proposé dans l’onglet «graphique».

Troisième défaut: la représentation en symboles proportionnels est seule disponible, ce qui va poser une série de problèmes classiques en cartographie statistique, avec des aberrations dans la représentation des valeurs relatives (indices, pourcentages), et des problèmes pour la représentation de valeurs très proches, ou au contraire pour celle des forts écarts (symboles qui se superposent ou sont peu lisibles).

Pour un indicateur comme le pourcentage de population urbaine ou l’espérance de vie à la naissance, on obtient ainsi une carte fort peu exploitable.

Une cartographie en plages de couleurs aurait été plus parlante et, évidemment, seule correcte, mais cela aurait demandé un gros travail de réalisation technique (discrétisations, choix du nombre de classes, des couleurs).

Enfin, on soulèvera une question cartographique de base qui semble laissée de plus en plus de côté par les réalisateurs de nombres d’applications récentes : celle du choix de la projection pour le fond de carte. Fort heureusement, les concepteurs de Gapminder ne se sont pas contentés d’un fond non projeté comme dans Google Maps (on recommande, dans ce cas précis, de passer à l’échelle mondiale en zoom arrière à partir de n’importe quelle carte de Google Maps pour se faire une idée concrète du problème). Ici, au contraire, nous avons une vraie projection, mais il s’agit d’une simple Mercator, dont on connaît l’effet sur la distorsion des surfaces lorsque l’on s’éloigne de l’équateur. Or, pour représenter des faits liés à la population et au développement, elle pose problème, et c’est ce qui l’a fait rejeter depuis longtemps par les cartographes soucieux d’une représentation «équitable» des pays du monde (cf. l’article d'Anna Barford sur worldmapper.org dans M@ppemonde n°89).

Mais, on le répète, cette partie cartographique est récente, et Hans Rosling ne l’utilise pas (ou pas encore?) dans ses «shows». On peut espérer qu’elle sera substantiellement améliorée dans les versions à venir.

En conclusion, l’outil GapMinder World est un excellent moyen de visualiser et d’explorer de façon progressive des indicateurs statistiques pour l’ensemble du monde, d’opérer de multiples croisements, avec l’excellente idée de proposer une animation temporelle. Les grandes tendances sont très bien mises en valeur, et l’on peut approfondir l’exploration de manière simple et rapide, en s’affranchissant des lourdeurs habituelles de ce type de visualisation graphique. L’ergonomie est assez bonne, les diverses commandes de paramétrage sont bien organisées et répondent rapidement. Une utilisation pédagogique de cet outil est donc envisageable, mais il faut que l’enseignant(e) se souvienne des suites de manipulations nécessaires à la reproduction de la visualisation souhaitée. Il serait donc intéressant de disposer à l’avenir d'un moyen d'enregistrer et de revenir rapidement à des configurations précises (indicateurs, zooms, tailles de symboles, couleurs, pays sélectionnés...).

On regrettera enfin que l’anglais soit l’unique langue disponible — ce qui est étonnant pour une organisation à portée internationale — et la relative pauvreté fonctionnelle de la version cartographique.

Laurent Jégou