Gapminder & Data Explorer, pour la beauté des statistiques

Les données statistiques environnementales, démographiques et économiques ont cela de passionnant qu'elles sont toutes plus ou moins fortement corrélées entre elles : l'accès à l'eau potable a une incidence sur l'espérance de vie, la contraception dépend en partie du niveau d'éducation ou encore la quantité d'émission de CO2 est liée à la consommation de carburant. Imaginez maintenant que ces données soient en plus rendues accessibles par année et par pays et qu'il soit possible de visualiser l'ensemble sous la forme d'une représentation graphique animée : compte tenu de l'infini des combinaisons à tester, des interactions improbables à découvrir, on entre d'un seul coup de plain-pied dans l'exploration statistique multidimensionnelle.

Et c'est précisément ce type d'outil que Gapminder et Google Data Explorer s'emploient à mettre à notre disposition.

Gapminder est conçu par Hans Rosling, professeur de Santé Internationale dans une université renommée de Suède. L'homme s'est notamment distingué en faisant des interventions amusantes et passionnantes lors des fameuses conférences TED. Gapminder est un outil d'une redoutable efficacité qui permet d'observer des statistiques en quatre dimensions : une donnée en abscisse, une donnée en ordonnée, une donnée pour la taille des bulles représentant chaque pays et le tout croiser par le temps. Il est dès lors possible de voir toutes ces données s'activer au rythme des années et en fonction de la situation de chaque pays de la planète. L'objectif est de promouvoir une vision du monde fondée sur les faits en s'appuyant sur le maximum de statistiques publiques en libre accès.

Gapminder.org est ainsi un véritable concentré de statistiques, sous toutes les formes puisque le site propose de nombreuses vidéos en provenance de TED, toutes sortes de présentation (en Flash, Powerpoint, documents PDF) et surtout, il propose Gapminder Desktop qui vous permet d'explorer toutes les données statistiques de l'outil sur votre ordinateur, même si vous n'avez pas accès à Internet. Enfin Gapminder, c'est aussi un blog traitant de l'actualité des statistiques et de leur application concrète, un Labs où sont expérimentés de nouvelles fonctionnalités et un récapitulatif des données exploitées, téléchargeables.

Passons désormais à son clone.

En 2007, Google fait l'acquisition du moteur Trendalyzer justement développé par la Fondation Gapminder pour permettre la représentation de statistiques internationales interactives et en animation. Son intention est d'élargir le concept et de le rendre disponible gratuitement pour toutes les données statistiques publiques. Ainsi, en 2009, Google produit Public Data Explorer qui s'avère être un outil très proche de celui de Gapminder dans lequel on retrouve un système d'exploration statistique en quatre dimensions. Les données proviennent de fournisseurs prestigieux comme World Bank ou EuroStat.

Public Data Explorer est encore à l'état de projet puisque l'outil est encore exposé dans Google Labs. Cela signifie qu'il est encore perfectible et donc amené à être amélioré. La force de Google est de pouvoir plus facilement convaincre des fournisseurs de céder gratuitement leurs données statistiques pour qu'elles soient exploitées via cette technologie. En ce qui concerne l'outil à proprement parlé, Google propose aussi d'autres types de graphiques comme des histogrammes ou des courbes en deux dimensions.

En définitive, je vous invite à essayer ces deux outils dont la puissance est littéralement stupéfiante : on se surprend à tester des dizaines de combinaisons, à apprendre en cherchant, à comprendre en observant ou à partager des graphiques animées sur les réseaux sociaux. Je vous conseille également de suivre les conférences de Hans Rosling (elles sont en anglais mais toutes sous titrées en français) et en particulier une des toutes premières. Il tient en haleine son auditoire car il a pour habitude d'expliquer les statistiques à la manière d'un commentateur sportif, ne manquez pas un tel spectacle !