Google élabore sa propre bibliothèque de statistiques

Google propose depuis peu un service sobrement intitulé Google Internet Stats. Il s'agit d'une bibliothèque de données statistiques traitant de tout ce qui se rapporte aux activités du web. Ces données sont fournies par des entreprises tierces appartenant à des secteurs tous aussi divers les uns que les autres : le secteur des médias (Times Online, Guardian, Wall Street Journal, Reuters), des instituts de sondage (GfK, TNS, Nielsen, Ipsos Media), des grandes firmes du web (Google, Youtube) etc...

Toutes ces données sont classées selon cinq catégories composées elles mêmes de plusieurs sous catégories, le tout rassemblé dans une base de données agrémentée d'un moteur de recherche. Il est possible de chercher des données relatives au e-commerce, à l'ADSL, aux loisirs ou des données démographiques sur l'utilisation des médias. Vous apprendrez par exemple que nous passons sur Internet plus de 30% du temps dédié à nos loisirs, que plus de 76000 suppressions d'emploi sont survenues dans le monde durant la seule journée du 6 janvier 2009 ou encore qu'en Mai 2009, Google a enregistré en Grande Bretagne plus de 4 milliards de pages de recherche visitées.

Deux fonctionnalités parachèvent cette description : il est possible de sélectionner une statistique aléatoirement dans l'ensemble de la base, et les utilisateurs sont invités à soumettre leur propre statistique via un formulaire. Ainsi Google Internet Stats se positionne-t-il comme un site didactique à la sauce collaborative. Par ailleurs, notons qu'il est diffusé exclusivement sur son domaine britannique favorisant nettement pour le moment la collecte des statistiques européennes.

Un bémol tout de même : ce qui m'a posé problème lors de ma première visite, c'est l'absence de source précise sur la quasi totalité des articles (la source était indiquée mais il n'était pas possible de consulter la statistique dans son contexte). Il s'agit à mon sens d'une erreur puisque la crédibilité et la pertinence de ce genre d'information dépend parfois directement du contexte : sans ce dernier, un contresens ou une mauvaise interprétation peuvent très vite arriver. Mais depuis quelques jours, chacune des statistiques semble disposer de son lien vers la source. Un flux RSS serait également le bienvenu.

On peut aisément supposer que cet énième projet Google est tout droit issu des fameux 20% de temps concédé aux salariés de Google pour "leur création personnelle". L'idée de Google Internet Stats est simple et, rondement menée, elle pourra rapidement devenir une place incontournable de ce type de documentation.