Google compromet l'analyse statistique de l'audience sur Internet

Alors que Google Analytics domine largement le marché des solutions webanalytics, il semblerait que les pontes de Google aient décidé de lui tirer plusieurs balles dans le pied en annonçant trois dispositions visant à compromettre l'envoi de données analytiques. La fourniture de ces données, pourtant anonymes, serait une façon pour Google de faire montre de bonne volonté.

Trop souvent comparé à Big Brother, la firme de Mountain View souhaite passer pour le bon élève. Car si Mark Zuckerberg a avoué ses erreurs de communication quant à la sécurité de Facebook, Google aime à rappeler qu'il n'est pas le diable et qu'il se doit de faciliter aux internautes la maîtrise de leurs données confidentielles.

1 - Le plugin Google Analytics Optout

La première disposition de Google est un plugin conçu pour Chrome, Firefox et Internet Explorer. Installé, celui-ci va empêcher Google Analytics d'enregistrer les données anonymes que sont la résolution d'écran, le navigateur, le FAI ou le système d'exploitation. Très concrètement, le script ga.js présent sur les sites trackés par Google Analytics sera désactivé et dans l'incapacité de fournir ces informations.

À noter que si une visite n'est plus prise en compte par Google Analytics, elle continuera d'être détectée et comptabilisée par le serveur du site Web. Cette décision est donc exclusivement relative à l'outil de Google et tout autre outil sera en mesure de récupérer les informations.

Il sera sûrement intéressant d'observer quelle résonnance aura cette décision sur la politique des autres fournisseurs de ce type de solution. Car même si Google Analytics est un des services les plus utilisés, d'autres compagnies (Woopra, StatCounter, Clicky, SiteMeter etc...) continueront de collecter les données des internautes. Il est évident que les utilisateurs, qui se seront rués sur le plugin fourni par Google, voudront également préserver leurs données vis à vis de ces autres solutions.

2 - Une option pour régler le niveau de vie privée

Par ailleurs, Google met à la disposition des webmasters une option de confidentialité visant à rendre partielle l'adresse IP, entraînant un renforcement de l'anonymat des informations recueillies. Google Analytics devra alors se contenter de cette IP tronquée. Dans ces conditions, côté analyse statistique, la localisation géographique reste effective mais sa fiabilité devient toute relative.

Ainsi, les webmasters vont-ils spontanément décider en leur âme et conscience de diminuer la fiabilité des données géographiques qu'ils recueillent ? Faut-il rappeler que la géolocalisation d'une adresse IP est au mieux approximative et que sa précision ne passe que rarement sous la barre du kilomètre ?

Même si Google Analytics ne révèle aucune information, il semblait indispensable à Google de donner, autant que possible, plus de choix et de controle à ses utilisateurs.

3 - Une version sécurisée du moteur de recherche

Troisième disposition : la possibilité pour l'internaute d'effectuer ses recherches sur le moteur de Google en HTTPS (protocole SSL). Ainsi les données sont chiffrées et les requêtes ne seront plus accessibles auprès du premier hacker venu. Pour le moment, il semblerait que seule la version .com propose une version sécurisée du moteur.

Si ce "mode privé" est excellent pour la confidentialité des données, il est en revanche néfaste pour l'analyse des statistiques Web, et ce, quelque soit son outil de prédilection : en effet, il n'est alors plus possible de connaître la provenance de l'internaute : sans ce fameux référant, difficile par exemple d'évaluer la pertinence d'un partenariat.

Quelle conséquence pour l'analyse statistique ?

Je n'irais pas jusqu'à dire que ces annonces remettent en cause le socle même de l'analyse statistique sur le Web, mais avouons qu'elles ne mettent pas les Webanalystes dans de bonnes dispositions pour la suite de leur activité. Pour les éditeurs Web, les conséquences ne sont pas anodines puisqu'ils comptent sur ses données pour améliorer, régler et optimiser l'expérience utilisateur de l'internaute. Par exemple, l'ergonomie d'un site peut dépendre de la résolution de l'écran, de la version du navigateur, de la prise en charge de Flash ou Javascript, de la langue du clavier...

Avoir une vue d'ensemble des préférences de sa communauté en matière d'outil Internet est un atout formidable et un gain de temps inestimable. Ce sont ces données statistiques, dont la transmission est justement remise en cause, qui permettent au Webdesigner, au Webmaster ou au créateur de contenu de se poser les bonnes questions et parfois de s'adapter à son lectorat : ai-je intérêt à proposer mon contenu dans une autre langue, dois-je songer à développer une version iPad de mon site, doit-il supporter Internet Explorer 6, est-il pertinent d'aborder régulièrement l'actualité Linux ? Autant de questions auxquelles ils auront au mieux des réponses de plus en plus partielles.

Certains commencent à lever la voix en estimant qu'ils auraient du avoir la possibilité d'autoriser le plugin. D'autres ne comprennent pas l'intérêt de développer des outils de Webanalytics aussi sophistiqués puis d'encourager les Webmasters à les utiliser dans de telles conditions. En définitive, deux nécessités antagonistes viennent de se télescoper.

Quel accueil de la part des internautes ?

Par ailleurs, comme vous pouvez l'imaginer, les enjeux sont bien plus colossaux sur le plan marketing où la conversion est une donnée essentielle. Mais il convient de rester prudent et de se garder de l'alarmisme : il reste à observer quelle part des utilisateurs installeront effectivement le plugin. D'ailleurs, d'après Brian Richardson, porte parole de Google, seul un visiteur sur quinze s'est employé à désactiver ses données personnelles dans Google Ads Preferences.

En réalité, ce type de problème s'est déjà posé, certes de manière plus officieuse, avec les bloqueurs de pub, véritable menace pour l'économie publicitaire en ligne, et qui a d'ailleurs déjà porté préjudice à plusieurs sites (on se souvient des difficultés de PC INpact). Ce type de bloqueur désactive Javascript et fausse les leviers statistiques du Web Marketing (CPM, CPC, CTR...).

Ceux qui se réjouissent ne réalisent probablement pas la somme d'informations perdues pour les utilisateurs de Google Analytics, des informations de toute façon anonymes et non pertinentes, lorsque traitées à l'échelle individuelle. Bien sûr, du point de vue de Google, la portée n'est pas la même. Mais au delà des préoccupations sur la confidentialité, Google a-t-il envisagé les conséquences que ces données manquantes auront sur l'analyse ?

Un coup de machette pour les outils d'Analytics ?

Au delà des considérations techniques et de l'impopularité de ces mesures auprès des Webmasters, on ne peut s'empêcher de penser à la portée symbolique des annonces de Google et à la volonté de la firme de se racheter une conduire, à l'heure où le Web s'enflamme au sujet des clauses de confidentialité de Facebook. Alors évidemment, il serait inapproprié de critiquer un service qui fournit des outils permettant à ses utilisateurs de maîtriser les informations qu'ils transmettent implicitement pendant leurs pérégrinations sur le Web. Les AdBlocks et les désactiveurs de Javascript ont déjà fait beaucoup de mal. Espérons simplement qu'ils ne seront pas trop nombreux à passer le cap et qu'il ne s'agisse que d'une tempête dans un verre d'eau. Car, après tout, cette obsession de l'anonymat, cette paranoïa maladive de la confidentialité n'est peut-être la préoccupation que d'une poignée de geeks. Or justement : les blogs et sites High Tech risquent d'être les plus handicapés.