Visualisez en cinq dimensions le fruit de vos efforts de référencement naturel

Même si tous les spécialistes du SEO connaissent parfaitement la notion de longue traîne (au coeur du mécanisme de référencement naturel), il convient tout de même de rappeler qu'il existe de nombreuses variables permettant de la représenter. Par exemple, dans le domaine du commerce, il s'agit d'étudier l'ensemble des produits peu vendus mais dont la somme peut largement dépasser la part de marché des produits les mieux vendus.

Dans le domaine qui nous intéresse, celui du référencement naturel, il s'agit de l'ensemble des requêtes par lesquelles un site Web est trouvé dans les résultats d'un moteur de recherche : pour faire court, on constate que les requêtes "simples" (souvent constituées d'un faible nombre de termes ou correspondant à des expressions très recherchées) sont peu nombreuses mais engendrent chacune un trafic important, tandis que les requêtes "complexes" (généralement constituées d'un nombre élevé de termes, mais pas forcément) sont très nombreuses, engendrent chacune un trafic très faible, mais toutes ensembles un trafic finalement beaucoup plus important que l'ensemble des requêtes "simples".

On rapproche souvent ces données de référencement avec le principe de la loi de Pareto dans laquelle il est établi qu'environ 80% des effets ont pour origine 20% des causes. Si on s'en tient aux estimations moyennes de SEOmoz, la courte traîne représenterait autour de 18.5% du trafic global tandis que la moyenne traîne et la longue traîne totaliseraient 81.5% de celui-ci.

Long tail chart, SEOmoz

En définitive, l'objectif de cet article est de proposer des moyens de visualisations permettant de dépasser la simple représentation graphique à deux dimensions (nombre de visites x nombre de requêtes). Dans un souci didactique, je fournis certaines données et décris ma démarche pas à pas afin d'aider les moins aguerris à suivre les procédures.

Associer les outils Google entre eux et exporter les données

Tout d'abord, si ce n'est pas encore fait et afin de simplifier l'exploitation des données, il convient d'associer le profil de votre site sur Google Webmaster Tools (GWT) et Google Analytics (GA) : cela permettra de disposer de toutes les informations nécessaires en un seul endroit (GA) et de profiter d'une période de stockage des informations plus longue que sur Google Webmaster Tools : environ trois mois dans GA contre cinq semaines dans GWT. Pour cela, rendez-vous dans la rubrique "Admin" de Google Analytics puis "Paramètres du site" et suivez les instructions.

Association Google Analytics et Google Webmaster Tools

À compter de maintenant, en vous rendant dans "Rapports standards" puis "Sources de trafic" puis "Optimisation de référencement" et enfin "Requêtes", vous êtes en mesure de consulter les données sur une durée maximum de trois mois. Libre à vous enfin d'exporter les données afin de les réutiliser dans le tableur de votre choix.

Pour ma part, j'ai choisi d'exporter mes données au format CSV et de les importer sous Excel. Naturellement, un léger nettoyage des datas s'impose : Google Analytics introduit par exemple des virgules dans les nombres avec millier, il est également nécessaire de remplacer les points par des virgules pour tous les nombres avec décimales etc...

Nous nous heurtons à une première limitation : Google n'indique pas le nombre exact de clics pour toutes les requêtes pour lesquelles il est inférieur à 10, et le CTR n'est pas exploitable non plus (il est égal à 0%). Bien que la position moyenne soit disponible, il est tout de même nécessaire de filtrer ces données puisqu'elles ne seront pas exploitables dans notre représentation graphique à trois dimensions. Cela dit, une requête bien positionnée mais n'apportant qu'un très faible trafic (et dont on ne connaît pas le CTR) ne constitue pas vraiment une priorité.

Tableau Excel, janvier 2012

Toutes les données de trafic de l'article proviennent du site Température Idéale

Les graphiques à bulles permettent d'afficher trois dimensions

Au final, nous disposons d'un tableau avec les trois données essentielles : la position moyenne, le CTR (taux de clic) et le nombre de clics. En indiquant le taux de clic en ordonnée, la position moyenne en abscisse et le nombre de clics en variable de diamètre pour les bulles, nous obtenons une longue traîne d'un autre genre.

Données Google Webmaster Tools, novembre 2011

Les données du graphique sont disponibles via ce lien vers le fichier Excel

L'analyse d'une seule période est relativement triviale puisqu'elle ne permet de tirer des conclusions que d'un état figé de votre stratégie de référencement. Elle a au moins le mérite de mettre en évidence la corrélation évidente existant entre "position moyenne" et CTR. Elle autorise également une hiérarchie visuelle immédiate entre les requêtes selon le nombre de visites reçues : plus le nombre de clics est élevé, plus le diamètre de la bulle est important.

Au final, il est déjà possible de dresser un premier diagnostic en identifiant les éventuelles anomalies évidentes : par exemple, une requête profitant d'un excellent classement mais d'un taux de clic très faible, ou une requête correspondant à un mot clé essentiel, mais mal positionnée.

Comment intégrer deux dimensions supplémentaires ?

Comme nous l'avons vu, l'analyse SEO d'une situation figée atteint rapidement ses limites et il devient très vite indispensable d'intégrer une notion de temps pour affiner une stratégie. Malheureusement, Excel ne propose pas de représentation graphique animée, mais rien ne nous empêche de multiplier les graphiques afin d'observer une évolution mois par mois. Voici donc le résultat sur trois périodes supplémentaires d'un mois, couvrant au total du 26 octobre 2011 au 26 février 2012.

Données Google Webmaster Tools, décembre 2011 Données Google Webmaster Tools, janvier 2012 Données Google Webmaster Tools, février 2012

Il apparaît clairement un "éclatement" du nombre de requêtes à l'issue de la quatrième période ainsi qu'une tendance générale à ce que les requêtes émergentes d'octobre 2011 "migrent" vers le coin supérieur gauche du graphique (= amélioration du classement et hausse du CTR), tout en grossissant (= augmentation du nombre de clics).

Mais, vous conviendrez que ça n'est pas vraiment pratique. Or, il existe encore une alternative : les "graphiques de mouvement" à bulles proposés par Google Documents. Si vous connaissez Hans Rosling, peut-être vous souvenez-vous de Gapminder et sa technologie Trendalyzer rachetée par Google. C'est justement ce type de graphique qu'il est possible de réaliser via Google Documents. Au passage, notons que la technologie est également incluse dans Google Analytics. Mais le résultat est totalement exécrable (et particulièrement gourmand en ressource) : mettez la "position moyenne" en abscisse et observez les bugs de positionnement des points...

Heureusement, Google Documents ne présente pas ce défaut. Par ailleurs, il autorise l'ajout d'une ligne de temps et d'une variable de code couleur pour les bulles. Nous avons donc une représentation graphique à cinq dimensions : CTR x position moyenne x nombre de clics x nombre d'impressions x temps.

Tableau Google Documents, novembre 2011 à février 2012

Cerise sur le gâteau : il est possible d'afficher les étiquettes de chaque bulle (impossible à ma connaissance avec les graphiques à bulles d'Excel), de porter le focus sur des bulles spécifiques en sélectionnant des requêtes dans la liste de droite, de modifier l'échelle des axes (linéaire ou logarithmique), ou encore de moduler la vitesse de l'animation. Il devient pratique de comparer l'évolution de deux requêtes avec ou sans accent (par exemple : "température idéale" vs "temperature ideale") ou l'évolution de trois synonymes (par exemple : "frigo", "frigidaire", "réfrigérateur" etc...).

Graphique de mouvement à bulles, octobre 2011 à février 2012

Les données du graphique sont disponibles via ce lien vers le document Google


D'autres améliorations sont envisageables comme par exemple le fait de ne conserver les requêtes qu'à condition que nous ayons chaque donnée pour chaque période : point positif, on gagne en cohérence d'observation, mais en contrepartie, cela devient particulièrement restrictif.

Bien sûr, plus vous aurez un nombre élevé de requêtes et un trafic important, plus les observations devraient être intéressantes. Pour autant, ce type de visualisation me paraît particulièrement pertinent et puissant lorsqu'il s'agit "d'amorcer la pompe" du SEO : il aide à cibler les efforts sur les premières lacunes, ou à activer certains leviers faciles (par exemple, l'optimisation d'une requête identifiée comme peu concurrentielle).

Et bien sûr, si cette démonstration vous a intéressé, n'hésitez pas à en parler dans les commentaires de l'article et à partager sur les réseaux !