Sentinelles et les prédictions épidémiologiques de Google

Dans un précédent article consacré au projet Flu Trends, Google nous démontrait qu'il est capable de prédire les épidémies de grippe aux USA où il se montre particulièrement efficace. Depuis, le projet a fait des émules : en Australie, en Nouvelle-Zélande, au Mexique et aussi en France où le réseau Sentinelles obtient d'excellents résultats, non seulement sur le suivi de la grippe, mais également sur le suivi d'autres maladies.


Tout d'abord, présentons le réseau Sentinelles : il s'agit d'un réseau constitué de 1300 médecins généralistes libéraux, de France Métropolitaine (soit un échantillon assez conséquent puisqu'il rassemble environ 2% de cette cible). Ces médecins contribuent à faire de Sentinelles une plateforme de recherche et de veille médicale. Ils ont notamment pour mission de surveiller 13 indicateurs de santé dont font parti la grippe, la gastro-entérite et la varicelle.

Ce sont ces trois maladies que les chercheurs du réseau Sentinelles ont tenté de croiser avec les données fournies par Google Trends ou Google Insights for Search. Or, les coefficients de corrélation qui en résultent sont pour le moins satisfaisants. Au passage, je vous invite à lire le paragraphe "Interprétation" de la page Wikipedia consacrée à la corrélation qui résume clairement ce qu'il est nécessaire de savoir à son sujet : en résumé, plus le coefficient est proche de 0, moins les variables sont corrélées; plus le coefficient est proche de -1 ou 1, plus les variables sont corrélées.

La page du réseau Sentinelles consacrée à cette analyse informe de cinq résultats essentiels, dont voici les deux plus remarquables :

  • la proportion de requêtes contenant le mot "gastro" montre une corrélation élevée avec l'incidence des diarrhées aiguës (corrélation = 0.88)
  • la proportion de requêtes contenant le mot "varicelle" montre une corrélation élevée avec l'incidence de la varicelle (corrélation = 0.8)

En ce qui concerne la grippe, les résultats sont un peu moins éloquents. Il se trouve que depuis les alertes de grippe aviaire ou de grippe porcine, les requêtes formulées dans le moteur de recherche Google se diversifient et ne concernent plus uniquement les requêtes de grippes dîtes "cliniques". Aussi, il n'est plus tellement pertinent de chercher une corrélation à partir de requêtes relatives à la "pandémie" de grippe, à la grippe "porcine" ou à la grippe "AH1N1".

C'est pourquoi, ces requêtes ont été analysées de trois façons différentes :

  • la proportion de requêtes contenant le mot "grippe" montre une corrélation plutôt faible avec l'incidence de la grippe clinique (corrélation = 0.13)
  • la proportion de requêtes contenant le mot "grippe" mais ne contenant pas les mots "aviaire" et "vaccin" montre une corrélation encore plus faible avec l'incidence de la grippe clinique (corrélation = 0.11)
  • en revanche, la proportion de requêtes contenant le mot "grippe", mais ne contenant pas une dizaine de mots faisant référence à une grippe non clinique, montre une corrélation plutôt élevée avec l'incidence de la grippe clinique (corrélation = 0.47)

Par ailleurs, si on s'en tient à une période allant de 2006 à 2008, on constate que ces trois coefficients de corrélation sont bien plus élevées (respectivement 0.5, 0.86 et 0.88). Il est probable que l'éviction des requêtes formulées en période de grippe aviaire en 2004-2005 et en période de grippe porcine en 2009 soit l'explication principale de ces plus fortes corrélations.

En définitive, ces recherches sont importantes car elles ont cela d'intéressant qu'elles permettent souvent d'anticiper une tendance ou d'appréhender l'intensité de cette tendance. Il est donc à la fois plaisant et rassurant de constater que même les institutions françaises sont capables de mettre Internet au service de leurs missions.