Google prédit les épidémies de grippe

Chaque semaine, des millions de requêtes sont formulés sur le moteur de recherche de Google, les utilisateurs recherchant entre autre des informations en rapport avec la santé. Comme on peut s’y attendre, les recherches en rapport avec la grippe sont logiquement plus nombreuses en période de grippe, celles liées aux allergies plus nombreuses à la saison des allergies, et les requêtes relatives aux coups de soleil plus nombreuses pendant l’été. En fait, Google a constaté que plus d'un tiers des recherches effectuées sur Internet sont liées à la santé et qu'en cas de maladie, les internautes ont effectivement tendance à utiliser leurs symptômes comme mots-clés.

Tous ces phénomènes sont facilement observables en utilisant Google Trends, et en particulier le nouvel outil de la firme de Mountain View, Google Flu Trends, permettant de dresser une carte des états les plus touchés.

Les tendances observées sont-elles fiables en tant que modèle et jusqu'à quel point ?

L’équipe de Google.org a constaté une corrélation assez forte entre les recherches sur la grippe et le taux d’incidence de la maladie elle-même. Évidemment, toutes les personnes lançant des recherches sur la grippe ne sont pas forcément malades. Néanmoins, les résultats ont été comparés aux données du CDC (le centre de contrôle et de prévention des maladies aux USA).

Il a été possible de constater une nette croissance du nombre de certaines requêtes (comme "flu" par exemple) exactement en même temps que la saison de la grippe, autorisant jusqu’à l'évaluation de l’ampleur d’une épidémie. Ces résultats se sont révélés à ce point pertinents, qu’ils ont été publiés dans Nature. Bien sûr, l’efficacité et la pertinence des résultats ne garantissent pas qu’il en soit de même dans le futur.

Par ailleurs, les méthodes employées par le CDC pour suivre - entre autre - la grippe aux USA sont variées et poussées. Une de ces méthodes consiste à s’appuyer sur plus d’un millier de médecins assurant tous les ans la visite de plusieurs millions de patients. Une fois recueillies et agrégées, ces données représentent un excellent indicateur de l’ensemble de l’activité grippale aux États-Unis.

Puisque le CDC fournit déjà un indicateur satisfaisant, quel est l'intérêt de ces observations fournies par Google Trends ?

En fait, il s’avère que les systèmes de surveillance de la grippe mettent jusqu’à deux semaines pour collecter et publier leurs résultats. Or, les requêtes de recherche sur Google sont automatiquement comptabilisées, et ce, quasiment en temps réel. Dès lors, il devient possible avec Google Flu Trends de fournir une estimation du niveau de l'activité grippale avec jusqu’à deux semaines d’avance sur la publication des rapports du CDC.

Pour les épidémiologistes, il s'agit en définitive d'un développement passionnant, car la détection précoce d'une maladie peut réduire le nombre de personnes touchées. Si une nouvelle souche de virus de la grippe apparaissait, une pandémie comparable à celle de 1918 pourrait voir le jour et causer des millions de morts.

Quelles sont les limites de Google Flu Trends ?

  • Comme le précise Google, Google Flu Trends ne pourra jamais être utilisé pour identifier des utilisateurs individuels : l'outil se base sur des données agrégées et anonymes, portant sur le nombre d'occurrences de certains mots-clés.
  • Naturellement, les observations réalisées via le moteur de recherche de Google n'ont pas pour vocation de remplacer les activités du CDC, ces dernières apportant une manne d'indicateurs supplémentaires reposant notamment sur l'âge.
  • Cet outil est réservé aux seuls habitants des USA. Or, si la grippe tue 36000 personnes dans cette région du monde, il ne faut pas perdre de vue qu'elle en tue par ailleurs plusieurs centaines de milliers dans le monde entier.
  • Rien n'assure que l'outil soit capable de fournir des tendances aussi pertinentes à l'avenir. Les résultats reposent essentiellement sur l'habitude largement répandue des internautes de se servir de Google pour leurs recherches.

Juste une petite remarque annexe : l’article affirme que 1500 médecins sont consultés par 16 millions de patients tous les ans. Même en supposant que ces médecins travaillent tous 365 jours sur 365, cela reviendrait en moyenne à recevoir 29 patients par jour. N’est-ce pas un peu beaucoup ?

Pour en savoir plus :

  • Je vous suggère de visionner ces vidéos portant sur le sujet : elles rappellent parfaitement les enjeux du projet et ses diverses applications.
  • Enfin, vous pouvez consulter le fichier au format PDF disponible sur Google.org : il s'agit d'un document récapitulant les méthodes de calcul et apportant une certaine expertise permettant de dépasser la simple observation.