Anticiper l'avenir grâce aux archives du Web et servir l'aide humanitaire

Et si on analysait les données du Web pour prédire les événements du futur ? C'est la solution avancée par Eric Horvitz (de Microsoft Research) et Kira Radinsky (du Technion-Israël Institute), deux chercheurs en data mining, pour mieux connaître l'avenir.

Bien que l'idée ne soit plus tout à fait neuve (Google propose déjà depuis plusieurs années des prédictions sanitaires), elle reste encore largement innovante, et la question qui en découle est relativement simple : en agrégeant les nombreuses données (présentes ou passées) disponibles sur Internet, peut-on anticiper les phénomènes humains (maladies, manifestations) et en tirer un algorithme capable de générer des alertes à la volée ?

Les chercheurs se sont penchés sur - entre autre - plus de vingt ans d'archives du New York Times afin de soumettre leur hypothèse (PDF) à l'épreuve de la réalité. Par ailleurs, la base de données rassemblant des connaissances très diverses serait également une consolidation de près d'une centaine de sources d'information (DBpedia, WordNet, OpenCyc...).

Ils se sont particulièrement intéressés aux événements précédant les épidémies, en suivant les articles de presse traitant des catastrophes naturelles (tempêtes, sécheresses). Ils affirment d'ailleurs que l'observation d'une telle chaîne d’événements aurait pu permettre, un an à l'avance, de prévoir la recrudescence du choléra.

Dans un autre ordre d'idée, l'analyse des données relatives au maintien de l'ordre tend à mettre en évidence que les protestations, émeutes, pics de violence sont systématiquement précédées d'un fait impliquant la mort d'un innocent dans les quartiers à forte population immigrée.

L'efficacité de leur modèle semble assez satisfaisant puisque les avertissements issus des tests étaient cohérents dans 70 à 90% des cas, d'autant que le système de Microsoft est capable d'affiner les prédictions en comparant les données issues de situations géographiques, démographiques et/ou économiques comparables.

Mis à la disposition des associations humanitaires, ce type d'outil devrait permettre de mieux préparer leurs interventions en fonction des risques de déclenchement des catastrophes sanitaires. Dans l'immédiat, aucune commercialisation n'est envisagée car de nombreuses améliorations sont en cours de réalisation (enrichissement de la base de données, élargissement des événements etc...).

Crédit photo : Ahmad Hashim / Flickr