The geography of tweets

Miguel Rios, responsable de l'équipe Visual Insights chez Twitter, présentait sa dernière oeuvre de datavisualisation : des milliards de tweets géolocalisés et agrégés depuis quatre ans, puis cartographiés.

En définitive, la carte est facile à lire : à chaque point correspond un tweet géolocalisé et la couleur de ce point varie en fonction du nombre de tweets enregistré à cet endroit.

Que révèlent ces cartes ?

Plusieurs constats :

  • comme le souligne le manager de l'équipe, on distingue particulièrement bien le trafic maritime
  • les grandes métropoles, espaces côtiers, bordures de fleuve et axes routiers ressortent parfaitement. D'ailleurs, la hiérarchie de densité (autoroute > nationale > départementale) semble généralement assez bien respectée.
  • on observe une quantité non négligeable de tweets perdus en pleine mer : s'agit-il d'une sorte de bruit constant correspondant à des erreurs de GPS ?
  • la densité de tweets observée pour une grande ville comme New York laisse apparaître la physionomie des quartiers : lotissements, immeubles, ponts etc...
  • dans une certaine mesure, la cartographie de l'Europe permet d'entrevoir la densité de population des pays : par exemple, la densité de l'Angleterre et des Pays-Bas est environ quatre fois plus élevée que celle de la France (100 contre 400 hab/km²).
new-york_twitter.jpg new-york_google-maps.jpg

Malheureusement, si l'Europe a été représentée dans sa globalité, Paris n'a pas fait l'objet d'une visualisation dédiée (contrairement à Seoul, Tokyo ou Moscou) : vous pouvez d'ailleurs retrouver toutes les autres visualisations sur le compte Flickr de Twitter.

Comment sont-elles conçues ?

Si j'en crois le tweet de Miguel Rios, ce type de conception nécessite vingt lignes de code en Langage R, le package ggmap (avec sa documentation PDF) qui permet la création de visualisations avec Google Maps, et bien entendu, une base de tweets "géotaggés" la plus grosse possible.

C'est probablement ce dernier point qui vous donnera le plus de fil à retordre, tant l'API de Twitter est limité ou hors de prix...

Source : Twitter