ElectionScope : que penser du modèle prédictif qui voit Sarkozy l'emporter ?

Incompris, comparés à de l'astrologie, traités avec dédain par une presse souvent hilare, force est d'admettre que les modèles prédictifs pâtissent généralement d'une mauvaise presse en France. Aussi, lorsque deux économistes annoncent la victoire de Nicolas Sarkozy au second tour de la présidentielle avec 50.3% de voix, il n'en faut pas plus pour que toute la gauchosphère intellectuelle s'en amuse lourdement ou s'en offusque ostensiblement.

L'objectif de cet article n'est pas tant de déterminer si le modèle prédictif est valide, que de débroussailler un peu le sujet et vérifier la crédibilité de la démarche réalisée par les deux économistes : identifier les méthodes, les mécanismes, l'intérêt du procédé...

Bienvenu dans l'Inquisition contemporaine !

Il y a au moins trois réactions possibles à la conclusion-choc de ce modèle :

  • l'accueil par le dénigrement, le cynisme et/ou l'ironie car il est hors de question d'approfondir le sujet ni d'identifier ne serait-ce qu'un bout d'élément probant dans la démarche de ces deux universitaires.
  • il y a éventuellement la curiosité "polie" : on s'en tiendra à ce que veut bien nous expliquer Le Parisien, L'Expansion, Le Figaro ou L'Express sans creuser plus loin, et clore cette lecture d'une légère moue sceptique.
  • enfin il y a la curiosité saine, celle qui consiste à croiser les informations et à juger sur pièce en fonction de l'ensemble des éléments portés à notre connaissance et en tirer les conclusions qui s'imposent.
Les mathématiques du 20ème siècle

Autant vous dire que sur le site d'actualité des chercheurs en mathématiques du CNRS, c'est la première méthode qui prédomine. Je ne rentrerais pas dans la doxa de ces professeurs de mathématiques qui préfère balayer l'annonce d'un revers de main en citant (très maladroitement) un sketch de Coluche, et en invalidant le bien fondé du modèle sur l'unique fait que l'information est relayée par le Figaro et signée de la main de deux chercheurs dont le cursus universitaire est, à priori, imprécis. L'article et ses commentaires sont postés par des mathématiciens de tout poil n'hésitant pas à comparer les travaux des deux économistes ni plus ni moins à de "l'amusette", de l'astrologie, de la fantaisie, de l'ânerie, ou même n'ayons pas peur des mots, à de la "magie" ! (sic)

Les principes de base d'un modèle prédictif

Rappelons d'abord un des principes de base d'un modèle prédictif. Plus il dispose d'informations, moins il se trompe. Aussi, s'il venait à se tromper sur l'issue du deuxième tour de la présidentielle française, le modèle ne devrait pas nécessairement être évincé. Par contre, et c'est là que la démarche est intéressante, les nouvelles données (ayant amené à l'échec du modèle ancienne version) devrait simplement permettre de l'améliorer, car jusqu'à preuve du contraire, un modèle prédictif est juste. Toute la difficulté et l'objectif de la démarche est d'élaborer un modèle capable de ne jamais se tromper, ou en tout cas le plus tard possible.

Un autre aspect qui devrait pourtant jouer en sa faveur auprès du grand public est que, contrairement aux sondages, un modèle prédictif n'a pas vocation à mesurer une situation du présent. Il essaye d'anticiper la mesure d'un résultat final, à partir de données connues dont il s'alimente au moment de l'élaboration du modèle. C'est d'ailleurs ainsi qu'une nouvelle estimation à 50.2% était avancée sur la base des dernières données trimestrielles du chômage (disponibles depuis quelques jours). Le terme consacré est celui de "simulation". La démarche qui vise à élaborer un modèle prédictif est particulièrement pertinente puisqu'il s'agit d'identifier des variables explicatives d'un résultat final : elles constituent une sorte de dénominateur commun, déterminant pour la faisabilité du calcul.

Les rouages du modèle prédictif d'Electionscope

L'overfitting (qu'on pourrait traduire par les "effets non modélisés"), dénoncé par nos éminents mathématiciens, est un biais qui intervient lorsqu'un modèle statistique est exagérément complexe (trop de paramètres pour trop peu d'observations) ou lorsqu'il donne trop d'importance au "bruit" ou à l'erreur aléatoire. Le risque est d'exagérer l'influence de tendances mineures détectées dans les données. Dans l'exemple qui nous intéresse, je me risquerais à dire que ce n'est vraiment pas le cas...

Le modèle repose sur le principe de la théorie économique du vote : les électeurs évaluent la situation et votent en conséquence. Si celle-ci est globalement bonne, alors le vote sera favorable au sortant (vote "récompense"). Inversement, si la situation n'est globalement plutôt pas bonne, alors l'électeur votera en faveur de l'opposition du sortant (vote "sanction") : il s'agirait donc d'une sorte de "référendum sur la gestion du parti sortant". La situation est un premier levier de décision : le vote tient moins compte des promesses électorales que du bilan du président sortant.

Mais les facteurs politiques ne suffisent pas : de fait, le vote n'est pas un acte résolument pragmatique ou réaliste, ni forcément idéaliste. Notre intention de vote pour un candidat n'est pas automatiquement en adéquation parfaite avec les idées (donc les programmes) qu'on souhaite défendre. C'est d'ailleurs ce que nous révèle le Comparacteur 2012 en mesurant un taux d'affinité des électeurs envers les programmes des candidats. Apparemment, l'électorat serait plutôt favorable aux programmes de François Hollande, François Bayrou, Eva Joly et Nicolas Dupont-Aignan. Dans la pratique, on le sait, le quatuor de tête annoncé par les sondages d'intention de vote est tout autre.

Aussi, Electionscope indexe son modèle prédictif en grande partie sur l'évolution du taux de chômage, un indicateur particulièrement déterminant et "écrasant" dans l'évaluation de l'état de santé du pays. Il prend également en compte le taux de croissance, l'ampleur du déficit public, la cote de popularité et la perception de la situation des Etats-Unis.

L'économie du 21ème siècle

Les précédentes prédictions "réussies" du modèle et les hypothèses

En l'état, le modèle intègre 38 années d'historique de résultats politiques et économiques. Bruno Jérôme et Véronique Speziari affirment que le modèle a fonctionné en France avec le résultat final des législatives de 1997 et 2002 ou avec 80% des villes de taille moyenne lors des municipales 2001. Il a également prédit avec succès le résultat des trois dernières élections présidentielles françaises et américaines (avec deux mois d'avance), ainsi que les législatives de 2005 en Allemagne. Certains aspects fragilisent néanmoins la stabilité du modèle par leur caractère exceptionnel, comme les cohabitations (1995 et 2002) ou le fait que le président sortant brigue un second mandat (2002 et 2012).

Les instituts de sondage tablaient encore récemment sur un taux d'indécis situé entre 30 et 36% (selon OpinionWay, IPSOS, IFOP, début avril 2012). Cela tend à ne pas invalider immédiatement la prédiction du modèle plaçant Nicolas Sarkozy au second tour avec 50.2% de suffrage. En tout cas, il convient de se demander ce qu'il adviendra de l'électorat d'indécis dans les prochains jours. Pour autant, on ne peut guère tirer d'autre conclusion de cette prédiction que celle qui consiste à envisager un entre deux tours particulièrement déterminant. Car, selon le modèle et contrairement à ce qu'affirment pour le moment les sondages d'intention de vote, les deux qualifiés seraient au coude à coude, et les marges d'erreur (évaluées à plus ou moins deux points) pourraient faire basculer la prédiction dans un sens comme dans l'autre.


Et si, paradoxalement, le rapport de défiance que les français sont de plus en plus nombreux à entretenir à l'égard des sondages engendrait une surestimation de l'électorat de gauche ? D'une part, la pression médiatique tend à effacer les "petits" candidats, dont le traitement est loin d'être équitable : les médias traditionnelles n'hésitent d'ailleurs pas à jouer le rôle d'une caisse de résonance favorable aux cinq favoris sur le plan de l'occupation du terrain médiatique. Mais est-on bien sûr que cette pression n'induit pas non plus une sous estimation de l'électorat de Nicolas Sarkozy ? Affublé du statut de candidat sortant au bilan largement critiqué, il n'est pas à exclure que Nicolas Sarkozy profite d'une espèce de "vote caché" le 6 mai prochain (le "Sarkozysme honteux" de certains électeurs).

D'ailleurs, à l'instar du lobby anti-sondage français perpétré par cette caste de sociologues et politologues gauchistes, je ne peux m'empêcher de croire que le principal défaut de ce modèle pour ses détracteurs est qu'il annonce la victoire d'un candidat qui n'est pas le leur. Mon côté provocateur pourrait presque me donner envie que le modèle voit juste...