Econoclaste plante son analyse de sondage et OWNI n'y voit que du feu

La plupart des articles consacrés aux analyses de sondage, et qui entreprennent de dénoncer leurs méthodes prétendument peu rigoureuses, trahissent presque systématiquement un cruel manque de connaissance en la matière. Et pour autant, rien n'arrête le détracteur : tourné à son avantage, chaque aspect du sondage semble justifier et conforter sa piètre démonstration. Ce qui est marquant par ailleurs, c'est aussi bien souvent le ton malicieux emprunté par ces détracteurs illuminés.

Un des derniers exemples en la matière est cette analyse d'Alexandre Delaigue, auteur du blog Econoclaste, dans un article intitulé "Un jour ordinaire dans le monde merveilleux des faux nombres" qu'Owni s'empressa de publier à son tour, bien que ce dernier s'était déjà risqué à cet exercice périlleux...

Décortiquons cette laborieuse démonstration.


1 - « Pour le sondage, d'abord, ça ne rigole pas. On nous colle partout des sigles "ISO", sans doute pour bien nous persuader que nous sommes face à de la science rigoureuse. »

C'est justement à cause de leurs détracteurs que les instituts de sondage (et les journalistes) se retrouvent dans l'obligation de rappeler la certification ISO. Il s'agit simplement d'une méthodologie validée. Je ne suis pas convaincu qu'on y porte autant d'attention lorsque le sigle se retrouve sur nos aliments ou nos matériels électroniques, tant il s'agit là d'un élément d'une grande banalité qu'on est amené à croiser plusieurs dizaines de fois par jour...

2 - « La méthodologie est comique de précision : ce sont mille et une personnes qui ont été interrogées. Vous vous demandez sans doute "pourquoi ce nombre". »

Lorsqu'un sondage est élaboré (notamment lorsque le mode d'interrogation est téléphonique ou sur Internet), il est quasi systématique qu'on y applique des quotas. Evidemment, ces quotas évoluent en fonction du profil des panélistes interrogés (généralement, on utilise entre trois et six critères : âge, sexe, profession, région, catégorie d'agglomération et nombre de personnes dans le foyer). Ils sont donc recalculés et ajustés, quasiment en temps réel, après chaque interrogation. Or, tous ces quotas sont croisés entre eux : il est donc très peu probable de parvenir à une structure d'échantillon suffisamment représentative sur la base exacte de 1000 interrogations. Ainsi, pour pallier aux éventuels manques, on interroge un reliquat de panélistes.

3 - « Premièrement, sur un sondage effectué aléatoirement, le nombre de personnes interrogées détermine la marge d'erreur. »

Malgré toute ma bonne volonté, je ne comprends pas le sens de cette phrase... D'une part, il n'y a aucun rapport entre le fait de tirer un échantillon aléatoirement et la détermination de la marge d'erreur. D'autre part, un échantillon tiré selon la méthode des quotas (donc par définition non-aléatoire) sera également accompagné d'une marge d'erreur ! Au passage, je ne sais pas exactement ce que signifie "effectuer un sondage aléatoirement". Pour faire simple et concis, la marge d'erreur est généralement mise en avant pour rappeler que plus les résultats reposent sur des effectifs réduits, plus ils perdent en précision et significativité. En d'autres termes, ces résultats deviennent des tendances qu'il convient de manier avec précaution.

4 - « Ce phénomène par lequel la simple présence de nombres persuade est renforcé par la précision apparente du nombre. »

Il s'agit de leviers actionnés par les journalistes. La mission de l'institut de sondage n'est pas de communiquer ses propres résultats dans la presse (tout au plus, se risque-t-il parfois à lacher un communiqué de presse, généralement très peu relayé). Sa mission est de vendre une prestation de service aux patrons de presse (entre autre), mettant ainsi à leur disposition des données chiffrées qu'ils sont naturellement libres de triturer à leur sauce (avec la rigueur dont ils sont capables).

5 - « Celle-ci est à peine modifiée par le fait d'interroger 1000 ou 1001 personnes. la précision exacte du nombre de personnes interrogées, ici, sert donc beaucoup plus à établir la conviction de scientificité qu'à informer réellement. »

C'est faux : 1001, 1002 ou 1036 sont des nombres entiers, correspondant à des personnes physiques "entières". Il n'y a là aucune raison d'arrondir le nombre de personnes interrogées. La démarche n'est pas tant d'établir la conviction de scientificité que de fournir une information réelle, brute et non déformée. Puisqu'on en est à faire des suppositions sur la façon d'informer, il est bien plus probable que si les instituts prenaient le parti d'annoncer des échantillons de 1000 individus exactement, les détracteurs seraient suspicieux à l'égard de ce chiffre douteusement si "parfait".

6 - « Elle ne prend pas en compte l'autre erreur, la plus courante : l'erreur structurelle. »

C'est faux : l'erreur statistique est forcément la plus courante puisqu'elle est inhérente à tout sondage faisant appel à des échantillons. Le seul contexte dans lequel nous n'avons strictement aucune erreur statistique est celui d'un recensemement complet d'une population définie (cas extrêmement rare, convenons-en, puisque désormais, même le recensement de la population française ne répond plus à cette exigence, l'INSEE préférant extrapoler les résultats).

7 - « En pratique, les sondages sont effectués par des personnes réelles, qui peuvent se tromper en collectant leurs données; surtout, particulièrement dans les sondages réalisés auprès de personnes réelles, il y a des biais de collecte d'information. »

C'est faux : "en pratique" de quoi, pour commencer ? Dans le cadre du sondage par Internet, le biais de collecte est extrêmement marginal puisqu'il ne fait intervenir aucune personne réelle dans le processus de récupération des données. Les sondages sont programmés, puis testés à moindre échelle, et soumis aux panélistes par voie numérique et selon un algorithme capable de faire appliquer les quotas (comme je l'évoquais précédemment). Il y a donc une équité totale lorsque le panéliste A et le panéliste B répondent à la même question.

8 - « Lorsque vous lisez "x% des français pensent que" il faut lire "x% des français qui répondent aux sondages pensent que". »

Il convient quand même de préciser qu'en toute circonstance, les échantillons finaux sont nécessairement représentatif de la population française. Ce qui revient à dire que notre échantillon de "français qui répondent aux sondages" en est par définition lui aussi représentatif (sur la base des critères que j'évoquais précédemment). Là encore, il s'agit d'une liberté de langage employée par les journalistes, et non par les instituts de sondage. D'ailleurs, il est parfaitement courant de lire "x% des français interrogés" dans les rapports d'analyse.

9 - « Les réponses peuvent être orientées par la façon dont les questions sont posées, voire même par l'ordre dans lequel elles sont posées : si par exemple on vous demande d'indiquer vos opinions politiques avant de vous poser des questions de société, vous aurez beaucoup plus tendance à vous conformer aux opinions-type de votre camp. »

Aussi surprenant que cela puisse paraître, l'orientation des questions est un biais des sondages dont les détracteurs sont conscients que depuis très peu de temps (récemment, Marianne, Le Figaro ou Le Parisien n'y sont allés pas avec le dos de la cuillère). C'est en tout cas bien la preuve que l'erreur structurelle est essentiellement le fait des patrons de presse (ou parfois des chefs de service politique) : ils ne peuvent plus nier le parti pris politique dans la tournure des questions qu'ils composent. Pour autant, comment résoudre le problème ? Existe-t-il une encyclopédie des questions de référence non biaisée, avec une garantie scientifique de leur neutralité ? Et quand bien même : si les grands journaux nationaux commandaient des sondages pour avoir un instantané objectif de l’état de l’opinion, cela se saurait.

10 - « Dans cet exemple, il y a un biais énorme : le mode d'interrogation, en ligne. Là encore, la "scientificité" est assise sur la dénomination du système d'interrogation, désignée par un sigle en anglais. Ca fait tout de suite plus sérieux. »

La scientificité réside dans la création d’un échantillon, selon des règles de représentativité, régies par des quotas correspondant à des données statistiques vérifiées portant sur une population la plus exhaustive possible (la taille de l'échantillon est un levier essentiel revenant au client puisqu'il conditionne directement le montant de la facture). La scientificité des sondages, c’est également les pondérations, redressements consentis à postériori pour restructurer un échantillon éventuellement déformé par des contraintes de population. Au passage, CAWI signifie "Computer-Assisted Web Interviewing". On dit également qu'il s'agit d'un système d'administration d'enquêtes, en ligne et auto-administré. Rien de bien mystérieux, en réalité...

11 - « les personnes qui ont servi à ce sondage correspondent à un sous-groupe particulier de la population, les gens qui ont un ordinateur et un accès internet, et qui acceptent de répondre à un sondage en ligne. Il y a très peu de chances qu'ils représentent la population française. L'application là-dessus de la "méthode des quotas", au passage, loin d'améliorer le résultat, ne fait qu'introduire de nouveaux biais. »

C'est faux. C'est même complétement l'inverse pour deux raisons essentielles : ce mode d'interrogation induit un risque d'erreur structurelle quasi nulle (contrairement aux enquêtes téléphoniques ou en "face-à-face") et la méthode des quotas visent précisément à corriger la légère déformation engendrée par ce mode de recueil. Le biais par téléphone est plus conséquent (pensons aux gens qui n'ont plus de téléphone fixe - les instituts n'appellent pas les gens sur leur téléphone portable, ou aux personnes âgées, à la retraite ou au chômage particulièrement sur-représentées). Par ailleurs, l'article fustigeait déjà le mode de recueil en face-à-face (le fameux biais des personnes "qui peuvent se tromper en collectant les données").

12 - « On aurait pu essayer d’autres verbes : "approuvez-vous" ? "Appréciez-vous" ? "vous intéressez-vous" ? et à chaque fois, on aurait eu un nombre différent. Du commentaire sur du bruit.

Et c'est au moment où on commençait à effleurer le problème essentiel des sondages que le sujet est clos. Il est navrant qu'ait été occultée la part de responsabilité pourtant si peu négligeable du commanditaire dans l'élaboration des sondages. J'espère simplement que nous n'en sommes pas encore à découvrir que le langage n'est jamais neutre et qu'un mot - bien que synonyme d'un autre - peut colporter des nuances lourdes de biais quand il s'agit de sonder l'opinion.


Ce qui me chagrine, c'est ce que le grand public retiendrait de l'article d'Econoclaste... Il faut bien se rendre compte qu'une large majorité de sondages ne sont ni médiatisés ni même publiés sur le site des instituts. En réalité, les sondages d'opinion représentent à peine 10% de leur chiffre d'affaire. Evidemment, ils constituent une excellente vitrine, mais c'est un peu l'arbre qui cache la forêt.

Cette "forêt" de sondages non médiatisés rassemble quand même tous les éléments évoqués : norme ISO, nombre de personnes interrogées (à l'individu près), sigle du mode d'interrogation (CATI, CAWI, CAPI), marge d'erreur... Il serait donc malhonnête d'affirmer que tous ces éléments serviraient à endormir la vigilance de l'honnête citoyen.

La seule différence essentielle réside peut-être dans l'élaboration des questions : si j'en crois mon expérience de consultant statistique, les commanditaires se montrent bien plus neutres et soucieux quand il s'agit de sonder des panélistes pour leur propre compte dans un cadre privé.