PreTEL, le modèle mathématique capable de prédire le succès d'un livre

Bien que les facteurs qui prévalent au succès d'un livre sont complexes et ne paraissent pas forcément rationnels, des chercheurs espagnols de l'Université de Grenade se sont employés à concevoir un modèle prédictif facilitant les estimations des ventes de livres. L'outil nommé PreTEL existe depuis le mois d'avril 2013, mais ne fait réellement parler de lui que depuis quelques semaines.

Sous la houlette du groupe de recherche GeNeura et de la société PRM Consultores SCA chargée de l'exploitation des données, le système PreTEL s'appuie sur le principe des réseaux neuronaux artificiels. L'analyse des ventes de plusieurs milliers de livres déjà publiés débouche sur un modèle mathématique particulièrement pertinent, tant il se révèle capable d'aider à l'estimation des ventes de nouveaux ouvrages. Concrètement, la marge d'erreur serait estimée à seulement 18%, ce qui est assez encourageant. Dans les faits, ce sont déjà plusieurs milliers de données relatives à des ventes de livres qu'ont été mises en commun.

Un modèle prédictif inspiré des réseaux neuronaux

Dans sa conception, PreTEL embarque des méthodes reprenant le principe d'intelligence artificielle et s'inspirant du fonctionnement des neurones biologiques. Les méthodes sont diverses : on compte les réseaux neuronaux artificiels (cartes auto-adaptatives, multi-layer perceptron), les modèles de régression logistique, les arbres de décision ou encore les modèles de type ARIMA.

L'outil fait appel à des méthodes d'apprentissage de type probabiliste. En d'autres termes, plus on nourrit PreTEL de nouvelles données, plus il essaiera de s'adapter en corrigeant et en améliorant les résultats. L'entraînement est ainsi l'élément central du système : c'est seulement à l'issu de cette phase d'apprentissage que le modèle est capable d'interpréter efficacement les tendances de vente d'un nouveau titre, pour en déduire des données prévisionnelles, comme un volume de tirage optimisé ou une estimation des ventes. Il devient donc évident que l'enjeu majeur soit d'alimenter autant que possible la base de connaissances en l'enrichissant des chiffres de vente d'un maximum d'ouvrages.

Quelles sont les données introduites dans l'algorithme ?

Comme nous venons de le voir, la matière première aboutissant au modèle mathématique de PreTEL est constituée de données statistiques qualitatives comme par exemple l'éditeur, le prix, le sujet de l'ouvrage, mais aussi quantitatives comme le nombre d'invendus ou le nombre de semaines de disponibilité à la vente. Aussi, pour assurer la fiabilité des résultats du système, des mises à jour et des enrichissements sont réalisés constamment.

L'outil va même plus loin puisqu'il est capable de simuler des lancements, selon un certain tirage. D'un point de vue purement statistique, il devient donc possible d'évaluer l'efficacité de la publication d'un livre très en amont de sa commercialisation. Chaque simulation exploite les données compilées relatives aux ouvrages similaires, puis dresse un profil de ventes à attendre, en fonction de l'algorithme.

Quelle est l'utilité d'un tel modèle ? Quelles sont ses limites ?

De fait, ce type d'information pourrait s'avérer être une mine d'or pour les maisons d'édition en mal d'indicateur. Il est en effet très compliqué pour un éditeur de prévoir le succès d'un livre, d'autant que les contraintes économiques incitent à prendre un minimum de risque et à ne pas trop spéculer sur la rentabilité d'un livre. Grâce à PreTEL, il devient possible d'ajuster un tirage, et de réduire les coûts et investissements pesant sur un ouvrage.

Pour autant, l'outil n'est pas parfait. Bien qu'il soit conçu pour s'améliorer sans cesse, il ne prend pas en compte certaines données conjoncturelles dans le milieu de l'édition comme le contexte économique, les modes de courants littéraires, l'intérêt pour la non-fiction et la réputation de l'auteur (ces aspects ne sont pas nécessairement mesurés lors du processus de vente). Ainsi, ces données dont le potentiel est plus compliqué à évaluer à priori sont pour l'instant laissées à la seule évaluation de l'éditeur.

Source : Université de Grenade

Crédit photo : xinita / Flickr