C-Radar, le modèle prédictif des entreprises françaises par Data Publica

Bien que Data Publica soit initialement le prolongement d'un projet de recherche consacré à l'open data, puis soit devenu un "sourceur" de données publiques grâce à son imposant annuaire, la société parisienne s'oriente depuis quelques mois vers le marché de l'exploitation des données d'entreprise en commercialisant un service qui se veut à la fois un moteur de recherche et un modèle prédictif.

Fort de son expérience et de deux années de recherche et développement, Data Publica commercialise C-Radar, sa nouvelle offre qui se révèle innovante à de nombreux égards puisqu'elle s'emploie à appliquer les dernières techniques en matière de scraping, data mining et machine learning. La maîtrise simultanée de ces techniques permet à C-Radar d'être le premier outil en France dans le domaine des ventes prédictives.

c-radar_homepage.jpg

Présentation de C-Radar et entretien avec Benjamin Gans

Pour en parler le mieux possible, j'ai transmis quelques questions à Benjamin Gans qui est en charge de la communication et du marketing au sein de Data Publica.

Contre quels secteurs C-Radar propose-t-il une disruption ?

c-radar_benjamin-gans.jpg

La force du produit C-Radar provient de notre capacité à capter et extraire toutes les informations concernant les entreprises françaises : que ce soit sur leurs sites web, les réseaux sociaux et les mentions média. A partir de ces données, nous complétons la base de données B2B de l'INSEE et d'Infogreffe pour proposer la base d'entreprise française la plus riche et la plus complète en France. Cette base de données possède des fonctionnalités qui bouleversent la manière de faire du marketing et de la vente : plus besoin de mailings de masse, identification d'une liste de prospects en quelques minutes, segmentation automatique d'un marché ou d'un écosystème. Bref, comme on nous le dit parfois, C-Radar est une sorte de Societe.com 2.0 rendu intelligent par le Big Data. Aussi, la disruption de C-Radar n'est pas contre un secteur mais effectivement contre des acteurs qui n'ont pas su identifier les potentialités du web et n'ont pas mis en place les technologies pour capter et enrichir leurs données. On peut citer les grands acteurs traditionnels du marché comme Ellisphère par exemple.

Quels sont vos concurrents aujourd'hui ?

Je n'identifie par particulièrement de concurrents en France car je ne vois pas aujourd'hui de société qui possède notre savoir faire technologique, ni notre capacité à extraire et traiter autant de données quotidiennement. Il peut arriver que certaines sociétés tiennent le même discours marketing que le notre mais mis à part la société Radius aux Etats-Unis, je n'en vois pas une seule qui ait développé autant de technologie ni qui traite ce même volume de données. Autour du produit C-Radar, il y a une dizaine d'ingénieurs mobilisés alors que chez nos concurrents, on va plutôt trouver une dizaine de commerciaux et seulement un ou deux ingénieurs. D'ailleurs, c'est cette dimension technologique qui a été récompensée par notre prix dans la catégorie Big Data du Concours Mondial de l'Innovation 2030 du ministère de l'économie en mars dernier.

c-radar_firmographie.jpg

Quelle est la matière première exploitée par C-Radar pour assurer la pertinence du modèle prédictif ?

La pertinence du modèle prédictif provient à la fois de la qualité des données et, par conséquent, de leurs sources et de leur traitement, mais aussi des algorithmes que nous avons produit pour affiner notre approche par similarité. Aujourd'hui, dans le monde de l'information B2B, tout le monde exploite les mêmes sources d'informations : les données financières sont issues d'Infogreffe et les données administratives de l'INSEE. Nous ajoutons à ces deux sources les données que nous captons depuis les sites web des entreprises, depuis leurs signaux émis sur les réseaux sociaux et dans les média. Ces données sont de plus en plus riches, mises à jour très fréquemment. Aujourd'hui C-Radar ce sont plusieurs millions de pages web crawlées tous les jours et une base de sites web professionnels identifiés en constante augmentation : depuis quelques jours nous sommes passés de 400000 sites à 1,1 million de sites web d'entreprises identifiés et "scannés". C-Radar, c'est aussi une technologie qui nous permet à partir d'un numéro Siren d'identifier le site web de l'entreprise. Si je résumais, je dirais que notre capacité technologique nous permet de transformer les signaux faibles en données et les données en prospects !

Dans quel domaine C-Radar s'est-il montré le plus spectaculaire par son efficacité ?

C-Radar, ce sont principalement deux fonctionnalités très innovantes et chacune de ces fonctionnalités produit à chaque fois son effet "wow". La première fonctionnalité est le moteur de recherche qui vous permet de chercher des entreprises par mots clés et non plus par code NAF. On pourrait croire que les 735 codes NAF suffisent à décrire toutes les activités françaises mais on est vite limité si, comme notre client Cegid, on cherche des entreprises de sous-traitance automobile et de sous-traitance aéronautique ! Avec le moteur de recherche C-Radar, on trouve toutes les entreprises qui concernent le ou les mots clés que l'on recherche. En quelques secondes par exemple on peut trouver les entreprises qui sont actives dans le secteur du Big Data, ou bien qui développent des applications pour smartphone : là par exemple, je peux te dire qu'il y en a 1206 en région parisienne qui sont dans le domaine d'activité des app android ! Deuxième effet spectaculaire et particulièrement utile pour les directions marketing et commerciales, c'est cette capacité qu'a notre outil à segmenter en seulement quelques minutes un marché, un écosystème, une base client pour y trouver des prospects similaires.

c-radar_moteur-de-recherche.jpg

Comment C-Radar s'inscrit-il dans la stratégie de Data Publica ? Quelles seront les futures évolutions de l'outil ?

En effet, ceux qui nous suivent régulièrement ont sûrement constaté que nous parlions beaucoup de C-Radar dans notre communication, actuellement. C-Radar est le prolongement de nombreux projets clients ainsi que de nombreuses réflexions menées en interne, et c'est un process dans lequel toute l'équipe technique est particulièrement investie. Nos efforts se concentrent actuellement sur l'amélioration de l'outil, nous enrichissons notamment la base avec de nouvelles sources de données open data, preuve que nous ne nous éloignons pas tant que ça de notre modèle initial. Et ce qui est le plus excitant c'est que nous continuons à découvrir des fonctionnalités innovantes, que nous implémenterons au fur et à mesure des évolutions de l'outil. Bref, C-Radar ça ne fait que commencer !

Pas seulement un moteur de recherche, également un modèle prédictif

C-Radar peut en effet se révéler très efficace pour aider à détecter de nouveaux clients. Le service promet d'évaluer la probabilité qu'une entreprise puisse potentiellement devenir un client, en mesurant son degré de similarité avec une base de prospects. Pour ce faire, C-Radar intègre de nouveaux critères de segmentation, en particulier les différents éléments constituant la présence en ligne d'une entreprise. Avec C-Radar, Data Publica exprime son ambition de vous faire abandonner les études de marché traditionnelles, basées sur des échantillons, au profit d'études de marché exhaustives à l'échelle 1.

En catégorisant ses prospects actuels ou anciens mais également en élaborant une typologie d'entreprises susceptibles d'être de potentiels prospects, C-Radar aide à la construction d'un corpus de données rassemblant des données Web (les offres d'emploi sont par exemple un des nombreux signaux pris en compte) et socio-économiques (comme notamment la propension à exporter), aboutissant à la création d'un écosystème cohérent d'entreprises.

Trois études de cas très concluantes

Afin de profiter des apports concrets du service, je vous recommande le blog consacré à C-Radar. Voici par ailleurs trois retours d'expérience dont j'ai pu prendre connaissance lors de la présentation publique du service.

  • CEGID était à la recherche de "vrais" prospects, facilement accessibles, et surtout à un coût raisonnable. Sur la base d'un échantillon pilote de 20000 prospects et 8000 CRM, C-Radar a permis de confirmer que 100% des comptes étaient dans la cible, et que 96% d'entre eux étaient effectivement de potentiels clients. Selon CEGID, C-Radar s'est révélé rentable à très court terme, c'est à dire dès le premier mois.
  • The French Talent est parti du principe que le profil de leurs clients actuels est le même que celui de leurs futurs clients. Il a donc d'abord fallu qualifier la base de prospects existante à l'aide d'un algorithme d'apprentissage. L'outil a permis de faire émerger trois groupes de prospects en fonction de critères sémantiques. Un des groupes, plus orienté "marketing en ligne", s'est révélé avoir une probabilité de futur client très supérieure aux deux autres.
  • Enfin, Prestaleads a mené une utilisation inversée de C-Radar. La société, dont l'objectif est de trouver des fournisseurs pour d'autres entreprises (par exemple, un fournisseur de pelliculeuse, un fabricant de bouchons à grande échelle), ne souhaitait plus baser son business sur du webmarketing traditionnel (Adwords trop cher et fastidieux) ou sur sa base de fournisseurs peu qualifiée (mauvais taux de retour). Pour chaque besoin spécifique, C-Radar a permis de trouver un seul fournisseur, disponible et parfaitement ciblé.

c-radar_segmentation.jpg