Je dis souvent : “Le machine-learning, c’est écrit en Python, l’Intelligence Artificielle, c’est écrit en Powerpoint”. 😉
Je préfère donc dire que l’on fait du machine-learning chez Implcit, parce qu’on code beaucoup en Python. Mais je pourrais tout aussi bien parler d’IA, parce que les problèmes que l’on résout sont du même ordre de complexité que ceux auxquels s’attaque l’IA.
Prenons la question de l’optimisation des performances en publicité digitale.
Grâce à une projection statistique innovante, Implcit est capable de modéliser une population de cliqueurs ou d’acheteurs au sein du panel Internet de Médiamétrie. Comme pour tous les panélistes, Implcit connaît tout d’eux :
- tous leurs critères socio-démographiques (sexe, âge, revenus, nombre d’enfants, etc.)
- toute leur activité digitale (sites, sections de sites, pages visitées, applications utilisées, etc.)
- tous leurs centres d’intérêts (“voitures hybrides”, “écologie”, etc.)
On a donc une population de cliqueurs (ou d’acheteurs, ou de convertisseurs) qui sont par exemple un peu plus âgés que la moyenne des internautes, un peu plus visiteurs de tel site, un peu plus intéressés par tel sujet, etc. Non seulement on se retrouve avec des milliers d’attributs descriptifs de cette population, mais ces attributs ne sont même pas discrets (au sens mathématique). Une variable est discrète lorsqu’elle prend un nombre fini de valeurs (oui/non, 1, 2, 3…). Dans notre cas, on a, pour chaque attribut, plusieurs valeurs (nombre d’individus uniques, nombre de pages, temps passé, etc.).
Du point de vue mathématique, on se retrouve donc avec un système de milliers d’équations à des centaines de milliers d’inconnues. C’est le genre de problème dont l’IA raffole…
Que cherche-t-on en résolvant ce système ?
On cherche non seulement le mouton à cinq pattes (le persona qui représente le mieux l’individu qui clique ou qui convertit), mais aussi comment le toucher via la publicité. En publicité contextuelle, cela revient à trouver les pages, les sections de sites ou les sites sur lesquels ce persona est le plus sur-représenté. La complexité du système augmente encore…
Un réseau de neurones pourrait-il résoudre ce système ?
Peut-être, à condition de l’entraîner sur d’énormes jeux de données, qui n’existent pas aujourd’hui, et seraient très longs à constituer.
J’écris “peut-être” parce qu’on n’a même pas essayé !
On n’a pas essayé parce qu’on a résolu ce système impossible d’une manière simple et élégante.
Ce jeu de données d’entrainement, on l’a. Pas au même sens qu’un réseau de neurones, mais d’une manière plus structurée, grâce au panel.
Panel is the new Artificial Intelligence
Un panel internet, c’est la donnée détaillée du comportement de 25 000 individus qui installent volontairement un logiciel de mesure. Chaque URL visitée par ces panélistes est enregistrée. Au total, cela revient à plus de 75 millions d’évènements par mois, soit plus d’un milliard d’évènements par an !
On utilise cette masse de données pour répondre à la question du ciblage publicitaire des cliqueurs, sans même avoir à résoudre l’équation du persona.
La modélisation des cliqueurs (ou des convertisseurs) créée une population sous la forme d’un sous-échantillon du panel. Chez Implcit, on appelle ça une cible.
A la différence des cibles habituelles, qui sont des combinaisons de critères explicites (femmes qui visitent Sephora et sont intéressées par l’écologie), ces cibles d’individus performants sont construites mathématiquement. Les critères de cette cible sont implicites (vous voyez l’allusion ?😉).
Le métier originel d’Implcit est le ciblage. Nous avons donc résolu ce système infernal en adaptant nos algorithmes de ciblage.
Ces algorithmes (de ciblage contextuel rappelons-le) nous apportent sur un plateau les pages, les sections de sites et les sites sur lesquels les cliqueurs (ou les acheteurs) sont le plus sur-représentés, exactement comme ces algorithmes le font sur les “femmes qui visitent Sephora et sont intéressées par l’écologie”.
Non seulement Implcit fait du machine-learning, mais nos algorithmes font même peut-être mieux que ne le ferait de l’Intelligence Artificielle.
L’Intelligence Artificielle peut faire beaucoup, mais elle ne sait rien. Elle ne sait pas faire des additions simples (2+3+5+7=14 🤪). Elle ne sait pas qu’un humain possède généralement cinq doigts à chaque main 🙃
Un panel, inversement, est constitué de vraies personnes, dont les mains ont cinq doigts et qui sont normalement capables de calculer 2+3+5+7 (quoi que, à voir l’audience de “Les Marseillais”, on peut parfois en douter). Le panel va éviter les pièges mathématiques dans lesquels l’IA peut tomber, car les vrais individus en chair, en os, et avec cinq doigts, ne tombent pas dans des pièges mathématiques.

A l’heure où la moindre start-up affiche “Intelligence Artificielle” en tête de son Business Plan, il est bon de rappeler que l’on peut faire mieux que l’IA sur certains problèmes.