HaveAI, une plateforme d’IA générative texte et image sous contrainte pour la santé
Comme L’Oréal sur les cosmétiques, Havea Group a recours à l’IA générative pour produire du contenu, des textes et des images. Secteur de la santé oblige, des sécurité s'imposent.
Distributeur e-commerce d’équipements pour les professionnels, Manutan exploite l’IA générative pour produire des fiches produits de qualité et rapidement. Une exigence pour un acteur dont le catalogue aux 850.000 références s’étoffe mois après mois.
Quelles conséquences en cas d’erreur ou d’hallucination du modèle génératif ? Des informations inexactes et un mauvais référencement. Pour une entreprise du monde de la santé, une communication erronée pourrait avoir des impacts potentiellement plus graves.
Plus de contenus pour le digital et l’international
Havea Group (1000 salariés, 7 marques, 1800 références et 330M€ de CA) devait dès lors s’assurer de la qualité des contenus générés grâce à la GenAI. Au cours du premier semestre 2024, le fabricant de produits de santé (compléments alimentaires et soin infantile) s’est doté d’une plateforme GenAI développée avec le cabinet Ekimetrics.
La commercialisation des produits d’Havea s’effectue par le biais de professionnels de santé, des pharmaciens ou directement sur Internet. En croissance organique de 20% par an, l’acteur de la santé souhaite accélérer sa digitalisation, son internationalisation et sa médicalisation.
Sur le digital, les ventes e-commerce sont passées de 3 à 30% en trois ans grâce à ses sites marchands, ainsi que des services tiers (parapharmacies en ligne, marketplaces, Amazon…). Comme l’explique Michaël Cosentino, le directeur Stratégie & IA d’Havea Group, cette évolution nécessite “de produire du contenu à plus grande échelle.”
Plus de contenu, mais aussi du contenu adapté à différentes géographies. 40% des ventes sont effectuées à l’international. Or, chaque pays a ses spécificités. “Ce n’est pas seulement une question de traduction, mais aussi d’adaptation de toute notre approche auprès du consommateur à ces spécificités locales.”
L’axe stratégique de la médicalisation impose lui aussi de produire du contenu (texte, image & vidéo). Résultat : “nos besoins en contenus se sont démultipliés”. Mais s’y ajoute une “contrainte particulière”. Havea évolue dans le secteur régulé de la santé.
Un devoir de conformité de l’information
“Nous avons un devoir de conformité de l’information que l’on pousse à nos partenaires ou nos consommateurs, sans aucun compromis possible. Nous devons avoir 100% de véracité dans le contenu poussé.”
Avec l’IA générative, l’entreprise s’est donc fixé trois objectifs : volume, qualité et conformité. Les experts Data & IA savent par expérience que le recours aux LLM imposent des contrôles et garde-fous pour prévenir erreurs et hallucinations.
En la matière, Havea et Ekimetrics ont donc procédé à un audit fin des sources de données produit. Le design technique et fonctionnel défini a aussi été travaillé pour en garantir la robustesse. Mais plus en amont, les deux partenaires ont commencé par identifier les bons cas d’usage (“pertinents et à plus forte valeur ajoutée”).
Ce cadrage stratégique a débouché sur l’identification d’un premier cas d’usage permettant de générer textes et images pour les nouveaux produits. Le projet s’est traduit par le développement d’une plateforme de GenAI baptisée HaveAI connectée à la base de données des produits (le PIM).
D’autres sources ou bases de connaissance, dont des dossiers Sharepoint, sont aussi reliés à HaveAI. Les dossiers Sharepoint renferment diverses informations, dont des articles scientifiques et d’autres informations métiers relatives aux produits ou à des pathologies.
Etapes et processus de traitement de la donnée et de Data gouvernance
L’interaction avec des bases de données métiers “vivantes” implique des “étapes et processus de traitement de la donnée et de Data gouvernance pour s’assurer ensuite que la donnée nourrit la solution de manière efficace et pour des outputs conformes”, souligne Soline Aubry, partner chez Ekimetrics.
Le produit de GenAI est alimenté à la fois avec des données structurées et non structurées. Selon Ekimetrics, la plateforme permet ainsi de “valoriser l'ensemble des données internes au service d'une multitude de cas d'usage métier”. Havea avance néanmoins progressivement sur le déploiement des cas d’usage.
La plateforme permet, par exemple, de produire des posts complets diffusés sur les principaux réseaux sociaux et des newsletters. “Nous sommes aussi capables de générer des fiches produit avec les contraintes spécifiques du canal e-commerce utilisé.”
L’outil est aussi mis à disposition du service consommateur pour répondre aux questions qui lui sont adressées par les clients. “Certains des cas d’usage capitalisent à la fois sur la production de contenus textuels et visuels. D’autres capitalisent uniquement sur le contenu textuel. Il y a un mixte”, précise Soline Aubry.
La démo présentée par le directeur Stratégie d’Havea permet de mieux comprendre le fonctionnement de la plateforme. Pour produire un contenu, l’utilisateur marketing va donc charger des documents sources et y associer un prompt pré-rédigé.
Des prompts prédéfinis en fonction de l’usage et du canal
A chaque tâche correspond son propre prompt prêt à l’emploi. Pour un post Instagram ou la rédaction d’une fiche produit sur Amazon, le prompt définit les caractéristiques essentielles (tonalité, nombre de caractères, contraintes SEO, positionnement, benchmark avec des fiches concurrentes, etc.).
Sur les contenus visuels, les besoins étaient identiques sur la volumétrie et la qualité, estime Michaël Cosentino. Traditionnellement, les graphistes produisaient des modèles 2D des produits et travaillaient sur la base de shootings. Havea souhaitait passer à des modèles 3D (pour l’animation et le rendu).
L’entreprise a formé ses équipes à deux outils : Substance et Midjourney. Ces formations ont permis de modéliser les patrons des 1800 références existantes et de les habiller (texture). Grâce à de la modélisation 3D, les graphistes sont en capacité d’intégrer les produits dans “différentes ambiances et différents environnements, tout en tenant compte des contraintes propres à chaque canal (site interne, fiche sur une marketplace, etc.).
Presque un an après la mise en production, le cadre de Havea insiste sur l’importance du cas d’usage, qui pour en assurer l’adoption “doit capter une part suffisante du métier” de la population concernée.
“Si on ne capte que 5% de leur journée, honnêtement, l’adoption sera très très compliquée (...) C’est la raison pour laquelle nous avons élargi au maximum, et continuons de le faire, le nombre de petits cas d’usage dérivés de la plateforme textuelle notamment.”
+15% pour le taux de clic et capacité de production x5
Michaël Cosentino revient également sur la robustesse de la gouvernance de la donnée, essentielle pour “sécuriser et structurer l’accès aux données et réduire les risques liés à l'exactitude et à la fiabilité des résultats produits.”
La qualité de l’output du modèle dépend de la qualité des données en entrée et aussi de leur complétude. Le dirigeant précise d’ailleurs que l’entreprise a modifié ses processus de remplissage de sa base de données produits (PIM).
Enfin, pour faire aboutir son projet GenAI, Havea a investi dans la conduite du changement au travers du recrutement d’une personne dédiée au profil lui permettant à la fois de former, évangéliser et développer techniquement d’autres cas d’usage.
Ces efforts ont semble-t-il porté leurs fruits. Havea annonce notamment un temps de production divisé par 5 pour un contenu textuel. Le KPI est équivalent sur la production d’un asset visuel. “C’est surtout une capacité à produire cinq fois plus”, retient le directeur Stratégie.
L’entreprise revendique aussi une réduction de 20% du time-to-market pour le lancement de produits ou de gammes, ainsi enfin qu’une augmentation du CTR (taux de clic) de 15% - soit une hausse de l’engagement pour les contenus générés.
Le secret beauté GenAI du marketing L’Oréal ? Imagen 3, Gemini et Veo 2
Le lab de création de contenus beauté CREAITECH de L’Oréal a démarré la production marketing avec les modèles multimodaux Imagen 3 et Gemini de Google. Avec le modèle vidéo Veo 2, le géant des cosmétiques anime des images statiques.
Pour la conception de ses produits Tech, notamment à base d’IA, L’Oréal peut compter sur ses propres données. Pour ses algorithmes de diagnostic de peau, le groupe a ainsi exploité 150.000 images de dermatologues et d'images labellisées.
Mais L’Oréal est désormais aussi un producteur de contenus générés par l’IA. Mais en matière d’usage de l’IA générative, la multinationale entend s’inscrire dans une démarche éthique ou responsable. Elle déclare, par exemple, s’interdire le recours à des modèles virtuels.
Dynamiser l’idéation et rationaliser la production marketing
“Nous avons décidé de continuer de travailler avec des humains”, et ce malgré le montant conséquent des dépenses consacrées aux shootings (...) Ce que nous avons appris avec l’IA générative, c’est qu’il faut d’excellents jeux de données, un cadre très rigoureux et il faut surtout de l’humain”, soulignait en 2024 Béatrice Dautzenberg, Global Director of Beauty Tech Services.
Ces engagements sont-ils conciliables avec des ambitions d’industrialisation en matière de production de contenus marketing ? Depuis l’année dernière, L’Oréal dispose en effet d’un Gen AI Beauty Content Lab, CREAITECH. Objectif annoncé : “amplifier la création de contenu en interne pour ses 37 marques de beauté.”
Au sein de son laboratoire de contenus, L’Oréal collabore notamment avec Google. L’annonce a été officialisée à l’occasion du salon Cloud Next 25 de la firme californienne. Le fabricant de cosmétiques estime, grâce aux LLM, “dynamiser l’idéation” et “rationaliser la production marketing.”
Pour y parvenir, L’Oréal a dans un premier temps déployé deux modèles multimodaux de Google : Imagen 3 et Gemini. En parallèle, les équipes CREAITECH exploitent le modèle vidéo Veo 2 afin de générer des séquences animées de huit secondes à partir d’images statiques.
Dans ce domaine, et conformément à la règle rappelée en 2024 par Béatrice Dautzenberg, sont exclues les images générées de personnes à des fins publicitaires. “L’Oréal Groupe a décidé de ne pas utiliser de visages, corps, cheveux ou peau ‘ressemblants’ pour soutenir ou améliorer les bénéfices produits”, précise-t-il.
Des délais de livraison raccourcis pour créer des concepts initiaux
Le recours à l’IA générative pour le marketing présente plusieurs avantages selon L’Oréal, et cela notamment sur les phases d’idéation. Les salariés n’ont plus l’obligation de s’appuyer sur les compétences d’un expert graphiste ou du développement pour procéder à des essais.
"Maintenant, il est plus facile de donner vie à des idées, de générer de nouveaux concepts, de créer des storyboards ou de tester des visuels de produits dans différents univers — tout cela pour exprimer une vision plus claire aux équipes internes ou aux partenaires et, ainsi, gagner du temps et éviter les allers-retours", détaille Thomas Alves Machado, directeur mondial du contenu généré par l’IA pour le groupe.
L’Oréal estime également pouvoir “livrer dans des délais beaucoup plus courts par rapport aux méthodes traditionnelles de travail avec des agences” basées sur plusieurs étapes d’idéation et de révision. Résultat : le temps nécessaire pour créer des concepts initiaux passe de plusieurs semaines à plusieurs jours.
“Enfin, l’intégration de l’IA générative réduit les coûts et renforce l’efficacité des équipes, au vu du nombre d’actifs créés.” Sur ses dizaines de milliers de produits, près de 50% changent chaque année. Avec la GenAI, L’Oréal peut plus facilement “créer des itérations” et tester des variantes.
“L’intégration de l’IA dans ce processus permet à ses équipes produits d’explorer et de tester divers concepts de design de packaging plus efficacement et à moindre coût comparativement à l'impression 3D”, revendique l’entreprise.
Des éléments pré-entraînés fournis au marketing
Pour produire des contenus, les équipes marketing des marques ne partent pas nécessairement de zéro. "Nous fournissons certains éléments pré-entraînés — pour l’instant des images, mais demain cela inclura aussi des vidéos et de l’audio — basés sur les marques avec lesquelles nous travaillons”, explique Antoine Castex, architecte Data & IA.
Ces actifs existants, par exemple un produit photographié en studio en Europe, permettent là aussi de raccourcir le cycle de production.
“Nous pouvons prendre la même photo du produit et la placer sans effort dans un jardin japonais, dans une rue parisienne animée, ou dans tout autre décor pertinent, assurant ainsi que le visuel résonne avec le public local tout en restant fidèle à la marque."
Antoine Castex fait savoir que L’Oréal envisageait à l’origine “de tout développer en interne”. Elle a finalement décidé de tirer profit de technologies développées par des partenaires comme Google. En revanche, les experts IA revendiquent “une sélection rigoureuse” de ces technologies.
Cela “nécessite d’évaluer et de tester constamment les derniers modèles et outils d’IA”, mais aussi de s’assurer “que nous en avons le contrôle, et que nous sommes sécurisés” vis-à-vis des règles édictées par le groupe en matière d’utilisation de la GenAI.
Malgré cette annonce autour de sa collaboration avec Google, L’Oréal rappelle qu’il se veut “agnostique” sur l’IA générative. D’autres fournisseurs technologiques sont ainsi mobilisés au sein de son lab de création de contenus. En mai 2024, L’Oréal indiquait exploiter un moteur WPP-Nvidia et plusieurs autres LLM.
Les Actus de la GenAI : Gemini 2.5 Flash, o3 & o4 mini, Windsurf…
Chaque semaine, l’IA’Gora de l’IMA s’intéresse aux principales annonces et actualités de l’IA générative. Dans cette édition : Gemma 3 QAT, o3 et o4 Mini d’OpenAI, un kit de développement d’agent et un protocole a2a de Google.
Gemini 2.5 Flash
Google continue d’étoffer sa palette de modèles. Il a récemment ajouté à son portefeuille Gemini 2.5 Flash. La particularité de ce modèle selon le ML Engineer et Data Scientist Médéric Hurier : son système hybride de raisonnement automatique.
Quel est l’intérêt d’une telle architecture ? Pour les questions simples, Gemini s’autorise à répondre rapidement. Pour les requêtes au contraire complexes, le modèle s’alloue un budget de raisonnement afin de rechercher une réponse plus approfondie. Un paramétrage manuel est par ailleurs possible. L’approche est ainsi jugée intéressante par l’expert, pour un coût en outre compétitif vis-à-vis d’OpenAI.
Gemma-3 QAT pour quantized-aware-trained
Des modèles comme DeepSeek R1 sont reconnus pour leurs performances. On oublie toutefois la consommation de ressources liée à l’utilisation de ces derniers.
En comparaison, des modèles plus petits et spécialisés s’avèrent plus simples à déployer. C’est le cas de Gemma 3 GAT, qui pourra être exécuté avec un seul GPU. “Une bonne release” open source signée Google. Disponible au téléchargement, selon différentes configurations, il peut être entraîné pour répondre au besoin ciblé.
o3 et o4-mini d’OpenAI
Il s’agit de purs modèles de raisonnement. Assez performants, ils signent selon Medéric Hurier le retour d’OpenAI sur les modèles “state-of-the-art”, pla ce “un peu abandonnée à Google et Gemini 2.5 Pro.”
Ces déclinaisons d’OpenAI offrent un contexte plus grand, des performances accrues, des prix “raisonnables” par rapport aux standards de la startup. Certains observateurs estiment ainsi que l’IA commence ici à toucher l’AGI (intelligence artificielle générale).
Pour le Data Scientist de Decathlon Technology, les progrès accomplis dans le domaine des modèles suivent une forme de loi de Moore. A la clé, de nouvelles solutions plus performantes pour des problèmes identifiés à un prix inchangé, et ce après seulement quelques mois. “C’est assez agréable d’être dans ce paradigme.”
OpenAI lorgne sur Windsurf
La licorne américaine est en course pour s’emparer d’un concurrent de Cursor, éditeur d’environnements de développement de code. L’IDE embarque de l’IA pour faciliter la génération de code. Windsurf est positionné lui aussi sur ce segment du marché.
OpenAI se déclare donc intéressé par un rachat de l’éditeur. Mais le leader de la GenAI exprime également un intérêt pour un tout autre domaine, à savoir celui des navigateurs Web. Dans le cadre du procès antitrust de Google aux US, qui pourrait aboutir à un démantèlement, OpenAI se dit prêt à acquérir Chrome. Une initiative qui permettrait à la startup d’augmenter sa fenêtre d’exposition de ses modèles et aussi de capter toujours plus de données pour leur entraînement. Chrome serait assurément aussi un moyen de favoriser son développement sur la recherche web.
Google Cloud Next 2025
Rendez-vous des développeurs annuel, la conférence a été l’occasion pour Google de faire plusieurs annonces (229 au total). Le mot central de cette édition : les agents. Au cœur des annonces également des nouveaux modèles, notamment pour l’image et l’audio. “On couvre vraiment tous les sujets”.
Des protocoles, des extensions pour Vertex, des systèmes live, etc. Médéric Hurier retient en particulier l’annonce d’un kit de développement pour la création d’agents et d’un protocole d’échange. Ces composants participent à rendre ces technologies prêtes pour l’entreprise.
Mais que faire avec des agents ? Google a compilé sur une page une multitude de cas d’usage développés avec ses clients. Customer agent, RH agent, Data agent… plus de 600 illustrations sont résumées.
Pour faire cohabiter ces agents, Google a donc aussi conçu un protocole dédié : a2a pour agent to agent. L’ambition est ici de créer un équivalent du HTTP pour les agents IA afin de leur permettre de communiquer et collaborer de manière sécurisée.
En comparaison du protocole MCP, a2a de Google apporte une couche de sécurité, à la manière du HTTP pour le web. La réaction de MCP à l’annonce de la firme de Mountain View sera intéressante. L’avenir des deux protocoles sera-t-il la concurrence ou la complémentarité ?
Anthropic se penche sur les capacités des modèles
L’éditeur de Claude a réalisé une étude sur les capacités des modèles. Pour la mener, Anthropic a collecté de nombreuses discussions et analysé les valeurs exprimées par l’IA.
Résultat : l’IA reflète des valeurs globalement positives. Cependant, dans certains cas, l’intelligence artificielle s’écarte de ces principes.