Etam et TotalEnergies : la qualité de donnée drivée par les Data Products et le pragmatisme
Pas de grand soir de la Data Quality. Le sujet, souvent mal compris des métiers, est traité avec les Data Products et solutions d’IA. Témoignages du Groupe Etam et de TotalEnergies.
Pas de Data, pas de chocolat, a coutume de dire Chafika Chettaoui, CDO d’Axa, pour insister sur les prérequis à tout projet d’IA. Ces prérequis sont notamment adressés par la Digital Factory de TotalEnergies au travers de la datability - qui englobe notamment la Data Quality.
“La databilité est une dimension indispensable du framework Data 360. Elle nous permet de nous assurer que, du point de vue des données, le produit peut être abordé de la meilleure façon, en abordant les sources, la typologie, la qualité, la gouvernance et l'accessibilité, la durabilité des données et les questions relatives aux conditions juridiques et éthiques”, détaille Florian Bergamasco, Data Science & AI Operations Lead.
La Data Quality, une affaire d’organisation ?
La databilité est gérée au niveau de la factory. Mais au sein d’organisations fédérées ou décentralisées, la qualité des données est aussi prise en compte au niveau des domaines de données et donc des métiers. Elle implique différents rôles, dont ceux de Data Steward et de Data Owner. C’est cette approche de type décentralisation gouvernée qui a été initiée chez TotalEnergies 5 ans auparavant.
La compagnie est structurée en branches, puis en domaines. Parmi les branches, celle du Marketing & Services. Ses actions sur la Data sont supervisées par un Branch Data Officer : Philippe Landreau. Et son périmètre est vaste. La branche commerciale est présente sur tous les continents et regroupe environ 25.000 collaborateurs.
Ses métiers sont multiples : vente de produits (carburants, lubrifiants, recharge électrique…), gestion de 14.000 stations et 60.000 bornes électriques, transport et logistique, équipements industriels. Ces activités se traduisent par différentes typologies de données (clients, points de vente, références articles…).
A l’image d’autres entreprises, TotalEnergies a démarré par un modèle plus centralisé. “Assez rapidement, on s’est aperçu qu’il fallait ajouter un certain nombre d’étages à ce dispositif pour rendre les choses véritablement opérationnelles”, explique Philippe Landreau. Le premier étage : la nomination de Data Officer dans les branches. C’était donc il y a 5 ans.
“Nous avions besoin de booster la démarche Data dans les différentes entités”. Mais le modèle restait centralisé, malgré un premier niveau de décentralisation. “Si on veut apporter de la valeur, cette valeur doit être au plus proche des activités et des personnes responsabilisées sur la valeur des données produites”, justifie le Data Officer.
Etam en route vers les Data Owners et Data Champions métiers
Depuis deux ans, la fédération s’effectue donc à deux niveaux avec des branches complétées par des Data Domaines. Charge à ses domaines de gérer leur gouvernance et leurs Data Products - dans un cadre défini par les Data Offices. Ces règles centrales sont traduites en actions opérationnelles, notamment sur la Data Quality.
Le modèle fédéré n’est cependant pas le seul possible, y compris pour traiter les problématiques de qualité des données. Acteur du retail, le groupe Etam (Undiz, Maison 123, Ysé…) s’appuie sur une organisation centralisée avec un Data Office (créé deux ans plus tôt) rattaché à la DSI. Au sein du Data Office, différentes fonctions, dont la Data Gouvernance, pilotée par Camille Maire.
L’entreprise traite différentes typologies de données, dont une grande partie relève du transactionnel, mais aussi des référentiels (clients, produits, fournisseurs, 1500 magasins…). Combinés, transactionnel et référentiels permettent des usages “top line” (“pour l’accroissement du chiffre d’affaires” via la recommandation produit, la fidélisation, etc.).
Les usages sont aussi axés “bottom line”, notamment pour la réduction des coûts via l’optimisation des stocks. Le Data Office embarque des compétences en BI, Data Science, architecture et gouvernance. “Pour amorcer la fédération de la donnée, nous avons recruté des Data Analystes au niveau de chacune des marques”, déclare Camille Maire.
“Pour accélérer cette fédération, nous mettons en place avec les RH des rôles de Data Owners et de Data Champions (...) Toute l’entreprise a été fractionnée en domaines Data et nous nous efforçons d’établir les Owners dans chacun d’entre eux”, poursuit-il.
La Data Quality rattachée à un besoin métier pour convaincre
La décentralisation gouvernée, une transition désormais incontournable ? Laetitia Cancelli, responsable du pôle Data Management au Data Center Of Excellence de Sopra Steria, nuance. “La bonne organisation, c’est celle qui correspond à l’entreprise.” Sur le marché, la tendance est à un Data Office avec un CDO fédérateur définissant “bonnes pratiques et process, les rôles et les responsabilités.”
“L’idéal, c’est évidemment d’avoir des domaines de données ou en tout cas des filières métiers avec des relais et des utilisateurs finaux qui ont pris à cœur ce sujet de la Data pour la valoriser au sein de leurs domaines.” C’est cette trajectoire que recommande l’ESN, estimant que ce modèle génère de meilleurs résultats qu’une organisation totalement centralisée ou à l’inverse éclatée.
“Mais attention, cela doit coller avec l’organisation en place et la stratégie”, prévient-elle. En outre, la fédération requiert un fort accompagnement en interne. “Ce qu’on a en premier lieu, ce sont des utilisateurs et des métiers pour qui aucun temps n’est disponible pour travailler sur la donnée.” Et cela vaut d’ailleurs pour la qualité des données.
Camille Maire le constate, le sujet est encore souvent renvoyé à l’IT. Impliquer les métiers sur la qualité reste complexe chez Etam. Certes, la DSI a un rôle à jouer au niveau de l’architecture et de la gestion de sa dette technique. Mais, elle ne peut être le seul maillon. “Les process métiers ont tout à voir dans la qualité de la donnée”, souligne le Head of Data Gouv du retailer.
Pour inverser la tendance, Camille Maire s’efforce de “mettre en responsabilité” les métiers. Sensibilisation et acculturation sont nécessaires. Mais ces actions sont encore plus efficaces lorsqu’elles sont rattachées directement à des projets. La résolution d’un problème de cohérence au niveau des prix (lancement et promotion) a ainsi été le fruit d’efforts conjoints IT et métiers.
Des rôles et responsabilités clairement définis chez TotalEnergies
L’expert le confirme, il est critique “de partir de leurs besoins” et de traduire en langage métier les impacts d’une mauvaise qualité de donnée. Du concret donc. Chez TotalEnergies, les responsabilités sont clairement formalisées et distribuées.
Acteur “fondamental”, le Domain Data Owner “fixe les règles sur son périmètre de données” et “la direction à suivre” sur la qualité. Les règles sont traduites dans les différents SI du cycle de vie de la donnée. Plus opérationnels, les Data Stewards sont “en charge au day to day d’assurer que les règles sont bien appliquées.”
En relation avec les équipes techniques, des contrôles sont ensuite implémentés dans le cycle de vie de la donnée pour automatiser la supervision et la mesure. La qualité n’est cependant pas une fin en soi. Philippe Landreau insiste ainsi sur la qualité comme impératif au développement de Data Products.
“Vous voulez exposer des données ? Très bien, mais exposons des données de qualité pour qu’elles puissent servir à tous. C’est sur cet argument que nous jouons.”
Pour distribuer ces responsabilités nouvelles au sein de l’organisation, tout n’est pas nécessairement à inventer. Le Branch Data Officer signale ainsi que l’entreprise a su tirer profit d’un existant organisationnel structuré autour des processus. Il est en effet possible de capitaliser sur des rôles de process owners ou business process owners.
L’usage véritable driver de la qualité des données
“Ces personnes ont souvent un rôle assez naturel à jouer dans des fonctions de Data Owner ou de Data Steward centralisés”, observe Philippe Landreau. Mais ces rôles sont à adosser à des enjeux métiers, auxquels peuvent répondre des produits IA ou Data.
“C’est très compliqué de travailler sur un plan d’action sur la qualité de données sans être face à un problème ou une question du métier. Par ailleurs, la qualité ne veut rien dire dans l’absolu. Elle dépend des usages.”
“L’usage doit véritablement driver le sujet de la qualité. On le constate. Nos principales avancées sont liées à la mise en place de cas d’usage qui ont nécessité de mettre auparavant un coup de collier sur la qualité”, analyse le Data Officer de TotalEnergies.
Ce constat est partagé par Laetitia Cancelli. “Nous n’avons pas ou très très rarement des clients qui viennent nous voir avec des programmes de Data Quality visant à révolutionner l’entreprise”, plaisante-elle. Non, ce sont les cas d’utilisation qui “drivent” les initiatives en matière de qualité. Mais le “bottom up” ne suffit pas cependant, met-elle en garde.
“Il faut fédérer les cas d’usage, trouver les bons sponsors, identifier dans quel projet les inclure… et souvent on tourne en rond”. Pour y remédier, Sopra Steria base son framework sur des actions botton-up, mais aussi top-down.
“Mais ce n’est pas du one shot. La qualité s’inscrit dans une boucle d’amélioration continue” faisant intervenir des plans de remédiation, un processus de Data Quality et “des équipes pour le porter, sinon ça ne fonctionne pas.”
ROI de la Data Quality ? Choisir ses batailles
Laetitia Cancelli appelle elle aussi au pragmatisme sur la qualité. Et ce pragmatisme consiste notamment à bien choisir ses batailles. Toutes les données n’ont pas vocation à être remises en qualité. “On peut faire des no go sur la qualité de données. Si le coût de la remise en qualité est supérieur au gain, il est acceptable de ne pas traiter le sujet dans l’immédiat.”
Priorité aux domaines présentant le plus de complexité et de points de douleur. C’est l’axe suivi d’ailleurs par Camille Maire chez Etam, dans un secteur du retail très “revenue oriented. Il faut démontrer la valeur de tout projet.” Gains de productivité ou de chiffre d’affaires sont des déclencheurs évidents sur le marché.
Calculer le ROI de la qualité de donnée reste compliqué, note toutefois l’expert. Et le coût de la non qualité ? “Cela parle encore moins au top level”, répond Camille Maire. Pour embarquer et avancer sur les référentiels de données (MDM), il ne néglige pas en effet le top-down et un sponsoring fort. Il s’agit “d’aligner les process métiers et l’architecture pour pouvoir dégager les gains attendus.”
Le Head of Data Gouv parie également sur un rapprochement entre métiers et IT. Cette ambition peut être réalisée au travers de la création d’une communauté interne de Data Champions - “qui commence à émerger chez Etam”. Il convient d’acculturer le métier certes, mais aussi l’IT pour favoriser une meilleure prise en compte des besoins métiers.
Pour rapprocher et composer des équipes mixtes (y compris via la méthodologie SAFe dans les projets), Camille Maire souhaite également mettre en place la Fresque de la Data Quality. Enfin, il encourage à capitaliser sur les success stories du Data Office, construites avec/pour les métiers.
Former le management intermédiaire pour favoriser le change
Des leviers sont mobilisables, à différents échelons donc. Et même si la Data Quality est souvent pilotée par des actions correctives ou en réaction, adopter en parallèle des mesures proactives reste possible. Pour Philippe Landreau, la valorisation des données et sa dimension Quality relèvent in fine de la conduite du changement.
Dans cette perspective, TotalEnergies mène une “grande campagne de formation” auprès du management intermédiaire et des praticiens de la Data. “Les managers intermédiaires n’ont pas forcément en tête la problématique de la qualité”.
La formation au Data Management vise donc à les sensibiliser afin qu’ils saisissent mieux les enjeux attachés aux données manipulées par leurs équipes. La sensibilisation doit aussi pouvoir se traduire par l’allocation de moyens.
“Nous essayons de semer la petite graine pour que le management intermédiaire donne les moyens nécessaires et comprennent lorsque leurs équipes parlent de Data Quality”, explique le Branch Data Officer.
En formant les praticiens, il s’agit cette fois de partager les bonnes pratiques de la gestion de la qualité, mais aussi de réfréner la tentation d’une quête de la qualité absolue. Une telle trajectoire est préjudiciable, prévient Philippe Landreau. La qualité à tout prix est ainsi présentée comme la plus sûre manière d’échouer à dégager un ROI.