Le Data Mesh n’est pas relégué au statut de mode passagère ou ringardisé par l’IA générative. Cette approche des stratégies de données guide ainsi les actions menées au sein de grands groupes. Témoignages de CDO lors du salon Big Data & AI Paris.
L’édition 2023 de la conférence Big Data & AI Paris se tenait Porte Maillot les 25 et 26 septembre. L’occasion pour l’écosystème de prendre la température en termes de tendances et de maturité sur la valorisation des données et l’intelligence artificielle.
En 2022, le Data Mesh s’imposait comme une thématique vedette. Un an plus tard, il conserve un rôle central, même si pour les décideurs il importe de se prononcer sur leurs stratégies concernant les LLMs et l’intelligence artificielle générative.
Fragmentation des investissements
En matière de maturité, Stéphane Bout, responsable du pôle de compétences Digital de McKinsey France rappelait lors d’une table ronde que 55% des organisations avaient commencé à déployer l’IA dans au moins une fonction, pouvant ainsi prétendre au niveau deux de maturité – sur une échelle de un à trois.
Cependant, moins de 5% se hissent jusqu’au 3e échelon. Plusieurs explications à cela, dont une identification des cas d’usage jugée “encore très empirique et bottom-up”. Il en résulte parfois une fragmentation des investissements en IA.
Un nombre réduit d’entreprises est parvenue à adopter une approche stratégique et fondée sur des investissements limités et ciblés. Les dépenses ne sont pas le seul indicateur de maturité. La mise en place de fondamentaux, comme l’acculturation ou la gouvernance, constitue un autre signal.
Pour Claire Mathieu, CDO de Suez, l’acculturation représente d’ailleurs un levier majeur. “L’acculturation a été un déclencheur pour engager un début de transformation”, témoignait-elle lors de Big Data & AI Paris.
Son ambition désormais est d’impliquer beaucoup plus les métiers en faisant progresser culture, usages et autonomie. Pour y parvenir, la CDO s’inspire du Data Mesh, mais en en adaptant les principes “au niveau de maturité des équipes métiers.”
Le Data Mesh au service de la démocratisation
Le Data Mesh peut ainsi être traduit, au travers des actions menées, comme un moyen de démocratiser accès et exploitation des données. Dès 2021, Yves Tyrode du groupe BPCE faisait de cette démocratisation un objectif à atteindre avec pour ligne de mire “le bénéfice pour l’utilisateur final.”
La destination est connue, mais le parcours reste encore souvent à tracer. Carrefour s’y attelle avec comme boussole cartographie et accessibilité des données. Le cœur de son dispositif et de sa stratégie Data Mesh, c’est le supermarché de la donnée, dont les produits seront à terme alimentés et consommés par 21 domaines de données.
Sébastien Rozanes, Global Chief Data & Analytics Officer du distributeur, présentait les contours de ce supermarché lors de la 2e journée du salon Big Data. En entrepôt, pour faire tourner ce magasin, Carrefour s’appuie sur une infrastructure technologique qualifiée “d’actif incroyable” : un data lake mondial (sous GCP) consolidant toutes les données en provenance de 9 data plateformes locales.
“Tout cela, ce n’est pas suffisant”, concède néanmoins le CDO. Le véritable enjeu, c’est de “rendre disponible cette donnée auprès de tous les utilisateurs métier et une expérience de self-service Data aussi simple qu’un voyage au supermarché.”
C’est à cette problématique que s’efforce donc de répondre Carrefour au travers de son implémentation du Data Mesh basée sur trois composants principaux – une analogie avec le magasin : l’assortiment (les produits Data), l’organisation et l’outil, ici un portail de données en MVP
De l’IA Générative pour naviguer dans les produits
Elodie Perthuisot, Directrice Executive E-Commerce, Data et Transformation Digitale, insistait en début d’année sur l’importance du marketing des projets, clé selon elle pour vulgariser et encourager l’appropriation par les métiers.
Le Data Store de Carrefour est aligné sur cette politique. L’objectif est d’ordre opérationnel. Il s’agit de “favoriser la réutilisation, d’éviter la prolifération des demandes et de mêmes analyses, et d’assurer ownership, et une définition unique de tous les termes métiers”, détaille Sébastien Rozanes.
Sur ce portail, l’enseigne référence et gouverne ses produits de données, leur attribue progressivement un nutriscore mesurant leur qualité. Carrefour intègre depuis deux, par itérations, de nouveaux rayons et domaines de données, et structure l’organisation associée.
Le projet est en cours depuis deux ans. A terme, l’entreprise prévoit de s’appuyer sur plus d’une centaine de data owners, ainsi que des data stewards. Sur le volet technologique, le supermarché exploite Dataplex de Google et privilégie le développement interne.
Pour simplifier l’interaction des consommateurs de données avec son store, l’Analytics Factory de Carrefour réfléchit au moyen de tirer profit de l’IA générative. La cible : une “machine qui scanne l’ensemble des tables dans BigQuery et les métadonnées”, capable de comprendre la donnée et “d’interagir de manière quasi humaine” pour recommander des produits en rayon.
Self-service BI et change pour Auchan Retail
Un autre acteur de la grande distribution poursuit une stratégie comparable avec un portail de données, baptisé Mesh, et une orientation Data Mesh. DSI et CDO d’Auchan Retail, Samir Amellal y voit un moyen de concevoir une stratégie Data adaptable et répondant à l’enjeu de démocratisation des données.
“L’étape s’annonce périlleuse et nous l’abordons avec beaucoup de précautions”, soulignait-il. Car qui dit démocratisation dit avant tout conduite du changement et transformation des métiers, comme ceux du pricing. Leur mutation passera par la consommation de données en self-service via un outil low code no code Tableau.
L’autonomisation du business vise à le faire monter en compétences, mais aussi à désengorger la direction Data centrale, dont le rôle change également pour s’orienter plus vers le pilotage de la gouvernance fédérée, la standardisation des pratiques et l’accompagnement.
Problème aussi, la donnée n’est pas documentée et la qualité, comme la confiance dans la Data, se dégradent. ManoMano prend conscience début 2021 de la nécessité de s’orienter vers “une organisation distribuée et fédérée. Sauf qu’à l’époque, nous n’étions pas prêts. Le Data Mesh, c’est bien, mais il y a des prérequis.”
Impossible alors de mettre une squad Data dans chaque train agile de la scale-up, justifie-t-il. “Nous n’avions pas de vraie gouvernance, d’équipe Data Platform… Nous sommes donc passés par une étape intermédiaire”, avec la création d’un train Data d’une quarantaine de personnes. Les prérequis ont ensuite été cochés progressivement, notamment sur le volet gouvernance.
A partir du 4e trimestre 2022, ManoMano basculait pleinement vers un mode distribué, avec entre autres du self-service (gouverné cette fois). “Chez nous, la Data est partout”, avec des squads rattachées à l’ingénierie, comme la gouvernance, des data scientist au Produit, ou encore des analystes “un peu partout” dans les fonctions.
Pour garantir la cohésion en l’absence d’un CDO, la marketplace compte sur des points réguliers (tous les 15 jours) entre ses différentes communautés, dont la communauté Data. Ces rendez-vous permettent de formaliser la roadmap et de définir les sujets transverses. “Cela ne peut pas fonctionner partout”, reconnaissait Cédric Cormon. La méthode pourrait néanmoins inspirer.