L’industriel Michelin a commencé à s’intéresser au Data Mesh et à ses principes en 2019. Depuis, l’entreprise poursuit ses développements avec du self-service, de la virtualisation des données et une gouvernance fédérée. Retour sur 3 ans d’expérimentation.
A lire aussi : Le Data Mesh nouvelle potion magique du chief data officer ?
Depuis, l’industriel a fait plus que s’intéresser aux principes du Data Mesh. Michelin, une data-driven company, était ainsi présente lors de la dernière édition du salon Big Data pour partager son expérience sur ce thème montant de l’univers de la Data.
Partager les données et déculpabiliser sur la gouvernance
Plusieurs facteurs ont donc motivé cet intérêt au sein de l’entreprise française, comme le souligne Joris Nurit. Ainsi, le nombre de cas d’usage Data et IA explosaient sous la demande des métiers. Sollicitant toujours plus de données et de qualité, ils témoignaient en revanche d’un travers.
“Le réflexe premier n’était pas de mettre à disposition ces données pour que d’autres les réutilisent (…) Le concept de Data Products qui exposent leurs données nous a paru porteur pour accélérer et réutiliser”, déclare le manager de Michelin. Le Data Mesh était en outre une opportunité de repenser l’approche de la gouvernance.
“Pendant des années chez Michelin, nous avons essayé d’avoir une gouvernance tirée par l’IT, d’une manière un peu culpabilisante pour le métier. L’IT s’efforçait de mettre autour de la table les différentes entités pour définir cette gouvernance et cela ne fonctionnait pas très bien”, reconnaît-il encore.
L’ambition est donc de “faire renaître une gouvernance du côté métier”. Or, c’est justement un des quatre piliers du Data Mesh au travers du concept de gouvernance fédérée. Mais pour Michelin, les fondations ont été posées par l’intermédiaire de la plateforme et de la Data Fabric.
Chez l’industriel, la plateforme est un socle indispensable permettant de faire se rencontrer producteurs et consommateurs de données. A la clé : la génération “d’un cercle vertueux de création de valeur”, précise Karim Hsini, enterprise architect data & analytics. Pour y parvenir, Michelin a dû revoir en profondeur son infrastructure.
De l’infrastructure on-prem à de véritables plateformes de données
Cinq ans auparavant, l’entreprise ne disposait pas d’une plateforme, mais “d’une solution on-prem” hébergeant un “workspace data” permettant l’implémentation de cas d’usage – essentiellement axés sur le reporting. Les utilisateurs n’avaient ainsi pas accès à la donnée, mais seulement à des rapports ou tableaux de bord.
La première tâche a consisté à “amener toutes les capacités à l’échelle pour pouvoir générer des cas d’usage self-service, mais aussi un workspace data utilisable à la fois par des utilisateurs business et IT”, indique l’architecte.
Le Data Mesh ne signifie toutefois pas nécessairement une rupture avec toute forme de centralisation. La plateforme a donc été “complétée” par un Data Lake dans le cloud. Ce choix d’environnement facilitait le scaling et la fourniture d’espaces de travail Data à la demande.
Michelin a multiplié les automatisations dans le cadre de sa plateforme afin de fournir rapidement des workspaces à ses clients internes. L’infrastructure était donc en place. Manquait encore la donnée, stockée dans des systèmes on-prem. Les données ont par conséquent été migrées sur le Data Lake.
L’étape actuelle consiste “à rendre une expérience plus unifiée et à mieux exposer nos points d’accès à la donnée à travers de la data virtualisation. C’est une technologie à laquelle nous croyons beaucoup”, réagit Karim Hsini.
Virtualisation et rationalisation des technologies Data
Michelin dispose en réalité de plusieurs plateformes Data, associées à des besoins spécifiques. Les usines bénéficient par exemple de plateformes pour leurs usages des données sur les flux de production. D’autres sont dédiées à l’IoT ou à la gestion des secrets industriels.
Dans cette configuration, la virtualisation ou “fédération” vise à “unifier non seulement l’interconnexion de nos mondes on-prem et cloud, mais aussi l’interconnexion de toutes nos plateformes.” Cette approche a en outre pour but de “rationaliser le foisonnement technologique” au sein du réseau “One Data World” et les multiples plateformes qui le composent.
La rationalisation passe aussi par les Data Products (ou Data as a Product dans le Data Mesh). En tant que produit, le dataset coche différentes cases. Il est ainsi documenté, répond à des enjeux de qualité, est accessible, etc. Parmi ces produits, Michelin propose donc des données brutes et des données raffinées (aggregated et fit for purpose data products).
“Ces sources data products sont finalement un miroir de notre système d’information. Chaque système IT expose ses données. C’est le producteur qui amène la matière brute dans notre plateforme. Cette matière brute est raffinée pour générer des aggregated data products (…) permettant de fournir des modèles prêts à consommer.”
Ces produits sont rationalisés dans le sens où ils sont réutilisés et peuvent répondre à de multiples cas d’usage, en data science ou en décisionnel par exemple. Enfin, pour gérer ces produits, Michelin a mis en place une gouvernance dite fédérée. Le préalable : “déconstruire” les pratiques en place rejetant le principe du self-service.
Data Custodian, Owners et Stewards : de nouveaux rôles
Cela représente un véritable changement d’état d’esprit pour les producteurs et owners des données. Ceux-ci doivent rendre leurs données accessibles et adapter leurs Data Products pour qu’ils soient facilement consommables par d’autres. Parallèlement à ce changement de culture, l’entreprise a été découpée en domaines de données.
Sont à présent mis en place progressivement des critères de qualité avec les data owners, ainsi qu’une mesure de l’usage des produits. Cette étape leur permet de mieux connaître leurs consommateurs et d’adapter leur roadmap. Cette nouvelle forme de gouvernance est le fruit d’un cheminement entamé auprès de l’IT.
L’IT intervient pour documenter et enrichir les données avec de la métadonnée. Dans les équipes informatiques a pour cela été créé un rôle de Data Custodian. Pour harmoniser les pratiques, les custodians sont animés au sein d’un réseau. Du côté métier, ont en parallèle été installés des Data Office, 4 au total. Les métiers disposent en outre de 30 Data Owners (des fonctions à temps plein) et de Data Stewards.
Grâce à cette organisation, l’équipe Data s’efforce d’infuser la culture Data dans les métiers. Pour mesurer les progrès, une matrice de maturité a été conçue. Très générique au débat, elle a été repensée en 2022 pour être axée sur les produits. Michelin s’est aussi équipé d’un Data Catalog (un en interne et un second en externe pour mettre à disposition des données auprès de tiers). L’outil permet de répartir rôles et responsabilités, de renseigner la métadonnée et de faire collaborer IT et gouvernance.
L’adoption et la mise en œuvre du Data Mesh se poursuivent. “Cette organisation est en mouvement et absolument pas terminée. Beaucoup d’initiatives sont en cours de déploiement. De nouvelles plateformes sont notamment en voie de création. Le travail de plateforme prend du temps”, conclut Joris Nurit.