Michelin poursuit sa mue Data Mesh

L’industriel Michelin a commencé à s’intéresser au Data Mesh et à ses principes en 2019. Depuis, l’entreprise poursuit ses développements avec du self-service, de la virtualisation des données et une gouvernance fédérée. Retour sur 3 ans d’expérimentation.

Dans un billet de blog publié en mai dernier sur le blog de Michelin, le responsable de la démocratisation de la Data, Joris Nurit, partageait sa découverte du concept du Data Mesh. Celle-ci remonte à 2019 et à la réception d’un mail faisant référence à un article de Zhamak Dehghani.

Depuis, l’industriel a fait plus que s’intéresser aux principes du Data Mesh. Michelin, une data-driven company, était ainsi présente lors de la dernière édition du salon Big Data pour partager son expérience sur ce thème montant de l’univers de la Data.

Partager les données et déculpabiliser sur la gouvernance

Plusieurs facteurs ont donc motivé cet intérêt au sein de l’entreprise française, comme le souligne Joris Nurit. Ainsi, le nombre de cas d’usage Data et IA explosaient sous la demande des métiers. Sollicitant toujours plus de données et de qualité, ils témoignaient en revanche d’un travers.

“Le réflexe premier n’était pas de mettre à disposition ces données pour que d’autres les réutilisent (…) Le concept de Data Products qui exposent leurs données nous a paru porteur pour accélérer et réutiliser”, déclare le manager de Michelin. Le Data Mesh était en outre une opportunité de repenser l’approche de la gouvernance.

“Pendant des années chez Michelin, nous avons essayé d’avoir une gouvernance tirée par l’IT, d’une manière un peu culpabilisante pour le métier. L’IT s’efforçait de mettre autour de la table les différentes entités pour définir cette gouvernance et cela ne fonctionnait pas très bien”, reconnaît-il encore.

L’ambition est donc de “faire renaître une gouvernance du côté métier”. Or, c’est justement un des quatre piliers du Data Mesh au travers du concept de gouvernance fédérée. Mais pour Michelin, les fondations ont été posées par l’intermédiaire de la plateforme et de la Data Fabric.

Chez l’industriel, la plateforme est un socle indispensable permettant de faire se rencontrer producteurs et consommateurs de données. A la clé : la génération “d’un cercle vertueux de création de valeur”, précise Karim Hsini, enterprise architect data & analytics. Pour y parvenir, Michelin a dû revoir en profondeur son infrastructure.

De l’infrastructure on-prem à de véritables plateformes de données

Cinq ans auparavant, l’entreprise ne disposait pas d’une plateforme, mais “d’une solution on-prem” hébergeant un “workspace data” permettant l’implémentation de cas d’usage – essentiellement axés sur le reporting. Les utilisateurs n’avaient ainsi pas accès à la donnée, mais seulement à des rapports ou tableaux de bord.

La première tâche a consisté à “amener toutes les capacités à l’échelle pour pouvoir générer des cas d’usage self-service, mais aussi un workspace data utilisable à la fois par des utilisateurs business et IT”, indique l’architecte.

Le Data Mesh ne signifie toutefois pas nécessairement une rupture avec toute forme de centralisation. La plateforme a donc été “complétée” par un Data Lake dans le cloud. Ce choix d’environnement facilitait le scaling et la fourniture d’espaces de travail Data à la demande.

Michelin a multiplié les automatisations dans le cadre de sa plateforme afin de fournir rapidement des workspaces à ses clients internes. L’infrastructure était donc en place. Manquait encore la donnée, stockée dans des systèmes on-prem. Les données ont par conséquent été migrées sur le Data Lake.

L’étape actuelle consiste “à rendre une expérience plus unifiée et à mieux exposer nos points d’accès à la donnée à travers de la data virtualisation. C’est une technologie à laquelle nous croyons beaucoup”, réagit Karim Hsini.

Virtualisation et rationalisation des technologies Data

Michelin dispose en réalité de plusieurs plateformes Data, associées à des besoins spécifiques. Les usines bénéficient par exemple de plateformes pour leurs usages des données sur les flux de production. D’autres sont dédiées à l’IoT ou à la gestion des secrets industriels.

Dans cette configuration, la virtualisation ou “fédération” vise à “unifier non seulement l’interconnexion de nos mondes on-prem et cloud, mais aussi l’interconnexion de toutes nos plateformes.” Cette approche a en outre pour but de “rationaliser le foisonnement technologique” au sein du réseau “One Data World” et les multiples plateformes qui le composent.

La rationalisation passe aussi par les Data Products (ou Data as a Product dans le Data Mesh). En tant que produit, le dataset coche différentes cases. Il est ainsi documenté, répond à des enjeux de qualité, est accessible, etc. Parmi ces produits, Michelin propose donc des données brutes et des données raffinées (aggregated et fit for purpose data products).

“Ces sources data products sont finalement un miroir de notre système d’information. Chaque système IT expose ses données. C’est le producteur qui amène la matière brute dans notre plateforme. Cette matière brute est raffinée pour générer des aggregated data products (…) permettant de fournir des modèles prêts à consommer.”

Ces produits sont rationalisés dans le sens où ils sont réutilisés et peuvent répondre à de multiples cas d’usage, en data science ou en décisionnel par exemple. Enfin, pour gérer ces produits, Michelin a mis en place une gouvernance dite fédérée. Le préalable : “déconstruire” les pratiques en place rejetant le principe du self-service.

Data Custodian, Owners et Stewards : de nouveaux rôles

Cela représente un véritable changement d’état d’esprit pour les producteurs et owners des données. Ceux-ci doivent rendre leurs données accessibles et adapter leurs Data Products pour qu’ils soient facilement consommables par d’autres. Parallèlement à ce changement de culture, l’entreprise a été découpée en domaines de données.

Sont à présent mis en place progressivement des critères de qualité avec les data owners, ainsi qu’une mesure de l’usage des produits. Cette étape leur permet de mieux connaître leurs consommateurs et d’adapter leur roadmap. Cette nouvelle forme de gouvernance est le fruit d’un cheminement entamé auprès de l’IT.

L’IT intervient pour documenter et enrichir les données avec de la métadonnée. Dans les équipes informatiques a pour cela été créé un rôle de Data Custodian. Pour harmoniser les pratiques, les custodians sont animés au sein d’un réseau. Du côté métier, ont en parallèle été installés des Data Office, 4 au total. Les métiers disposent en outre de 30 Data Owners (des fonctions à temps plein) et de Data Stewards.

Grâce à cette organisation, l’équipe Data s’efforce d’infuser la culture Data dans les métiers. Pour mesurer les progrès, une matrice de maturité a été conçue. Très générique au débat, elle a été repensée en 2022 pour être axée sur les produits. Michelin s’est aussi équipé d’un Data Catalog (un en interne et un second en externe pour mettre à disposition des données auprès de tiers). L’outil permet de répartir rôles et responsabilités, de renseigner la métadonnée et de faire collaborer IT et gouvernance.

L’adoption et la mise en œuvre du Data Mesh se poursuivent. “Cette organisation est en mouvement et absolument pas terminée. Beaucoup d’initiatives sont en cours de déploiement. De nouvelles plateformes sont notamment en voie de création. Le travail de plateforme prend du temps”, conclut Joris Nurit.

Cookie	Durée	Description
mautic_device_id	1 year	Ce sont des cookies tiers utilisés par Mautic qui nous permettent d’utiliser le service Mautic. Nous utilisons Mautic pour soutenir nos activités de marketing. Ce cookie permet de connaître l’appareil avec lequel le visiteur accède au site. Expiration du cookie au bout d’un an.
mautic_referer_id	30 minutes	Ce sont des cookies tiers utilisés par Mautic qui nous permettent d’utiliser le service Mautic. Nous utilisons Mautic pour améliorer notre compréhension des attentes de nos lecteurs, leurs proposées des contenus et événements les plus pertinents, soutenir nos activités de marketing en suivant leur navigation sur le site, collecter de l’information sur leurs préférences et gérer les formulaires présent sur le site. Ce cookie permet de connaître l’origine du visiteur.
mtc_id	session	Ce sont des cookies tiers utilisés par Mautic qui nous permettent d’utiliser le service Mautic. Nous utilisons Mautic pour améliorer notre compréhension des attentes de nos lecteurs, leurs proposées des contenus et événements les plus pertinents, soutenir nos activités de marketing en suivant leur navigation sur le site, collecter de l’information sur leurs préférences et gérer les formulaires présent sur le site. Ce cookie donne un ID au visiteur du site web dans le but de le reconnaître. Expiration du cookie à la fin de la session
mtc_sid	session	Ce sont des cookies tiers utilisés par Mautic qui nous permettent d’utiliser le service Mautic. Nous utilisons Mautic pour améliorer notre compréhension des attentes de nos lecteurs, leurs proposées des contenus et événements les plus pertinents, soutenir nos activités de marketing en suivant leur navigation sur le site, collecter de l’information sur leurs préférences et gérer les formulaires présent sur le site. Ce cookie donne un ID à la session du visiteur du site, afin de la reconnaître. Expiration du cookie à la fin de la session

Cookie	Durée	Description
YSC	session	Ce cookie est un cookie de Youtube qui enregistre un identifiant unique pour conserver des statistiques sur les vidéos de YouTube que l'utilisateur a vues.
_first_pageview	10 minutes	Ce cookie de session est créé lors du premier affichage de page pour chaque visite. Sa finalité est de permettre de n'afficher certains éléments du code que lors du premier affichage de la page, et rendre le site ainsi plus rapide.
_gat	1 minute	Ce cookie est un cookie de Google Analytics permettant de limiter la cadence des requêtes. Il est valide pendant 24 heures après la date de la session.

Cookie	Durée	Description
IDE	1 year 24 days	Used by Google DoubleClick and stores information about how the user uses the website and any other advertisement before visiting the website. This is used to present users with ads that are relevant to them according to the user profile.
NID	6 months	This cookie is used to a profile based on user's interest and display personalized ads to the users.
VISITOR_INFO1_LIVE	5 months 27 days	This cookie is set by Youtube. Used to track the information of the embedded YouTube videos on a website.

Cookie	Durée	Description
ARRAffinitySameSite	session	No description
attribution_user_id	1 year	No description
cg_uuid	1 year	Sets a unique ID for the visitor, that allows third party advertisers to target the visitor with relevant advertisement. This pairing service is provided by third party advertisement hubs, which facilitates real-time bidding for advertisers.
cilSessionId_e6aa0e1dbf	1 day	No description
cilSessionId_efcc418067	1 day	No description
cilSessionId_ffd7baf9a1	1 day	No description
cookielawinfo-checkbox-others	1 year	No description
PagePeeker		No description
recs_17b347eba0c893c4ff49a469be629e65	past	No description
scid	past	No description
sdx	past	No description
su_sdx	past	No description
su_sid	past	No description
su_user_id	past	No description
thirdparty	1 hour	No description
ubpv	6 months 1 day	No description
ubrs		No description
ubvs	5 months 27 days	No description
ubvt	3 days	No description
UID	2 years	No description

Les rubriques

Alliancy Connect

Contenu

Michelin poursuit sa mue Data Mesh

Partager les données et déculpabiliser sur la gouvernance

De l’infrastructure on-prem à de véritables plateformes de données

Virtualisation et rationalisation des technologies Data

Data Custodian, Owners et Stewards : de nouveaux rôles

Suggestion de contenus