Le concept de Data Mesh interpelle les experts de la Data dans les entreprises, et en particulier les CDO. Reposant sur 4 grands piliers, le Data Mesh pourrait les aider à franchir un nouveau cap de maturité et d’industrialisation.
Data Warehouse, Data lake, Data Product, Data Scientist… l’univers du management de données regorge d’acronymes, de technologies, de métiers ou encore de nouvelles approches ou concepts. Le Data Mesh en est un. Les sociétés de services et les cabinets spécialisés en Data & IA s’y intéressent de très près.
Ce ne sont pas les seuls. Les chief data officers ou leur équivalent dans les organisations expriment également un intérêt croissant à l’égard de ce sujet montant. Pourquoi ? Notamment en raison de la rupture qu’il porte.
A lire aussi : Leboncoin : récit d’une transition vers le Data Mesh
De la centralisation des données à la fédération
Le Data Mesh repose sur la décentralisation et la fédération. Or, jusqu’à aujourd’hui, et malgré des velléités contraires, le traitement de la donnée demeure très centralisé, aussi bien au niveau de la gouvernance, des compétences que des architectures. Cette rupture, nous la devons à une consultante, et désormais CEO, mondialement connue : Zhamak Dehghani.
Elle est l’auteure de l’ouvrage “Data Mesh: Delivering Data-Driven Value at Scale” et donc la créatrice du concept associé. Mais qu’est-ce que le Data Mesh et pourquoi un tel intérêt des décideurs Data (ainsi que des offreurs) pour ce sujet ? Emily Sergent, ingénieure pour Denodo, le définit comme un “concept architectural et organisationnel”.
“Plutôt que de s’appuyer sur une infrastructure de données monolithique centralisée gérée par une équipe IT en central, le Data Mesh fait intervenir des domaines de données. Ceux-ci travaillent de manière indépendante à la production de produits de données. Les domaines disposent véritablement de la connaissance métier pour ajouter de la valeur aux données des entreprises”, détaille-t-elle.
Mais pourquoi revenir sur la centralisation ? Car elle n’est pas sans inconvénients. Ainsi, juge la représentante de l’éditeur, cette organisation revient à donner le pouvoir de décision à des équipes sans nécessairement une connaissance approfondie de la donnée. Compréhension du besoin, mise à disposition des données et création de valeur pourraient, par exemple, ne pas être optimisées par rapport aux attentes terrain et des consommateurs de la Data.
Emily Sergent relève deux autres limites, en ce qui concerne “la vitesse” cette fois. Les plateformes de données centralisées ne favoriseraient pas la fraîcheur des données. La centralisation déboucherait aussi sur des retards dans la prise en compte des besoins. Le Data Office ou la DSI, selon l’entreprise, devient dès lors un goulet d’étranglement pour ces projets.
Domaine, produit, infrastructure et gouvernance : 4 piliers
“Les domaines comprendront réellement leurs données dans les systèmes opérationnels sources, mais aussi les transformations nécessaires pour les mettre à disposition de l’analytique. C’est donc l’opportunité de faire des itérations courtes, de réaliser des changements rapidement et d’être sûr de la qualité”, promeut Emily Sergent.
Les domaines, qui peuvent être calqués sur les principales fonctions de l’entreprise, ne constituent toutefois que l’un des quatres piliers principaux et interdépendants définis par Zhamak Dehghan.
- Data Domains. Par son découpage en domaines, le Data Mesh conduit à une redéfinition des rôles entre IT, Data Office et métiers. A ce titre, il implique largement les métiers dans la gestion de l’actif données.
- Data as a product. La donnée est un produit à part entière. La conception, la mise à disposition et l’évolution du produit sont gérées par les domaines. Un produit respecte des caractéristiques fondamentales (découvrable, adressable, documenté, fiable, interopérable et sécurisé).
- Self-service data infrastructure as a platform. Le Data Mesh est agnostique sur le plan technologique. Et même s’il prône la décentralisation, il s’appuie sur une plateforme commune, rationalisée et standardisée. Cette mutualisation se fait au bénéfice des domaines qui peuvent consommer des ressources à la demande.
- Federated data governance. La gouvernance des données est prise en charge de manière fédérée et les domaines sont des acteurs clés, par exemple pour la documentation et la gestion de la qualité.
Pour Denodo, le Data Mesh présente des avantages dans différents contextes, dont un manque d’expertise métier ou de flexibilité des référentiels centralisés. Cette approche vise aussi à remédier à la lenteur des infrastructures dans la fourniture des données.
Compte tenu de son cœur de business, l’éditeur promeut les bénéfices permis par la combinaison du Data Mesh et de la virtualisation logique des données. Le concept sous-jacent demeure bien néanmoins agnostique du point de vue des technologies, même si virtualisation et cloud peuvent contribuer à faciliter sa mise en œuvre.
Le Data Mesh : un “buzzword” à clarifier
Mais attention à ne pas céder aux sirènes marketing des offreurs de solutions qui commencent d’ores et déjà à s’emparer du thème du Data Mesh. Pour Christophe Heng, Leader Data pour Onepoint, la thématique est devenue un “buzzword”, qui plus est “mal comprise”.
Face à cette incompréhension, les organisations sont donc en quête d’informations précises sur la nature du Data Mesh et la manière de l’implémenter. De plus, il “s’agit d’un paradigme qui relie les approches en Data” et s’inscrit dans “l’ère de la démocratisation” des données. Le Data Mesh recoupe en outre plusieurs des ambitions du Data Office et du CDO.
“Le rêve du Data Office est de faire dialoguer la technique et le métier. A mon sens, le Data Mesh est un outil formidable pour tous ces nouveaux CDO désireux de voir la donnée trouver une véritable place dans leur entreprise”, considère Christophe Heng.
Néanmoins, le Data Mesh n’est pas livré avec un guide d’installation. L’expert de Onepoint en souligne avant tout le “bon sens”. Il insiste aussi sur une application pragmatique des grands principes afin d’améliorer pratiques et niveau de maturité Data des organisations.
Mais le Data Mesh n’est pas pour tous. La société de conseil procède en amont à une étude d’éligibilité ou “Data Mesh Readiness”. De plus, un obstacle en particulier contribue à freiner son adoption selon Christophe Heng : le domain design. “Les entreprises ont tendance à vouloir calquer leurs domaines sur des organisations métiers ou hiérarchiques plutôt que de construire des domaines Data.”
Pas un scénario Data Mesh, mais une multiplicité
C’est un premier frein à surmonter. Cependant, le Leader Data estime possible de progresser sur d’autres piliers, dont les produits et l’infrastructure, sans néanmoins adhérer à une organisation fédérée. “Il faut rester pragmatique dans l’approche. Il est possible d’approfondir des pans du Data Mesh en fonction de ses besoins et de sa maturité. N’oublions pas qu’il s’agit d’un paradigme.”
Néanmoins, la passage au Data Mesh comporte au moins deux prérequis : une organisation orientée domaines donc et une IT/Data au cœur du business. Ce chantier peut être amorcé de différentes manières par ailleurs : une volonté de maîtrise et de partage des données, la modernisation de plateforme, la gouvernance fédérée…
Le Data Mesh, c’est également une importante conduite du changement à mener de façon transverse. Par conséquent, un sponsoring au plus haut niveau de l’organisation sera indispensable. La présence du CDO au Comex peut aider à susciter l’adhésion et le sponsorship.
Mais les domaines devront eux aussi être convaincus des bienfaits de cette approche et de la nécessité pour eux d’investir. Comment ? Grâce à une démonstration chiffrée de la valeur générée. CDO et DSI le savent, ce chiffrage est complexe. La dernière préconisation de Christophe Heng : “ne surtout pas prendre le Data Mesh comme une référence absolue” ni figée.