Comment devenir une entreprise data driven ? Certainement pas en se contentant de l’infrastructure et de data scientists. Adeo (Leroy Merlin) a réintégré la Data au sein des équipes produits digitaux et Dailymotion travaille au plus près du métier. Témoignages.
« Dans une entreprise intelligente, la donnée circule à travers toute l’entreprise ». Cette citation est du PDG de L’Oréal, Jean-Paul Agon. Et pour Olivier Rafal, directeur du Consulting pour SFEIR, elle résume bien l’ambition des entreprises aujourd’hui en matière de Data. Toutefois, reste encore à implémenter la démarche pour y parvenir, c’est-à-dire installer les moyens d’une entreprise dite « data driven ».
A lire aussi : Les entreprises partagées sur les bienfaits de la protection des données
Pour l’ESN, la réussite repose notamment sur la prise en compte de messages clés. Il s’agit notamment de repenser les usages de la donnée dans une ère où tout est Data. Une grande partie des données générées demeure inexploitée et non valorisée. Le volume de données mondial atteint 74 Zo en 2021 selon Statista. Et ce chiffre doublera d’ici 2024.
La Data au service de la stratégie de l’entreprise
Les organisations ont donc tout intérêt à explorer la masse de données dont elles disposent, et donc à ne pas se cantonner à la seule BI. Mais pour le faire, elles doivent aussi apprendre des années Big Data, et des causes de l’échec de nombre de ces projets d’infrastructure.
Comment ? En particulier en réorganisant la collaboration entre l’IT et les métiers. « Ce n’est pas la Data pour elle-même. Nous sommes une entreprise de retail, pas de technologie. Tout ce que nous faisons en matière de projets Data, c’est au service de la stratégie globale de l’entreprise », souligne Laurent Ostiz, Chief Data Officer groupe d’Adeo (Leroy Merlin, Bricoman…).
« Si vous vous lancez dans un projet Data, ce n’est pas parce que vous aurez des Data Scientists que vous ferez du data driven. Ce n’est pas non plus parce que vous disposerez d’un data lake. C’est nécessaire, mais il y a aura aussi le métier, de la conformité, de la sécurité, de la résolution de problèmes concrets. C’est l’ensemble qui permettra de faire évoluer la culture de l’entreprise », poursuit-il.
La tonalité de ces messages du CDO est largement partagée par le responsable de l’ingénierie Data chez Dailymotion, Philippe Girolami. Ce dernier supervise trois équipes dédiées à la donnée (analytics, MLops et plateformes). Et les projets ne manquent pas, notamment en matière de machine learning.
« Chez nous, les modèles sont assez complexes. Nous faisons de l’analyse d’images, de l’analyse de texte assez pointue et des moteurs de recommandations. Nos data scientists sont à l’intersection de l’ingénierie logicielle et du machine learning », détaille l’expert de Dailymotion. Et le passage à l’échelle des projets repose sur les outils mis à disposition par l’équipe plateformes.
Augmenter les collaborateurs grâce à la Data
Sans être YouTube, l’entreprise gère néanmoins des volumes de données considérables, avec notamment un datawarehouse hébergeant environ 20 Po de données, mais aussi 140.000 tables. Ses chaînes de traitement gèrent par ailleurs 40.000 messages par seconde, en moyenne. L’élasticité de l’infrastructure est par conséquent critique.
Voilà pour la machinerie. L’enjeu, cependant, se situe sans doute ailleurs, c’est-à-dire dans l’identification des bons cas d’usages, ceux qui apporteront de la valeur à l’organisation. Pour Laurent Ostiz, la valorisation de la Data vise d’abord à améliorer le quotidien de l’ensemble des collaborateurs, en améliorant des usages existants, ou en en créant de nouveaux. La « démocratisation » était le point de départ de la démarche Data engagée au sein d’Adeo.
Les technologies sont donc au service des différentes catégories composant le personnel du distributeur : vendeurs en magasin, chefs de secteur, caissiers, logisticiens en entrepôts, etc. « Le meilleur moyen de les aider, c’est de remonter à la source de problèmes récurrents qu’ils peuvent rencontrer. Avec cette approche, nous ciblons des situations pour augmenter les collaborateurs grâce à la Data », résume le CDO.
Tous les autres aspects en découlent, comme la stratégie technologique, la gouvernance, la démocratisation de l’accès à l’ensemble des données au travers d’un moteur de recherche global Adeo, etc. A la clé, l’identification de cas d’usage impossibles à détecter au niveau central et générateurs de « beaucoup de valeur ».
C’est le cas par exemple en ce qui concerne la seconde réception des marchandises en entrepôt. Il s’agit du contrôle des palettes effectué après le déchargement des camions pour vérifier la conformité avec la commande. L’optimisation des règles de gestion historiques des « sondages », grâce à du machine learning, représente ainsi un gain de plusieurs millions d’euros chaque mois.
La Data, une fonction comme une autre du produit digital
Chez Dailymotion, un pure-player du Web, la Data a toujours été présente. Cependant, l’entreprise a dû changer d’approche en 2017 sous l’impulsion du directeur technologique. Le mandat : devenir data driven, avec l’ambition de développer les usages du machine learning. Un premier projet au sein de l’équipe ingénierie n’atteindra pas la phase de production cependant.
« Il faut un mandat qui vienne d’en haut pour aligner les équipes. Au sein des produits, la sensibilisation doit aussi se faire, comme au sein du business. Encore faut-il également, pour initier la démarche, décider du but à atteindre : amélioration d’un process, automatisation, progression de la marge ou du revenu… », déclare Philippe Girolami.
Charge ensuite aux ingénieurs, avec des architectes Data, d’engager le dialogue avec le produit afin d’évangéliser et éduquer sur les possibilités. Il est critique d’avoir le métier ou le produit impliqué dans cette discussion. A défaut, il sera difficile de monter en production. En outre, sans dialogue riche, le risque est fort d’optimiser le mauvais KPI ou de passer totalement à côté d’une règle métier.
Cette nécessaire proximité avec le métier, Dailymotion en prenait réellement conscience en 2018 à l’occasion d’un projet de réinternalisation du moteur de recommandations. Après plusieurs mois de développement technique, le nouveau moteur n’atteignait pas la production. L’ingénierie s’est donc rapprochée du produit pour définir les objectifs d’optimisation et les contraintes. Six semaines plus tard, la production démarrait.
C’est d’ailleurs la raison pour laquelle, chez Adeo, la Data est traitée directement au sein des équipes produit, comme pour n’importe quelle autre fonctionnalité. « La tactique aujourd’hui, c’est de considérer que tous ces sujets Data font intégralement partie des produits digitaux que nous développons. Le backlog des produits comprend des projets Data », précise Laurent Ostiz.
Pour cela, l’organisation s’appuie sur des équipes Data proches des produits, plutôt qu’une compétence centrale. Depuis la mise en place de ce modèle, basé notamment sur la méthode SRE [Site Reliability Engineer], le passage en production et l’industrialisation ont gagné en efficacité. Adeo conserve néanmoins, en central, de l’expertise pour des demandes spécifiques. Le distributeur s’efforce également de capitaliser sur la plateforme Data et de réutiliser des développements existants.