Dans un secteur de la grande distribution sous pression, Auchan a développé avec Ekimetrics des modèles d’intelligence artificielle. L’objectif : maximiser le CA de ses magasins en définissant l’allocation optimale de la superficie.
Au premier trimestre 2022, le chiffre d’affaires de la grande distribution en France reculait de 3,1%. Au niveau semestriel, le bilan est plus favorable. Cependant, il s’explique en grande partie par l’inflation. La hausse des prix a néanmoins des effets négatifs plus directs, comme la baisse des marges.
Contexte économique et pression concurrentielle impactent directement les distributeurs, qui parallèlement consacrent des budgets conséquents à leur transformation digitale. Ces efforts génèrent massivement de nouvelles données. Celles-ci ne sont toutefois que partiellement valorisées, constate Piotr Woznica, senior manager data science pour Ekimetrics.
A lire aussi : Carrefour Links valorise un asset Data “unique en Europe”
Maximiser la performance des magasins Auchan en France
Un meilleur usage des données permettrait cependant aux retailers de dégager de nouvelles sources de revenus, par exemple dans le secteur du retail media, comme l’illustre Carrefour avec Carrefour Links. Auchan Retail France s’efforce lui aussi de mieux valoriser son patrimoine de données.
Le distributeur en témoignait aux côtés de son partenaire Ekimetrics à l’occasion du salon Big Data Paris 2022. Auchan, comme ses concurrents, vise une maximisation de la performance de ses supermarchés et hypermarchés en France.
L’enseigne détient 350 magasins au total, comptant en moyenne une quarantaine de rayons. Leur taille est hétérogène et s’échelonne entre 600 et 17.000 m2. Auchan a lancé un projet visant à optimiser le chiffre d’affaires de chacun de ses points de vente en s’appuyant sur la Data Science.
Les leviers d’optimisation ne peuvent s’appliquer uniformément sur l’ensemble du parc. Les actions doivent être déterminées à l’échelle de chaque magasin et de ses rayons. “Entre un petit supermarché ou un grand hyper, on devine que la répartition optimale des surfaces des différents rayons ne sera pas la même”, résume Piotr Woznica.
D’autres paramètres entrent en compte, comme la distance entre le magasin et ses concurrents, ainsi que leur type d’activité (spécialistes ou généralistes). Les populations de la zone de chalandise influent également sur les optimisations à appliquer. En fonction de ces différents paramètres, “le magasin idéal ne sera pas le même.”
Définir le magasin idéal en termes de CA généré
Afin de déterminer cet idéal, de nombreuses données, internes comme externes, sont nécessaires, tout comme le recours à des algorithmes. Cependant, “ce n’est pas la complexité de l’algorithme qui est clé, mais la sélection des données à utiliser et la manière de les présenter aux algorithmes”, souligne l’expert en Data Science.
Dans ce cadre, Auchan et Ekimetrics ont conçu une solution basée sur une approche prédictive du chiffre d’affaires pour optimiser à l’échelle. Le projet a été mené en deux étapes principales. La première a consisté à modéliser le CA pour le prédire en utilisant en entrée des domaines de données multiples, dont les surfaces des rayons.
“Une fois cette fonction de prédiction robuste, on passe à une 2e étape qui va optimiser cette fonction avec pour objectif de déterminer la meilleure allocation des mètres carrés aux différents rayons pour maximiser le CA”, détaille Matthieu Guiet, data analyst pour Auchan Retail France.
Ces développements permettent de disposer de recommandations relatives à l’aménagement des magasins, soit la superficie à ajouter ou retirer au niveau de chacun des rayons.
Pour parvenir à des résultats satisfaisants (“fiables et pérennes”), des facteurs sont déterminants, préviennent les deux acteurs du projet baptisé Caméléon – un nom attribué par le métier car sa mission consiste à “trouver la meilleure solution tout en s’adaptant le plus possible à son environnement.”
L’étape clé du feature engineering
Le premier facteur clé de succès est ainsi la capacité à identifier et collecter les données pertinentes. Au total, ce sont 3 To de données (ou 20 milliards de lignes) qui ont été exploités pour entraîner les modèles. Le second levier stratégique est le feature engineering.
“Dans un projet avec un tel spectre de données, il est critique de pouvoir équilibrer les informations sous-représentées et celles sur-représentées comme les statistiques des populations de la zone de chalandise”, retient Piotr Woznica.
Était ainsi sous-représenté dans les données le lien entre les rayons d’un magasin. L’approche a donc consisté à mettre le client au centre. Et il ne s’agit pas là d’une formule marketing.
“Nous avons analysé son parcours, son comportement d’achat, sa relation avec les produits et les rayons. Nous en avons déduit des variables qui représentent les liens entre les rayons. Elles se sont avérées très importantes puisque ces variables amélioraient drastiquement la prédiction.”
Les données sur-représentées ont elles aussi permis d’extraire des variables pertinentes. Cependant, elles ne permettaient pas d’envoyer un signal jugé suffisamment clair à l’algorithme. Les équipes Data Science ont donc eu recours à une “réduction dimensionnelle bien choisie” pour gagner en pertinence et en efficacité.
Une interface utilisateur pensée pour le métier
Enfin, troisième facteur clé de succès : l’interface utilisateur à destination de la direction des concepts (sponsor de Caméléon) et des directeurs de magasins. Indispensable à l’adoption, elle participe aussi à l’acculturation Data. Les données de prédiction sont restituées dans une interface permettant aux utilisateurs métiers de définir aisément des paramètres.
Les recommandations sont ainsi utilisables pour le remodeling des magasins, ou pour augmenter ou diminuer les surfaces. “L’utilisateur peut faire varier l’existant ou définir des m2, ajouter des rayons pas encore présents. Le paramétrage permet ensuite d’obtenir une simulation de la taille des rayons idéale du magasin en maximisant le CA.”, précise Matthieu Guiet.
L’équipe Data estime, en simulation, qu’une variation de la taille des rayons de plus ou moins 20% permettrait une hausse moyenne du CA brut de 4,8 points. Un A/B testing devrait en principe confirmer ces prédictions, même si la direction Data se déclare très confiante sur les résultats.
Cependant, une telle démarche est complexe et coûteuse à mener à l’échelle d’un hypermarché. Des tests sont en revanche en cours sur des parties de supermarchés. “Il faut voir l’outil comme un GPS. Il aide les directeurs de magasins et les équipes concepts dans leur prise de décision. Ce n’est pas une voiture autonome. Et ce n’est pas son objectif”, signale le data analyst.
Montée en compétence et autonomie d’Auchan
En matière de conduite de projet et de gouvernance, Auchan a organisé de multiples ateliers avec directeurs de magasins et de territoires, mais aussi des représentants de la direction produit. Le pilotage s’appuyait en outre sur “le triangle de l’efficacité” de l’entreprise, composé des directions de la Data, des concepts et de la performance.
Sur le plan de la gouvernance, le retailer souhaitait par ailleurs disposer d’une solution exploitable en interne, par ses propres équipes et sur son infrastructure cloud GCP. Grâce à du transfert de compétences, Auchan est désormais autonome sur la maintenance et l’évolution de Caméléon
Le socle Data, qui constitue les fondations du projet, représente en outre désormais des “assets Data” mutualisables pour le distributeur. Ceux-ci pourront être mobilisés pour d’autres réalisations ou des évolutions de Caméléon. L’entreprise prévoit d’ailleurs en 2023 d’étendre ses usages à l’optimisation de l’assortiment. L’amélioration de la connaissance client représente une autre piste.
D’après les prédictions du modèle, ce sont la majorité des 350 magasins qui sont éligibles à des optimisations. En effet, seul “un nombre restreint d’entre eux sont aujourd’hui dans un schéma idéal.” L’objectif au cours des prochaines années sera donc de mener des évolutions magasin par magasin “pour proposer un remodeling ou un réagencement.”