Avec sa plateforme Data, Sarenza facilite les usages des données par ses métiers

Cet article a été publié originellement sur mydatacompany.fr

Pricing, retours produits, recommandation, fraude… l’e-commerçant Sarenza développe ses usages de la donnée avec une approche orientée time-to-market. Pour cela, l’entreprise s’appuie sur une plateforme Data dans le cloud et la démocratisation de l’accès à la donnée.

Filiale de Monoprix, Sarenza est un site e-commerce spécialiste des chaussures et accessoires. L’entreprise dispose d’une dizaine de sites Internet pour répondre aux commandes des consommateurs européens de 26 pays.

Bien qu’un acteur natif du digital, la Data reste un sujet encore jeune en interne. La démocratisation de la donnée, Sarenza la doit en grande partie à la création d’une plateforme Data dans le cloud. Or, des Data, l’e-commerçant n’en manque pas. Encore fallait-il les rendre disponibles auprès des équipes.

 

Plateforme 100% sur Google Cloud

Son département Data, transverse, met ainsi à disposition des data analystes, au travers d’une plateforme sur Google Cloud, 87 To de données. Au total, ce sont 429 To de données qui sont analysés chaque mois. Il s’agit de données opérationnelles comme les commandes ou le stock, mais aussi des données ingérées depuis les API de partenaires.

Cinq ans auparavant environ, Sarenza opérait une infrastructure Data on-premise. Pour gagner en réactivité et être plus « time-to-market », le vendeur a donc migré dans le cloud depuis une architecture Hadoop Hortonworks.

Désormais, l’architecture est « totalement décentralisée » en Europe au travers des services de Google Cloud Plateform. Sarenza dispose ainsi d’une architecture Spark Scala pour la partie calcul et d’un cluster Kubernetes. Son coût de fonctionnement mensuel : 6000 euros.

« Tout est géré pour l’orienter time-to-market. Parce que sarenza, son métier, c’est aussi le pricing, la gestion de stock et une capacité à répondre pendant les soldes. Il fallait piloter très précisément quand les données allaient atterrir le matin » auprès des analystes, attachés aux différents métiers.

Du Machine Learning pour la prédiction des retours

L’élasticité était donc une des principales attentes d’une migration dans le cloud. « On peut très bien allouer le matin 600 To de RAM et les rendre 10 minutes après, le tout avec un coût assez limité » souligne Olivier Girardot, ex de la division Data de Sarenza.

La « scalabilité assez infinie » permet de servir les usages, insiste-t-il. Les usages, c’est en effet la priorité de cette plateforme Data. Sarenza affiche d’ailleurs plusieurs grands projets dans ce domaine des usages. Un algorithme de machine learning a par exemple été développé afin de mieux prédire les retours produits.

Le retour est un argument commercial pour les e-commerçants. Sarenza propose ainsi à ses clients des retours jusqu’à 100 voire 200 jours. « Du point de vue comptable ça peut rapidement devenir un enfer si vous n’arrivez pas à prédire rapidement ces retours » rappelle Romain Marret, responsable Data et architecte Big Data.

Grâce à un apprentissage reposant sur l’historique des retours et tenant compte de 18 caractéristiques produits et clients, Sarenza dispose d’un outil prédictif fiable. Le taux d’erreur sur la prédiction des retours sur un mois est ainsi inférieur à 2%. Et ce score constitue aussi un indicateur précieux pour le marketing dans le pilotage de ses investissements.

En ce qui concerne la détection de la fraude, Sarenza a fait le choix de la réinternalisation. Sa plateforme Data lui permettait de concevoir ses propres modèles, avec une efficacité accrue à la clé. Le niveau de certification manuelle a été ramené de 8% à 2%.

2 à 3% d’incrément de CA grâce aux recommandations

« Cela veut dire qu’on a permis de réduire le volume de commandes à certifier manuellement sans augmenter la fraude résiduelle. Cette certification est en production, automatique et en temps réel. Elle se fait avec plus de 30 caractéristiques analysées, que ce soit sur les clients ou les produits commandés » détaillent les experts de la boutique en ligne.

Autre domaine critique pour un e-commerçant : les prix. Depuis deux ans, Sarenza opère un pricing dynamique. Dans ce secteur, l’enjeu consiste à disposer de stocks suffisants pour la période des soldes. Du stock donc, mais pas trop pour soigner les marges.  

L’objectif avec le machine learning consiste donc à maximiser le chiffre d’affaires et la marge en pilotant l’écoulement des stocks tout au long de la saison. Pour son apprentissage, l’algorithme s’appuie donc sur les courbes d’écoulement des produits. Il tient compte également des prix de la concurrence.

Classiquement, les données permettent aussi à Sarenza de proposer aux visiteurs les bonnes recommandations de produits similaires. Sur une fiche produit, 12 vignettes de recommandation s’affichent. Pour les sélectionner, le principe est assez simple : le site recommande des produits vus ensemble lors des visites des différents clients.

Cultiver l’autonomie des métiers grâce à l’acculturation Data

Classique donc, mais néanmoins source de revenus. Cela augmente « le taux de conversion en permettant au client de trouver plus rapidement le produit qu’il cherche » précise Romain Marret. La recommandation représente de fait pour Sarenza un incrément de chiffre d’affaires de 2 à 3%.

Si la plateforme Data facilite une approche itérative en matière d’usages, la dimension technique ne constitue pas l’alpha et l’oméga dans ce secteur. Une des missions de l’équipe Data consiste donc aussi à diffuser une culture des données auprès des métiers et en particulier les data analystes.

« La démocratisation de l’accès à la donnée passe ainsi à la fois par l’organisation et la technique». Sur le plan organisationnel, sont régulièrement organisées des « universités data »ouvertes à l’ensemble des collaborateurs. Des actions de formation et d’initiation aux technologies (SQL, machine learning, etc.) complètent ce dispositif.

Pour l’acculturation, Sarenza revendique là aussi une approche itérative. « Cela s’est fait petit à petit en même temps que notre migration cloud », relate l’architecte Big Data. Le site e-commerce a débuté avec un système décisionnel ouvert à un petit nombre de personnes.

Suivait un PoC avec quelques jeux de données ouverts à des équipes. « Face au succès que cela a rencontré, petit à petit nous avons a embarqué plus de données et plus d’équipes ». L’expert insiste par ailleurs sur un « travail en proximité » systématique avec les métiers sur les premiers use cases.