Cet article a été publié originellement sur mydatacompany.fr
BNP Personal Finance a recruté en 2017 des Data Scientists dans ses métiers et mis en place un Data Lab rattaché à la DSI. Cette organisation a servi à industrialiser ses projets d’intelligence artificielle avec des gains très significatifs pour le marketing, les opérations et le risque.
BNP Personal Finance concilie des Data scientists rattachés à des directions métier et un Data Lab, en lien lui avec sa DSI. Le laboratoire, créé en février 2017, s’est spécialisé rapidement sur les données non-structurées et peut se consacrer à plus de recherche et de de développement que ses homologues dans les métiers.
Le Data Lab délivre par ailleurs une offre de services aux différents métiers, y compris aux Data scientists de l’organisme de crédit. Comme l’explique son responsable, Jérémie Guez, il a développé une plateforme « qui permet à tous les Data scientists de BNP Personal Finance de faire de la Data science. »
Une plateforme unique pour les spécialistes des données
Cette plateforme s’adresse plus largement à l’ensemble des spécialistes de la donnée au sein de l’organisation. Ainsi, près 150 personnes l’exploitent pour leurs besoins. « Cela nous permet d’avoir une vue sur tous les projets, qui sont intégralement réalisés grâce à cette plateforme. »
Toujours à destination des Data scientists, le Data Lab fournit une offre de mise en production des scores. Une fois développés, reste en effet à les mettre en production et donc à les intégrer dans le système d’information pour apporter concrètement de la valeur. Les liens avec la DSI facilitent cette étape complexe.
20 spécialistes dans un datalab au service des métiers
« Nous allons retravailler le code avec le métier. Notre expertise en Data science nous permet en outre d’apporter du conseil sur les projets, par exemple au niveau des modèles, pour permettre au mieux la mise en production », une phase qui dure de 3 à 6 mois.
Le Data Lab réunit une vingtaine de membres, des Data ingénieurs, des DataOps, des développeur Python, des DevOps, six Data scientists, des professionnels de la Data visualisation, des Chefs de projet, etc. Son expertise est mise également à disposition des lignes métiers de BNP au travers d’une offre de consulting en Data science.
Toutes les lignes de métier en effet ne disposent pas directement de Data scientists. Ce consulting permet d’accompagner les autres experts de la Data science sur des domaines précis, en particulier ceux nécessitant l’exploitation de données non-structurées.
Une « décentralisation » des Data scientists auprès des métiers
A noter que pour ses missions, le Data Lab bénéficie en interne d’un « très bon » niveau d’acculturation à la Data science. Cela s’explique par la « décentralisation » des Data scientists auprès des métiers, en particulier les opérations, le marketing, les risques, ainsi que dans différentes filiales à l’étranger de la banque.
Cette acculturation au sein de l’organisation facilite le travail en Data science et l’identification des besoins. Plus largement, le Data Lab participe à une revue des objectifs métiers, qui pour 2020 a débuté en septembre. Son équipe intervient également en « proposition de valeur ».
« Tout est développé en interne, c’est notre ADN »
Jérémie Guez précise à ce titre que « tout est développé en interne. C’est notre ADN. Nous n’avons pas 1 euro de frais de licence. » Quelques semaines plus tôt, le directeur du Data Lab était ainsi présent au Royaume-Uni afin de présenter un chatbot basé sur des technologies de NLP (Natural Language Processing) avancées. Ces développements seront ainsi mis à disposition des centres d’appels.
« Nous montrons notre savoir-faire et cela suscite des besoins. La notoriété acquise par le Data Lab en interne fait que des métiers viennent également nous saisir pour les projets qu’ils envisagent. »
La sélection des projets est arbitrée en Comité exécutif de BNP Paribas Personal Finance en fonction de deux grands critères. Il s’agit côté métier, du retour sur investissement (ROI) identifié ou estimé et, côté Data Lab, de la compétence et de la montée en compétence apportée à ses équipes.
Déploiement et intégration en continu des projets de Data science
En ce qui concerne les développements en eux-mêmes, les cycles sont d’une durée variable. Pour la plateforme de Data science, maîtrisée de bout-en-bout par le Data Lab, des sprints courts de deux semaines sont réalisés.
Pour les projets métiers cette fois, des phases d’exploration de trois mois sont menées, suivies de pilotes d’une durée de six mois. « Au-delà de la méthode agile, nous nous démarquons grâce à du déploiement continu et de l’intégration continue. L’agilité est aussi dans nos développements. Ce n’est pas seulement de l’agilité projet. »
« Plus-value importante » de l’IA dans la lutte contre la fraude
Cette approche permet une mise à jour simplifiée des modèles, grâce entre autres à des tests automatiques. Et cela s’applique à l’ensemble des projets réalisés au sein du Data Lab. Sans surprise, le marketing, les opérations et les risques sont les plus pourvoyeurs de projets.
Les algorithmes développés portent ainsi sur la fraude, le risque, l’appétence, l’optimisation de campagnes marketing, les chatbots pour les opérations, et un moteur de recherche pour les ressources humaines.
Les résultats sont au rendez-vous. Jérémie Guez précise que sur les campagnes marketing les gains sont très significatifs. Pour le score de fraude, la « plus-value était importante» pour le risque, « à tel point qu’ils veulent le déployer dans tous les pays (…) Cela a contribué à crédibiliser encore plus la démarche Data science » se félicite l’expert.
Un chatbot étendu aux centres d’appels
La plateforme de Data science fait parti des réalisations phares du Data Lab. Pensée au départ pour cinq personnes, la plateforme accueille désormais 150 collaborateurs et constitue l’outillage incontournable des projets du groupe.
Le chatbot, réalisé en une vingtaine de jours pour le MVP (Minimum Viable Product), est un autre développement significatif. Plusieurs itérations ont été apportées depuis, afin d’y intégrer les derniers algorithmes, comme Bert. « Le produit répond à des besoins métiers tout en étant à la pointe de la technologie en matière de NLP. »
L’étape d’après : le monitoring des modèles
Ce chatbot a été conçu initialement pour des usages internes à la DSI pour répondre aux questions les plus fréquentes en tant que « FAQ intelligente ». BNP Paribas Personal Finance étudie à présent la possibilité de l’adapter pour les besoins des centres d’appels afin d’aider les commerciaux à répondre plus rapidement aux questions de la clientèle. Demain pourrait y être ajouté le support de la voix pour proposer un voicebot.
A noter que sont associés plusieurs rôles clés à chaque projet entrant en production. Cela comprend notamment le product owner et le model reviewer. Ce dernier intervient sur le contrôle du modèle, afin entre autres de détecter les biais éventuels. L’explicabilité des algorithmes est quant à elle assurée par le model owner.
L’industrialisation n’est plus la seule priorité du Data Lab, souligne son responsable. La préoccupation porte désormais sur le monitoring de modèles, qui évoluent dans le temps, à la manière « d’organismes vivants » tel que les qualifie David Giblas de Malakoff Mederic.
Après l’industrialisation, l’étape du monitoring des modèles
Jérémie Guez souhaite anticiper et mettre en place une équipe assurant la supervision continue des modèles. Car d’ici deux à trois ans, ce ne sont plus quelques scores qui seront en production, mais sans doute près d’une centaine. « C’est dès aujourd’hui qu’il faut commencer à expérimenter. »
Des centaines de scores en production dans 3 ans
Un autre objectif du Data Lab en matière d’intelligence artificielle consistera à poursuivre le travail sur le traitement du langage, une expertise qui constitue un « vrai plus pour les métiers ». En matière d’industrialisation, si le worklow est jugé au point sur le volet technique, le modèle organisationnel doit encore progresser.
« Nous avons pour objectif de superviser toute la chaîne, de l’ingestion de la donnée à la prédiction du score. Et cela nécessite une organisation pour l’accompagner » conclut Jérémie Guez.