Au sein d’une organisation hybride, la Data Factory de la banque opère comme centre d’expertise en Data Science pour ses différents métiers, accompagnant leur montée en compétences, souligne sa responsable, Clémence Panet Amaro.
Pouvez-vous nous présenter la place qu’occupe la Data Factory dans l’organisation et ses missions ?
Il s’agit d’une entité rattachée à la direction data groupe (DDG), dont le périmètre comprend, outre nos missions, les sujets d’administration de la donnée – gouvernance, qualité, dictionnaire des données -, mais aussi d’architecture data et de socle data ainsi les référentiels.
La Data Factory apporte quant à elle un centre d’expertise ou d’excellence en data science et IA. Elle se compose pour cela de huit data scientists, dont la principale fonction est d’accompagner les métiers de La Banque Postale et de ses filiales dans le développement de projets data.
Ces projets adressent toute la chaîne de valeur de la data : des extractions qui nécessitent une grande rapidité de réponse et une expertise, des études statistiques ad hoc, des constructions de tableau de bord jusqu’aux modèles d’IA avec des solutions de machine ou de deep learning mais également des briques d’algorithmies réutilisables, notamment sur l’explicabilité des modèles.
Nous fonctionnons comme un cabinet de conseil interne en data. Nous ne facturons pas nos services cependant. En revanche, la phase d’industrialisation est à la charge des donneurs d’ordre.
A lire aussi : Casser la dichotomie IT et métiers sur la Data
Quels sont vos autres partenaires dans l’organisation ?
Comme je l’indiquais, nous les accompagnons dans leurs projets, mais pas seulement. Notre tâche consiste plus globalement à accompagner tous les métiers au travers d’actions d’acculturation et de formations aux sujets de data science.
La Data Factory se veut animatrice de communautés, avec lesquelles nous partageons à la fois les projets réalisés, mais aussi les expertises et les codes développés. Tout code conçu par la factory a vocation à être diffusé et réexploité au sein du groupe.
Ainsi, actuellement, nous montons en compétence sur les techniques NLP (Natural Langage Process). Nous anticipons d’ores et déjà que les développements à venir présenteront un intérêt pour différents métiers et usages : analyse des verbatims clients sur le site, réclamations, courriels… Il s’agit donc clairement d’assets mutualisables.
De manière plus générale, quel est le modèle d’organisation mis en place au sein de la Banque Postale ?
On peut le qualifier d’hybride. La direction data centrale joue en quelque sorte le rôle de chef d’orchestre. Elle vient mettre en musique, coordonner, et fournir un cadre de gouvernance data aux autres métiers. La finalité est de favoriser un fonctionnement harmonieux sur la data.
Comme je l’indiquais précédemment, la DDG (Direction Data Groupe) pilote également tous les sujets liés à la gouvernance, dont la gestion de la qualité des données et de connaissance de ce patrimoine grâce à un dictionnaire de données.
Pour autant, cette direction n’a pas pour objet de tout centraliser. Ainsi, certaines directions métiers disposent de leurs propres compétences data. Et c’est légitime car elles sont amenées à traiter, manipuler et surveiller les données de leurs domaines.
C’est en cela que notre organisation se décrit comme hybride. Ce modèle permet par ailleurs de responsabiliser les métiers sur leurs données. La gouvernance est structurée autour de domaines distincts, confiés aux métiers. A ce titre, il importe qu’ils disposent eux aussi d’experts de la data pour gérer ces actifs et développer des usages.
De quels profils et expertises disposez-vous au sein de la Factory ?
La Data Factory se compose de Data Scientists aux profils variés, des juniors comme des seniors ou des docteurs / doctorant, mais aussi des statisticiens traditionnels devenus Data Scientists, et d’autres qui sortent d’école.
Je remarque d’ailleurs que les profils de statisticiens plus à « l’ancienne » sont assez attachés à l’explicabilité de leur modèle, au choix de leurs variables ainsi qu’à leur sens métier. Les jeunes diplômés y sont moins sensibilisés, mettant plus l’accent sur la performance.
A noter que certains des Data Scientists de la Factory se forment sur des parcours de data ingénieur. Ils ont la volonté de mieux communiquer avec l’IT. Une meilleure synergie est importante pour les passages en production. Cela traduit la recherche d’industrialisation et le fait qu’un cap a été franchi sur la maturité des projets data.
Côté IT, on fait aussi un pas vers les data scientists. D’ailleurs, nous avons accueilli, de manière alternée, un data ingénieur entre la DSI et la direction de la Data groupe. Cela est bénéfique pour développer des synergies et un langage commun.
Pouvez-vous nous citer quelques exemples de projets mis en production ou accompagnés par la Factory ?
Comme nous sommes une direction transverse, les projets sont multiples et touchent différents domaines tels que le marketing, la sécurité financière, les risques, la conformité.
Pour n’en citer que quelques-uns, nous avons par exemple co-construit avec le métier de la clientèle des professionnels, en renfort des équipes data existantes, des scorings produits afin d’en améliorer le ciblage, nous travaillons aussi à une meilleure identification de cette clientèle.
En ce qui concerne la sécurité financière, nous avons par exemple travaillé, pour le moment en mode R&D et toujours en faisant attention s’agissant de données à caractères personnelles, sur des projets relatifs à la fraude documentaire via de l’analyse d’images. Ceux-ci permettent par exemple de remonter aux opérationnels des pôles de gestion de la fraude des cas de potentiels clients multi-détenteurs d’identités à analyser.
Nous travaillons également autour des sujets d’explicabilité, de transparence, de lutte contre les biais, essentiels au développement de cas d’usage data dont la finalité se doit d’être éthique.