Premières étapes pour devenir une entreprise data driven

Cet article a été publié originellement sur mydatacompany.fr

Commencer petit, mais voir grand dès le départ. Le candidat au statut de data company ou data driven doit s’appuyer sur ses compétences, créer une première application avec un impact concret, puis capitaliser.

Nombre d’entreprises, data rich ou non, se rêvent demain en data company ou data driven grâce par exemple à un datalab et des compétences en datascience. Mais voilà, il ne suffit pas d’empiler les briques, de préférence avec le terme data accolé, pour y parvenir. C’est une transformation, avec un début. Mais lequel ? Par où commencer ?

« Chaque petite décision quotidienne est susceptible d’être augmentée par de la donnée »

Pour le directeur des opérations de Dataiku, Romain Fouache, le point de départ, c’est sans doute de disposer d’une vision sur le long terme. Des données oui, mais pour qui, quoi et quels objectifs ? Mais en outre, « une entreprise doit réfléchir, à terme, à l’augmentation de l’ensemble de ses décisions, process, produits par de la donnée. »

Classiquement, elle commencera donc par identifier quelques cas d’usage « saillants ». Un acteur de la finance s’intéressera ainsi à l’attrition (churn), aux risques de fraude ou à la tarification de ses offres.

Ce n’est cependant qu’un début et « chaque petite décision quotidienne est susceptible d’être augmentée par de la donnée ». A l’échelle d’une organisation, les cas d’usage potentiels se compteraient ainsi en centaines, voire en milliers.

Les individus moteurs de la transformation

Cette multitude de possibilités risque toutefois de s’avérer « paralysante ». Il faut faire des choix. A ce titre, Romain Fouache met en garde contre une approche basée sur les technologies, en constante évolution, ou les données (dont 90% n’existaient pas deux ans plus tôt).

Romain Fouache, directeur des opérations de Dataiku.

« Il y a cinq ou six ans, on ne parlait que de Hadoop. Plein de sociétés se sont mises à construire des data lake sur base Hadoop en considérant que leur transformation, c’est leur techno Hadoop. Quelques années plus tard, on ne parlait plus que de Spark. »

Une question peut permettre de simplifier ce processus de décision : quels sont les ‘pain points’ ou grandes difficultés rencontrées dans l’entreprise ? « L’élément essentiel pour tracer son chemin, c’est de tracer le chemin des personnes dans la société. C’est regarder, parmi les talents disponibles, comment les supporter et à quel rythme pour faire croître cet effort data » préconise le dirigeant de Dataiku.

Si in fine l’objectif est d’impliquer l’ensemble des collaborateurs, le point de départ de la démarche consistera donc à s’appuyer et à faire bénéficier les compétences existantes et manipulant déjà des données. La première étape s’imposera dès lors d’elle-même.

Etape 1 : créer la première application avec un impact concret

L’étape n°1 consistera à identifier quelques cas d’usage pour cette population et à lui livrer une démonstration concrète ayant un impact sur le métier. Et pour y parvenir, cela doit être réalisé conjointement avec le métier.

Commencer par une petite équipe pluridisciplinaire

« Cela veut dire commencer par une petite équipe pluridisciplinaire, potentiellement sur une ou plusieurs business units de l’entreprise, qui travaillera sur un ou deux cas d’usage spécifiques. Mais pas en mode lab » souligne Romain Fouache.

Cette implication du métier est une condition sine qua non à l’impact réel sur celui-ci. « Il faut que le métier accepte cet impact et donc il faut l’adoption. Et la meilleure façon d’avoir l’adoption, c’est l’implication » résume-t-il.

Etape 2 : capitaliser et réutiliser

Une première démonstration concrète a été réalisée. D’autres suivront, mais à chaque fois l’entreprise doit pouvoir capitaliser sur ses réalisations antérieures : préparation de données, algorithmes et équipes.

Cette seconde étape reviendra donc à « croître par la réutilisation et la diffusion de l’approche au sein des différentes équipes. » Une part des algorithmes conçus lors des premiers projets pourront notamment être réexploités pour d’autres cas d’usage de l’entreprise.

Réutiliser le travail du dernier kilomètre de datascience

« Si le travail du dernier kilomètre de datascience a déjà été fait une fois, dans le bon contexte, vous serez à même de le réutiliser des centaines de fois. » Par ailleurs « plus des personnes sont engagées et plus par capillarité vous serez capable de bâtir sur ces fondations en tirant parti des compétences liées à la donnée. »

Etape 3 : Transversalité et gouvernance 

La démarche et les efforts en faveur de la data sont au rendez-vous ? L’entreprise doit à présent s’assurer de leur transversalité et de leur gouvernance. La finalité est notamment de maximiser la capacité à réutiliser le travail effectué préalablement. La conclusion, c’est un usage transverse et global dans toute la société.

« Un client comme GE Aviation a commencé sur des sujets type ingénierie (…) puis par capillarité, cela a pris dans la logistique, la finance et les différents domaines de l’organisation. Tous peuvent bénéficier de l’utilisation de la donnée » détaille le COO de Dataiku.

« La question n’est pas de savoir si trois ou dix projets seront mis en production, mais comment parvenir à des milliers de projets qui tournent et impliquant sur le sujet un très grand nombre de collaborateurs. »

Des compétences indispensables ? Un « panachage de compétences »

Une ou des compétences ne suffiront pas à faire la différence. C’est leur combinaison qui permettra de tirer de la valeur des données dans l’entreprise. Un bon projet de données ne dépend pas uniquement de la mise à disposition de compétences en datascience ou métier.

« Plutôt que d’avoir besoin de 200 data scientists, vous en avez 10 adossés à 190 experts data métier. Et ensemble, ils sont capables de réaliser autant sinon plus » soutient Romain Fouache. A condition bien sûr de réussir à les faire travailler efficacement de concert pour parvenir à des projets avec un impact métier concret. 

Des data scientists adossés à des experts data métier

Des équipes restreintes de data scientists peuvent ainsi « prépackager » des analyses, potentiellement complexes, pour les mettre entre les mains d’analystes de marché, qui eux ne sont pas des spécialistes de la datascience.

Plus globalement, les « équipes doivent être très proches. Des méthodologies comme Agile sont bien, mais ce qui importe avant tout c’est la cohésion entre les équipes (…) La collaboration est au cœur du succès des initiatives données. »  

Implication de la direction et ambitions sur l’échelle

« Un des éléments discriminants est l’échelle à laquelle le projet de transformation est lancé. Plus vous avez l’ambition de le faire à une grande échelle, à terme, et plus les chances de succès sont importantes » résume très simplement l’expert.

A ce titre, la direction de l’entreprise doit valider et promouvoir cette vision à long terme. Elle devra par ailleurs être portée localement, mais dans le cadre d’une démarche de gouvernance (responsabilités, modèles utilisés, dépendances technologiques…), ce notamment dans une optique de capitalisation et d’industrialisation.

« Les personnes sont au cœur du processus »

Point « fondamental et souvent sous-estimé » de la gouvernance : « les personnes sont au cœur du processus. Il y a une responsabilité des individus qui construisent les modèles sur l’utilisation qui en est faite. »

Ce sont eux qui assurent le pilotage, soutient Romain Fouache, qui prend ses distances avec l’expression « data driven », suggérant que les données sont à la manœuvre.