Figaro Classifieds met le Machine Learning au service de l’emploi

Cet article a été publié originellement sur mydatacompany.fr

Editeur de services comme Cadremploi, Keljob et ChooseYourBoss, Figaro Classifieds exploite le Machine Learning pour adapter en temps réel l’affichage des offres. Résultats : une augmentation du nombre de candidatures pour les clients recruteurs et de la pertinence des offres.

La Data science et le Machine Learning ne sont pas l’apanage des grands noms de la banque et de l’assurance ou une technologie cantonnée au développement de scores de détection de la fraude. Cette forme d’intelligence artificielle peut être mise au service de l’emploi et de la détection de candidats.

C’est en effet à ce domaine que Figaro Classifieds, un acteur historique de la recherche d’emploi, consacre aujourd’hui ses développements dans le domaine du Machine Learning. Et il ne s’appuie pas pour cela sur une cohorte de Data Scientists. 

 

Du Machine Learning pour proposer du matching temps réel des offres et candidats

Son directeur technologique, Marc Morel, mobilise une « petite équipe data ». Il n’en dispose pas moins d’atouts grâce à des « technologies innovantes » et à l’innovation sur les algorithmes.

Marc Morel, directeur technologique de Figaro Classifieds

« Nous sommes aujourd’hui sur des pans de Machine Learning très peu communs (…) C’est poussé ; on n’est pas dans des projets ‘bullshit’ ; on n’est pas dans un Data Lab coupé de l’entreprise. Non, les apports sur notre business sont concrets. »

Et pour proposer du matching en temps réel entre les offres d’emploi des clients de Figaro Classifieds et les profils des candidats, le service a composé un binôme efficace comprenant un Data Scientist et un développeur.

« J’ai eu la chance de rencontrer un profil de mathématicien, mais très appétent pour la technologie. Il s’est formé, et nous l’avons formé sur la partie développement » se félicite Marc Morel, qui a pu ainsi enrichir les compétences de son équipe malgré les fortes tensions à l’embauche sur les métiers de la Data science.

L’enjeu pour cette équipe Data consiste donc à concevoir des algorithmes fonctionnant en temps réel pour le matching entre un poste et un candidat. Et cela n’est pas sans poser quelques difficultés. « Cela doit se passer dès que la personne arrive sur le site. Il faut vite comprendre qui est le candidat et quels emplois sont susceptibles de l’intéresser afin de lui proposer les bonnes offres » souligne le CTO (Chief Technology Officer).

Comprendre rapidement le candidat et ses attentes

Cinq ans plus tôt, Figaro Classifieds a débuté des travaux autour d’algorithmes de co-occurrence. Ce n’était cependant que la première étape. « L’objectif était que dès l’enregistrement du CV, le moteur de recherche comprenne le parcours du candidat et s’adapte. Ainsi, pour deux recherches équivalentes, les résultats seront différents d’un utilisateur à l’autre. »

Si une telle personnalisation des résultats est essentielle pour un site de recherche d’emploi, elle s’avère cependant complexe à mettre en œuvre. Pourquoi ? Dans ce secteur, les utilisateurs se montrent peu fidèles et l’historique de données par conséquent est restreint.

Convaincre le candidat et collecter les bonnes données

« Dans la recherche d’emploi, plus encore sur le marché cadre marqué par le plein emploi, les candidats ne restent pas des mois sur les services. Il est donc impératif, le plus rapidement possible, qu’ils constatent que notre site ne leur propose pas n’importe quelles offres » explique Marc Morel.

Pour offrir cette personnalisation, le site va donc collecter des données en temps réel, comme la nature des offres consultées, les points communs entre ces offres et le temps de lecture. Lire une annonce ne traduit pas nécessairement un intérêt.

Mais attention, précise Marc Morel, « nous ne sommes pas dans le Big Data. Nous exploitons certes des technologies de Big Data, mais notre collecte de données est extrêmement ciblée et structurée. Nous avons collecté le minimum nécessaire tout en étant en capacité d’étendre notre collecte à tout moment, pour inclure éventuellement des éléments pertinents supplémentaires. »

Des outils Big Data, mais une approche Smart Data

Cette approche permet d’assurer une conformité avec le RGPD. Prévenir les biais est une autre préoccupation du service d’emploi du Figaro. « Nous sommes très vigilants sur tout ce qui a trait aux discriminations. » Sont ainsi exclues les données sociodémographiques, auxquelles n’a pas accès le Data Scientist.

L’algorithme est ré-entraîné toutes les heures

Il s’agit donc pour le service d’emploi d’identifier et de traiter avant tout les bons indicateurs. Et en la matière, les éléments déclarés par le candidat ne sont pas nécessairement les plus pertinents, relève le responsable technologique.

« Nos algorithmes sont basés sur les expériences, le secteur d’activité et le comportement sur nos produits. Le genre du candidat, jamais. Ce type de données n’est à aucun moment exporté dans nos algorithmes. Nous prenons uniquement ce qui est nécessaire au traitement des algorithmes. L’axe unique pour nous, c’est le skill [NDLR : la compétence]. »

« Un utilisateur pourra déclarer rechercher un emploi à Bordeaux, mais son véritable souhait c’est de partir en province. Il est donc susceptible d’accepter une offre d’emploi attractive à Nice pour quitter Paris, même s’il n’a pas saisi Nice dans ses critères » illustre-t-il.

L’algorithme de matching doit donc opérer un certain nombre de filtres pour simplifier la recherche, en excluant par exemple les offres de stage si le candidat dispose de 10 ans d’expérience, et en adaptant les résultats à son comportement réel, c’est-à-dire sa navigation internet.

Chaque heure, l’algorithme est ré-entraîné pour intégrer les nouvelles offres d’emploi et les nouveaux CV. Ce processus permet notamment, via de l’analyse sémantique, de prendre en compte les nouveaux termes, très fréquents et spécifiques aux métiers et secteurs (DevOps, BizDev, growth manager, etc.).

50% des candidatures apportées par l’algorithme

Sur Cadremploi, la moitié des candidatures sont désormais le fruit des algorithmes de Machine Learning. « Les résultats sont bien supérieurs à ce que nous anticipions » se félicite Marc Morel.

Ces développements s’inscrivent dans une démarche de test & learn, financés notamment grâce au CIR (crédit d’impôt recherche). Ils portent aujourd’hui principalement sur l’emploi, le coeur de l’activité de Figaro Classifieds.

« Nos clients évoluent dans leurs attentes. Ils sont beaucoup plus ROIstes »

L’entreprise étudie néanmoins aussi des applications du Machine Learning dans le domaine de l’immobilier. Toutefois, la priorité reste l’amélioration continue du matching. « Quatre ans auparavant, 20% des candidatures provenaient de la partie algorithmique. C’était alors de la co-occurrence assez classique, mais cela a porté ses fruits. Désormais plus de la moitié des apports de candidatures se fait grâce à l’algorithme. »

Mieux, cette évolution ne s’est pas faite par cannibalisation. Le nombre total de candidatures a en effet progressé parallèlement. Cela permet ainsi de répondre aux attentes des clients recruteurs de Figaro Classifieds en termes de volume. « Nos clients évoluent dans leurs attentes. On était historiquement sur un engagement de moyens. Aujourd’hui, ils sont dans la mesure de la quantité de candidatures reçues en fonction des sources. Ils sont beaucoup plus ROIstes. »

La qualification fine pour accroître le taux de transformation des candidatures sera peut-être l’enjeu de demain. « On pourrait le faire, mais cela ne répond pas encore aux attentes de nos clients, très attachés à du quantitatif. » Cette approche plus qualitative, l’entreprise la pratique néanmoins déjà depuis plusieurs années pour son site ChooseYourBoss au travers d’un « niveau de matching ». La sélection des candidats relève toutefois toujours de la compétence du recruteur.