Les enjeux liés à la donnée en 2018 : IA, deep learning et data gouvernance

Alors que 2017 a révélé l’importance du rôle des data scientists et des analystes dans la productivité des entreprises, 2018 sera l’année du deep learning et, entre autres, de la data-gouvernance. Cette nouvelle année à venir consacrera probablement la science des données comme un atout stratégique majeur, plus proche des besoins de l’entreprise.

Florian Douetteau, CEO de Dataiku

Deep learning : du Cloud au hardware

Jusqu’ici, l’implication du hardware dans le deep learning s’est limitée au Cloud. Aujourd’hui, le système tend à s’adapter davantage au deep learning, en raison des enjeux que celui-ci représente. Cette évolution s’observe notamment chez les processeurs NVIDIA, ou encore dans les Bitcoins. Ces technologies mènent vers un hardware plus spécifique, plus à même d’accompagner les performances des systèmes d’apprentissage et de l’IA.

Machine learning : de nouvelles architectures

Les réseaux accusatifs générateurs (GAN) constituent une nouvelle architecture de machine learning particulièrement intéressante. Ces réseaux dits « neuronaux » et « concurrents » fonctionnent selon deux modes complémentaires : le premier consiste à produire des échantillons de données « naturels » à partir de données réelles, et le second consiste à distinguer les données réelles des imitations. Les deux modèles, appelés « génératif » et « discriminant », apprennent ainsi l’un de l’autre.
Le succès de cette nouvelle architecture est dû au fait qu’elle nécessite moins de paramètres. Ce qui accroît son efficacité : génération ou création d’images et de retouches d’images à haute résolution et de vidéos, synthèse texte et image, etc. Elle a également la capacité de s’entraîner avec un volume de données réduit et de fournir des prédictions sur les données manquantes. Cependant, les GAN présentent des risques, notamment lorsqu’un des réseaux a assez appris pour se passer de l’apprentissage auprès d’un réseau concurrent.

Des innovations démocratisées

L’innovation est encore en décalage par rapport à l’usage réel des outils en entreprise. Les collaborateurs ont parfois des difficultés à mettre en pratique les innovations. 2018 devrait changer la donne : l’intensification du machine learning et son extension à un plus grand champ d’applications permettra aux bots d’acquérir une capacité de conversation plus proche des interactions humaines. Plus encore : les bibliothèques de données permettront une meilleure compréhension sémantique des échanges, améliorant leur efficacité.

Une synergie des compétences renforcée

En 2018, la complémentarité entre les métiers prend une dimension plus intense. Les projets futurs nécessiteront davantage de synergie entre les data scientists et les équipes commerciales, afin que chaque collaborateur ait un regard sur le déroulement entier d’une action.
Bien que chaque membre de l’entreprise puisse accéder à des données relevant d’une compétence précise, chaque action nécessite que toutes les expertises soient impliquées. De plus, les modèles de machine learning évoluent constamment. Il est donc fréquent que la personne qui effectue la mise à jour des modèles soit différente de celle qui les a créés. Ainsi, il est nécessaire d’intensifier la collaboration pour faciliter leur mise en application.

Data Gouvernance : vers une plus grande sécurité des données

Lorsqu’on parle de machine learning, on pense nécessairement aux données et aux nouvelles réglementations qui y sont liées, que les entreprises ne doivent pas ignorer. Le RGPD illustre parfaitement la préoccupation grandissante des gouvernements pour les enjeux liés à la sécurité des données. Aux entreprises, il revient donc d’évaluer les risques en amont et de faciliter la traçabilité du parcours des données pour s’assurer d’être en conformité avec la législation.
En l’occurrence, il peut être efficace de retracer le cycle de vie des données, en inscrivant celui-ci sur un support centralisé et accessible. Le cycle de vie des données doit comporter un inventaire des données existantes (données consommateurs, données d’identification ou encore données RH), des personnes qui y accèdent et y ont régulièrement recours, ainsi que des modes de traitement de la donnée (copie, suppression, etc.). De cette manière, il sera plus simple d’identifier les pratiques qui impliquent la manipulation de données personnelles et celles qui présentent des risques.

Cookie	Durée	Description
mautic_device_id	1 year	Ce sont des cookies tiers utilisés par Mautic qui nous permettent d’utiliser le service Mautic. Nous utilisons Mautic pour soutenir nos activités de marketing. Ce cookie permet de connaître l’appareil avec lequel le visiteur accède au site. Expiration du cookie au bout d’un an.
mautic_referer_id	30 minutes	Ce sont des cookies tiers utilisés par Mautic qui nous permettent d’utiliser le service Mautic. Nous utilisons Mautic pour améliorer notre compréhension des attentes de nos lecteurs, leurs proposées des contenus et événements les plus pertinents, soutenir nos activités de marketing en suivant leur navigation sur le site, collecter de l’information sur leurs préférences et gérer les formulaires présent sur le site. Ce cookie permet de connaître l’origine du visiteur.
mtc_id	session	Ce sont des cookies tiers utilisés par Mautic qui nous permettent d’utiliser le service Mautic. Nous utilisons Mautic pour améliorer notre compréhension des attentes de nos lecteurs, leurs proposées des contenus et événements les plus pertinents, soutenir nos activités de marketing en suivant leur navigation sur le site, collecter de l’information sur leurs préférences et gérer les formulaires présent sur le site. Ce cookie donne un ID au visiteur du site web dans le but de le reconnaître. Expiration du cookie à la fin de la session
mtc_sid	session	Ce sont des cookies tiers utilisés par Mautic qui nous permettent d’utiliser le service Mautic. Nous utilisons Mautic pour améliorer notre compréhension des attentes de nos lecteurs, leurs proposées des contenus et événements les plus pertinents, soutenir nos activités de marketing en suivant leur navigation sur le site, collecter de l’information sur leurs préférences et gérer les formulaires présent sur le site. Ce cookie donne un ID à la session du visiteur du site, afin de la reconnaître. Expiration du cookie à la fin de la session

Cookie	Durée	Description
YSC	session	Ce cookie est un cookie de Youtube qui enregistre un identifiant unique pour conserver des statistiques sur les vidéos de YouTube que l'utilisateur a vues.
_first_pageview	10 minutes	Ce cookie de session est créé lors du premier affichage de page pour chaque visite. Sa finalité est de permettre de n'afficher certains éléments du code que lors du premier affichage de la page, et rendre le site ainsi plus rapide.
_gat	1 minute	Ce cookie est un cookie de Google Analytics permettant de limiter la cadence des requêtes. Il est valide pendant 24 heures après la date de la session.

Cookie	Durée	Description
IDE	1 year 24 days	Used by Google DoubleClick and stores information about how the user uses the website and any other advertisement before visiting the website. This is used to present users with ads that are relevant to them according to the user profile.
NID	6 months	This cookie is used to a profile based on user's interest and display personalized ads to the users.
VISITOR_INFO1_LIVE	5 months 27 days	This cookie is set by Youtube. Used to track the information of the embedded YouTube videos on a website.

Cookie	Durée	Description
ARRAffinitySameSite	session	No description
attribution_user_id	1 year	No description
cg_uuid	1 year	Sets a unique ID for the visitor, that allows third party advertisers to target the visitor with relevant advertisement. This pairing service is provided by third party advertisement hubs, which facilitates real-time bidding for advertisers.
cilSessionId_e6aa0e1dbf	1 day	No description
cilSessionId_efcc418067	1 day	No description
cilSessionId_ffd7baf9a1	1 day	No description
cookielawinfo-checkbox-others	1 year	No description
PagePeeker		No description
recs_17b347eba0c893c4ff49a469be629e65	past	No description
scid	past	No description
sdx	past	No description
su_sdx	past	No description
su_sid	past	No description
su_user_id	past	No description
thirdparty	1 hour	No description
ubpv	6 months 1 day	No description
ubrs		No description
ubvs	5 months 27 days	No description
ubvt	3 days	No description
UID	2 years	No description

Les rubriques

Alliancy Connect

Contenu