Mohit Joshi, President d’Infosys, aborde notamment le processus d’extraction des données et comment leur structuration à l’aide de nouveaux modèles d’IA rendent obsolète la métaphore « Les données au XXIe siècle sont le nouvel or noir ».
Et s’il était temps de leur trouver une nouvelle métaphore ? Il y a seize ans, les stratèges d’entreprise ont commencé à considérer les données comme le nouvel or noir. Selon eux, les données, tout comme le pétrole, sont difficiles à extraire et n’ont de valeur qu’une fois structurées. En 2006, pour de nombreuses entreprises mondiales, ces données structurées et de qualité étaient rares et disposaient d’un potentiel comparable à celui du kérosène.
A lire aussi : Avec le XV de France, l’IA entre dans la mêlée
Cette métaphore est dorénavant révolue. L’acquisition et la manipulation des données s’avèrent aujourd’hui relativement plus simples, contrairement au forage du pétrole qui reste techniquement complexe. Le pétrole brut nécessite d’énormes dépenses en capital, des équipements spécialisés et des professionnels qualifiés. La structuration des données présente toujours des difficultés, qu’il s’agisse de réactualiser les données en temps voulu ou de disposer d’une puissance de calcul suffisante. Il est cependant possible d’y parvenir grâce au cloud, à des outils prêts à l’emploi et via des data scientists. C’est irréfutable : en 2023, les données auront besoin d’une bien meilleure métaphore.
Les données ressemblent à l’énergie nucléaire
Les données sont riches en potentiel, nécessitent une manipulation particulière et peuvent devenir sensible si nous en perdons le contrôle. Les données du XXIe siècle ont une longue « moitié de vie ». Le moment de leur utilisation, l’endroit où elles sont utilisées et la manière de les contrôler sont aussi importants que l’endroit où elles sont placées.
Les données sont de l’or, qui n’a pas encore été exploité
Les données représentent une montagne précieuse de matériaux. Sous la couche de terre arable et au-dessus du fondement se trouve un mélange de minéraux dont la valeur varie. Le défi pour l’équipe chargée des données et de l’IA est de localiser et d’extraire l’or tout en laissant le plomb. Comme l’or, les données doivent être transformées à partir de la matière première pour en extraire la valeur. Elles doivent être nettoyées et vérifiées avant que des idées et des enseignements puissent en être tirés.
Les données représentent une nouvelle monnaie
Elles prennent de la valeur lorsqu’elles circulent. Une récente étude a révélé que les entreprises qui importent des données et partagent davantage leurs propres données obtiennent de meilleurs résultats financiers et progressent davantage vers l’exploitation de l’IA à l’échelle de l’entreprise – un objectif crucial pour ¾ des entreprises. Elles reconnaissent que l’économie des données émergente contient un grand potentiel. Mais pas plus tard qu’en 2021, seulement un tiers d’entre elles avaient pris des mesures pour commencer à collaborer avec des partenaires. Pour se doter de la capacité et de la volonté de partager des données entre clients et fournisseurs, les dirigeants d’entreprise doivent repenser les données et leurs relations commerciales.
Le partage des données offre un double avantage
Au XXIe siècle, les données ne sont pas un bien propriétaire, rare et non renouvelable. Les entreprises avisées apprennent qu’un écosystème de partage de données connecté à des partenaires et à des pairs offre de plus grands avantages. La formation et l’amélioration des systèmes d’IA nécessitent des données riches et variées. Ce type de données se trouve souvent au-delà du data lake d’une entreprise. Le partage de données entrantes et sortantes offrent aux entreprises de nouvelles méthodes pour s’assurer qu’elles disposent des bonnes informations pour leurs data scientists et leurs modèles d’IA. Toutes choses étant égales par ailleurs, l’importation de données provenant de tiers et les niveaux élevés de partage de données ont permis d’améliorer les résultats de l’entreprise plus que toute autre action liée aux données ou à l’IA.
D’autre part, un rafraîchissement des données plus proche du temps réel est corrélé à une augmentation des revenus. Néanmoins, il est impératif de mettre en place des vérifications pratiques et stratégiques en matière de données, qui continuent de freiner les entreprises.
Les données sans friction et l’IA doivent encore être peaufinées
Les entreprises s’efforcent d’extraire de la valeur de leurs données et les changements technologiques permettent de nouvelles façons de penser et de travailler avec les données. L’IA n’est pas un concept nouveau. Grâce au cloud et à l’informatique avancée, l’IA s’est démocratisée. Les utilisateurs expérimentés ont ouvert la voie et permettent dorénavant aux entreprises d’agir.
La vérification des données et la puissance de calcul de l’IA représentent les principaux obstacles à la mise en production d’un modèle d’IA. La vérification des données reste également un défi persistant, quelle que soit l’expérience d’une entreprise sur l’utilisation de l’IA. Traiter des données incorrectes ou incomplètes risque drastiquement d’introduire des biais dans les données et les modèles d’IA et, in fine, de produire des résultats inexploitables. Il n’existe pas de solution miracle. Obtenir de bonnes données requiert une certaine discipline et concentration, quelle que soit la vitesse à laquelle l’IA progresse.