Au-delà de la technique : vers une analyse éthique des données dans l’Industrie du Futur

Notre chroniqueur invité Imed Boughzala décrit les changements nécessaires dans l’analyse et la manipulation des données pour aller vers une « industrie du futur responsable ». Il souligne la diversité des cas d’usages concernés.

Dans cette chronique je souhaite revenir sur l’industrie du futur responsable, concept clé pour la réindustrialisation de la France, et plus particulièrement sur l’importance de la manipulation des données à travers les différents technologies et objets connectés (IoT, jumeau numérique, cloud…).

En effet, le monde industriel évolue rapidement (Industrie 4.0 vers le 5.0), entraîné par les avancées technologiques et l’essor de l’analyse des données (Data analytics). Dans l’étude de l’intelligence digitale, pour une transformation digitale réussie qui se veut data-driven, je souhaite ici apporter une perspective complémentaire en mettant l’accent sur l’importance cruciale de l’analyse éthique des données. Alors que les discussions peuvent naturellement se concentrer sur les aspects techniques, il est impératif de considérer la responsabilité, la transparence et la diversité des cas d’usage pour garantir une intégration efficace de l’analyse des données dans les secteurs industriels. Le périmètre de l’analyse éthique des données dans l’industrie du futur englobe l’ensemble du cycle de vie des données, de leur collecte à leur destruction en passant par leur traitement – analyse, modélisation, interprétation…

Voici quelques éléments clés du périmètre de cette analyse :

  1. Collecte des données : Cela inclut les méthodes et les pratiques utilisées pour collecter les données de qualité. Les critères de la qualité des données sont : cohérence, exactitude, exhaustivité, auditabilité, ordre, caractère unique, actualité. Il est crucial de s’assurer que la collecte est légale, transparente et respectueuse de la vie privée des individus (RGPD). Cela implique également de prendre en compte la diversité et la véracité des sources de données et de s’assurer qu’elles ne sont pas biaisées.
  2. Traitement des données : Une fois collectées, les données doivent être traitées de manière éthique (nettoyage, anonymisation…). Cela comprend la garantie de la qualité des données, la protection contre la manipulation ou la falsification, ainsi que la prise en compte des implications éthiques de l’analyse et de la modélisation des données.
  3. Analyse, modélisation et simulation : L’analyse des données doit être réalisée de manière éthique, en évitant les biais injustes et en garantissant la transparence des méthodes utilisées (statistiques, régression, réseaux de neurones, algorithmes IA …). Il est important de prendre en compte la diversité des cas d’usage (selon les étapes du processus ou de la chaine de valeur, les métiers, les domaines, les secteurs…) et de s’assurer que les résultats de l’analyse ne contribuent pas à perpétuer les inégalités ou les discriminations existantes (genre, race, croyances, communauté…).
  4. Interprétation, visualisation et prise de décision : Les résultats de l’analyse des données doivent être interprétés avec prudence, en reconnaissant les limites et les incertitudes associées aux données et aux modèles. Les décisions basées sur ces analyses doivent être prises de manière responsable, en prenant en compte les valeurs éthiques et les implications sociales.
  5. Responsabilité et gouvernance : Il est essentiel d’établir des mécanismes de responsabilité et de gouvernance pour superviser et réglementer l’utilisation des données dans l’industrie du futur. Cela peut inclure la mise en place de cadres réglementaires, de normes éthiques et de processus de contrôle de la conformité et de sécurisation.
  6. Diversité et inclusion : Enfin, l’analyse éthique des données doit prendre en compte la diversité et l’inclusion dans tous les aspects du processus, de la collecte à l’interprétation des données. Cela implique de garantir la représentation équitable des différentes populations dans les ensembles de données (échantillonnage, représentativité, classification, clustering…), ainsi que la prise en compte des perspectives et des besoins des groupes marginalisés ou sous-représentés.

La responsabilisation dans l’analyse des données

L’analyse des données peut fournir des informations puissantes (parfois dangereuses –lorsqu’il s’agit de la santé voire, du génome humain), mais cela s’accompagne d’une responsabilité accrue. Il est essentiel d’instaurer des pratiques éthiques tout au long du processus de manipulation des données. Cela englobe la transparence dans les méthodes utilisées, la protection de la vie privée des individus, et la prise en compte des implications sociales et environnementales des résultats obtenus. En plaçant la responsabilité au cœur de l’analyse des données, nous nous assurons que les bénéfices tirés de cette discipline ne se font pas au détriment de l’éthique. Les comités d’éthique jouent ici un rôle important au niveau des organisations, des corps de métiers ou encore des Etats.

La diversité des cas d’usage

Une approche éthique doit également tenir compte de la diversité des cas d’usage de l’analyse des données. Les implications de cette technologie ne se limitent pas uniquement aux aspects opérationnels, mais s’étendent également aux domaines sociaux et culturels (dont la culture métier). Il est crucial de considérer comment les résultats de l’analyse des données peuvent affecter différents groupes de la société, en s’assurant qu’ils ne renforcent pas les inégalités existantes. L’intégration de perspectives diverses dans la conception des modèles et des algorithmes contribue à éviter les biais indésirables et à créer des solutions plus inclusives. En effet, d’un contexte organisationnel à un autre, d’un secteur à un autre ou encore d’un pays à un autre, les enjeux liés à cette analyse de données pourraient être différents en termes de durabilité/conservation, de criticité, de confidentialité, de stockage, de sécurité… Les données manipulées dans le monde de la santé ou de la génomique, par exemple, ne représentent pas la même criticité que des données dans le secteur du transport public ou encore de l’automobile.

Analyse de données et transition écologique

L’analyse des données joue aussi un rôle crucial dans la transition écologique en fournissant des informations précieuses pour comprendre les impacts environnementaux des activités humaines et en identifiant les stratégies les plus efficaces pour atténuer ces impacts. En utilisant des techniques telles que l’analyse de données massives (Big data), l’apprentissage automatique ou Machine Learning (supervisé et non supervisé) et la modélisation prédictive, les experts peuvent analyser de vastes ensembles de données environnementales. Ils peuvent ainsi détecter les tendances, identifier les sources de pollution, évaluer les risques environnementaux et élaborer des solutions durables. Par exemple, les données sur la consommation d’énergie peuvent être analysées pour identifier les secteurs à fort impact énergétique et développer des stratégies de conservation. De même, l’analyse des émissions de gaz à effet de serre peut aider à évaluer l’efficacité des politiques climatiques et à orienter les investissements vers des technologies plus propres. En intégrant des considérations éthiques telles que la protection de la vie privée et l’équité sociale dans l’analyse des données environnementales, nous pouvons garantir que la transition écologique se déroule de manière juste et inclusive, en tenant compte des besoins des populations les plus vulnérables et en préservant les écosystèmes fragiles de notre planète.

Réconcilier l’éthique et la technicité

In fine, l’éthique et la technicité ne sont pas mutuellement exclusives. Au contraire, elles se renforcent mutuellement. Les professionnels de l’industrie doivent être formés non seulement sur les aspects techniques de l’analyse des données, mais aussi sur les principes éthiques qui sous-tendent cette discipline. Cela implique un engagement continu dans le développement des compétences éthiques, la sensibilisation aux enjeux éthiques émergents et la création de cultures organisationnelles qui valorisent l’intégrité et la responsabilité dans le domaine de la Data au-delà des rôles dédiés comme le Data analyst, Data scientist ou Chief Data Officer.

En conclusion, l’analyse éthique des données élargit la perspective de l’analyse au sens technique (descriptive[1], exploratoire/explicative[2], prédictive[3] et prescriptive[4]) en apportant une réflexion critique sur la responsabilité et la diversité des cas d’usage. En intégrant ces éléments, nous pouvons élaborer des recommandations pratiques qui guideront la main-d’œuvre industrielle vers un avenir où les compétences techniques et éthiques sont conjointement valorisées. Ce n’est qu’en embrassant cette dualité, que l’industrie pourra véritablement maîtriser l’analyse des données de manière durable et éthique. Pour aller plus loin, un Mooc de l’Institut Mines Télécom développé par son école de management IMT-BS sur l’intelligence des données a été publié dans les deux versions française et anglaise en 2023 sur la plateforme Coursera et financé par la Fondation Mines-Télécom. Par ailleurs, l’IMT fait partie de l’alliance franco-allemande de l’Industrie du futur. Au sein de son projet « Osons l’Industrie du futur » un groupe de travail s’est penché récemment sur l’analyse éthique des données essentielle. Il s’agit d’accompagner les métiers industriels et les PME dans la prise de conscience des risques et des points de vigilance liés aux applications pour ce type d’analyse, et aussi dans l’identification des compétences nécessaires à développer dans les entreprises.

[1] qui décrit les caractéristiques des données telles qu’elles sont.

[2] qui tente de comprendre les raisons sous-jacentes à un phénomène observé dans les données.

[3] qui utilise les données historiques pour faire des prévisions sur les événements futurs.

[4] qui utilise les données et les algorithmes pour recommander des actions pour atteindre un objectif spécifique.