Je n’ai pas immédiatement compris quelle était précisément l’intention des auteurs de ce livre. Mais je l’ai lu avec intérêt et j’y ai appris beaucoup. Surtout, il m’a ouvert un vaste champ de réflexion lié à un phénomène brûlant, les big data. Tout cela en ne mentionnant ce terme qu’une seule fois…
Le livre est construit autour d’un argument a priori très mince : l’existence d’un corpus de cinq millions de livres numérisés par Google et quelques universités. Cette numérisation s’accompagne d’un outil à disposition de tous, le « n-gram viewer ». Il permet de visualiser sous forme de courbe la fréquence d’utilisation d’un mot – année par année et sur plus de deux siècles – parmi ce très vaste ensemble de 500 milliards de mots.
Comme l’affirment les auteurs, « cette sorte de microscope de l’usage linguistique offre des possibilités totalement nouvelles pour observer et comprendre les phénomènes culturels » La taille de cette base de données met ainsi en lumière des évolutions d’usage de mots et expressions qui échappent à « l’œil nu » du chercheur.
Cette façon de procéder a un nom : la « Culturomique », de l’anglais Culturomics, qui donne son titre à l’ouvrage. « Culturomique » pour cette « science numérique de la culture » que Jean-Paul Delahaye et Nicolas Gauvrit nous invitent à découvrir. L’un est professeur à l’Université de Lille et chercheur en informatique. Le second enseigne les mathématiques à l’université d’Artois et s’intéresse particulièrement aux liens entre mathématiques et psychologie.
Un appel au sens critique
Cette découverte se fait chapitre après chapitre via de grandes digressions sur la « psychologie et la littérature », la problématique de « la notoriété des chercheurs » ou encore de « l’étrange usage des chiffres et des nombres ». On y découvre bien des choses, mais qui semblent souvent n’avoir aucun lien avec le sujet. Déconcertant… Même si l’ouvrage est abondamment illustré de courbes d’évolution d’usage de mots ou d’expressions.
Et puis, on finit par découvrir ce qui est sans doute la motivation profonde des auteurs : montrer que la « Culturomique » est un outil magique mais à manier avec grande précaution. Ils l’écrivent d’ailleurs dès l’avant-propos : l’outil permet des avancées remarquables, « à condition de faire preuve d’une grande prudence et d’un méticuleux sens critique. » En effet, la « Culturomique » met en évidence des phénomènes avec une facilité déconcertante.
Il est alors très tentant d’en tirer des conclusions définitives et… totalement imbéciles. Tentant car extrêmement facile. Imbéciles car une chose est de faire apparaître des phénomènes, une autre est de savoir les analyser et les comprendre, ce qui réclame un immense travail et requiert de nombreuses connaissances.
Les auteurs soulèvent ainsi, même à peine évoqué, le problème des big data. Faute d’une analyse solide des résultats des traitements de données massives, le risque est immense de prendre des vessies pour des lanternes. Le pire n’est jamais loin du meilleur…
Culturomics, le numérique et la culture,
de Jean-Paul Delahaye et Nicolas Gauvrit.
Ed. Odile Jacob, mars 2013, 224 pages, 22,90 €.
Cet article est extrait du n°4 d’Alliancy le mag – Découvrir l’intégralité du magazine