Le combat pour l’IA passera par l’open source, chinois ou non

 

L’innovation vient de la contrainte. Or, la guerre que se livrent les États-Unis et la Chine sur l’intelligence artificielle ne va pas sans en générer quelques-unes.

 

Les sanctions et limitations imposées aux entreprises chinoises par l’administration américaine, d’abord celle de Biden, puis dorénavant celle de Trump, visent, entre autres, à empêcher des entreprises de l’Empire du Milieu de venir concurrencer les leaders nationaux, comme OpenAI et Anthropic, en leur coupant l’accès aux puces les plus utilisées pour « motoriser » l’IA. 

Las ! La start-up chinoise DeepSeek a commencé à attirer l’attention en décembre dernier avec la sortie de son modèle DeepSeek V3. Et l’annonce de son nouveau modèle R1 il y a quelques jours a été un coup de pied dans la fourmilière, entraînant des pertes importantes en bourse sur le Nasdaq (le principal indice technologique américain), en particulier pour l’action Nvidia, qui a vu près de 600 milliards de dollars s’évaporer dans sa chute : un record. 

Selon le document technique, DeepSeek a notamment utilisé un cluster de moins de 2 050 puces Nvidia H800 pour entraîner son modèle V3 — une version moins puissante de la puce star H100, mais que le fabricant est autorisé à vendre aux entreprises chinoises. Ce cluster est beaucoup plus petit que les dizaines de milliers de puces utilisées par les entreprises américaines pour entraîner des modèles de taille similaire. De quoi faire dire à la start-up que les coûts induits par son approche sont très largement inférieurs à ceux des géants américains, mais aussi alimenter les soupçons de contournement des sanctions. Avec de nombreux effets de bord : l’administration américaine a ainsi lancé une évaluation du risque sur la sécurité nationale, tandis qu’OpenAI et Microsoft ont fait part de leur propre enquête sur un abus d’utilisation des API d’OpenAI qui aurait permis de « nourrir » DeepSeek de manière frauduleuse. 

Dans la foulée, un autre champion chinois, Alibaba Cloud, a publié une nouvelle version de son modèle Qwen2.5-Max, annonçant qu’il surpassait ses principaux concurrents open source, que ce soit le modèle V3 de DeepSeek ou le Llama 3.1 de l’américain Meta. L’entreprise a également mis en avant que son modèle égalait ceux « fermés et propriétaires » d’OpenAI (GPT-4) et d’Anthropic (Claude 3.5 Sonnet). 

Au-delà de la forte tension géopolitique qu’illustre ce bras de fer entre les mondes de la tech américaine et chinoise, c’est la lutte entre modèles open source et fermés qui est sans doute l’un des développements les plus captivants de ces successions d’annonces. Les approches open source lancent en effet un défi aux leaders en place et à leurs méthodologies « conventionnelles ». Le choc « DeepSeek R1 » est donc aussi à voir comme une incarnation des nouvelles tendances de fond du développement de l’IA, pour lequel de plus en plus d’acteurs veulent donner la priorité aux solutions open source. 

Des choix qui n’ont rien d’anodin : les questionnements sur les dépendances technologiques auxquelles sont confrontées toutes les organisations ne font que se renforcer d’année en année et, avec eux, les espoirs placés dans ces réponses open source. Maîtrise, transparence, adaptabilité… les arguments mis en avant sont nombreux et séduisants. Dans la course à l’IA, il reste encore à apporter la preuve que ces atouts seront bien au rendez-vous pour les usages quotidiens des entreprises. 

Sans présager du futur des modèles de DeepSeek ou d’Alibaba Cloud, on notera tout de même à quel point l’ironie est grande de voir ce nouveau coup de projecteur sur le combat open source venir d’entreprises chinoises. On aurait pu espérer mieux, en termes de parangons d’indépendance, de transparence et de liberté. 

 

Pour lire en avant-première les prochains éditos de la rédaction, abonnez-vous à notre newsletter à paraître chaque vendredi !