Cinq choses à savoir sur le phénomène Deepseek  

 

 

La semaine dernière, la nouvelle intelligence artificielle chinoise et lowcost, Deepseek, a défrayé la chronique dans le monde entier en surpassant, à moindre coût, les performances des grands modèles de langage, le tout en open source. Alors que les entreprises tech dégringolent en bourse, une question se pose : Comment une entreprise inconnue du grand publique a-t-elle pu surpasser Open AI ? Voici tout ce qu’il faut savoir sur cette intelligence artificielle.    

 

 

Deepseek, c’est quoi ? 

 

Réponse aux questions, résolution de problèmes logiques et génération de code, etc., l’outil conversationnel DeepSeek-V3 dispose des mêmes facultés que ChatGPT et,plus impressionnant encore, DeepSeek R1, dédié à la résolution de problèmes Logiques, dépasse les performances de GPT-4. D’ailleurs, cette version avancée est proposée gratuitement, contrairement à ses concurrents outre-Atlantique. Après seulement un an de développement, DeepSeek a atteint des scores semblables aux grand modèles de langage les plus performants des États-Unis. Salm Altman, dirigeant d’Open AI directement touché par l’onde de choc de la nouvelle IA, s’est dit impressionné par les résultats de DeepSeek. Mais, après cette courte phase d’admiration, le géant américain accuse la technologie chinoise de vol et de plagiat, sans quoi elle n’aurait pu égaler leur puissance informatique. 

 

 

D’où vient cette IA ?  

 

DeepSeek est né dans la start-up du même nom à Hangzou, une métropole chinoise réputée pour son écosystème technologique dynamique. À seulement 40 ans, son fondateur, Liang Wenfeng affiche un parcours peu conventionnel. Mathématicien de formation, il fonde en 2015 un fonds d’investissement axé sur l’intelligence artificielle, puis crée un fonds caritatif en 2020. Son expertise financière alliée à une vision technologique innovante est au cœur de l’identité de DeepSeek. Pour Liang Wenfeng, la réussite passe par l’optimisation des ressources plutôt que par une quête de puissance brute. Une approche qui contraste nettement avec celle des géants américains. 

 

 

Quelle est sa particularité ? 

 

Une IA plus performante que les LLM américains avec seulement 2 000 GPU Nvidia : c’est le tour de force réalisé par DeepSeek. Alors que OpenAI utilise plus de 16 000 puces Nvidia pour entraîner ses modèles. Cette prouesse permet à la startup chinoise de produire sa puissance de calcul avec seulement 6 millions de dollars. De quoi remettre en question les sommes colossales dépensées par les investisseurs dans l’IA et faire décliner le prix des actions en bourse. L’efficacité des restrictions américaines sur l’exportation de puces vers la Chine est elle aussi questionnée. Paradoxalement, ces limitations semblent avoir stimulé l’innovation chinoise, poussant les entreprises à optimiser leurs ressources. Le point clé de sa puissance réside dans la façon dont DeepSeek orchestre la collaboration entre ses modèles spécialisés. Plutôt que de centraliser le traitement des données dans un système unique et massif, l’entreprise a développé une architecture distribuée intelligente, activant uniquement les modules pertinents en fonction des besoins spécifiques de chaque tâche. Une optimisation qui remet en question les paradigmes classiques de l’IA. 

 

Une IA gratuite ? 

 

DeepSeek redéfinit les modèles économiques traditionnels. Son interface destinée au grand public est entièrement gratuite, tandis que ses services pour les entreprises affichent des tarifs 10 à 40 fois inférieurs à ceux d’OpenAI. L’entreprise adopte également une approche open source, rendant son code librement accessible. Cela permet à d’autres acteurs de développer leurs propres applications à partir de ses technologies, contribuant ainsi à un écosystème riche et collaboratif. Une stratégie qui contraste fortement avec le modèle de secret industriel privilégié par OpenAI. 

 

 

Quels sont les risques de DeepSeek ? 

 

Les pays occidentaux se posent des questions quant à la politique opaque du traitement des données personnelles. L’Italie a déjà retiré Deepseek des plateformes de téléchargement, une interdiction qui rappelle celle, bien que brève, de ChatGPT en mars 2023. L’entreprise chinoise explique que les données des utilisateurs peuvent être analysées et stockées sur des serveurs chinois pour une durée illimitée. La société de sécurité Wiz a révélé une base de données sensibles DeepSeek non protégée. Aucun code n’a été nécessaire, alors que cette dernière permet un contrôle total des opérations y compris la possibilité d’accéder aux données internes. Toutefois, l’intelligence artificielle peut être installée localement et donc limiter les risques de transmission des données. Une autre question éthique préoccupe les utilisateurs : le traitement des sujets sensibles, du moins aux yeux du parti communiste chinois. L’AFP a posé plusieurs questions à DeepSeek, au sujet des manifestations de la place Tian’anmen, du sort des Ouïghours dans le Xinjiang ou encore de l’indépendance de Taïwan et l’agent conversationnel botte en touche. « Je suis désolé, je ne peux pas répondre à cette question. Je suis un assistant IA conçu pour fournir des réponses utiles et inoffensives ». « Parlons d’autre chose ». En revanche, lorsqu’il s’agit de Trump, DeepSeek l’accuse de « saper les normes démocratiques ».