EuroLLM, un modèle de langage européen conforme aux exigences de l’Union

Développé dans les laboratoires de l’Université Paris-Saclay, le modèle de langage (LLM) issu du projet européen EuroLLM, serait capable de rivaliser avec les modèles internationaux et permettrait à l’Union européenne de disposer d’une IA respectueuse de ses valeurs et conforme à ses réglementations.

Publié et mis à jour le 26 décembre 20242 min de lecture
EuroLLM, un modèle de langage européen conforme aux exigences de l’Union

Pour les chercheurs à l’origine de son développement, EuroLLM, dans sa dernière version 9B, est sans nul doute le modèle de langage le plus avancé de sa catégorie sur le Vieux continent. Conçu par le laboratoire MICS de l’université Paris-Saclay, et avec la participation de nombreuses universités européennes, le projet collaboratif marque une grande étape dans l’objectif de souveraineté des Etats membres en matière d’IA Générative. Entraîné uniquement avec des données publiques, pour garantir la reproductibilité des résultats, EuroLLM-9B est disponible en open source mais aussi en open weight, où seuls les paramètres ou les poids pré-entraînés du modèle de réseau neuronal sont rendus publics. Pour le Dr Pierre Colombo, expert international en LLMs et membre de l’équipe de recherche, “ce modèle de langage multilingue rivalise avec les approches internationales les plus performantes.”

Un modèle multimodal européen à venir

Mais, surtout, la transparence des modèles étant une valeur chère à l’UE, l’équipe de recherche publiera prochainement un nouveau rapport technique qui détaillera les choix de données, les configurations de modélisation, ainsi que les orientations futures pour le développement d’une nouvelle génération de modèles linguistiques européens. Dans les faits, le LLM a été entraîné sur les 24 langues officielles de l’Union européenne ainsi qu’un ensemble de 11 autres langues stratégiques et commercialement importantes, parmi lesquelles l’arabe, le catalan, le chinois, le galicien, l'hindi, le japonais, le coréen, le norvégien, le russe, le turc et l’ukrainien. Les résultats sont particulièrement remarquables en traduction multilingue, où EuroLLM-9B surpasse des modèles de référence tels que Gemma-2-9B–IT ou Aya-expanse-8B. Le projet de recherche, qui a pour but de réduire la dépendance à des modèles principalement centrés sur l’anglais, s’est vu attribuer une bourse pour le développer davantage. Le consortium de supercalculateurs EuroHPC a alloué 5 millions d’euros au projet afin de créer un modèle multimodal européen d'intelligence artificielle.

Autres articles

La course mondiale à l'IA change d'échelle, des datacenters spatiaux à Wall Street

REVUE EXPRESS'

La course mondiale à l'IA change d'échelle, des datacenters spatiaux à Wall Street

Cette semaine, la Chine mise sur des datacenters en orbite, Qualcomm défie Nvidia sur l'IA pour datacenters, tandis qu'OpenAI et Anthropic préparent leur entrée en Bourse.

Une édition consacrée aux alliances et à la souveraineté

spécial vivatech 2026

Une édition consacrée aux alliances et à la souveraineté

Innovations, intelligence artificielle et souveraineté numérique, retrouvez dans ce dossier spécial consacré à VivaTech les temps forts de l'édition 2026.

La souveraineté numérique face au fantasme des frontières technologiques 

ADOPTION TECHNOLOGIQUE

La souveraineté numérique face au fantasme des frontières technologiques 

Industriels et responsables publics du G7 s’accordent sur une souveraineté numérique fondée sur l'adoption, l'industrie et la coopération plutôt que sur l'autosuffisance technologique. 

Les DSI français attendent davantage de l’IA et des systèmes d’entreprise

ARTICLE PARTENAIRE

Les DSI français attendent davantage de l’IA et des systèmes d’entreprise

Une nouvelle étude indépendante commanditée par Rimini Street, spécialiste du support informatique, révèle que les dirigeants français subissent une pression croissante pour accélérer l’innovation grâce à l’IA, tout en devant faire face à la hausse des coûts informatiques, à la pénurie de talents et à l’intensification des menaces de cybersécurité.

Certains LLM chaud ! Nos algorithmes ont la clim, pas nous

humeur

Certains LLM chaud ! Nos algorithmes ont la clim, pas nous

Pendant que la France tente de ne pas céder à la "panicule", les modèles d'IA tournent, eux, plutôt sereinement : data centers sous tension, réseau testé, télétravail en débat.