Développé dans les laboratoires de l’Université Paris-Saclay, le modèle de langage (LLM) issu du projet européen EuroLLM, serait capable de rivaliser avec les modèles internationaux et permettrait à l’Union européenne de disposer d’une IA respectueuse de ses valeurs et conforme à ses réglementations.
Pour les chercheurs à l’origine de son développement, EuroLLM, dans sa dernière version 9B, est sans nul doute le modèle de langage le plus avancé de sa catégorie sur le Vieux continent. Conçu par le laboratoire MICS de l’université Paris-Saclay, et avec la participation de nombreuses universités européennes, le projet collaboratif marque une grande étape dans l’objectif de souveraineté des Etats membres en matière d’IA Générative. Entraîné uniquement avec des données publiques, pour garantir la reproductibilité des résultats, EuroLLM-9B est disponible en open source mais aussi en open weight, où seuls les paramètres ou les poids pré-entraînés du modèle de réseau neuronal sont rendus publics. Pour le Dr Pierre Colombo, expert international en LLMs et membre de l’équipe de recherche, “ce modèle de langage multilingue rivalise avec les approches internationales les plus performantes.”
Un modèle multimodal européen à venir
Mais, surtout, la transparence des modèles étant une valeur chère à l’UE, l’équipe de recherche publiera prochainement un nouveau rapport technique qui détaillera les choix de données, les configurations de modélisation, ainsi que les orientations futures pour le développement d’une nouvelle génération de modèles linguistiques européens. Dans les faits, le LLM a été entraîné sur les 24 langues officielles de l’Union européenne ainsi qu’un ensemble de 11 autres langues stratégiques et commercialement importantes, parmi lesquelles l’arabe, le catalan, le chinois, le galicien, l’hindi, le japonais, le coréen, le norvégien, le russe, le turc et l’ukrainien. Les résultats sont particulièrement remarquables en traduction multilingue, où EuroLLM-9B surpasse des modèles de référence tels que Gemma-2-9B–IT ou Aya-expanse-8B. Le projet de recherche, qui a pour but de réduire la dépendance à des modèles principalement centrés sur l’anglais, s’est vu attribuer une bourse pour le développer davantage. Le consortium de supercalculateurs EuroHPC a alloué 5 millions d’euros au projet afin de créer un modèle multimodal européen d’intelligence artificielle.