L’entreprise française Mistral AI a annoncé mardi sa première intelligence artificielle multimodale, nommée Pixtral 12B, capable de traiter des images fournies par les utilisateurs.
Une note de blog de la pépite française de l’IA a officialisé son lancement, après la mise en ligne du modèle mercredi. A la différence des modèles publiés précédemment, Pixtral 12B est capable d’assimiler des images fournies par les utilisateurs et d’y détecter du texte, de les analyser et les synthétiser. Selon l’entreprise, tous les formats d’images (type pdf, jpeg, etc.) sont acceptés. Le principe est ainsi différent des intelligences artificielles capables de générer des images à partir de texte, telles que Midjourney. Pixtral 12B est accessible sur le site de Mistral La Plateforme ainsi que via son IA conversationnelle Le Chat, lancée en début d’année.
Une lutte acharnée contre les mastodontes outre-Atlantique
L’entreprise française a également annoncé de nouveaux tarifs pour l’utilisation de ses différents modèles, ainsi qu’une nouvelle version de son modèle Mistral Small. Avec Pixtral 12B, Mistral continue de faire la course auprès des modèles d’IA des mastodontes américains, tels que Chat-GPT4 (OpenAI), Gemini (Google). Créée en avril 2023, Mistral AI, dont les trois fondateurs français sont issus des rangs de Meta (maison mère de Facebook) et de Google, a toujours revendiqué sa volonté de proposer une option alternative aux modèles des grandes entreprises américaines des nouvelles technologies. Le poids lourd du secteur, Microsoft, a investi 15 millions d’euros dans l’entreprise, qui a annoncé en juin une nouvelle levée de fonds de 600 millions d’euros.