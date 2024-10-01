Mistral AI a été cofondé en avril 2023 par Arthur Mensch, ancien de Google DeepMind, aux côtés de Guillaume Lample et Timothée Lacroix, anciens de Meta AI. Les cofondateurs, qui se sont rencontrés lors de leurs études à l’École polytechnique en banlieue parisienne, ont baptisé leur entreprise en référence au puissant vent du nord-ouest qui souffle du sud de la France jusqu’à la Méditerranée. En termes de valorisation, en juin 2024, l’entreprise française était la plus grande startup d’IA en Europe et en dehors de la région de la baie de San Francisco.1

Chez DeepMind, Mensch était l’un des principaux auteurs de l’article fondateur intitulé « Training Compute-Optimal Large Language Models ». Le document et le modèle « Chinchilla » qui y était présenté exploraient les lois de mise à l’échelle des LLM et plusieurs découvertes très influentes concernant la relation entre la taille du modèle, les données d’entraînement, l’efficacité et les performances des modèles de langage autorégressifs. Chez Meta, Lacroix et Lample faisaient partie des chercheurs à l’origine des modèles originaux LLaMa.

L’expertise combinée des cofondateurs en matière d’efficacité et de développement de LLM a permis de développer une série de modèles principalement open source dont les performances n’ont souvent rien à envier à celles de LLM beaucoup plus grands. Parmi les premières contributions les plus notables de l’entreprise européenne au développement de l’IA générative figuraient les innovations dans les modèles de mélange d’experts (MoE) épars.

Sa mission déclarée implique un « engagement fort en faveur de solutions ouvertes, portables et personnalisables, et une attention particulière portée à la livraison des technologies les plus avancées dans un délai limité ».