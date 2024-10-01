Mistral AI è stata fondata nell'aprile 2023 da Arthur Mensch, ex di Google DeepMind, e Guillaume Lample e Timothée Lacroix, ex di Meta AI. I cofondatori, che si sono conosciuti mentre studiavano all'École Polytechnique alla periferia di Parigi, hanno chiamato l'azienda come il forte vento da nord ovest che soffia dal sud della Francia verso il Mediterraneo. Nel giugno 2024, la società francese è stata valutata come la più grande startup di AI in Europa e la più grande al di fuori dell'area della baia di San Francisco.1

Quando lavorava per DeepMind, Mensch è stato uno degli autori del celebre articolo "Training compute-optimal large language models ". Il documento, così come il modello "Chinchilla" che ha introdotto, hanno esplorato le leggi della scalabilità per gli LLM e hanno presentato diverse scoperte molto influenti sulla relazione tra dimensioni del modello, dati di addestramento, efficienza e prestazioni per i modelli linguistici auto-regressivi. Quando lavoravano per Meta, Lacroix e Lample sono stati tra i ricercatori responsabili dei modelli originali LLama.

L'esperienza combinata dei cofondatori nell'efficienza e nello sviluppo degli LLM ha prodotto una serie di modelli per lo più open source, le cui prestazioni spesso corrispondono a quelle di LLM notevolmente più grandi. Tra i contributi più importanti dell'azienda europea allo sviluppo dell'AI generativa ci sono state le innovazioni per vari modelli mixture of experts (MoE).

La sua missione dichiarata prevede un "forte impegno verso le soluzioni aperte, portatili e personalizzabili e un'attenzione estrema alla distribuzione della tecnologia più avanzata in tempi limitati".