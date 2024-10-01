A Mistral IA foi cofundada em abril de 2023 por Arthur Mensch, anteriormente da Google DeepMind, ao lado de Guillaume Lample e Timothée Lacroix, anteriormente da Meta AI. Os cofundadores, que se conheceram originalmente enquanto estudavam na École Polytechnique nos subúrbios de Paris, nomearam sua empresa em homenagem ao forte vento oeste que sopra do sul da França para o Mediterrâneo. Em avaliação, a empresa francesa era a maior startup de IA da Europa e a maior fora da área da Baía de São Francisco em junho de 2024.1

Na DeepMind, Mensch foi um dos principais autores do artigo seminal "Treinamento de grandes modelos de linguagem ideais para computação". O artigo, e o modelo "Chinchilla" nele apresentado, exploraram leis de escalonamento para LLMs e introduziram várias descobertas altamente influentes quanto à relação entre tamanho do modelo, dados de treinamento, eficiência e desempenho para modelos de linguagem autorregressivos. Na Meta, Lacroix e Lample estavam entre os pesquisadores por trás dos modelos originais do LLaMa.

A experiência combinada dos cofundadores em eficiência e desenvolvimento de LLMs resultou em uma série de modelos principalmente de código aberto cujo desempenho geralmente corresponde ao de LLMs significativamente maiores. Entre as contribuições iniciais mais notáveis da empresa europeia para o desenvolvimento da IA generativa estavam inovações em modelos de mixture of experts (MoE) esparsos.

Sua missão declarada envolve um "forte compromisso com soluções abertas, portáteis e personalizáveis, e um foco extremo em enviar a tecnologia mais avançada em tempo limitado".