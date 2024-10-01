Mistral AI fue fundada en abril de 2023 por Arthur Mensch, anteriormente de Google DeepMind, junto con Guillaume Lample y Timothée Lacroix, anteriormente de Meta AI. Los cofundadores, que se conocieron originalmente mientras estudiaban en la École Polytechnique, en las afueras de París, bautizaron a su empresa por el fuerte viento del noroeste que sopla desde el sur de Francia hacia el Mediterráneo. Según su valoración, la empresa francesa era la mayor startup de IA de Europa y la mayor fuera del área de la bahía de San Francisco, en junio de 20241.

En DeepMind, Mensch fue uno de los autores principales del influyente artículo, “Training compute-optimal large language models”. El artículo, y el modelo "Chinchilla" presentado en él, exploraban las leyes de escalabilidad de los LLM e introducían varios descubrimientos muy influyentes sobre la relación entre el tamaño del modelo, los datos de entrenamiento, la eficiencia y el rendimiento de los modelos lingüísticos autorregresivos. En Meta, Lacroix y Lample estaban entre los investigadores detrás de los modelos originales de LLaMa.

La experiencia combinada de los cofundadores en eficiencia y desarrollo de LLM ha dado lugar a una serie de modelos, en su mayoría de código abierto, cuyo rendimiento suele equipararse al de LLM significativamente más grandes. Entre las primeras contribuciones más notables de la empresa europea al desarrollo de la IA generativa se encuentran las innovaciones en los modelos de mezcla de expertos (MoE) dispersos.

Su misión declarada implica un "fuerte compromiso con las soluciones abiertas, portátiles y personalizables, y un enfoque extremo en el envío de la tecnología más avanzada en un tiempo limitado".