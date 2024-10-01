Mistral AI fue cofundada en abril de 2023 por Arthur Mensch, antes de Google DeepMind, junto con Guillaume Lample y Timothée Lacroix, antes de Meta AI. Los cofundadores, que se conocieron originalmente mientras estudiaban en la École Polytechnique en los suburbios de París, nombraron a su empresa por el fuerte viento del noroeste que sopla desde el sur de Francia hacia el Mediterráneo. Por valoración, la empresa francesa era la startup de IA más grande de Europa y la más grande fuera del Área de la Bahía de San Francisco, a junio de 2024.1

En DeepMind, Mensch fue uno de los autores principales del artículo seminal "Training compute-optimal large language models". El documento, y el modelo "Chinchilla" presentado en él, exploraron las leyes de escala para los LLM e introdujeron varios descubrimientos muy influyentes con respecto a la relación entre el tamaño del modelo, los datos de entrenamiento, la eficiencia y el rendimiento de los modelos de lenguaje autorregresivos. En Meta, Lacroix y Lample estuvieron entre los investigadores detrás de los modelos originales de LLaMa.

La experiencia combinada de los cofundadores en eficiencia y desarrollo de LLM ha producido una variedad de modelos de código abierto, en su mayoría, cuyo rendimiento a menudo coincide con el de LLM significativamente más grandes. Entre las primeras contribuciones más notables de la empresa europea al desarrollo de la IA generativa se encuentran las innovaciones en los modelos de mixture of experts (MoE).

Su misión declarada implica un "fuerte compromiso con las soluciones abiertas, portátiles y personalizables, y un enfoque extremo en el envío de la tecnología más avanzada en un tiempo limitado".