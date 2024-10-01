Mistral AI wurde im April 2023 von Arthur Mensch, ehemals Google DeepMind, zusammen mit Guillaume Lample und Timothée Lacroix, ehemals Meta AI, gegründet. Die Mitbegründer, die sich ursprünglich während ihres Studiums an der École Polytechnique in einem Vorort von Paris kennengelernt hatten, benannten ihr Unternehmen nach dem starken Nordwestwind, der von Südfrankreich ins Mittelmeer weht. Gemessen an der Bewertung war das französische Unternehmen im Juni 2024 das größte KI-Startup in Europa und das größte außerhalb der San Francisco Bay Area.1

Bei DeepMind war Mensch einer der Hauptautoren des wegweisenden Papiers „Training Compute-optimal Large Language Models“. Das Papier und das darin vorgestellte „Chinchilla“ -Modell erkundeten Skalierungsgesetze für LLMs und stellten mehrere sehr einflussreiche Entdeckungen in Bezug auf die Beziehung zwischen Modellgröße, Trainingsdaten, Effizienz und Leistung für autoregressive Sprachmodelle vor. Bei Meta gehörten Lacroix und Lample zu den Forschern, die hinter den ursprünglichen LLaMa-Modellen standen.

Das kombinierte Fachwissen der Mitbegründer in den Bereichen Effizienz und LLM-Entwicklung hat eine Reihe von meist Open-Source-Modellen hervorgebracht, deren Leistung oft mit der von deutlich größeren LLMs übereinstimmt. Zu den bemerkenswertesten frühen Beiträgen des europäischen Unternehmens zur Entwicklung generativer KI gehörten Innovationen im Bereich der geringen Mixture-of-Experts-Modelle (MoE).

Die erklärte Mission umfasst ein „starkes Engagement für offene, portable und anpassbare Lösungen sowie einen extremen Fokus darauf, die fortschrittlichste Technologie in begrenzter Zeit auf den Markt zu bringen“.