تأسست Mistral AI في أبريل 2023 على يد Arthur Mensch، الذي كان يعمل سابقًا في Google DeepMind، إلى جانب Guillaume Lample وTimothée Lacroix، اللذَين عمِلا سابقًا في Meta AI. المؤسسون المشاركون، الذين التقوا في الأصل أثناء دراستهم في مدرسة École Polytechnique بضواحي باريس، أطلقوا اسم شركتهم تيمنًا بالرياح الشمالية الغربية القوية التي تهب من جنوب فرنسا إلى البحر الأبيض المتوسط. من حيث التقييم، كانت الشركة الفرنسية أكبر شركة ناشئة في مجال الذكاء الاصطناعي في أوروبا والأكبر خارج منطقة خليج سان فرانسيسكو، اعتبارًا من يونيو 2024.1

في DeepMind، كان Mensch أحد المؤلفين الرئيسيين للورقة الأساسية ، Training compute-optimal large language models". تناولت الورقة البحثية، ونموذج "Chinchilla" الذي قدَّمته، قوانين التحجيم للنماذج اللغوية الكبيرة وطرحت عدة اكتشافات مؤثِّرة جدًا تتعلق بالعلاقة بين حجم النموذج وبيانات التدريب والكفاءة والأداء في النماذج اللغوية ذاتية الانحدار. في Meta، كان كلٌّ من Lacroix وLample من بين الباحثين وراء نماذج LLaMa الأصلية.

أسفرت الخبرة المشتركة للمؤسسين في الكفاءة وتطوير النماذج اللغوية الكبيرة عن مجموعة من النماذج، معظمها مفتوح المصدر، والتي غالبًا ما تضاهي أداء النماذج اللغوية الكبيرة الأكبر حجمًا. من أبرز المساهمات المبكرة للشركة الأوروبية في تطوير الذكاء الاصطناعي التوليدي كانت الابتكارات في نماذج مزيج الخبراء (MoE).

وتتمثل مهمتها المعلنة في "الالتزام القوي بالحلول المفتوحة والقابلة للنقل والتخصيص، مع تركيز شديد على تقديم أكثر التقنيات تقدمًا في وقت محدود".