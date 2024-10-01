Mistral AI didirikan pada April 2023 oleh Arthur Mensch, yang sebelumnya bekerja di Google DeepMind, bersama dengan Guillaume Lample dan Timothée Lacroix, yang sebelumnya bekerja di Meta AI. Para pendiri, yang awalnya bertemu saat belajar di École Polytechnique di pinggiran kota Paris, menamai perusahaan mereka dengan nama angin barat laut yang kuat yang bertiup dari Prancis selatan ke Mediterania. Berdasarkan valuasi, perusahaan asal Prancis ini merupakan startup AI terbesar di Eropa dan terbesar di luar San Francisco Bay Area, per Juni 2024.1

Di DeepMind, Mensch adalah salah satu penulis utama makalah penting, “Training compute-optimal large language models”. Makalah tersebut, dan model “Chinchilla” yang diperkenalkan di dalamnya, menjelajahi hukum penskalaan untuk LLM dan memperkenalkan beberapa penemuan yang sangat berpengaruh mengenai hubungan antara ukuran model, data pelatihan, efisiensi, dan kinerja untuk model bahasa autoregresif. Di Meta, Lacroix dan Lample termasuk di antara peneliti di balik model LLaMa asli.

Keahlian gabungan para pendiri dalam efisiensi dan pengembangan LLM telah menghasilkan serangkaian model sumber terbuka yang kinerjanya sering setara dengan LLM yang jauh lebih besar. Di antara kontribusi awal perusahaan Eropa yang paling menonjol untuk pengembangan AI generatif adalah inovasi dalam model sparse Mixture of Experts (MoE).

Misi yang dinyatakannya melibatkan "komitmen yang kuat terhadap solusi yang terbuka, portabel, dan dapat disesuaikan, serta fokus yang ekstrem pada pengiriman teknologi paling canggih dalam waktu yang terbatas."