Rilis ChatGPT 2 tahun lalu membuka babak baru dalam AI, didorong oleh model bahasa besar dengan ukuran dan kompleksitas yang belum pernah terjadi sebelumnya. Model-model ini sekarang menjadi kekuatan utama dalam riset dan bisnis, tetapi banyak dari mereka tidak merilis data mereka, resep perdagangan lengkap, atau pos pemeriksaan mereka. Di situlah organisasi nirlaba Allen Institute for Artificial Intelligence (Ai2) masuk. Ai2 dimulai pada tahun 2014, didirikan oleh salah satu pendiri Microsoft Paul Allen. Kelompok riset ini bekerja pada model bahasa, model multimodal, dan kerangka kerja evaluasi dalam sumber terbuka.

Baru-baru ini, Ai2 merilis Molmo, keluarga model AI multimodal canggih yang bertujuan untuk secara signifikan menutup kesenjangan antara sistem terbuka dan berpemilik. “Bahkan model kami yang lebih kecil mengungguli pesaing 10x ukurannya,” kata Ai2.

Sebelumnya pada bulan September, Ai2 merilis OlmoE, campuran model pakar dengan 1 miliar parameter aktif dan 7 miliar total parameter yang dikembangkan bersama dengan AI Kontekstual. Itu dilatih pada 5 triliun token dan dibangun di atas campuran data baru yang menggabungkan pelajaran dari Dolma Ai2.

Kami berbicara dengan Hanna Hajishirzi, Direktur Senior Penelitian NLP di Ai2, setelah keynote di Konferensi PyTorch di San Francisco untuk membahas model sumber terbuka dan literasi AI.