Il rilascio di ChatGPT due anni fa ha aperto un nuovo capitolo nell'AI, guidato da grandi modelli linguistici di dimensioni e complessità senza precedenti. Questi modelli sono ora una forza trainante nella ricerca e nel business, ma molti di essi non rilasciano i propri dati, la ricetta completa del trading o i loro checkpoint. Ed è qui che entra in gioco l'organizzazione no-profit Allen Institute for Artificial Intelligence (Ai2). Ai2 è nata nel 2014, fondata dal cofondatore di Microsoft Paul Allen. Il gruppo di ricerca lavora su modelli linguistici, modelli multimodali e framework di valutazione open source.

Di recente, Ai2 ha rilasciato Molmo, una famiglia di modelli AI all'avanguardia con l'obiettivo di colmare significativamente il divario tra sistemi aperti e proprietari. "Anche i nostri modelli più piccoli superano in prestazioni i concorrenti 10 volte più grandi", afferma Ai2.

All'inizio di settembre, Ai2 ha rilasciato OlmoE, un modello mixture of experts con 1 miliardo di parametri attivi e 7 miliardi totali, sviluppato insieme a Contextual AI. È stato addestrato su 5 trilioni di token e basato su un nuovo mix di dati che incorpora lezioni tratte da Dolma di Ai2.

Abbiamo parlato con Hanna Hajishirzi, Senior Director of NLP Research di Ai2, dopo il suo intervento alla conferenza PyTorch di San Francisco, per discutere di modelli open source e di alfabetizzazione AI.