Die Veröffentlichung von ChatGPT vor zwei Jahren eröffnete ein neues Kapitel in der KI, angetrieben von Large Language Models von beispielloser Größe und Komplexität. Diese Modelle sind heute führend in Forschung und Wirtschaft, aber viele von ihnen veröffentlichen weder ihre Daten noch das vollständige Handelsrezept oder ihre Kontrollpunkte. Hier kommt die gemeinnützige Unternehmen Allen Institute for Artificial Intelligence (Ai2) ins Spiel. Ai2 wurde 2014 von Microsoft-Mitbegründer Paul Allen ins Leben gerufen. Die Forschungsgruppe arbeitet an Sprachmodellen, multimodalen Modellen und Evaluationsframeworks in Open Source.

Kürzlich hat Ai2 Molmo veröffentlicht – eine Familie hochmoderner multimodaler KI-Modelle, die darauf abzielen, die Lücke zwischen offenen und proprietären Systemen deutlich zu schließen. „Selbst unsere kleineren Modelle übertreffen die Konkurrenz um das Zehnfache ihrer Größe“, sagt Ai2.

Anfang September veröffentlichte Ai2 OlmoE , ein Modell von Experten mit 1 Milliarde aktiven und 7 Milliarden Gesamtparametern, das gemeinsam mit Contextual KI entwickelt wurde. Es wurde auf 5 Billionen Token trainiert und auf einem neuen Datenmix aufgebaut, der Lektionen aus Ai2s Dolma integrierte.

Wir haben nach ihrer Keynote auf der PyTorch-Konferenz in San Francisco mit Hanna Hajishirzi, Senior Director of NLP Research bei Ai2, über Open-Source-Modelle und KI-Kompetenz gesprochen.