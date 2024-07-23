Am Dienstag, dem 23. Juli, kündigte Meta die Veröffentlichung der Llama 3.1-Kollektion mehrsprachiger großer Sprachmodelle (LLMs) an. Llama 3.1 umfasst sowohl vortrainierte als auch auf Anweisungen abgestimmte Open-Source-Generative-KI-Modelle für Texteingabe und -ausgabe in Größen von 8 Milliarden, 70 Milliarden und – zum ersten Mal – 405 Milliarden Parametern.

Das instruktionsoptimierte Llama 3.1-405B, das voraussichtlich das größte und leistungsstärkste Open-Source-Sprachmodell heute wird und mit den besten proprietären Modellen auf dem Markt konkurriert, wird auf IBM watsonx®.ai verfügbar sein und kann in der IBM Cloud, in einer Hybrid-Cloud-Umgebung oder lokal eingesetzt werden.

Die Veröffentlichung von Llama 3.1 folgt auf die Einführung der Llama-3-Modelle am 18. April. In der dazugehörigen Ankündigung erklärte Meta, dass „[ihr] Ziel in naher Zukunft darin besteht, Llama 3 mehrsprachig und multimodal zu gestalten, einen längeren Kontext zu bieten und die Gesamtleistung in Bezug auf die LLM-Funktionen wie Schlussfolgerung und Codierung weiter zu verbessern.“

Die heutige Veröffentlichung von Llama 3.1 zeigt deutliche Fortschritte auf dem Weg zu diesem Ziel, von einer drastisch erhöhten Kontextlänge über eine erweiterte Werkzeugnutzung bis hin zu mehrsprachigen Funktionen.