Na terça-feira, 23 de julho, a Meta anunciou o lançamento da coleção Llama 3.1 de grandes modelos de linguagem (LLMs) multilíngues. O Llama 3.1 inclui modelos de IA generativa de código aberto de texto pré-treinado e ajustado para instruções em tamanhos de 8B, 70B e, pela primeira vez, parâmetros de 405B.

O Llama 3.1-405B, ajustado para instruções, que se considera o maior e mais poderoso modelo de linguagem código aberto disponível atualmente e competitivo com os melhores modelos proprietários do mercado, estará disponível na IBM watsonx.ai™ onde pode ser implementado na IBM Cloud, em um ambiente de nuvem híbrida ou no local.

O lançamento do Llama 3.1 segue o lançamento dos modelos Llama 3 em 18 de abril. No anúncio de lançamento que acompanha, a Meta afirmou que “[seu] objetivo no futuro próximo é tornar o Llama 3 multilíngue e multimodal, ter um contexto mais longo e continuar a melhorar o desempenho geral em todos os recursos de LLM, como raciocínio e codificação”.

O lançamento de hoje do Llama 3.1 demonstra um progresso significativo em direção a esse objetivo, desde o aumento drástico do comprimento do contexto até a expansão do uso de ferramentas e recursos multilíngues.