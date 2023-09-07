É um momento empolgante para a IA para empresas. À medida que aplicamos a tecnologia de forma mais ampla em áreas que vão desde o atendimento ao cliente até o RH e a modernização de código, ainteligência artificial (IA) está ajudando um número cada vez maior de nós a trabalhar de forma mais inteligente, não mais difícil. E como estamos apenas no início da revolução da IA para empresas, o potencial de melhorar a produtividade e a criatividade é vasto.
Mas a IA hoje é um campo incrivelmente dinâmico, e as plataformas de IA devem refletir esse dinamismo, incorporando os últimos avanços para atender às demandas de hoje e de amanhã. É por isso que nós da IBM continuamos a adicionar novos e poderosos recursos ao IBM® watsonx, nosso portfólio de produtos de IA.
Hoje estamos anunciando nossa mais recente adição: uma nova família de modelos de base desenvolvidos pela IBM que estarão disponíveis no watsonx.ai, nosso estúdio para IA generativa, modelos de base e aprendizado de máquina. Coletivamente chamados de “Granite,” esses modelos de base multitamanhos aplicam a IA generativa tanto à linguagem quanto ao código. E, assim como o granito é um material forte e multifuncional com muitos usos na construção e na fabricação, nós da IBM acreditamos que esses modelos Granite proporcionarão um valor duradouro à sua empresa.
Mas agora vamos dar uma olhada nos detalhes técnicos e explicar um pouco sobre como os criamos e como eles o ajudarão a levar a IA para o próximo nível em sua empresa.
Desenvolvidos pela IBM Research, os modelos Granite (Granite.13b.instruct e Granite.13b.chat) utilizam uma arquitetura de "decodificador", que é o que sustenta a capacidade dos grandes modelos de linguagem atuais de prever a próxima palavra em uma sequência.
Com 13 bilhões de modelos de parâmetros, os modelos Granite são mais eficientes do que modelos maiores, cabendo em uma única GPU V100 de 32 GB. Elas também podem ter um impacto menor no ambiente e, ao mesmo tempo, ter um bom desempenho em tarefas especializadas do domínio do negócio, como resumo, resposta a perguntas e classificação. Eles são amplamente aplicáveis em diversos setores e são compatíveis com outras tarefas de NLP, como geração de conteúdo, extração de insights e geração aumentada de recuperação (um framework para melhorar a qualidade das respostas ao vincular o modelo a fontes externas de conhecimento) e named entity recognition (identificar e extrair informações-chave em um texto).
Na IBM, nosso foco é a construção de modelos direcionados aos negócios. A família de modelos Granite não é diferente e, por isso, os treinamos em uma variedade de conjuntos de dados — totalizando 7 TB antes do pré-processamento, 2,4 TB após o pré-processamento — para produzir 1 trilhão de tokens, a coleção de caracteres que tem significado semântico para um modelo. Nossa seleção de conjuntos de dados foi direcionada às necessidades dos usuários corporativos e inclui dados dos seguintes domínios:
Ao treinar modelos em conjuntos de dados especializados para a empresa, ajudamos a garantir que nossos modelos estejam familiarizados com a linguagem especializada e o jargão desses setores e tomem decisões baseadas em conhecimento relevante do setor.
Nos negócios, a confiança é sua licença para operar. “Confie em nós” não é um argumento, especialmente quando se trata de IA. Como uma das primeiras empresas a desenvolver IA empresarial, a abordagem da IBM para o desenvolvimento de IA é orientada por princípios fundamentais baseados em compromissos de confiança e transparência. Com os produtos IBM watsonx, você vai além de ser um usuário de IA e se torna um criador de valor de IA. Ela possui um processo de ponta a ponta para construção e teste de modelos de base e IA generativa, começando com a coleta de dados e terminando em pontos de controle para acompanhar a implementação responsável dos modelos e aplicações, com foco em governança, avaliação de riscos, mitigação de vieses e conformidade.
Como os modelos Granite estarão disponíveis para os clientes se adaptarem às suas próprias aplicações, todos os conjuntos de dados usados no treinamento passam por um processo de avaliações de governança, risco e conformidade (GRC) definido. Desenvolvemos procedimentos de governança para incorporar dados no IBM Data Pile que são consistentes com os princípios de Ética de IA da IBM. Lidar com os critérios de GRC para dados abrange todo o ciclo de vida dos dados de treinamento. Nosso objetivo é estabelecer um link auditável a partir de um modelo de base treinado até a versão específica do conjunto de dados na qual o modelo foi treinado.
Muita atenção da mídia tem (com razão) se concentrado no risco de a IA generativa produzir uma saída odiosa ou difamatória. Na IBM, sabemos que as empresas não podem se dar a esses riscos, por isso nossos modelos Granite são treinados com dados examinados pelo nosso próprio "detector de HAP", um modelo de linguagem treinado pela IBM para detectar e eliminar conteúdo de ódio e palavrões (daí "HAP”), que é utilizado como benchmark em relação a modelos internos e públicos. Depois que uma pontuação é atribuída a cada frase em um documento, uma análise de dados é executada sobre as frases e pontuações para explorar a distribuição, o que determina a porcentagem de frases para filtragem.
Além disso, aplicamos uma ampla gama de outras medidas de qualidade. Procuramos e removemos duplicações que melhoram a qualidade da saída e usamos filtros de qualidade de documentos para remover ainda mais documentos de baixa qualidade inadequados para treinamento. Também implementamos salvaguardas regulares e contínuas de proteção de dados, incluindo monitoramento de sites conhecidos por hackear materiais ou postar outros materiais ofensivos, e evitar esses sites.
E como o cenário da tecnologia de IA generativa está em constante mudança, nosso processo completo evoluirá e melhorará continuamente, proporcionando às empresas resultados confiáveis.
A chave para a visão da IA para empresas da IBM é a noção de capacitação. Cada organização implementará os modelos Granite para atingir seus próprios objetivos, e cada empresa tem seus próprios regulamentos a cumprir, sejam eles provenientes de leis, normas sociais, normas do setor, demandas do mercado ou requisitos arquitetônicos. Acreditamos que as empresas devem ser capacitadas a personalizar seus modelos de acordo com seus próprios valores (dentro de limites), onde quer que suas cargas de trabalho fiquem, usando as ferramentas watsonx.
Mas isso não é tudo. Faça o que fizer no watsonx, você mantém a propriedade dos seus dados. Não usamos seus dados para treinar nossos modelos. você mantém o controle dos modelos que constrói e pode levá-los a qualquer lugar.
Os modelos Granite iniciais são apenas o começo: estão sendo planejados outros modelos em outros idiomas, e outros modelos treinados pela IBM também estão em preparação. Enquanto isso, continuamos a adicionar modelos de código aberto ao watsonx. Recentemente, anunciamos que a IBM está oferecendo o modelo de 70 bilhões de parâmetros do Llama 2-chat da Meta para clientes selecionados para acesso antecipado, e planejamos torná-lo amplamente disponível no final de setembro. Além disso, a IBM hospedará o StarCoder, um grande modelo de linguagem para código, incluindo mais de 80 linguagens de programação, commits do Git, problemas do GitHub e Jupyter Notebooks.
Além dos novos modelos, a IBM também está lançando novos recursos complementares no estúdio watsonx.ai. Ainda este mês, será lançada a primeira versão do nosso Tuning Studio, que incluirá ajuste de prompts, uma maneira eficiente e de baixo custo para os clientes adaptarem modelos de base às suas tarefas posteriores, por meio do treinamento de modelos com seus próprios dados confiáveis. Também lançaremos nosso Synthetic Data Generator, que ajudará os usuários a criar conjuntos de dados tabulares artificiais a partir de esquemas de dados personalizados ou conjuntos de dados internos. Essa funcionalidade permitirá que os usuários extraiam insights para treinamento e ajustes finos de modelos de IA ou simulações de cenários com risco reduzido, aumentando a tomada de decisão e acelerando o tempo de lançamento no mercado.
A inclusão dos modelos de base Granite e de outros recursos no watsonx abre novas e empolgantes possibilidades na IA para empresas. Com novos modelos e novas ferramentas, surgem novas ideias e novas soluções. E a melhor parte de tudo isso? Estamos apenas começando.
Todas as declarações sobre a direção e intenção futuras da IBM estão sujeitas a alterações ou retirada sem aviso prévio e representam apenas metas e objetivos.