A receita do RAG: como os serviços em nuvem viabilizam resultados de IA generativa em diversos setores

Duas pessoas sentadas em uma mesa olhando para um notebook juntas

Autor

Uwe Fassnacht

Product Director for IBM Cloud Code Engine

De acordo com uma pesquisa da IBM , cerca de 42% das empresas entrevistadas usam IA em seus negócios. De todos os casos de uso, muitos de nós já estamos extremamente familiarizados com os chatbots de processamento de linguagem natural, capazes de responder às nossas perguntas e auxiliar em tarefas como redigir e-mails ou redações. No entanto, mesmo com a ampla adoção desses chatbots, as empresas ainda enfrentam alguns desafios ocasionais. Por exemplo, esses chatbots podem gerar resultados inconsistentes, pois acessam grandes repositórios de dados que podem não ser relevantes para a consulta em questão.

Felizmente, a geração aumentada por recuperação (RAG) surgiu como uma solução promissora para fundamentar os grandes modelos de linguagem (LLMs) nas informações mais precisas e atualizadas. Como um framework de IA, o RAG trabalha para melhorar a qualidade das respostas geradas por LLMs ao fundamentar o modelo em fontes de conhecimento, complementando a representação interna de informações do LLM. A IBM lançou seu novo portfólio de produtos de IA, o watsonx, que oferece RAG, em maio de 2023.

Em termos simples, utilizar RAG é como fazer o modelo realizar uma prova com consulta: você está pedindo que o chatbot responda a uma pergunta com todas as informações à sua disposição. Mas como o RAG funciona em nível de infraestrutura? Com uma combinação de serviços de plataforma como serviço (PaaS), o RAG pode ser executado com sucesso e facilidade, viabilizando resultados de IA generativa para organizações de diversos setores com o uso de LLMs.

Como os serviços PaaS são essenciais para o RAG

A IA de nível empresarial, incluindo a IA generativa, requer uma infraestrutura distribuída altamente sustentável, intensiva em computação e dados. Embora a IA seja o componente central do framework RAG, outros “ingredientes”, como as soluções PaaS, são parte essencial da receita. Essas ofertas, especificamente as tecnologias serverless e de armazenamento, operam discretamente nos bastidores, permitindo que os dados sejam processados e armazenados com mais facilidade, o que proporciona respostas cada vez mais precisas dos chatbots.

A tecnologia serverless oferece suporte a cargas de trabalho intensivas em computação, como as exigidas pelo RAG, ao gerenciar e proteger a infraestrutura associada. Isso devolve tempo aos desenvolvedores, para que possam se concentrar na programação. A computação serverless permite que os desenvolvedores criem e executem código de aplicações sem provisionar ou gerenciar servidores ou infraestrutura de backend.

Se um desenvolvedor estiver carregando dados em um LLM ou chatbot, mas não souber como processá-los previamente para garantir o formato correto ou filtrá-los por pontos específicos, o IBM Cloud Code Engine pode fazer isso por ele, facilitando o processo de obtenção de resultados corretos dos modelos de IA. Como uma plataforma serverless totalmente gerenciada, o IBM Cloud Code Engine pode escalar a aplicação com facilidade por meio de recursos automatizados que gerenciam e protegem a infraestrutura subjacente.

Além disso, se um desenvolvedor estiver carregando fontes de dados para LLMs, é fundamental contar com um armazenamento altamente seguro, resiliente e durável. Isso é especialmente crítico em setores altamente regulamentados como serviços financeiros, saúde e telecomunicações.

O IBM Cloud Object Storage, por exemplo, oferece segurança e durabilidade para armazenar grandes volumes de dados. Com retenção imutável de dados e recursos de controle de auditoria, o IBM Cloud Object Storage oferece suporte ao RAG ao proteger seus dados contra adulterações ou ataques de ransomware, além de ajudar a garantir a conformidade com requisitos regulatórios e de negócios.

Com o amplo stack tecnológico da IBM, incluindo o IBM Code Engine e o Cloud Object Storage, organizações de todos os setores podem acessar o RAG sem dificuldades e concentrar-se no uso mais eficaz da IA em seus negócios.

O poder da nuvem e da IA na prática

Já estabelecemos que o RAG é extremamente valioso para viabilizar resultados de IA generativa, mas como isso se traduz na prática?

O Blendow Group, um importante provedor de serviços jurídicos na Suécia, lida com uma grande variedade de documentos legais, analisando, resumindo e avaliando documentos que vão de decisões judiciais à legislação e jurisprudência. Com uma equipe relativamente pequena, o Blendow Group precisava de uma solução escalável para auxiliar em sua análise jurídica. Trabalhando com a IBM Client Engineering e a NEXER, o Blendow Group criou uma ferramenta inovadora baseada em IA, aproveitando amplamente os recursos para aprimorar pesquisas e análises jurídicas, além de agilizar a criação de conteúdo legal, tudo isso mantendo a máxima confidencialidade dos dados sensíveis.

Com o uso do stack tecnológico da IBM, incluindo o IBM Cloud Object Storage e o IBM Code Engine, a solução de IA foi personalizada para aumentar a eficiência e o alcance da análise de documentos legais do Blendow Group.

A Fundação Mawson’s Huts também é um excelente exemplo de como aproveitar o RAG para obter melhores resultados com IA. A fundação tem como missão preservar o legado de Mawson, que inclui a reivindicação territorial australiana de 42% da Antártida, além de educar crianças em idade escolar e outros públicos sobre o continente antártico e a importância de preservar seu ambiente intocado.

Com o The Antarctic Explorer, uma plataforma de aprendizagem com IA executada no IBM Cloud, a Mawson está levando o acesso à Antártida para crianças e outros públicos por meio de um navegador, de qualquer lugar. Usuários podem enviar perguntas por meio de uma interface no navegador, e a plataforma de aprendizagem usa recursos de processamento de linguagem natural com IA fornecidos pelo IBM watsonx Assistant para interpretar as perguntas e entregar respostas adequadas, com mídias associadas (vídeos, imagens e documentos) que são armazenadas e recuperadas do IBM Cloud Object Storage.

Ao utilizar ofertas de infraestrutura como serviço junto ao watsonx, tanto a Mawson’s Huts Foundation quanto o Blendow Group conseguem obter insights mais precisos de seus modelos de IA, facilitando o gerenciamento e o armazenamento dos dados contidos neles.

Gerando resultados com IA generativa na nuvem

A IA generativa e os LLMs já demonstraram grande potencial de transformação para organizações de diversos setores. Seja para educar o público em geral ou para analisar documentos jurídicos, as soluções PaaS na nuvem são essenciais para o sucesso do RAG e para a execução de modelos de IA.

Na IBM, acreditamos que as cargas de trabalho de IA provavelmente formarão a espinha dorsal de cargas de trabalho de missão crítica para os negócios e, por isso, exigem uma infraestrutura confiável e resiliente por design. Com o IBM Cloud, empresas de diversos setores que utilizam IA podem acessar níveis mais altos de resiliência, desempenho, segurança, conformidade e custo total de propriedade. Saiba mais sobre o IBM Cloud Code Engine e o IBM Cloud Object Storage abaixo.

Soluções relacionadas
IBM Red Hat OpenShift

O Red Hat OpenShift on IBM Cloud é uma plataforma de contêineres OpenShift (OCP) totalmente gerenciada.

Explore o Red Hat OpenShift
Soluções de contêiner

As soluções de contêineres executam e escalam cargas de trabalho conteinerizadas com segurança, inovação de código aberto e implementação rápida.

Explore contêineres
Serviços de consultoria em nuvem 

Libere novos recursos e aumente a agilidade dos negócios com os serviços de consultoria em nuvem da IBM. Descubra como cocriar soluções, acelerar a transformação digital e otimizar o desempenho por meio de estratégias de nuvem híbrida e parcerias especializadas.

Serviço de nuvem
Dê o próximo passo

Modernize sua infraestrutura com as soluções de contêineres da IBM. Execute, escale e gerencie cargas de trabalho conteinerizadas em todos os ambientes com flexibilidade, segurança e eficiência usando a abrangente plataforma de contêineres da IBM.

  1. Explore soluções de contêineres
  2. Crie sua conta gratuita na IBM Cloud