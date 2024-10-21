72% dos CEOs de alto desempenho concordam que possuir as ferramentas de IA generativa mais avançadas confere a uma organização uma vantagem competitiva, segundo o IBM Institute for Business Value. Mas se essas ferramentas de IA generativa não estiverem fundamentadas no contexto exclusivo de uma empresa, as organizações talvez não obtenham o benefício total delas.
Por mais poderosos que sejam os grandes modelos de IA generativa de uso geral, como o ChatGPT e o Google Gemini, eles não são treinados com conjuntos de dados específicos das organizações. Quando conectados aos processos de uma organização, podem faltar informações importantes que podem causar confusão e produzir resultados abaixo do ideal.
“Toda empresa tem sua própria linguagem”, explica Michael Choie, Senior Managing Consultant, IA e Analytics, IBM Consulting. Considere a palavra “vestir”. Para uma cadeia de supermercados, isso significa “molho para saladas”. Para um hospital, isso significa ‘curativos’.”
A IBM fez uma parceria com a The Harris Poll para publicar o IA em ação 2024, uma pesquisa com 2 mil Organizações em todo o mundo. A pesquisa revelou que 15% dessas organizações — chamadas de Líderes em IA — estão alcançando resultados mensuráveis com IA.
Uma coisa que diferencia os líderes de IA é a confiança em sua capacidade de personalizar seus esforços de IA para obter o valor ideal. Isso não significa que uma organização deva criar seus próprios modelos do zero para se destacar da multidão. Em vez disso, ela pode adaptar os modelos de IA existentes aproveitando o que ninguém mais tem: dados empresariais proprietários.
“Todo fornecedor de IA, como o X ou o Google, tem acesso a informações públicas. Eles também têm acesso aos dados de suas próprias plataformas", explica Shobhit Varshney, vice-presidente e sócio sênior, líder de IA nas Américas, IBM Consulting. "O que eles não têm acesso são os dados da sua empresa. Essa peça do quebra-cabeça está faltando.”
Como Varshney elabora em AI em Ação 2024,“A próxima fronteira é fazer com que a IA atravesse o abismo e entre em uma empresa para que ela possa absorver, aprender e se tornar sua vantagem competitiva.”
Existem três maneiras principais de alimentar modelos de IA com dados proprietários: Engenharia de prompts, Retrieval-augmented generation (RAG) e ajuste fino.
Neste contexto, engenharia de prompts significa incluir dados proprietários no prompt que é passado para a IA.
Digamos que um usuário queira um modelo de IA para resumir conversas da central de atendimento. O usuário pode escrever um prompt—"Resumir esta conversa"—e anexar a transcrição da chamada como parte do prompt.
A engenharia de prompts não requer alterações do modelo em si. É mais adequado para tarefas genéricas de baixo volume, em que é razoável incluir o contexto necessário em cada prompt.
A geração aumentada de recuperação (RAG) significa conectar um modelo de IA a um banco de dados proprietário. O modelo pode extrair informações relevantes desse banco de dados ao responder aos prompts.
Por exemplo, uma organização pode dar a um chatbot de atendimento ao cliente acesso a um banco de dados de produtos da empresa. Quando os usuários fazem perguntas ao chatbot sobre esses produtos, ele pode ver a documentação correspondente e recuperar a resposta correta.
O RAG não exige nenhuma alteração permanente no modelo. Pode melhorar a precisão e reduzir alucinações, mas também pode aumentar os tempos de resposta.
O ajuste fino consiste em fornecer a um modelo de IA dados adicionais suficientes para alterar alguns de seus parâmetros. O ajuste fino altera permanentemente o comportamento de um modelo, adaptando-o a um caso de uso ou contexto específico. Também é mais rápido e mais barato do que treinar um modelo totalmente novo.
"Se você tiver uma rede neural que tem 100 camadas diferentes, treinar significa que você está modificando todas as 100 camadas", explica Choie. “O ajuste fino significaria que você está realmente mudando as últimas camadas. Você ainda está modificando o modelo, mas não precisa alterá-lo completamente porque ele já está funcionando bem."
O ajuste fino requer um pouco mais de investimento inicial do que a engenharia de prompts e o RAG. É útil para transformar um modelo menor em um especialista em um domínio especializado. Por exemplo, uma seguradora pode ajustar um modelo para dominar a arte de processar novos sinistros.
Varshney compara um modelo aperfeiçoado a um novo funcionário intensivamente treinado que acaba de sair da escola. Eles podem não ter a amplitude de conhecimento que um polímata engenhoso (ou um grande modelo de IA de propósito geral) tem, mas são muito melhores no processamento de afirmações do que o polímata.
"Ele não pode pagar seus impostos ou escrever um contrato legal", diz Varshney, "mas se eu pedir para processar uma reclamação, ele saberá como fazer isso imediatamente."
O uso de dados proprietários dessas maneiras pode oferecer uma vantagem competitiva significativa, ao familiarizar os modelos de IA com os processos, produtos, clientes e outras nuances exclusivos de uma empresa.
"Se você tiver uma IA cujos principais usuários forem de uma empresa específica, é importante que a IA use dados dessa mesma empresa", diz Choie.
Quando os modelos de IA têm acesso a dados proprietários, eles são fundamentados em um contexto comercial específico, o que significa que suas produções também são fundamentadas nesse contexto.
"Posso pegar um modelo de IA aberto, ajustá-lo com meus próprios dados proprietários, e essa cópia é exclusivamente minha", diz Varshney. "Sou proprietário do IP por trás dele. Eu o executo na minha própria infraestrutura."
Como resultado, esses modelos podem produzir produções mais precisas e eficazes do que modelos não aprimorados e prontos para uso que extraem um conjunto geral de dados públicos.
As organizações podem usar muitos tipos diferentes de modelos de IA para obter resultados. Mas os modelos de código aberto, como os modelos IBM Granite, que estão disponíveis sob uma licença Apache 2.0 para uso comercial amplo e sem ônus, oferecem certos benefícios.
"Ao treinar um modelo de IA, há muitos parâmetros e técnicas diferentes que você precisa ajustar para garantir que o modelo aprenda de forma eficaz e eficiente. Você precisa de cientistas de dados especializados e especialistas em aprendizado de máquina para configurar isso", explica Choie. "O benefício de ajustar os modelos abertos é que temos esses modelos nos quais algumas pessoas brilhantes já colocaram as mãos. Tudo o que precisamos fazer é alimentar os modelos com dados adicionais específicos da tarefa e ajustar algumas camadas, o que é uma tarefa muito mais simples do que construir um modelo."
Além de permitir que as organizações se beneficiem da sabedoria da multidão, os modelos de código aberto podem permitir que elas façam experimentos sem que o custo do fracasso seja muito alto. Essa experimentação, por sua vez, ajuda as organizações a buscar uma estratégia multimodelo, usando muitos modelos diferentes – e ajustados de maneira diferente – para tarefas específicas do domínio.
Essa estratégia multimodelo é considerada uma melhor prática. O relatório AI in Action 2024 constatou que 62% dos líderes em IA utilizam múltiplos modelos, em comparação com 32% dos aprendizes de IA.
"É quase óbvio usar modelos de código aberto", diz Choie. "Eles têm custo reduzido, você tem algumas das melhores pessoas do setor trabalhando neles e, sempre que há atualizações ou problemas, a comunidade trabalha neles em conjunto."
Um gerenciamento eficaz de dados é uma das principais características que separa os líderes de IA de outras Organizações, de acordo com a IA em ação 2024. 61% dos líderes de IA acreditam em sua capacidade de acessar e gerenciar eficazmente os dados organizacionais para apoiar iniciativas de IA, em comparação com 11% dos aprendizes de IA.
Porém, alimentar dados proprietários nos modelos de IA não é tão simples quanto parece. Silos de dados, controle de qualidade e outros problemas podem atrapalhar.
Em termos gerais, a solução é implementar uma malha de dados integrada que elimina silos, garante interoperabilidade e orquestra a movimentação fluida de dados entre plataformas.
Mas como isso se parece na prática? Aqui estão algumas considerações importantes:
Os primeiros obstáculos para muitos dos esforços de IA são coletar e armazenar dados, processos que não são tão simples quanto podem parecer.
A captura de dados em bancos de dados tradicionais geralmente leva a silos de dados, o que pode impedir que uma organização agregue todos os dados de que precisa para criar um banco de dados RAG eficaz ou ajustar modelos. De acordo com o IBM Data Differentiator, 82% das empresas enfrentam silos de dados que bloqueiam seus fluxos de trabalho principais.
As organizações precisam implementar pipelines para recuperar dados de fontes díspar, prepará-los para uso e depositá-los em um armazenamento acessível e centralizado.
A recuperação e preparação de dados podem envolver o uso de ferramentas de processamento de fluxo, como o Apache Kafka, ou ferramentas de integração de dados prontas para ETL e ELT , como o IBM DataStage. As organizações também devem escolher os repositórios certos para dados, o que pode incluir:
Data lakes, que oferecem ambientes de armazenamento de baixo custo projetados para lidar com grandes quantidades de dados brutos, estruturados e dados não estruturados.
Data warehouses, que são construídos para apoiar esforços de análise de dados, business intelligence e ciência de dados.
Data lakehouses, como o watsonx.data, que mesclam os recursos de warehouses e lakes em uma única solução de gerenciamento de dados.
Uma infraestrutura de nuvem híbrida também é um componente importante dos esforços de integração de dados. Muitas empresas hoje têm dados distribuídos entre armazenamentos de dados locais e vários serviços de nuvem.
"Você precisa garantir que pode agregar todas essas informações, não importa onde estejam, e alimentá-las em seus modelos de IA", diz Choie. "Se você não estiver usando o híbrido, estará perdendo algo."
Inputs ruins levam a produções ruins. As organizações precisam garantir que os dados proprietários que alimentam os modelos de IA sejam confiáveis e precisos.
"Você precisa descobrir o que há de valioso em seus dados (o diferenciador) para poder ampliar isso", afirma Varshney. "Você quer reduzir o ruído nos dados e fornecer dados de alta qualidade para fazer o ajuste fino."
Os dados devem ser limpos antes de serem passados para uma IA. Caso contrário, isso pode piorar o desempenho do modelo.
Varshney dá o exemplo de um ticket para a central de atendimento com uma solução não tão óbvia: "As pessoas podem tentar cinco diferentes maneiras de corrigi-lo antes de encontrar a que funciona. Você não pode enviar esse ticket diretamente para o modelo. Será muito barulhento. Ele conterá todas as coisas que as pessoas experimentaram. O modelo pode ficar confuso sobre qual é o resultado certo. Você deve limpar o ruído para que o modelo veja apenas a solução real."
Limpeza, preparação e seleção de conjuntos de dados envolvem algum trabalho manual por parte de cientistas de dados e analistas, sejam eles internos ou parceiros externos. Também envolve ferramentas como:
As ferramentas de gerenciamento de dados habilitadas para IA podem validar automaticamente os dados, sinalizar erros e converter dados para o formato adequado.
Os geradores de dados sintéticos podem ajudar a preencher os valores ausentes e aumentar os ativos com corpora maiores.
Ferramentas de pré-processamento e engenharia de dados, como o Apache Spark e a biblioteca do Python dos pandas.
As ferramentas de observabilidade de dados podem rastrear o fluxo de dados ao longo do tempo, monitorar o uso e a linhagem de dados e detectar anomalias.
Quaisquer que sejam as vantagens competitivas que os dados proprietários possam trazer para a IA generativa, a vantagem estratégica duradoura vem da implantação da combinação correta de tecnologia e processos de negócios.
"O próprio workflow é onde está o dinheiro", explica Varshney. "O modelo é uma commodity e continuaremos obtendo modelos cada vez melhores. O que realmente precisamos descobrir é a combinação certa de unir IA tradicional, automação e IA generativa em um workflow.
Em outras palavras, as organizações não podem utilizar a IA generativa — mesmo um modelo ajustado às suas especificações — em seus processos e esperar resultados. Em vez disso, eles devem avaliar seus processos e adaptar seus fluxos de trabalho aos modelos, tanto quanto adaptam seus modelos aos seus fluxos de trabalho.
Considere a humilde lava-louças.
"Quando desenvolvemos máquinas de lavar louça, não esperávamos que elas se levantassem e lavassem da maneira que fazemos sobre uma pia", diz Varshney. “Mudamos o processo para que a máquina de lavar louça pudesse realmente se destacar na lavagem. Colocamos o problema no formato correto. Precisamos fazer o mesmo aqui. Precisamos reengenheirar processos e descobrir a combinação certa de IA tradicional e IA generativa. Então, você começa a liberar valor.”
