Implementação de serviços de IA com ferramentas visuais

Quando você usa ferramentas visuais para criar um aplicativo para um caso de uso complexo, como Retrieval Augmented Generation (RAG) ou IA agêntica, seu aplicativo é implantado como um serviço de IA. Um serviço de IA é uma unidade de código implementável que captura a lógica do seu aplicativo de IA generativa. Depois de implantar um serviço de IA, você pode testá-lo na interface de teste fornecida no espaço ou acessar o endpoint para colocar a implantação em produção.

Ferramentas visuais que implementam serviços de IA

Quando você cria um aplicativo com qualquer uma das ferramentas a seguir, seu aplicativo é implantado como um serviço de IA:

  • AutoAI (para RAG) : Você pode usar o site AutoAI para criar experimentos de IA generativa baseados em RAG e implantar o pipeline com o melhor desempenho como um serviço de IA.

Por exemplo, um serviço de IA para um prompt que conversa com documentos de base pode gerenciar a lógica para recuperar conteúdo do índice de documentos vetorizados, bem como a inferência com um modelo de base para gerar uma resposta.

Métodos de implementação

Dependendo de seus requisitos, você pode implantar seu aplicativo como um serviço de IA a partir de uma ferramenta visual compatível, usando uma das seguintes abordagens:

  • Implementação direta (caminho rápido) : Use essa opção se sua solução estiver completa e você não quiser fazer mais alterações. Se você optar por fazer a implementação por meio de um caminho rápido, uma implementação on-line será criada automaticamente.
  • Bloco de anotações de implantação : Use essa opção se quiser personalizar sua solução adicionando ou alterando o código, como a criação de uma implantação em lote.

Além das ferramentas visuais, você pode implantar manualmente seu aplicativo como um serviço de IA diretamente do projeto se tiver criado um ativo de serviço de IA de forma programática.

A tabela a seguir compara as opções de implementação de várias ferramentas e projetos:

Comparação de métodos de implantação
Ferramenta Implementação on-line Implementação em lote Implantar diretamente (caminho rápido) Notebook de implementação
Prompt Lab Automático Manual Processo em duas etapas Suportado; gerado automaticamente
Laboratório de agentes Automático Manual Processo em duas etapas Suportado; gerado automaticamente
AutoAI (para RAG) Automático Manual Processo em várias etapas Não suportado
Projetos Manual Manual Processo em várias etapas Suportado; criado manualmente

O serviço de IA captura a lógica do seu caso de uso e contém a função de geração, que é uma unidade de código implementável. A implantação é exposta como um ponto de extremidade da API REST que pode ser acessado por outros aplicativos. Você pode enviar uma solicitação ao ponto de extremidade da API REST para usar o serviço de IA implantado para inferências. O serviço de IA implantado processa a solicitação e retorna uma resposta.

Implementação de serviços de IA com ferramentas visuais

Implementação a partir de ferramentas

Use o caminho rápido para implantar diretamente de uma ferramenta visual ou salve seu trabalho em um notebook de implantação para implantar sua solução como um serviço de IA.

Implementação com caminho rápido

Se você usou uma ferramenta visual compatível para criar seu aplicativo em watsonx.ai, poderá implantar sua solução diretamente da ferramenta. A implantação direta a partir das ferramentas oferece um caminho rápido para a implantação de sua solução como um serviço de IA e cria uma implantação on-line automaticamente. Como a implementação não pode ser alterada depois de criada, você deve garantir que a solução esteja totalmente desenvolvida antes de implementá-la.

Para criar uma implementação em lote, você deve implementar a solução manualmente a partir de um projeto. Para obter mais informações, consulte Implantação a partir do projeto.

Para implantar um padrão RAG no site AutoAI,, siga estas etapas:

  1. No construtor de experimentos AutoAI, escolha o pipeline de melhor desempenho e clique em Save as (Salvar como ).
  2. Escolha Recuperação e geração como o objetivo e selecione o tipo de ativo de serviço de IA.
  3. Habilite a opção para promover e implantar o serviço de IA em um espaço de implantação.
  4. Escolha um espaço de implantação existente ou crie um novo e clique em Criar e implantar.

Esse procedimento cria automaticamente uma implementação on-line. A implantação é criada e aberta no espaço de destino, para que você possa testar a implantação ou acessar o endpoint para fazer inferências.

Implementação a partir do notebook gerado automaticamente

Depois de criar um aplicativo em uma ferramenta visual, se quiser personalizar a lógica do aplicativo antes da implantação, você poderá salvar seu trabalho em um notebook de implantação. Por exemplo, você pode editar e executar um notebook AutoAI RAG se quiser adicionar novos documentos ao banco de dados vetorizado e, em seguida, aplicar o padrão RAG otimizado que você descobriu com a ferramenta AutoAI ao índice atualizado.

O notebook de implantação contém o código para testar, promover e implantar um serviço de IA. Para implantar seu aplicativo, você deve salvar seu trabalho em um notebook de implantação. Você não pode usar um notebook padrão para implantar um ativo de serviço de IA.

Para salvar sua solução em um notebook de implantação em Prompt Lab ou no Agent Lab:

  1. Clique no ícone Salvar Salvar ícone e selecione Salvar como no menu suspenso.
  2. Na caixa de diálogo Salvar seu trabalho, selecione Deployment notebook.
  3. Na seção Definir detalhes, insira um nome e uma descrição opcional para o seu notebook de implantação.
  4. Clique em Salvar.

Quando você salva seu trabalho em um notebook de implantação, o watsonx.ai gera automaticamente um notebook que contém o código para testar, promover e implantar um serviço de IA. Para criar uma implantação on-line para seu serviço de IA, execute as células no notebook de implantação.

Implementação a partir do projeto

Crie uma implementação on-line ou em lote para implementar seu aplicativo como um serviço de IA. As implementações on-line são adequadas para aplicativos que exigem alta disponibilidade e atualizações em tempo real, enquanto as implementações em lote são ideais para atualizações complexas ou quando o tempo de inatividade programado é aceitável.

Criação de implementações on-line

Se você salvou um ativo de IA em um projeto como um ativo de serviço de IA implantável, siga estas etapas para promover o serviço de IA e criar uma implantação on-line:

  1. Na guia Assets (Ativos ) do seu projeto ou espaço de implementação, selecione Deploy (Implementar ) para o serviço de IA.
  2. Escolha ou crie um espaço de implantação.
  3. Selecione Online como o tipo de implementação.
  4. Insira um nome para sua implantação e, opcionalmente, insira um nome de serviço, uma descrição e tags.
  5. Clique em Criar.

Criação de implantações em lote

Se você salvou um ativo de IA em um projeto como um ativo de serviço de IA implantável, siga estas etapas para promover o serviço de IA e criar uma implantação em lote:

  1. Em seu espaço de implementação, vá para a guia Assets (Ativos ).
  2. Para seu ativo de serviço de IA na lista de ativos, clique no ícone Menu e selecione Deploy.
  3. Selecione Batch como o tipo de implementação.
  4. Insira um nome para sua implantação e, opcionalmente, insira um nome de serviço, uma descrição e tags.
  5. Selecione uma especificação de hardware:
    • Extra pequeno : 1 CPU e 4 GB de RAM
    • Pequeno : 2 CPUs e 8 GB de RAM
    • Média : 4 CPUs e 16 GB de RAM
    • Grande : 8 CPU e 32 GB de RAM
    • Extra grande : 16 CPU e 64 GB de RAM
  6. Clique em Criar.

Próximas etapas