Os recursos empresariais, essenciais para alcançar metas estratégicas e requisitos operacionais, são descritos no modelo de capacidade da arquitetura da IA generativa. Ele inclui seis categorias principais, apresentando recursos exclusivos e de suporte necessários para uma implementação eficaz da IA generativa, com documentação abrangente disponível em outras arquiteturas.
Os grupos de recursos restantes são recursos de suporte para a IA generativa. Os recursos não são exclusivos da IA generativa, mas devem estar presentes para suportá-la como um recurso empresarial. Esses grupos são:
Gerenciamento de dados é um grupo de recursos para armazenar, gerenciar e transformar dados em formulários que os tornam adequados para ajuste e treinamento de modelos de IA generativa. Também incluídos nessa categoria estão recursos para registrar e classificar as respostas do modelo para fins de auditoria e como entrada para ajuste e refinamento adicionais do modelo.
Os recursos de suporte são um agrupamento abrangente de recursos de aplicações, integração e operações de TI necessários para implementar e gerenciar com sucesso soluções de IA generativa com uma empresa.
Os recursos de IA generativa capturam os recursos de hardware e plataforma necessários para desenvolver, ajustar, implementar e gerenciar de forma eficiente e eficaz modelos e soluções de IA generativa.
Cada categoria de recursos é composta por um ou mais grupos de recursos. Esta seção destaca os grupos e recursos fundamentais para a IA generativa.
O grupo de recursos do Model Hub encapsula os recursos necessários para gerenciar modelos importados, bem como modelos ajustados ou treinados pela empresa. Esses recursos permitem que as empresas gerenciem os modelos e conjuntos de dados disponíveis para uso dentro da empresa e limitem o acesso a modelos e conjuntos de dados a usuários ou grupos específicos dentro da empresa. A importação de modelos e a importação de dados são recursos fundamentais para que as empresas reduzam a entrada de modelos do número crescente de repositórios de modelos públicos, como o Hugging Face.
Model Hosting O Model Hosting oferece recursos para implementar modelos gerais e ajustados como serviços habilitados por API dentro de uma empresa, otimizando a utilização de recursos, permitindo refinamento e substituição independentes e simplificando a governança. A chave para isso é o gerenciamento de políticas de acesso a modelos, garantindo que o acesso aos modelos seja restrito a usuários e grupos autorizados, evitando o uso não autorizado.
A personalização de modelos é um grupo de recursos que permitem que uma empresa ajuste e treine modelos de IA generativa para necessidades específicas de negócios. Normalmente, esse recurso será realizado usando uma plataforma de nuvem, pois o modelo pré-pago da nuvem é adequado à natureza "explosiva" do ajuste e do treinamento das demandas de recursos.
Modelo e gestão de dados é um conjunto crítico de recursos para que uma empresa use modelos de IA generativa em ampla escala. Especificamente, esses recursos fornecem às empresas os insights necessários para monitorar e gerenciar os riscos do modelo, como a introdução de viés nas respostas do modelo, e para ajudar a lidar com os requisitos regulatórios e de conformidade para transparência e justiça do modelo.
O monitoramento de modelos é o análogo operacional da governança de modelos; enquanto a governança de modelos lida com o gerenciamento de riscos e modelos de longo prazo, os recursos do monitoramento de modelos permitem que as empresas monitorem e gerenciem as operações dos modelos em tempo real. O monitoramento de modelos é composto por vários recursos principais, incluindo:
O gerenciamento de conformidade da IA generativa é uma categoria de recursos relacionada à ativação dos controles necessários para “proteger o uso” da IA por meio do stack de aplicações e “proteger as aplicações por si só”. Aderir aos padrões éticos e diretrizes para garantir que os sistemas de IA respeitem os valores e direitos humanos.
Gerenciamento de segurança de aplicações de IA. Essa categoria de recursos trata de habilitar os controles necessários para “proteger o uso” da IA por meio do stack de aplicações e “proteger as próprias aplicações”. Aderir aos padrões éticos e diretrizes para garantir que os sistemas de IA respeitem os valores e direitos humanos.
Gerenciamento de segurança de modelos de IA. Essa categoria de recursos trata de habilitar os controles necessários para "proteger o modelo" na camada, bem como proteger o uso de modelos. Implementar as melhores práticas para treinamento, validação e avaliação de modelos para melhorar o desempenho e a confiabilidade.
Gerenciamento de segurança de dados de IA. Essa categoria de recursos permite controles para a camada de "proteção dos dados". Estabelecer diretrizes claras para coleta, armazenamento e uso de dados para garantir a qualidade de dados e mitigar o viés. Embora a segurança de dados não seja algo exclusivo da IA generativa, vamos nos concentrar apenas nas áreas em que a IA generativa exige atenção especial do ponto de vista dos dados.
IA agêntica é um grupo de recursos necessários para criar e implementar aplicações de IA agêntica. Inclui recursos fundamentais, como roteamento e orquestração, e gerenciamento de ferramentas e chamada de ferramentas.
Ajuste da IA generativa é um grupo de recursos necessários para “personalizar” um modelo generativo geral de acordo com as necessidades de uma empresa. Os modelos são treinados em uma ampla base de conhecimento e não terão conhecimento de jargões e processos específicos do setor. Assim, a maioria das empresas precisará utilizar recursos como engenharia de prompts, ajuste de prompts e ajuste fino de modelos para criar um modelo que compreenda os termos e processos do negócio da empresa.
Os recursos de aplicações de IA generativa permitem que as empresas desenvolvam aplicações de IA generativa avançadas. Os recursos incluem a capacidade de gerar funções dinamicamente para responder às consultas do usuário; memória conversacional, que permite que aplicações de IA generativa retenham e façam referência a interações anteriores de maneira conversacional; e roteamento de modelos, que permite que as aplicações encaminhem consultas dinamicamente para um modelo mais adequado para responder.