O que é o ciclo de vida da IA?

By Dave Bergmann

Explicação do ciclo de vida da IA

O ciclo de vida da IA é um processo estruturado e iterativo de planejamento, treinamento, implementação e manutenção de sistemas de IA. Ele envolve não apenas o treinamento de modelos de aprendizado de máquina, mas também a coleta e preparação de dados de treinamento, sistemas para avaliar e aprimorar o desempenho do modelo e a integração de modelos treinados em aplicações de IA do mundo real.

O ciclo de vida da IA abrange tudo, desde a decisão inicial de resolver um problema específico com inteligência artificial até o uso ativo de um modelo treinado em um fluxo de trabalho do mundo real. A noção de ciclos de vida da IA está intimamente ligada às disciplinas de operações de aprendizado de máquina (MLOps) e sistemas de gerenciamento de IA (AIMS), ambas envolvendo abordagens sistemáticas para o desenvolvimento, governança e manutenção da IA.

O conceito central dos ciclos de vida de desenvolvimento de IA reside no fato de que as soluções de IA não são projetadas ou implementadas isoladamente: são sistemas dinâmicos cuja eficácia sustentada depende de um planejamento cuidadoso e de um monitoramento diligente. Existem dependências essenciais entre cada etapa do processo de desenvolvimento e implementação de IA, e compreender essas dependências é fundamental para construir soluções impulsionadas por IA que sejam bem-sucedidas, escaláveis e sustentáveis.

Este artigo detalha cada uma das etapas essenciais do ciclo de vida da IA.

As mais recentes tendências em IA, trazidas a você por especialistas

Receba insights selecionados sobre as notícias mais importantes (e intrigantes) sobre IA. Inscreva-se no nosso boletim informativo semanal Think. Consulte a Declaração de privacidade da IBM.

Definição do problema

A primeira e indiscutivelmente mais importante fase da gestão do ciclo de vida da IA é a fase de planejamento, na qual você identifica o caso de uso para sua aplicação de IA: o problema que você está ajudando a resolver com a IA e as tarefas específicas que a IA pode realizar para auxiliar na resolução. Todas as decisões subsequentes devem se referir às decisões tomadas durante o processo de planejamento.

É essencial ser detalhista e levar em conta toda e qualquer contingência. Ignorar certas considerações não economiza trabalho: apenas o adia e o agrava. Todos os stakeholder relevantes devem ser incluídos e consultados na fase de planejamento, tanto para aproveitar sua experiência ou perspectiva específica, quanto para garantir consenso sobre como as coisas prosseguirão a partir daí.

Defina o escopo do seu projeto de IA. Em que aspectos do seu problema a sua solução de IA irá atuar ou ajudar a resolver? Quais aspectos estão fora dos limites?

Defina suas necessidades. Nas áreas problemáticas para as quais você utilizará a IA, o que exatamente você precisa que ela faça? É importante entender o que é viável e o que não é, seja em termos dos recursos de IA existentes ou dos recursos disponíveis para dar continuidade a esse projeto.

Defina sucesso. Tanto qualitativamente quanto (especialmente) quantitativamente, o que se qualifica como um resultado bem-sucedido? Ao estabelecer métricas de sucesso desde o início, você permite que elas orientem as decisões do projeto e controlem o desenvolvimento e a otimização do seu sistema de IA.

Avalie os riscos. Identifique algumas maneiras pelas quais sua solução de IA, conforme o escopo definido até agora, pode afetar adversamente sua organização ou seus usuários. Os riscos éticos, reputacionais e financeiros devem ser sinalizados e abordados antes de passar para a fase de coleta de dados, especialmente considerando que o gerenciamento inadequado de dados costuma ser a fonte desses riscos.

Coleta e preparação de dados

Em um nível técnico, a qualidade e a quantidade de seus dados de treinamento são o fator mais importante no ponto forte de seus modelos de IA.

Coleta de dados

Considere que todo aprendizado de máquina depende do reconhecimento de padrões aplicados. Um modelo de aprendizado de máquina treinado usa os padrões que "aprendeu" com seus dados de treinamento para inferir a saída ideal para uma determinada entrada. É necessária uma qualidade de dados suficiente para garantir que os padrões que ele aprende correspondam aos dos novos dados nos quais ele realizará a inferência nas aplicações do mundo real. É necessário um volume de dados suficiente para garantir que o modelo tenha aprendido todos os padrões de que precisará, bem como para evitar o sobreajuste.

Avalie as fontes de dados relevantes disponíveis para você, desde conjuntos de dados de código aberto disponíveis por meio de plataformas como Hugging Face ou Kaggle até a web scraping e o uso dos dados proprietários da sua organização. Quando os dados de alta qualidade são proibitivamente escassos ou caros, os dados sintéticos podem, às vezes, preencher as lacunas. podem, às vezes, preencher as lacunas.

Preparação de dados

Os dados brutos raramente estão prontos para o aprendizado de máquina: eles geralmente exigem algum grau de pré-processamento antes de seu uso em pipelines de treinamento de modelos. A engenharia de funcionalidade é uma parte importante desse processo.

O aprendizado supervisionado exige rotulagem de dados, o que muitas vezes requer pelo menos algum grau de intervenção humana manual demorada (embora a automação muitas vezes possa simplificar o processo). A rotulagem em alguns domínios de dados especializados exigirá o input de especialistas. Mesmo os conjuntos de dados que contêm dados pré-rotulados devem ser inspecionados para garantir a precisão e a relevância dos rótulos para seu caso de uso específico.

Os dados provenientes de diferentes fontes precisam ser normalizados e uniformizados em termos de unidades e formato: por exemplo, treinar um modelo com dados meteorológicos apresentados tanto em Celsius quanto em Fahrenheit inevitavelmente levará ao fracasso.

Gestão de dados

Os dados não devem ser simplesmente descartados após o treinamento do modelo. Eles devem ser armazenados e mantidos para o caso de você precisar auditar seu sistema, explorar o desempenho, replicar seus modelos ou cumprir os requisitos regulamentares do RGPD ou estruturas semelhantes.

A gestão de dados adequada é um componente essencial da explicabilidade da IA, da privacidade de dados e da conformidade regulatória, especialmente em setores e casos de uso que envolvem dados com informações confidenciais. É também um componente necessário para o estabelecimento de fluxos de dados que otimizam a obtenção de dados escaláveis, especialmente quando o seu fluxo de trabalho de IA utiliza dados proprietários continuamente atualizados.

Seleção do modelo

A próxima etapa é a seleção do modelo: escolher a arquitetura do modelo que melhor se adapta ao seu caso de uso, aos dados de treinamento e aos recursos computacionais. Existe uma enorme variedade de algoritmos de aprendizado de máquina, desde modelos de regressão pequenos e simples até redes neurais de última geração. O maior e mais sofisticado modelo nem sempre é a escolha mais sábia: existem tarefas para as quais modelos de deep learning enormes são um exagero, e até mesmo tarefas em que modelos convencionais de aprendizado de máquina superam seus equivalentes de deep learning.

Quando se trata de IA generativa, treinar LLMs e outros tipos de modelos generativos a partir do zero exige um grande investimento em tempo, dados, hardware e energia. Na maioria dos casos, a necessidade de um modelo generativo personalizado é mais bem atendida por meio do ajuste fino de um modelo pré-treinado. Mas mesmo no mundo dos modelos prontos, há um enorme espectro em termos de tamanho, arquitetura e recursos.

As avaliações de benchmark são um guia útil para determinar quais modelos são bons em quê, mas não devem ser consideradas como verdade absoluta. Se o seu problema estiver bem definido, vale a pena explorar a viabilidade de desenvolver um benchmark personalizado que reflita diretamente o desempenho nas tarefas específicas que você precisa que um modelo execute. Isso também será útil para a fase de avaliação do modelo posteriormente.

Treinamento de modelo

Além da IA generativa, a maioria das soluções de IA envolverá o treinamento do seu próprio modelo. Nossa explicação sobre o treinamento do modelo fornece mais informações sobre o processo de desenvolvimento do modelo, desde os diferentes tipos de aprendizado de máquina até a escolha de uma função de perda (ou, no aprendizado por reforço, uma função de recompensa) e a otimização dos parâmetros (e hiperparâmetros) do modelo. Geralmente é necessário algum grau de experimentação antes de chegar à arquitetura e ao esquema de aprendizado ideais.

Em última análise, o objetivo do treinamento do modelo é ajustar os parâmetros do modelo até que o desempenho do modelo nos exemplos em seu conjunto de dados de treinamento atinja um limite aceitável de precisão.

O treinamento de modelo é um processo iterativo e nem sempre prossegue de forma linear e constante. É importante salvar periodicamente "pontos de verificação" das ponderações do modelo ao longo do processo de treinamento. Na ausência desse controle de versão, uma única atualização de modelo pode ser desastrosa e forçar você a começar do zero. O controle de versão também é uma prática necessária para depuração, reprodutibilidade e colaboração entre equipes.

Avaliação de modelos

Otimizar o desempenho de um modelo em dados de treinamento não é, por si só, o objetivo fundamental do treinamento do modelo. O verdadeiro objetivo do treinamento do modelo é desenvolver um modelo que generalize bem para novos dados que ainda não viu. É preciso ter cuidado para evitar o sobreajuste, que pode ser entendido como o equivalente do aprendizado de máquina de "ensinar para o teste", mais próximo da memorização mecânica do que do conhecimento propriamente dito.

A avaliação pós-treinamento é essencial para confirmar que o modelo generaliza bem para dados não vistos. Este processo de validação testa a qualidade da saída do modelo em um conjunto de dados separado, com novas entradas que se assemelham a tarefas do mundo real. A validação pode usar uma variedade muito maior de métricas de desempenho do que aquelas adequadas para as funções de perda que medem a precisão do modelo durante o treinamento.

A avaliação e o treinamento do modelo normalmente constituem duas partes de um ciclo iterativo:

Primeiro, os modelos são treinados até que a perda ou a recompensa atinja um limite aceitável.

Em seguida, o desempenho do modelo é validado em um novo conjunto de tarefas, muitas vezes usando métricas de desempenho diferentes.

Se os resultados da avaliação do modelo não forem satisfatórios, o modelo passa por um treinamento adicional, geralmente com ajustes estratégicos destinados a lidar com qualquer falha identificada na fase de validação.

AI Academy

Torne-se um especialista em IA

Adquira conhecimento para priorizar os investimentos em IA que estimulam o crescimento dos negócios. Comece a usar hoje mesmo a nossa AI Academy sem custo e lidere o futuro da IA na sua organização.

Assista à série

Implementação de modelos

Após o treinamento e a validação bem-sucedida de um modelo, ele passa para a fase de implementação, durante a qual você operacionaliza o modelo em um ambiente de produção real e o integra aos sistemas e APIs existentes. O ideal é que a fase de avaliação do modelo tenha validado o desempenho do modelo em tarefas que usam ou pelo menos se aproximam desses fluxos de trabalho do mundo real.

Existem muitas configurações a serem consideradas na implementação de modelos, mas talvez a decisão mais importante seja o tipo de ambiente de implementação em que ele operará.

Ambientes de implementação

Implementação no local: o modelo é executado no hardware físico, geralmente aceleradores de IA, que você (ou sua organização) possui e mantém. Esta opção oferece maior controle, mas também exige o maior investimento inicial.

Implementação na nuvem: o modelo é executado em um hardware de propriedade e operado por provedores de nuvem terceirizados, localizados fisicamente em outro lugar em um grande data center. A implementação na nuvem é geralmente o caminho mais rápido para a escalabilidade.

Implementação no edge: o modelo é implementado em uma rede local distribuída de "dispositivos de edge", como sensores ou dispositivos de Internet das coisas (IoT).

Implementação no dispositivo: o modelo é executado diretamente no dispositivo do usuário final, como um notebook ou smartphone.

Monitoramento do modelo

Um modelo implementado raramente deve ser considerado um produto inerte e "acabado". Uma governança de IA adequada exige o monitoramento contínuo das métricas de desempenho do modelo e do feedback do usuário.

É quase inevitável que, em uma aplicação no mundo real, surjam problemas imprevistos e casos de edge, não importa o quão minuciosamente você planeje, teste e realize simulações de segurança com antecedência. Além disso, mesmo um modelo treinado de forma otimizada pode, com o tempo, sofrer com a degradação do desempenho devido a problemas como o desvio do modelo.

A implementação de modelos, portanto, normalmente requer treinamento periódico para manter um desempenho adequado e se adaptar às mudanças de circunstâncias. Mais uma vez, esquemas de controle de versão bem pensados são importantes para depuração, responsabilização e atualização segura em sistemas críticos.

Autora

Dave Bergmann

Senior Staff Writer, AI Models

IBM Think

Ciência de dados e MLOps para líderes de dados

Alinhe-se com outros líderes sobre as três principais metas de MLOps e IA confiável: confiança nos dados, confiança nos modelos e confiança nos processos.