O foco do setor em uma IA confiável está sendo impulsionado por várias forças: postura de responsabilidade social corporativa, preocupações com risco à reputação e um conjunto crescente de regulamentações. As organizações reconhecem que precisam de uma abordagem sistemática para garantir que a IA e o aprendizado de máquina possam ser confiáveis e operacionalizados. Os aspectos da IA confiável incluem justiça, robustez, privacidade, explicabilidade e transparência. Os padrões de casos de uso incluem a realização de verificações de integridade de aplicações existentes e a criação de um framework para a governança de IA em toda a organização, mas hoje, vamos nos concentrar na operacionalização de novas aplicações.
As organizações precisam de uma abordagem sistemática para criar e operacionalizar novas aplicações de IA de maneira confiável. Essa abordagem deve levar em consideração o ciclo de vida da ciência de dados e da IA de ponta a ponta. O ciclo de vida da IA consiste em uma sequência de estágios que reúnem várias personas e melhores práticas. (Consulte o relatório da O'Reilly Operationalizing AI para obter uma visão geral). Os estágios do ciclo de vida incluem:
Em um cenário ideal, os aspectos da IA confiável devem ser abordados em cada uma dessas etapas e não apenas no final. Precisamos de proteções apropriadas em cada estágio, desde a definição do negócio, exploração de dados e construção do modelo até a validação, implementação, monitoramento e gerenciamento contínuo do modelo. Vamos dar uma olhada mais de perto em cada estágio e como os vários aspectos da IA confiável são abordados.
Essa etapa orienta a priorização de casos de uso e o desenvolvimento de um plano de ação de IA. A equipe — composta por um stakeholder de negócios, cientista de dados, proprietário de dados, líder de operações e outras funções — primeiro se concentra no caso de uso de negócios, definindo o valor de negócios e especificando KPIs de negócios. Em seguida, aborda a tarefa técnica, traduzindo a meta de negócios em tarefas de IA específicas a serem resolvidas. Por fim, a equipe desenvolve um plano de ação estruturado para uma solução para as tarefas técnicas identificadas em apoio à meta de negócios.
Aplicar os princípios do Enterprise Design Thinking é uma prática recomendada para este estágio. O Design Thinking ajuda a identificar e definir vários aspectos comerciais e técnicos de viés/imparcialidade, robustez, explicabilidade etc. no contexto do caso de uso. Esta etapa ajuda a responder perguntas como:
Também é importante anotar quaisquer dados organizacionais e políticas de IA que a equipe terá que seguir enquanto desenvolve esses casos de uso, para evitar desafios de última hora ao tentar validar para uso em produção.
Essa etapa permite que o consumidor de dados encontre e acesse conjuntos de dados relevantes. As equipes de ciência de dados podem "comprar dados" em um catálogo central usando metadados ou termos comerciais para pesquisar. Elas podem conhecer os dados, incluindo seu proprietário, a linhagem, o relacionamento com outros conjuntos de dados e assim por diante. É importante fornecer aos cientistas de dados uma visão técnica da linhagem de dados, para que eles possam entender cada transformação de dados que pode afetar a forma como eles criam e usam recursos.
Com base nessa exploração, eles podem solicitar um feed de dados. Uma vez aprovados, os conjuntos de dados podem ser disponibilizados à equipe de ciência de dados em seu ambiente de desenvolvimento de ciência de dados.
Se a equipe precisar trabalhar com dados pessoais regulamentados, como informações de identificação pessoal (PII) ou informações de saúde protegidas (PHI), o administrador de dados ou um provedor de dados deverá garantir que os dados compartilhados cumpram os regulamentos por meio de anonimato apropriado.
As equipes de ciência de dados exploram e preparam os dados, além de construir, treinar e testar seus modelos de IA/ML durante esse estágio. As atividades durante esse estágio são melhor realizadas como um conjunto de sprints ágeis. É importante que os vieses nos dados sejam verificados nesta fase, mesmo antes de qualquer trabalho de construção do modelo começar. Esta é uma proteção interna para a imparcialidade, e tais proteções podem ser implementadas durante e após as etapas de construção do modelo. A robustez, a explicabilidade e outros aspectos do modelo podem ser igualmente contabilizados e testados durante esta fase.
Depois que esses testes forem concluídos com sucesso, um pipeline de MLOps permite que o modelo e os ativos relacionados sejam migrados do ambiente de desenvolvimento para um ambiente de validação de pré-produção.
Essa etapa envolve a validação do modelo e a implementação em produção. As atividades de validação podem ser executadas por uma equipe diferente daquela que construiu o modelo, como a equipe de validação do modelo da organização ou de gerenciamento de risco do modelo ou uma entidade externa.
Esta equipe valida qualidade, robustez, imparcialidade etc. e gera relatórios de validação. É importante capturar os resultados da validação para referência e comparação. Fichas técnicas do modelo, explicações locais e globais e outras métricas também são verificadas.
Se o modelo passar na validação, a equipe de operações poderá promovê-lo para o ambiente de produção usando um pipeline de MLOps. O modelo é implementado lá, seja para invocação online ou em lote.
Nesse estágio, a equipe de operações estabelece o monitoramento e a gestão contínuos do modelo de IA/ML em produção. A equipe configura monitores para a coleta periódica de métricas. Qualidade, robustez e imparcialidade são monitoradas em frequências ditadas pelas necessidades dos negócios. Monitorar o desvio de dados e precisão e gerar explicações para transações selecionadas, bem como para o comportamento global, são exemplos de atividades contínuas.
A empresa pode optar por agir caso os monitores detectem que um limite foi violado, abrangendo desde alertas até medidas corretivas. As etapas de mitigação de viés ou re-treinamento do modelo podem ser configuradas para garantir um comportamento confiável contínuo. Os modelos podem ser desativados com base em critérios comerciais ou técnicos. Esse estágio estabelece os limites externos para uma IA confiável.
Esses estágios do ciclo de vida da IA se encaixam em uma estrutura geral de governança de IA para a empresa. Essa framework permite que vários casos de uso sigam os estágios do ciclo de vida de forma consistente, independentemente das ferramentas de desenvolvimento usadas. Ela ajuda a automatizar a documentação em todo o ciclo de vida e fornece uma visão consistente para os diversos stakeholders.
A operacionalização da IA confiável exige que juntemos pessoas (especialização), processos (melhores práticas) e plataforma (tecnologia). IBM Cloud Pak for Data e IBM Spectrum Fusion fornecem o framework que suporta várias etapas do ciclo de vida da IA de ponta a ponta. Ele pode se encaixar em ambientes existentes e complementar as ferramentas existentes de desenvolvimento e implementação de modelos. A plataforma pode ser executada em uma ampla variedade de opções de nuvem (IBM, AWS, Azure, GCP etc.) e infraestrutura local, proporcionando um verdadeiro recurso de nuvem híbrida.
A IBM fornece um conjunto de ofertas de serviços que reúne Educação, conhecimento, melhores práticas e Tecnologia para ajudar os clientes a começar a operacionalizar a IA confiável.