O que é underfitting?

As mais recentes tendências em IA, trazidas a você por especialistas

Receba insights selecionados sobre as notícias mais importantes (e intrigantes) sobre IA. Inscreva-se no nosso boletim informativo semanal Think. Consulte a Declaração de privacidade da IBM.

Agradecemos a você! Você se inscreveu.

Sua assinatura será entregue em inglês. Você encontrará um link para cancelar a assinatura em cada boletim informativo. Você pode gerenciar suas assinaturas ou cancelar a assinatura aqui. Consulte nossa Declaração de privacidade da IBM para obter mais informações.

O que é underfitting?

Underfitting é um cenário em ciência de dados em que um modelo não consegue capturar com precisão a relação entre os inputs e outputs, gerando uma alta taxa de erro tanto no conjunto de treinamento quanto em dados não vistos.

O underfitting ocorre quando um modelo é simples demais, o que pode ser causado por tempo de treinamento insuficiente, poucas funcionalidades de entrada ou regularização excessiva.

Assim como o overfitting, um modelo com underfitting não consegue identificar a tendência dominante nos dados, o que resulta em erros durante o treinamento e baixo desempenho do modelo. Se um modelo não puder generalizar bem para novos dados, ele não poderá ser aproveitado para tarefas de classificação ou previsão. A capacidade de um modelo generalizar para novos dados é justamente o que torna possível o uso diário de algoritmos de aprendizado de máquina para fazer previsões e classificar dados.

Alto viés e baixa variância são bons indicadores de underfitting. Como esse comportamento pode ser observado durante o uso do conjunto de treinamento, modelos com underfitting geralmente são mais fáceis de identificar do que os com overfitting.

Mixture of Experts | 12 de dezembro, episódio 85

Decodificando a IA: resumo semanal das notícias

Participe do nosso renomado painel de engenheiros, pesquisadores, líderes de produtos e outros enquanto filtram as informações sobre IA para trazerem a você as mais recentes notícias e insights sobre IA.

Underfitting vs. overfitting

Simplificando, o overfitting é o oposto do underfitting: ocorre quando o modelo é treinado em excesso ou tem complexidade demais, resultando em altas taxas de erro nos dados de teste. O overfitting é mais comum do que o underfitting, que normalmente ocorre como tentativa de evitá-lo, por meio de um processo chamado “parada antecipada” (early stopping).

Se o treinamento insuficiente ou a baixa complexidade levam ao underfitting, então uma estratégia lógica de prevenção seria aumentar o tempo de treinamento ou adicionar entradas mais relevantes. No entanto, se o modelo for treinado em excesso ou receber funcionalidades demais, pode acabar sofrendo de overfitting, apresentando baixo viés e alta variância (ou seja, o dilema viés-variância). Nesse cenário, o modelo estatístico se ajusta demais aos dados de treinamento, perdendo a capacidade de generalizar bem para novos pontos de dados. É importante observar que alguns tipos de modelos podem ser mais propensos ao overfitting do que outros, como árvores de decisão ou KNN.

Identificar overfitting pode ser mais difícil do que detectar underfitting porque, ao contrário do underfitting, os dados de treinamento apresentam alta precisão em um modelo com overfitting. Para avaliar a precisão de um algoritmo, normalmente se utiliza uma técnica chamada validação cruzada k-fold.

Na validação cruzada k-folds, os dados são divididos em k subconjuntos de tamanhos iguais, conhecidos como "folds". Um dos k-folds será usado como conjunto de teste, também chamado de conjunto de retenção ou conjunto de validação, enquanto os demais folds serão utilizados para treinar o modelo. Este processo se repete até que cada dobra tenha atuado como uma dobra de resistência. Após cada avaliação, uma pontuação é mantida e, ao término de todas as iterações, as pontuações são calculadas para avaliar o desempenho geral do modelo.

O cenário ideal ao treinar um modelo é encontrar o equilíbrio entre overfitting e underfitting. Identificar esse “ponto ideal” entre os dois permite que modelos de aprendizado de máquina façam previsões com precisão.

Como evitar o subajuste

Como conseguimos detectar o underfitting com base no conjunto de treinamento, conseguimos auxiliar melhor na identificação da relação dominante entre os inputs e outputs logo no início. Ao manter uma complexidade de modelo adequada, podemos evitar o underfitting e obter previsões mais precisas. Abaixo estão algumas técnicas que podem ajudar a reduzir o underfitting:

Diminua a regularização

A regularização é geralmente usada para reduzir a variância de um modelo aplicando uma penalidade aos parâmetros de entrada com coeficientes maiores. Existem diferentes métodos, como regularização L1, regularização Lasso, dropout e outros, que ajudam a reduzir ruídos e valores discrepantes dentro de um modelo. No entanto, se as funcionalidades dos dados se tornarem homogêneas demais, o modelo não consegue identificar a tendência dominante, levando ao underfitting. Ao diminuir o nível de regularização, é possível introduzir mais complexidade e variação no modelo, permitindo seu treinamento adequado.

Aumente a duração do treinamento

Como mencionado anteriormente, interromper o treinamento cedo demais também pode resultar em um modelo com underfitting. Portanto, estender a duração do treinamento pode evitar esse problema. No entanto, é importante estar atento ao excesso de treinamento e, consequentemente, ao overfitting. Encontrar o equilíbrio entre esses dois cenários é essencial.

Seleção de funcionalidade

Em qualquer modelo, determinados atributos são usados para prever um resultado específico. Se não houver atributos preditivos suficientes, devem ser introduzidos mais atributos, ou atributos com maior relevância. Por exemplo, em uma rede neural, você pode adicionar mais neurônios ocultos ou, em uma random forest, adicionar mais árvores. Esse processo injeta mais complexidade no modelo, proporcionando melhores resultados de treinamento.

Soluções relacionadas
IBM watsonx.ai

Treine, valide, ajuste e implemente recursos de IA generativa, modelos de base e recursos de aprendizado de máquina com o IBM watsonx.ai, um estúdio empresarial de última geração para construtores de IA. Crie aplicações de IA em uma fração do tempo com uma fração dos dados.

Conheça o watsonx.ai
Soluções de inteligência artificial

Use a IA a serviço de sua empresa com a experiência e o portfólio de soluções líder do setor da IBM à sua disposição.

Explore as soluções de IA
Consultoria e serviços em IA

Reinvente os fluxos de trabalho e operações críticos adicionando IA para maximizar experiências, tomadas de decisão em tempo real e valor de negócios.

Explore os serviços de IA
Dê o próximo passo

Obtenha acesso completo aos recursos que abrangem o ciclo de vida do desenvolvimento da IA. Produza soluções poderosas de IA com interfaces fáceis de usar, fluxos de trabalhos e acesso a APIs e SDKs padrão do setor.

Explore o watsonx.ai Agende uma demonstração em tempo real