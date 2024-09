O subajuste é um cenário em ciência de dados no qual um modelo de dados é incapaz de capturar o relacionamento entre as variáveis de entrada e saída com precisão, gerando uma alta taxa de erro tanto no conjunto de treinamento quanto nos dados não exibidos. Ele ocorre quando um modelo é muito simples, o que pode ser o resultado de um modelo que necessita de mais tempo de treinamento, mais recursos de entrada, ou menos regularização. Assim como no sobreajuste (overfitting), um modelo com subajuste não consegue estabelecer a tendência dominante nos dados, o que resulta em erros de treinamento e baixo desempenho. Se um modelo não fizer uma generalização adequada para novos dados, não poderá ser utilizado para tarefas de classificação ou previsão. É devido à generalização de um modelo para novos dados que é possível usar algoritmos de machine learning, todos os dias, para fazer previsões e classificar dados.

Uma propensão alta e uma variância baixa são indicadores plausíveis de subajuste. Como esse comportamento pode ser notado durante o uso do conjunto de dados de treinamento, os modelos com subajuste geralmente são mais fáceis de identificar do que aqueles com sobreajuste.