Os dados de verdade fundamental são a base do aprendizado supervisionado de máquina, que depende de conjuntos de dados de alta qualidade e rotulados. Modelos de aprendizado supervisionado de máquina (ML) são usados para construir e avançar muitas das aplicações de IA atuais. Por exemplo, os modelos de ML supervisionados são responsáveis pelo reconhecimento de imagens e objetos, análises preditivas de dados, análise de sentimentos de clientes e detecção de spam.

Os dados de verdade de base fornecem as informações rotuladas e verificadas de forma precisa necessárias para treinar modelos supervisionados de ML, validar seu desempenho e testar sua capacidade de generalização (ou fazer previsões precisas com base em novos dados). Ao atuar como a "resposta correta" em comparação com as previsões do modelo, a verdade de base assegura que os sistemas de IA aprendam os padrões adequados e funcionem de forma confiável em cenários reais.

Por exemplo, imagine a imagem de um gato. O conjunto de dados de treinamento para esta imagem pode incluir rótulos para o corpo, as orelhas, os olhos e os bigodes do gato, classificações até o nível de pixel. Essas anotações ensinam algoritmos de aprendizado de máquina a identificar funcionalidades semelhantes dentro de novos dados de imagem.

A precisão desses rótulos no conjunto de treinamento é crítica. Se as anotações forem incorretas ou inconsistentes (como rotular patas de cachorro em vez de patas de gato), o modelo não aprende os padrões corretos. Isso pode levar a previsões falsas.

Um gato com patas de cachorro pode parecer inócuo. No entanto, as consequências de previsões falsas são mais graves em áreas como saúde e mitigação das mudanças climáticas, onde a precisão em tempo real é fundamental.