No campo de ciência de dados, os dados de referência representam o padrão de excelência dos dados precisos. Isso permite que os cientistas de dados avaliem o desempenho do modelo comparando os resultados com a “resposta correta” (dados baseados em observações do mundo real). Isso valida que os modelos de aprendizado de máquina (ML) produzem resultados precisos que refletem a realidade.
Dados de referência são especialmente importantes para o aprendizado supervisionado, uma subcategoria de ML que usa conjuntos de dados rotulados para treinar algoritmos a classificar dados (classificadores) ou prever resultados com precisão.
Rotulagem de dados ou anotação de dados é fundamental para a coleta de dados de referência. Sem rótulos ou anotações precisas, os dados não podem ser considerados um benchmark para a verdade no mundo real.
Os dados de verdade fundamental são a base do aprendizado supervisionado de máquina, que depende de conjuntos de dados de alta qualidade e rotulados. Modelos de aprendizado supervisionado de máquina (ML) são usados para construir e avançar muitas das aplicações de IA atuais. Por exemplo, os modelos de ML supervisionados são responsáveis pelo reconhecimento de imagens e objetos, análises preditivas de dados, análise de sentimentos de clientes e detecção de spam.
Os dados de verdade de base fornecem as informações rotuladas e verificadas de forma precisa necessárias para treinar modelos supervisionados de ML, validar seu desempenho e testar sua capacidade de generalização (ou fazer previsões precisas com base em novos dados). Ao atuar como a "resposta correta" em comparação com as previsões do modelo, a verdade de base assegura que os sistemas de IA aprendam os padrões adequados e funcionem de forma confiável em cenários reais.
Por exemplo, imagine a imagem de um gato. O conjunto de dados de treinamento para esta imagem pode incluir rótulos para o corpo, as orelhas, os olhos e os bigodes do gato, classificações até o nível de pixel. Essas anotações ensinam algoritmos de aprendizado de máquina a identificar funcionalidades semelhantes dentro de novos dados de imagem.
A precisão desses rótulos no conjunto de treinamento é crítica. Se as anotações forem incorretas ou inconsistentes (como rotular patas de cachorro em vez de patas de gato), o modelo não aprende os padrões corretos. Isso pode levar a previsões falsas.
Um gato com patas de cachorro pode parecer inócuo. No entanto, as consequências de previsões falsas são mais graves em áreas como saúde e mitigação das mudanças climáticas, onde a precisão em tempo real é fundamental.
A ground truth é essencial para o ciclo de vida do aprendizado supervisionado de máquina (ML), incluindo as fases de treinamento, validação e teste do modelo.
A ground truth serve como a base para várias tarefas de aprendizado supervisionado, incluindo classificação, regressão e segmentação. Não importa se um modelo está aprendendo a categorizar dados, prever resultados numéricos ou identificar objetos em imagens, a verdade básica fornece o benchmark para previsões precisas. Essas tarefas têm uma ampla variedade de casos de uso no mundo real, nos quais a precisão dos dados reais é crucial para o sucesso.
Nas tarefas de classificação, os dados de ground truth fornecem os rótulos corretos para cada entrada, ajudando o modelo a categorizar dados em classes pré-definidas. Por exemplo, na classificação binária, um modelo distingue entre duas categorias (como verdadeiro ou falso). A classificação múltiplas classes é um pouco mais complexa: o modelo atribui os dados a uma das várias classes que deve escolher.
Considere o setor de saúde. As plataformas de IA frequentemente usam classificação de múltiplas classes para analisar imagens médicas, como tomografias e ressonâncias magnéticas, para ajudar no diagnóstico.
Falando de forma geral, uma aplicação de IA pode examinar uma radiografia de um braço e categorizá-la em uma das quatro classes: quebrado, fraturado, torcido ou saudável. Se os dados de ground truth forem falhos, isso pode levar a previsões incorretas, resultando potencialmente em diagnósticos errados ou tratamentos atrasados.
As tarefas de regressão se concentram em prever valores contínuos. Os dados de ground truth representam os resultados numéricos reais que o modelo busca prever. Por exemplo, um modelo de regressão linear pode prever os preços das casas com base em fatores como metragem quadrada, número de cômodos e localização.
Na mitigação das mudanças climáticas, modelos de IA usam imagens de satélite e dados de sensoriamento remoto para monitorar mudanças ambientais, incluindo variações de temperatura ou desmatamento.
Os dados de ground truth neste caso incluem registros verificados de dados históricos de clima ou medições conhecidas de temperatura. Esses dados de ground truth ajudam a garantir que as previsões do modelo de IA sejam precisas e possam informar decisões críticas de políticas e ações climáticas.
Tarefas de segmentação envolvem dividir uma imagem ou conjunto de dados em regiões ou objetos distintos. Dados de ground truth em segmentação são frequentemente definidos no nível do pixel para identificar limites ou regiões dentro de uma imagem.
Por exemplo, no desenvolvimento de veículos autônomos, os rótulos de ground truth são usados para treinar modelos a detectar e diferenciar pedestres, veículos e sinais de trânsito em ambientes reais e agir de acordo. Se os rótulos de ground truth forem incorretos ou inconsistentes, o modelo pode identificar incorretamente objetos, representando sérios riscos de segurança nas estradas.
Existem vários desafios para estabelecer dados reais de alta qualidade, incluindo:
Existem várias estratégias e metodologias que as organizações podem usar para estabelecer e otimizar dados de ground truth de alta qualidade, incluindo:
Governe modelos de IA generativa de qualquer lugar e implemente na nuvem ou no local com o IBM watsonx.governance.
Use a IA a serviço de sua empresa com a experiência e o portfólio de soluções líder do setor da IBM à sua disposição.
Reinvente os fluxos de trabalho e operações críticos adicionando IA para maximizar experiências, tomadas de decisão em tempo real e valor de negócios.