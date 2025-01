A preparação de dados é o processo de coleta de dados brutos e sua integração a um conjunto de dados de treinamento. A preparação de dados ajuda a garantir que os dados de treinamento estejam livres de vieses e é o que prepara um modelo para o sucesso: dados precisos levam a previsões e insights precisos. Como as empresas vinculam sistemas de IA a armazenamentos de dados proprietários, como por meio da geração aumentada de recuperação (RAG) , a preparação de dados é crítica para a implementação confiável da IA.

Os usuários conectam a plataforma de AutoML à fonte dos dados de treinamento, idealmente um grande conjunto de dados contendo dados prontos para uso no treinamento. A fase de preparação de dados ocorre antes de implementar uma solução de AutoML.

A solução de AutoML intervém para pré-processar e limpar ainda mais os dados. Um pré-processamento de dados mais completo leva a um melhor desempenho do modelo de IA.

Ao criar manualmente modelos para tarefas de aprendizado supervisionado e aprendizado semissupervisionado, os dados de treinamento devem ser rotulados manualmente. As funcionalidades e saídas devem ser selecionadas com base no caso de uso pretendido do modelo. As soluções de AutoML podem lidar com a engenharia de funcionalidades em nome dos usuários para selecionar as funcionalidades de dados com maior probabilidade de melhorar o desempenho do modelo.