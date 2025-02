É claro que cada algoritmo de classificação de aprendizado de máquina difere em suas operações internas. No entanto, todos seguem um processo geral de classificação de dados em duas etapas:

Aprendizado. No aprendizado supervisionado, um anotador humano atribui um rótulo a cada ponto de dados no conjunto de treinamento. Esses pontos são definidos por um conjunto de variáveis de input (ou variáveis independentes), que podem ser numéricas, cadeias de texto, funcionalidades de imagens, entre outras. Em termos matemáticos, o modelo considera cada ponto de dados como uma tupla x. Uma tupla é simplesmente uma sequência numérica ordenada representada como x = (x 1 , x 2 , x 3 …x n ). Cada valor na tupla representa uma funcionalidade específica do ponto de dados. O modelo usa as funcionalidades de cada ponto de dados junto com seu rótulo de classe para identificar quais funcionalidades definem cada classe. Ao mapear os dados de treinamento conforme essa equação, o modelo aprende as funcionalidades gerais associadas a cada rótulo de classe.

Classificação. A segunda etapa nas tarefas de classificação é a classificação propriamente dita. Nessa fase, os usuários aplicam o modelo a um conjunto de testes composto por dados não vistos. Dados que não foram usados anteriormente são ideais para avaliar a classificação do modelo e evitar o overfitting. O modelo utiliza sua função preditiva aprendida y=f(x) para classificar os dados não vistos em classes distintas com base nas funcionalidades de cada amostra. Os usuários então avaliam a precisão do modelo de acordo com o número de amostras de teste corretamente previstas.2