A classificação tem sido tradicionalmente um tipo de aprendizado de máquina supervisionado, o que significa que ela usa dados rotulados para treinar modelos. No aprendizado supervisionado, cada ponto de dados nos dados de treinamento contém variáveis de entrada (também conhecidas como variáveis independentes ou funcionalidades) e uma variável de saída, ou rótulo.
No treinamento de classificação, o trabalho do modelo é entender as relações entre funcionalidades e rótulos de classe e, em seguida, aplicar esses critérios a conjuntos de dados futuros. Os modelos de classificação usam as funcionalidades de cada ponto de dados junto com seu rótulo de classe para decodificar quais funcionalidades definem cada classe. Em termos matemáticos, o modelo considera cada ponto de dados como uma tupla x. Uma tupla é uma sequência numérica ordenada representada como x = (x1,x2,x3…xn).
Cada valor na tupla é uma funcionalidade do ponto de dados. Ao mapear dados de treinamento com essa equação, um modelo aprende quais funcionalidades estão associados a cada rótulo de classe.
O objetivo do treinamento é minimizar erros durante a modelagem preditiva. Os algoritmos de gradiente descendente treinam modelos minimizando a lacuna entre os resultados previstos e os reais. Posteriormente, os modelos podem receber ajuste fino com mais treinamento para executar tarefas mais específicas.
As abordagens de aprendizado não supervisionado para problemas de classificação têm sido um foco importante de pesquisas recentes. Métodos de aprendizado não supervisionado permitem que os modelos descubram padrões em dados não rotulados por si mesmos. A falta de rótulos é o que diferencia o aprendizado não supervisionado do aprendizado supervisionado.
Enquanto isso, o aprendizado semissupervisionado combina dados rotulados e não rotulados para treinar modelos para fins de classificação e regressão. Em situações em que a obtenção de grandes conjuntos de dados rotulados não é viável, o aprendizado semissupervisionado é uma alternativa viável.