A principal distinção entre as duas abordagens é o uso de conjuntos de dados rotulados. Simplificando, o aprendizado supervisionado usa dados rotulados de entrada e saída, enquanto um algoritmo de aprendizado não supervisionado não.

No aprendizado supervisionado, o algoritmo "aprende" com o conjunto de dados de treinamento, fazendo previsões iterativas sobre os dados e ajustando-se para a resposta correta. Embora os modelos de aprendizado supervisionado tendam a ser mais precisos do que os modelos de aprendizado não supervisionado, eles exigem intervenção humana inicial para rotular os dados adequadamente. Por exemplo, um modelo de aprendizado supervisionado pode prever quanto tempo seu deslocamento terá com base na hora do dia, nas condições climáticas e assim por diante. Mas, primeiro, é preciso treiná-lo para saber que o tempo chuvoso prolonga o tempo de condução.

Os modelos de aprendizado não supervisionado, por outro lado, trabalham por conta própria para descobrir a estrutura inerente dos dados não rotulados. Observe que eles ainda requerem alguma intervenção humana para validar variáveis de saída. Por exemplo, um modelo de aprendizado não supervisionado pode identificar que os compradores online frequentemente compram grupos de produtos ao mesmo tempo. No entanto, um analista de dados precisaria validar se faz sentido para um mecanismo de recomendação agrupar roupas de bebê com um pedido de fraldas, compota de maçã e copinhos.