O mundo está ficando "mais inteligente" a cada dia e, para acompanhar as expectativas dos consumidores, as empresas estão usando cada vez mais algoritmos de aprendizado de máquina para facilitar as coisas. Você pode vê-los em uso nos dispositivos do usuário final (por meio de reconhecimento facial para liberar smartphones) ou para detectar fraudes de cartão de crédito (como o acionamento de alertas para compras incomuns).
Dentro da inteligência artificial (IA) e do aprendizado de máquina, existem duas abordagens básicas: aprendizado supervisionado e aprendizado não supervisionado. A principal diferença é que um usa dados rotulados para ajudar a prever os resultados, enquanto o outro não. No entanto, existem algumas nuances entre as duas abordagens e áreas-chave em que uma supera a outra. Esta publicação esclarece as diferenças para que você possa escolher a melhor abordagem para sua situação.
Boletim informativo do setor
Receba insights selecionados sobre as notícias mais importantes (e intrigantes) sobre IA. Inscreva-se no nosso boletim informativo semanal Think. Consulte a Declaração de privacidade da IBM.
Sua assinatura será entregue em inglês. Você encontrará um link para cancelar a assinatura em cada boletim informativo. Você pode gerenciar suas assinaturas ou cancelar a assinatura aqui. Consulte nossa Declaração de privacidade da IBM para obter mais informações.
O aprendizado supervisionado é uma abordagem de aprendizado de máquina definida pelo uso de conjuntos de dados rotulados. Esses conjuntos de dados são projetados para treinar ou "supervisionar" algoritmos na classificação de dados ou na previsão de resultados com precisão. Usando entradas e saídas rotuladas, o modelo pode medir sua precisão e aprender ao longo do tempo.
O aprendizado supervisionado divide-se em dois tipos de problemas na mineração de dados: classificação e regressão.
O aprendizado não supervisionado usa algoritmos de aprendizado de máquina para analisar e agrupar conjuntos de dados não rotulados. Esses algoritmos descobrem padrões ocultos em dados sem a necessidade de intervenção humana (portanto, são "não supervisionados").
Modelos de aprendizado não supervisionado são usados para três tarefas principais: cluster, associação e redução de dimensionalidade:
A principal distinção entre as duas abordagens é o uso de conjuntos de dados rotulados. Simplificando, o aprendizado supervisionado usa dados rotulados de entrada e saída, enquanto um algoritmo de aprendizado não supervisionado não.
No aprendizado supervisionado, o algoritmo "aprende" com o conjunto de dados de treinamento, fazendo previsões iterativas sobre os dados e ajustando-se para a resposta correta. Embora os modelos de aprendizado supervisionado tendam a ser mais precisos do que os modelos de aprendizado não supervisionado, eles exigem intervenção humana inicial para rotular os dados adequadamente. Por exemplo, um modelo de aprendizado supervisionado pode prever quanto tempo seu deslocamento terá com base na hora do dia, nas condições climáticas e assim por diante. Mas, primeiro, é preciso treiná-lo para saber que o tempo chuvoso prolonga o tempo de condução.
Os modelos de aprendizado não supervisionado, por outro lado, trabalham por conta própria para descobrir a estrutura inerente dos dados não rotulados. Observe que eles ainda requerem alguma intervenção humana para validar variáveis de saída. Por exemplo, um modelo de aprendizado não supervisionado pode identificar que os compradores online frequentemente compram grupos de produtos ao mesmo tempo. No entanto, um analista de dados precisaria validar se faz sentido para um mecanismo de recomendação agrupar roupas de bebê com um pedido de fraldas, compota de maçã e copinhos.
A escolha da abordagem certa para sua situação depende de como seus cientistas de dados avaliam a estrutura e o volume de seus dados, bem como o caso de uso. Para tomar sua decisão, certifique-se de fazer o seguinte:
A classificação de big data pode ser um verdadeiro desafio no aprendizado supervisionado, mas os resultados são altamente precisos e confiáveis. Por outro lado, o aprendizado não supervisionado pode lidar com grandes volumes de dados em tempo real. Porém, há uma falta de transparência sobre como os dados são agrupados e um risco maior de resultados imprecisos. É aqui que entra o aprendizado semissupervisionado.
Não consegue decidir se deseja usar aprendizado supervisionado ou não supervisionado? O aprendizado semissupervisionado é um meio termo, onde você usa um conjunto de dados de treinamento com dados rotulados e não rotulados. É particularmente útil quando é difícil extrair funcionalidades relevantes dos dados e quando você tem um grande volume de dados.
O aprendizado semissupervisionado é ideal para imagens médicas, onde uma pequena quantidade de dados de treinamento pode levar a uma melhoria significativa na precisão. Por exemplo, um radiologista pode rotular um pequeno subconjunto de tomografias computadorizadas (TCs) em busca de tumores ou doenças para que a máquina possa prever com mais precisão quais pacientes podem precisar de mais atenção médica.
Os modelos de aprendizado de máquina são uma maneira poderosa de obter os insights de dados que melhoram o nosso mundo. Para saber mais sobre os algoritmos específicos usados com aprendizado supervisionado e não supervisionado, incentivamos você a se aprofundar nos artigos do Learn Hub sobre essas técnicas. Também recomendamos verificar o post de blog que vai um passo além, com uma visão detalhada de deep learning e redes neurais.
Treine, valide, ajuste e implemente recursos de IA generativa, modelos de base e recursos de aprendizado de máquina com o IBM watsonx.ai, um estúdio empresarial de última geração para construtores de IA. Crie aplicações de IA em uma fração do tempo com uma fração dos dados.
Use a IA a serviço de sua empresa com a experiência e o portfólio de soluções líder do setor da IBM à sua disposição.
Reinvente os fluxos de trabalho e operações críticos adicionando IA para maximizar experiências, tomadas de decisão em tempo real e valor de negócios.