O que é um algoritmo de aprendizado de máquina?
Comece sua avaliação sem custo do watsonx.ai
Uma rede neural

Um algoritmo de aprendizado de máquina é um conjunto de regras ou processos usados por um sistema de IA para realizar tarefas, geralmente para descobrir novos padrões e insights de dados ou para prever valores de saída de um determinado conjunto de variáveis de entrada. Os algoritmos permitem que o aprendizado de máquina (ML) aprenda.

Os analistas do setor reconhecem a importância do aprendizado de máquina e seus algoritmos subjacentes. Segundo a Forrester, "os avanços nos algoritmos de aprendizado de máquina trazem precisão e profundidade à análise de dados de marketing que ajudam os profissionais da área a entender como os detalhes de marketing (como plataforma, criativo, chamada para ação ou mensagens) afetam o desempenho".1 Já a Gartner afirma que "o aprendizado de máquina está no centro de muitas aplicações de IA bem-sucedidas, alimentando sua enorme tração no mercado".2

Geralmente, o treinamento de algoritmos de ML com mais dados fornece respostas mais precisas do que aqueles com menos dados. Usando métodos estatísticos, algoritmos são treinados para determinar classificações ou fazer previsões, bem como para descobrir insights importantes em projetos de mineração de dados. Esses insights podem posteriormente melhorar a tomada de decisão para elevar métricas de crescimento importantes.

Entre os casos de uso de algoritmos de aprendizado de máquina estão: a capacidade de analisar dados para identificar tendências e prever problemas antes que ocorram.3 Uma IA mais avançada pode permitir um suporte mais personalizado, reduzir o tempo de resposta, proporcionar reconhecimento de fala e melhorar a satisfação do cliente. Alguns dos setores que se beneficiam particularmente de algoritmos de aprendizado de máquina para criar novos conteúdos com base em grandes volumes de dados são: gestão da cadeia de suprimentos, transporte e logística, varejo e produção.4 Todos eles adotam a IA generativa, com sua capacidade de automatizar tarefas, melhorar a eficiência e fornecer insights valiosos, mesmo para iniciantes.

Disponível agora: watsonx

Multiplique o poder da IA para sua empresa com a plataforma de dados e IA de última geração da IBM.

Conteúdo relacionado

Assine a newsletter da IBM

Deep learning

O deep learning é uma aplicação específica das funções avançadas fornecidas pelos algoritmos de aprendizado de máquina. A diferença está na forma como cada algoritmo aprende. Os modelos de aprendizado de máquina "profundo" podem utilizar conjuntos de dados rotulados, também conhecidos como aprendizado supervisionado, para informar seu algoritmo, mas não necessariamente exigem dados rotulados. O deep learning pode ingerir dados não estruturados em sua forma bruta (como texto ou imagens) e pode determinar automaticamente o conjunto de recursos que distinguem diferentes categorias de dados umas das outras. Isso elimina parte da intervenção humana necessária e possibilita o uso de conjuntos de dados maiores.

A maneira mais fácil de pensar sobre inteligência artificial, aprendizado de máquina, deep learning e redes neurais é pensar nelas como uma série de sistemas de IA, do maior para o menor, cada um abrangendo o seguinte. A inteligência artificial (IA) é o sistema mais abrangente. O aprendizado de máquina é um subconjunto da IA. Já o deep learning é um subcampo do aprendizado de máquina, enquanto as redes neurais constituem a espinha dorsal dos algoritmos de deep learning. É o número de camadas de nós (ou profundidade) das redes neurais que distingue uma única rede neural de um algoritmo de deep learning, que deve ter mais de três.

Como funcionam os algoritmos de aprendizado de máquina

Um artigo da Universidade da Califórnia em Berkeley divide o sistema de aprendizado de um algoritmo de aprendizado de máquina em três partes principais.5

  1. Processo de decisão: em geral, os algoritmos de aprendizado de máquina são usados para fazer uma previsão ou classificação. Com base em alguns dados de entrada, que podem ser rotulados ou não rotulados, o algoritmo produzirá uma estimativa sobre um padrão nos dados.

  2. Função de erro: uma função de erro avalia a previsão do modelo. Se houver exemplos conhecidos, uma função de erro poderá realizar uma comparação para avaliar a precisão do modelo.

3.    Processo de otimização do modelo: se o modelo puder se ajustar melhor aos pontos de dados no conjunto de treinamento, os pesos serão ajustados para reduzir a discrepância entre o exemplo conhecido e a estimativa do modelo. O algoritmo repetirá esse processo de "avaliação e otimização", atualizando pesos de forma autônoma até que um limite de precisão seja atingido.  

O aprendizado supervisionado, em particular, utiliza um conjunto de treinamento para ensinar modelos   para produzir o resultado desejado. Esse conjunto de dados de treinamento inclui entradas e saídas corretas, o que permite ao modelo aprender com o tempo. O algoritmo mede sua precisão por meio da função de perda, ajustando-se até que o erro tenha sido suficientemente minimizado.

Tipos de algoritmos de aprendizado de máquina

Existem quatro tipos de algoritmos de aprendizado de máquina: supervisionado, não supervisionado, semi-supervisionado e por reforço.  Dependendo do seu orçamento e da sua necessidade de velocidade e precisão, cada tipo e variante tem suas vantagens. Os algoritmos avançados de aprendizado de máquina exigem várias tecnologias (como deep learning, redes neurais e processamento de linguagem natural) e são capazes de usar aprendizado não supervisionado e supervisionado.6 Veja a seguir os algoritmos mais populares e comumente usados.

Algoritmos de aprendizado supervisionado

O aprendizado supervisionado pode ser separado em dois tipos de problemas na mineração de dados: classificação e regressão.

  • A classificação usa um algoritmo para atribuir dados de teste com precisão a categorias específicas. Reconhece entidades específicas dentro do conjunto de dados e tenta tirar algumas conclusões sobre como essas entidades devem ser rotuladas ou definidas. Algoritmos de classificação comuns são: classificadores lineares, máquinas de vetores de suporte (SVM), árvores de decisão, k-vizinhos mais próximos e floresta aleatória, que são descritos em mais detalhes abaixo.
  • A regressão é utilizada para entender a relação entre variáveis dependentes e independentes. É geralmente usada para fazer projeções, como receita de vendas de um determinado negócio. Regressão linear, regressão logística e regressão polinomial são algoritmos de regressão populares.

Diversos algoritmos e técnicas de computação são usados nos processos de aprendizado de máquina supervisionado, geralmente calculados por meio do uso de programas como o Python. Entre os algoritmos de aprendizado supervisionado temos:

  • AdaBoost ou reforço de gradiente: também chamada de reforço adaptativo7, essa técnica reforça um algoritmo de regressão de baixo desempenho combinando-o com outros mais fracos para criar um algoritmo mais forte que resulte em menos erros. O reforço combina o poder de previsão de vários estimadores de base.
  • Redes neurais artificiais: também conhecidas como ANNs, as redes neurais ou redes neurais simuladas (SNNs) são um subconjunto de técnicas de aprendizado de máquina e estão no centro de algoritmos de deep learning. O algoritmo aprendiz reconhece padrões nos dados de entrada usando blocos de construção chamados neurônios, aproximando-se dos neurônios do cérebro humano, que são treinados e modificados ao longo do tempo (mais em "redes neurais").
  • Algoritmos de árvores de decisão: usadas para prever valores numéricos (problemas de regressão) e classificar dados em categorias, as árvores de decisão usam uma sequência de ramificação de decisões vinculadas que podem ser representadas por um diagrama de árvore. Uma das vantagens das árvores de decisão é que elas são fáceis de validar e auditar, ao contrário da caixa-preta de uma rede neural.
  • Redução de dimensionalidade: quando um conjunto de dados selecionado tem um alto número de características7 , ele tem alta dimensionalidade. A redução de dimensionalidade reduz o número de características, deixando apenas os insights ou informações mais significativos. Um exemplo é a análise de componentes principais.
  • K-vizinhos mais próximos: também conhecido como KNN, esse algoritmo não paramétrico classifica os pontos de dados com base em sua proximidade e associação com outros dados disponíveis. Ele pressupõe que pontos de dados semelhantes podem ser encontrados próximos uns dos outros. Consequentemente, procura calcular a distância entre os pontos de dados, geralmente por meio da distância euclidiana, e depois atribui uma categoria com base na categoria mais frequente ou média. 
  • Regressão linear: usada para identificar a relação entre uma variável dependente e uma ou mais variáveis independentes. Geralmente é empregada para fazer previsões sobre resultados futuros. Quando há apenas uma variável independente e uma dependente, é conhecida como regressão linear simples.
  • Regressão logística: enquanto a regressão linear é utilizada com variáveis dependentes contínuas, a regressão logística é selecionada quando a variável dependente é categórica, o que significa que há saídas binárias, como "verdadeiro" e "falso" ou "sim" e "não". Enquanto ambos os modelos de regressão procuram entender as relações entre entradas de dados, a regressão logística é usada sobretudo para resolver problemas de classificação binária, como identificação de spam.
  • Redes neurais: utilizadas sobretudo para algoritmos de deep learning, as redes neurais processam os dados de treinamento de entrada ao imitarem a interconectividade do cérebro humano por meio de camadas de nós. Cada nó é composto de entradas, pesos, um viés (limite) e uma saída. Se esse valor de saída excede um determinado limite, ele "dispara" ou ativa o nó, passando dados para a próxima camada da rede. As redes neurais aprendem com ajustes baseados na função de perda por meio do processo de descida de gradiente. Quando a função de custo é igual ou próxima de zero, é possível confiar na precisão do modelo.
  • Naive Bayes: essa abordagem adota o princípio da independência condicional de classe do Teorema de Bayes. Isso significa que a presença de uma característica não afeta a presença de outra na probabilidade de um determinado resultado, e cada preditor tem um efeito igual sobre tal resultado. Existem três tipos de classificadores Naive Bayes: Naive Bayes multinomial, Naive Bayes Bernoulli e Naïve Bayes gaussiano. Essa técnica é usada principalmente em sistemas de classificação de texto, identificação de spam e recomendações.
  • Florestas aleatórias: em uma floresta aleatória, o algoritmo de aprendizado de máquina prevê um valor ou categoria combinando os resultados de uma série de árvores de decisão. A "floresta" refere-se a árvores de decisão não correlacionadas, que são montadas para reduzir a variância e permitir previsões mais precisas.
  • Máquinas de vetores de suporte (SVM): esse algoritmo pode ser usado tanto para classificação de dados quanto para regressão, mas geralmente para problemas de classificação, construindo um hiperplano onde a distância entre duas classes de pontos de dados está em seu máximo. Esse hiperplano é conhecido como limite de decisão, separando as classes de pontos de dados (como laranjas e maçãs) em ambos os lados do plano.
Algoritmos de aprendizado não supervisionado

Diferentemente do aprendizado supervisionado, o aprendizado não supervisionado usa dados não rotulados. A partir desses dados, o algoritmo descobre padrões que ajudam a resolver problemas de agrupamento ou associação. Isso é particularmente útil quando os especialistas em um assunto não têm certeza das propriedades comuns em um conjunto de dados. Algoritmos de agrupamentos comuns são: hierárquicos, K-means, modelos de mistura gaussiana e métodos de redução de dimensionalidade, como PCA e t-SNE.

  • Agrupamento: esses algoritmos podem identificar padrões nos dados para poderem ser agrupados. Os algoritmos podem ajudar cientistas de dados ao identificarem diferenças entre itens de dados que passaram despercebidas pelos humanos.
  • Agrupamento hierárquico: agrupa dados em uma árvore de agrupamentos.8 O agrupamento hierárquico começa pelo tratamento de todos os pontos de dados como um agrupamento separado. Em seguida, executa repetidamente estas etapas:  1) identificar os dois agrupamentos que estão mais próximos e 2) mesclar os dois agrupamentos mais comparáveis. Essas etapas continuam até que todos os agrupamentos sejam mesclados.
  • Agrupamento K-means: identifica grupos nos dados sem rótulos9  em diferentes agrupamentos, encontrando grupos de dados que são semelhantes uns aos outros. O nome "K-means" vem dos centroides $k$ que utiliza para definir os agrupamentos. Um ponto é atribuído a um agrupamento em particular se ele estiver mais próximo do centroide desse agrupamento do que qualquer outro centroide.

Algoritmos de aprendizado semi-supervisionado

Nesse caso, o aprendizado ocorre quando apenas uma parte dos dados de entrada fornecidos foi rotulada, dando ao algoritmo uma certa "vantagem inicial". Essa abordagem pode combinar o melhor dos dois mundos10: melhor precisão associada ao aprendizado de máquina supervisionado e a capacidade de usar dados econômicos não rotulados, como no caso do aprendizado de máquina não supervisionado.

Algoritmos por reforço

Nesse caso, os algoritmos são treinados da mesma forma que os humanos aprendem: por meio de recompensas e punições, que são medidas e monitoradas por um agente de aprendizagem por reforço11, que tem uma compreensão geral da probabilidade de aumentar ou diminuir a pontuação. Por meio de tentativa e erro, o agente aprende a realizar ações que levam aos resultados mais favoráveis ao longo do tempo. O aprendizado por reforço é geralmente utilizado12  na gestão de recursos, em robótica e em videogames.

Soluções relacionadas
Deep learning

Crie redes neurais complexas. Experimente em escala para implementar modelos de aprendizagem otimizados dentro do IBM Watson Studio.

Explore o deep learning

Análise de dados preditiva

Analise dados e crie modelos analíticos e preditivos de resultados futuros. Descubra riscos e oportunidades para sua empresa.

Explore análises de dados preditivas

Crie aplicativos com processamento de linguagem natural

O PLN é uma IA que fala a língua do seu negócio. Crie soluções que gerem um ROI de 383% em três anos com o IBM® Watson Discovery.

Explore a criação de aplicativos com NLP
Recursos Aprendizagem prática e sem custo para tecnologias de IA generativa

Aprenda os conceitos fundamentais relacionados à IA e IA generativa, incluindo engenharia imediata, grandes modelos de linguagem e os melhores projetos de código aberto.

Quadrante Mágico em Plataformas de IA Conversacionais Corporativas, 2023

A IBM foi novamente reconhecida como líder no Quadrante™ Mágico do Gartner® de 2023 em IA conversacional corporativa.

Magic Quadrant da Gartner em plataformas de ciência de dados e aprendizado de máquina

Conheça as ferramentas que as empresas usam para executar e gerenciar modelos de IA com eficiência e preparar os cientistas de dados com tecnologias que otimizam a tomada de decisão baseada em dados.

Machine learning for dummies

Descubra como o aprendizado de máquina permite que você aprenda continuamente com os dados e preveja o futuro.

Como criar IA responsável em escala

Quatro estratégias para escalar a IA com uma base de dados sólida.

AI in the enterprise, 2021: Unleashing opportunity through data

As tecnologias de IA têm evoluído rapidamente nas últimas décadas. Saiba como as empresas estão implementando a IA hoje em dia.

Take the next step

Build an AI strategy for your business on one collaborative AI and data platform—IBM watsonx. Train, validate, tune and deploy AI models to help you scale and accelerate the impact of AI with trusted data across your business.

Explore watsonx Book a live demo