O que é deep learning?
O deep learning tenta imitar o cérebro humano, embora longe de igualar sua capacidade, permitindo que os sistemas agrupem dados e façam previsões com incrível precisão
Explore solução de deep learning da IBM Receba atualizações sobre IA
ilustração que representa redes neurais em aprendizagem profunda, trabalhando para fazer previsões baseadas em dados
O que é deep learning?

Deep learning é um subconjunto de aprendizado de máquina, que é essencialmente uma rede neural com três ou mais camadas. Essas redes neurais tentam simular o comportamento do cérebro humano, embora longe de corresponder a sua capacidade, permitindo que ele “aprenda” com grandes quantidades de dados. Embora uma rede neural com uma única camada ainda possa fazer previsões aproximadas, camadas ocultas adicionais podem ajudar a otimizar e refinar a precisão.

O deep learning impulsiona muitos aplicativos e serviços de  inteligência artificial (IA)  que melhoram a automação, realizando tarefas analíticas e físicas sem intervenção humana. A tecnologia de deep learning está por trás de produtos e serviços cotidianos (como assistentes digitais, controles remotos de TV ativados por voz e detecção de fraude de cartão de crédito), bem como tecnologias emergentes (como carros autônomos).

Deep learning vs. machine learning

Se o deep learning é um subconjunto do aprendizado de máquina, como eles diferem entre si? O deep learning se distingue do aprendizado de máquina clássico pelo tipo de dados com os quais trabalha e pelos métodos nos quais aprende.

Os algoritmos de aprendizado de máquina utilizam dados estruturados e rotulados para fazer previsões, o que significa que recursos específicos são definidos dos dados de entrada do modelo e organizados em tabelas. Isso não significa necessariamente que não use dados não estruturados; significa apenas que, se existir, geralmente passa por algum pré-processamento para organizá-lo em um formato estruturado.

O deep learning elimina parte do pré-processamento de dados que normalmente está envolvido com o aprendizado de máquina. Esses algoritmos podem ingerir e processar dados não estruturados, como texto e imagens, e automatizam a extração de recursos, removendo parte da dependência de especialistas humanos. Por exemplo, digamos que temos um conjunto de fotos de diferentes animais de estimação e queremos categorizar por “gato”, “cachorro”, “hamster” etc. Algoritmos de deep learning podem determinar quais recursos (por exemplo, orelhas) são mais importantes para distinguir um animal do outro. No aprendizado de máquina, essa hierarquia de recursos é estabelecida manualmente por um especialista humano.

Em seguida, por meio dos processos de descida de gradiente e propagação retroativa, o algoritmo de deep learning se ajusta e se adapta à precisão, permitindo fazer previsões sobre uma nova foto de um animal com maior precisão.  

Os modelos de aprendizado de máquina e deep learnin também são capazes de diferentes tipos de aprendizado, que geralmente são categorizados como aprendizado supervisionado, aprendizado não supervisionado e aprendizado por reforço. O aprendizado supervisionado utiliza conjuntos de dados rotulados para categorizar ou fazer previsões; isso requer algum tipo de intervenção humana para rotular os dados de entrada corretamente. Por outro lado, o aprendizado não supervisionado não requer conjuntos de dados rotulados e, em vez disso, detecta padrões nos dados, agrupando-os por quaisquer características distintivas. O aprendizado por reforço é um processo no qual um modelo aprende a se tornar mais preciso para executar uma ação em um ambiente baseado em feedback, a fim de maximizar a recompensa.

Para obter mais detalhes das diferenças sutis entre as diferentes tecnologias, consulte "AI vs. Aprendizado de Máquina vs. Deep Learning vs. Redes Neurais: Qual é a diferença?"

Para uma análise mais detalhada das diferenças específicas entre aprendizado supervisionado e não supervisionado, consulte "Aprendizado supervisionado vs. não supervisionado: qual é a diferença?"

Como funciona o deep learning

As redes neurais de deep learning, ou redes neurais artificiais, tentam imitar o cérebro humano por meio de uma combinação de entradas de dados, pesos e viés. Esses elementos trabalham juntos para reconhecer, classificar e descrever com precisão os objetos dentro dos dados.

As redes neurais profundas consistem em várias camadas de nós interconectados, cada um construído sobre a camada anterior para refinar e otimizar a previsão ou categorização. Essa progressão de cálculos através da rede é chamada de propagação direta. As camadas de entrada e saída de uma rede neural profunda são chamadas de camadas  visíveis . A camada de entrada é onde o modelo de deep learning ingere os dados para processamento e a camada de saída é onde a previsão ou classificação final é feita.

Outro processo chamado propagação retroativa usa algoritmos, como  descida de gradiente, para calcular os erros nas previsões e, em seguida, ajusta os pesos e vieses da função movendo-se para trás pelas camadas em um esforço para treinar o modelo. Juntas, a propagação direta e a propagação retroativa permitem que uma rede neural faça previsões e corrija quaisquer erros adequadamente. Com o tempo, o algoritmo se torna gradualmente mais preciso.

O descrito acima descreve o tipo mais simples de rede neural profunda nos termos mais simples. No entanto, os algoritmos de deep learning são incrivelmente complexos e existem diferentes tipos de redes neurais para resolver problemas ou conjuntos de dados específicos. Por exemplo,

  • Redes neurais convolucionais (CNNs), usadas principalmente em aplicativos de visão computacional e classificação de imagens, pode detectar recursos e padrões em uma imagem, permitindo tarefas, como detecção ou reconhecimento de objetos. Em 2015, uma CNN superou um humano em um desafio de reconhecimento de objetos pela primeira vez.
  • Redes neurais recorrentes (RNNs) são normalmente usados em aplicativos de linguagem natural e reconhecimento de fala, pois aproveitam dados sequenciais ou de séries temporais.
Aplicações de deep learning

Os aplicativos de deep learning do mundo real fazem parte de nossas vidas diárias, mas, na maioria dos casos, eles são tão bem integrados a produtos e serviços que os usuários não percebem o complexo processamento de dados que está ocorrendo em segundo plano. Alguns desses exemplos incluem o seguinte:

Aplicação da lei
 

Os algoritmos de deep learning podem analisar e aprender com dados transacionais para identificar padrões perigosos que indicam possíveis atividades fraudulentas ou criminosas. Reconhecimento de voz, visão computacional e outros aplicativos de deep learning podem melhorar a eficiência e a eficácia da análise investigativa, extraindo padrões e evidências de gravações de som e vídeo, imagens e documentos, o que ajuda a aplicação da lei a analisar grandes quantidades de dados com mais rapidez e precisão.

Serviços financeiros
 

Instituições financeiras usam regularmente análises preditivas para conduzir negociação algorítmica de ações, avaliar riscos de negócios para aprovações de empréstimos, detectar fraudes e ajudar a gerenciar carteiras de crédito e investimento para clientes.

Atendimento ao cliente
 

Muitas organizações incorporam tecnologia de deep learning em seus processos de atendimento ao cliente. Chatbots – usados em uma variedade de aplicativos, serviços e portais de atendimento ao cliente – são uma forma direta de IA. Os chatbots tradicionais usam linguagem natural e até mesmo reconhecimento visual, comumente encontrados em menus de call center. No entanto,  soluções de chatbot mais sofisticadas  tentam determinar, por meio do aprendizado, se há várias respostas para perguntas ambíguas. Com base nas respostas que recebe, o chatbot tenta responder a essas perguntas diretamente ou encaminhar a conversa para um usuário humano.

Assistentes virtuais como Siri da Apple, Amazon Alexa ou Google Assistant ampliam a ideia de um chatbot ao ativar a funcionalidade de reconhecimento de voz. Isso cria um novo método para envolver os usuários de maneira personalizada.

Assistência médica
 

O setor de assistência médica se beneficiou muito dos recursos de deep learning desde a digitalização de registros e imagens hospitalares. Os aplicativos de reconhecimento de imagem podem oferecer suporte a especialistas em imagens médicas e radiologistas, ajudando-os a analisar e avaliar mais imagens em menos tempo.

Requisitos de hardware para deep learning

O deep learning requer uma quantidade enorme de capacidade de computação.  Unidades de processamento gráfico (GPUs)  de alto desempenho são ideais porque podem lidar com um grande volume de cálculos em vários núcleos com muita memória disponível. No entanto, gerenciar várias GPUs no local pode criar uma grande demanda de recursos internos e ser incrivelmente caro para escalar.

Soluções relacionadas
watsonx é IA para negócios mais inteligentes

O IBM watsonx é um portfólio de ferramentas, aplicativos e soluções prontos para negócios, projetados para reduzir os custos e os obstáculos da adoção da IA, otimizando os resultados e o uso responsável da IA.

Explore o watsonx
watsonx Assistant – Chatbot de IA

O watsonx Assistant é a plataforma de IA conversacional. Esta tecnologia de inteligência artificial corporativa permite que os usuários criem soluções como chatbots e agentes de voz.

Conheça o watsonx Assistant
Recursos E-book sobre Inteligência artificial Uma introdução ao deep learning

Explore este ramo do aprendizado de máquina que é treinado em grandes quantidades de dados e lida com unidades computacionais trabalhando em conjunto para realizar previsões

Arquiteturas de deep learning

A ascensão da inteligência artificial

Dê o próximo passo

Conheça o watsonx.ai, a plataforma de IA e dados que reúne recursos de IA generativa. Com o watsonx.ai, sua equipe poderá treinar, validar, ajustar e implementar modelos de IA em uma fração de tempo. 

Explore o watsonx.ai