Minha IBM

Efetue login

O que é aprendizado de máquina?

O aprendizado de máquina (ML) é uma ramificação da inteligência artificial (IA) focada em permitir que computadores e máquinas imitem a maneira como os seres humanos aprendem, realizem tarefas de forma autônoma e melhorem seu desempenho e precisão por meio da experiência e exposição a mais dados.

A UC Berkeleydivide o sistema de aprendizado de um algoritmo de aprendizado de máquina em três partes principais.

Um processo de decisão: em geral, os algoritmos de aprendizado de máquina são usados para fazer uma previsão ou classificação. Com base em alguns dados de entrada, que podem ser rotulados ou não rotulados, o algoritmo produzirá uma estimativa sobre um padrão nos dados.
Uma função de erro: uma função de erro avalia a previsão do modelo. Se houver exemplos conhecidos, uma função de erro poderá realizar uma comparação para avaliar a precisão do modelo.
Processo de otimização do modelo: se o modelo puder se ajustar melhor aos pontos de dados no conjunto de treinamento, os pesos serão ajustados para reduzir a discrepância entre o exemplo conhecido e a estimativa do modelo. O algoritmo repetirá esse processo iterativo de "avaliação e otimização", atualizando pesos de forma autônoma até que um limite de precisão seja atingido.

Boletim informativo do setor

As mais recentes tendências em IA, trazidas a você por especialistas

Receba insights selecionados sobre as notícias mais importantes (e intrigantes) sobre IA. Inscreva-se no nosso boletim informativo semanal Think. Consulte a Declaração de privacidade da IBM.

Aprendizado de máquina versus deep learning versus redes neurais

Como o deep learning e o aprendizado de máquina tendem a ser usados de forma intercambiável, vale a pena observar as nuances entre os dois. Aprendizado de máquina, deep learning e redes neurais são todos subcampos da inteligência artificial. No entanto, as redes neurais são, na verdade, um subcampo do aprendizado de máquina, e o deep learning é um subcampo das redes neurais.

A forma como o deep learning e o aprendizado de máquina diferem está na maneira como cada algoritmo aprende. O aprendizado de máquina "profundo" pode usar conjuntos de dados rotulados, também conhecidos como aprendizado supervisionado, para informar seu algoritmo, mas não exige necessariamente um conjunto de dados rotulado. O processo de deep learning pode ingerir dados não estruturados em sua forma bruta (por exemplo, texto ou imagens) e pode determinar automaticamente o conjunto de funcionalidades que distinguem diferentes categorias de dados umas das outras. Isso elimina parte da intervenção humana necessária e permite o uso de grandes quantidades de dados. Você pode pensar no deep learning como "aprendizado de máquina escalável", como observa Lex Fridman nesta palestra no MIT¹.

O aprendizado de máquina clássico ou "não profundo" depende mais da intervenção humana para aprender. Especialistas humanos determinam o conjunto de recursos para entender as diferenças entre as entradas de dados, geralmente exigindo dados mais estruturados para aprender.

As redes neurais, ou redes neurais artificiais (ANNs), são compostas por camadas de nós, contendo uma camada de entrada, uma ou mais camadas ocultas e uma camada de saída. Cada nó, ou neurônio artificial, se conecta a outro e tem um peso e um limite associados. Se a saída de qualquer nó individual estiver acima do valor de limiar especificado, esse nó será ativado, enviando dados para a próxima camada da rede. Caso contrário, nenhum dado será transmitido para a próxima camada da rede por esse nó. O "profundo" em deep learning está apenas se referindo ao número de camadas em uma rede neural. Uma rede neural que consiste em mais de três camadas, que incluiriam a entrada e a saída, pode ser considerada um algoritmo de deep learning ou uma rede neural profunda. Uma rede neural que tem apenas três camadas é apenas uma rede neural básica.

Deep learning e redes neurais são creditados por acelerar o progresso em áreas como visão computacional, processamento de linguagem natural (NLP) e reconhecimento de fala.

Veja a postagem do blog “IA x aprendizado de máquina x deep learning x redes neurais: qual é a diferença?”Para uma análise mais detalhada de como os diferentes conceitos se relacionam.

Mixture of Experts | 25 de abril, episódio 52

Decodificando a IA: resumo semanal das notícias

Junte-se ao nosso painel de engenheiros, pesquisadores, líderes de produto e outros especialistas de classe mundial enquanto eles cortam o ruído da IA para trazer a você as últimas notícias e insights sobre IA.

Assista aos episódios mais recentes do podcast

Métodos de aprendizado de máquina

Os modelos de aprendizado de máquina se enquadram em três categorias principais.

Aprendizado supervisionado

Aprendizado supervisionado, também conhecido como aprendizado de máquina, é definido pelo uso de conjuntos de dados rotulados para treinar algoritmos para classificar dados ou prever resultados com precisão. À medida que os dados de entrada são alimentados no modelo, o modelo ajusta seus pesos até que tenha sido ajustado adequadamente. Isso ocorre como parte do processo de validação cruzada para garantir que o modelo evite overfitting ou underfitting. O aprendizado supervisionado ajuda as organizações a resolver diversos problemas do mundo real em escala, como classificar o spam em uma pasta separada de sua caixa de entrada. Alguns métodos usados no aprendizado supervisionado incluem redes neurais, Naïve Bayes, regressão linear, regressão logística, rendom forest e máquina de vetores de suporte (SVM).

Aprendizado não supervisionado

Aprendizado não supervisionado, também conhecido como aprendizado de máquina não supervisionado, usa algoritmos de aprendizado de máquina para analisar e agrupar conjuntos de dados não rotulados (subconjuntos chamados clusters). Esses algoritmos descobrem padrões ocultos ou agrupamentos de dados sem a necessidade de intervenção humana.

A capacidade do aprendizado não supervisionado de descobrir semelhanças e diferenças nas informações o torna ideal para análise exploratória de dados, estratégias de vendas cruzadas, segmentação de clientes e reconhecimento de imagens e padrões. Também é usado para reduzir o número de funcionalidades em um modelo por meio do processo de redução de dimensionalidade. A análise de componentes principais (PCA) e a decomposição de valor singular (SVD) são duas abordagens comuns para isso. Outros algoritmos usados no aprendizado não supervisionado incluem redes neurais, clustering k-means e métodos de clustering probabilísticos.

Aprendizado semissupervisionado

O aprendizado semissupervisionado oferece um meio termo entre o aprendizado supervisionado e não supervisionado. Durante o treinamento, ele usa um conjunto de dados rotulado menor para orientar a classificação e a extração de funcionalidades de um conjunto de dados maior e não rotulado. O aprendizado semissupervisionado pode resolver o problema de não ter dados rotulados suficientes para um algoritmo de aprendizado supervisionado. Também ajuda se for muito caro rotular dados suficientes.

Para se aprofundar nas diferenças entre essas abordagens, confira "Aprendizado supervisionado versus não supervisionado: qual éa diferença? "

Aprendizado de reforço

O aprendizado por reforço é um modelo de aprendizado de máquina semelhante ao aprendizado supervisionado, mas o algoritmo não é treinado usando dados de amostra. Esse modelo aprende à medida que avança usando tentativa e erro. Uma sequência de resultados bem-sucedidos será reforçada para desenvolver a melhor recomendação ou política para um determinado problema.

O sistema IBM Watson que ganhou o Jeopardy! desafio em 2011 é um bom exemplo. O sistema usou o aprendizado por reforço para aprender quando tentar uma resposta (ou pergunta, por assim dizer), qual quadrado selecionar no quadro e quanto apostar, especialmente em duplas diárias.

Algoritmos comuns de aprendizado de máquina

Vários algoritmos de aprendizado de máquina são comumente usados. Isso inclui:

Redes neurais
Regressão linear
Regressão logística
Clustering
Árvores de decisão
Random forests

Redes neurais

As redes neurais simulam a maneira como o cérebro humano funciona, com um grande número de nós de processamento interligados. As redes neurais são boas em reconhecer padrões e desempenham um papel importante em aplicações, incluindo tradução de linguagem natural, reconhecimento de imagens, reconhecimento de fala e criação de imagens.

Regressão linear

Esse algoritmo é usado para prever valores numéricos, com base em uma relação linear entre valores diferentes. Por exemplo, a técnica poderia ser usada para prever os preços das casas com base em dados históricos da área.

Regressão logística

Esse algoritmo de aprendizado supervisionado faz previsões para variáveis de resposta categóricas, como respostas “sim/não” às perguntas. Ele pode ser usado para aplicações como classificação de spam e controle de qualidade em uma linha de produção.

Clustering

Usando aprendizado não supervisionado, algoritmos de clustering podem identificar padrões em dados para que eles possam ser agrupados. Os computadores podem ajudar cientistas de dados ao identificar diferenças entre itens de dados que passaram despercebidas pelos seres humanos.

Árvores de decisão

Decision trees podem ser usadas para prever valores numéricos (regressão) e classificar dados em categories. As decision trees usam uma sequência ramificada de decisões vinculadas, que podem ser representadas com um diagrama de árvore. Uma das vantagens das decision trees é que elas são fáceis de validar e auditar, ao contrário da caixa-preta da rede neural.

Random forests

Em uma rendom forest, o algoritmo de aprendizado de máquina prevê um valor ou categoria ao combinar os resultados de várias decision trees.

Vantagens e desvantagens dos algoritmos de aprendizado de máquina

Dependendo de seu orçamento, da necessidade de velocidade e da precisão exigida, cada tipo de algoritmo - supervisionado, não supervisionado, semissupervisionado ou de reforço - tem suas próprias vantagens e desvantagens. 

Por exemplo, os algoritmos de decision trees são usados tanto para prever valores numéricos (problemas de regressão) quanto para classificar dados em categorias. As decision trees usam uma sequência ramificada de decisões vinculadas que podem ser representadas por um diagrama de árvore. Uma das principais vantagens das decision trees é que elas são mais fáceis de validar e auditar do que uma rede neural. A má notícia é que elas podem ser mais instáveis do que outros preditores de decisão.

Em geral, há muitas vantagens no aprendizado de máquina que as empresas podem aproveitar para obter novas eficiências. Isso inclui o aprendizado de máquina que identifica padrões e tendências em grandes volumes de dados que os seres humanos talvez não detectem. E essa análise requer pouca intervenção humana: basta alimentar o conjunto de dados de interesse e deixar que o sistema de aprendizado de máquina monte e refine seus próprios algoritmos, que melhorarão continuamente com a entrada de mais dados ao longo do tempo. Os clientes e usuários podem desfrutar de uma experiência mais personalizada, pois o modelo aprende mais com cada experiência com aquela pessoa.

No lado negativo, o aprendizado de máquina requer grandes conjuntos de dados de treinamento precisos e sem viés. GIGO é o fator operacional: garbage in/garbage out. A coleta de dados suficientes e a existência de um sistema robusto o suficiente para executá-los também podem consumir muitos recursos.

O aprendizado de máquina também pode ser propenso a erros, dependendo da entrada. Com uma amostra muito pequena, o sistema pode produzir um algoritmo perfeitamente lógico que esteja completamente errado ou seja enganoso. Para evitar desperdício de orçamento ou desagradar os clientes, as organizações devem agir de acordo com as respostas somente quando houver alta confiança no resultado.

Casos de uso de aprendizado de máquina do mundo real

Aqui estão apenas alguns exemplos de aprendizado de máquina que você pode encontrar todos os dias:

Reconhecimento de voz: também conhecido como reconhecimento automático de voz (ASR), reconhecimento de voz por computador, ou voz-para-texto, é um recurso que usa processamento de linguagem natural (PNL) para traduzir a voz humana em um formato escrito. Muitos dispositivos móveis incorporam o reconhecimento de fala em seus sistemas para realizar buscas por voz (por exemplo, Siri — ou melhore a acessibilidade para mensagens de texto.

Atendimento ao cliente: chatbots online estão substituindo agentes humanos ao longo da jornada do cliente, mudando a maneira como pensamos sobre engajamento do cliente em sites e plataformas de redes sociais. Os chatbots respondem a perguntas frequentes (FAQs) sobre tópicos como frete, ou fornecem conselhos personalizados, produtos de venda cruzada ou sugestões de tamanhos para os usuários. Os exemplos incluem agentes virtuais em sites de comércio eletrônico; bots de mensagens, usando Slack e Facebook Messenger; e tarefas geralmente feitas por assistentes virtuais e assistentes de voz.

Visão computacional: essa tecnologia de IA permite que os computadores obtenham informações significativas de imagens digitais, vídeos e outras entradas visuais e, em seguida, adotem a ação apropriada. Alimentada por redes neurais convolucionais, a visão computacional tem aplicações em marcações em fotos em redes sociais, geração de imagens de radiologia na área da saúde e carros autônomos no setor automotivo.

Mecanismos de recomendação: usando dados de comportamento de consumo passados, os algoritmos de IA podem ajudar a descobrir tendências de dados que podem ser usadas para desenvolver estratégias de venda cruzada mais eficazes. Os mecanismos de recomendação são usados por varejistas online para fazer recomendações de produtos relevantes aos clientes durante o processo de finalização da compra.

Automação robótica de processos (RPA): também conhecida como robótica de software, a RPA usa tecnologias de automação inteligente para realizar tarefas manuais repetitivas.

Negociação automatizada de ações: projetada para otimizar carteiras de ações, as plataformas de negociação de alta frequência orientadas por IA realizam milhares ou até milhões de negociações por dia sem intervenção humana.

Detecção de fraude: Bancos e outras instituições financeiras podem usar aprendizado de máquina para detectar transações suspeitas. A aprendizagem supervisionada pode treinar um modelo usando informações sobre transações fraudulentas conhecidas. A detecção de anomalias pode identificar transações que parecem atípicas e merecem uma investigação mais aprofundada.

Desafios do aprendizado de máquina

Com o desenvolvimento da tecnologia de aprendizado de máquina, ela certamente facilitou nossa vida. Entretanto, a implementação do aprendizado de máquina nas empresas também levantou uma série de preocupações éticas sobre as tecnologias de IA. Alguns exemplos incluem:

Singularidade tecnológica

Embora esse tópico atraia muita atenção do público, muitos pesquisadores não estão preocupados com a ideia de a IA superar a inteligência humana em um futuro próximo. A singularidade tecnológica também é chamada de IA forte ou superinteligência. O filósofo Nick Bostrum define superinteligência como "qualquer intelecto que supera amplamente os melhores cérebros humanos em praticamente todos os campos, incluindo criatividade científica, sabedoria geral e habilidades sociais".

Apesar do fato de que a superinteligência não é iminente na sociedade, a ideia levanta algumas questões interessantes quando consideramos o uso de sistemas autônomos, como carros autônomos. É irreal pensar que um carro sem motorista nunca teria um acidente, mas quem é responsável nessas circunstâncias? Ainda devemos desenvolver veículos autônomos, ou devemos limitar essa tecnologia a veículos semiautônomos que ajudam as pessoas a dirigir com segurança? Ainda não há consenso sobre isso, mas esses são os tipos de debates éticos que estão ocorrendo à medida que novas e inovadoras tecnologias de IA se desenvolvem.

Impacto da IA nos empregos

Embora grande parte da percepção pública sobre a inteligência artificial gire em torno da perda de empregos, essa preocupação provavelmente deveria ser reformulada. Com cada nova tecnologia disruptiva, vemos que a demanda do mercado por funções específicas muda. Por exemplo, quando olhamos para o setor automotivo, muitos fabricantes, como a GM, estão mudando o foco para a produção de veículos elétricos, a fim de se alinhar às iniciativas ecológicas. O setor de energia não está desaparecendo, mas a fonte de energia está mudando de uma economia de combustível para uma elétrica.

Da mesma forma, a inteligência artificial deslocará a demanda por empregos para outras áreas. Serão necessários indivíduos para ajudar a gerenciar sistemas de IA. Ainda será necessário haver pessoas para lidar com problemas mais complexos dentro dos setores que são mais propensos a serem afetados por mudanças na demanda de trabalho, como o atendimento ao cliente. O maior desafio com a inteligência artificial e seu efeito no mercado de trabalho será ajudar as pessoas a fazer a transição para novas funções que estão em demanda.

Privacidade

A privacidade tende a ser discutida no contexto de privacidade de dados, proteção de dados e segurança de dados. Essas preocupações permitiram que os formuladores de políticas fizessem mais avanços nos últimos anos. Por exemplo, em 2016, a legislação GDPR foi criada para proteger os dados pessoais das pessoas na União Europeia e no Espaço Econômico Europeu, dando aos indivíduos mais controle sobre seus dados. Nos Estados Unidos, estados individuais estão desenvolvendo políticas, como a Lei de Privacidade do Consumidor da Califórnia (CCPA), que foi introduzida em 2018 e exige que as empresas informem os consumidores sobre a coleta de seus dados. Legislações como essa forçaram as empresas a repensar a forma como armazenam e usam informações de identificação pessoal (PII). Como resultado, os investimentos em segurança tornaram-se uma prioridade cada vez maior para as empresas, à medida que procuram eliminar quaisquer vulnerabilidades e oportunidades de vigilância, hackers e ataques cibernéticos.

Preconceito e discriminação

Casos de viés e discriminação em vários sistemas de aprendizado de máquina levantaram muitas questões éticas em relação ao uso da inteligência artificial. Como podemos nos proteger contra vieses e discriminação quando os próprios dados de treinamento podem ser gerados por processos humanos com viés? Embora as empresas geralmente tenham boas intenções em seus esforços de automação, a Reuters² destaca algumas das consequências imprevistas da incorporação da IA nas práticas de contratação. Em seu esforço para automatizar e simplificar um processo, a Amazon involuntariamente discriminou candidatos a emprego por gênero para cargos técnicos, e a empresa acabou tendo que descartar o projeto. A Harvard Business Review³ levantou outras questões pontuais sobre o uso da IA em práticas de contratação, como, por exemplo, quais dados você deve poder usar ao avaliar um candidato para um cargo.

O viés e a discriminação também não se limitam à função de recursos humanos; eles podem ser encontrados em uma série de aplicações, desde software de reconhecimento facial até algoritmos de mídia social.

À medida que as empresas se tornam mais conscientes dos riscos da IA, elas também se tornam mais ativas nessa discussão sobre ética e valores de IA. Por exemplo, a IBM desativou seus produtos de análise e reconhecimento facial de uso geral. O CEO da IBM, Arvind Krishna, escreveu: "A IBM se opõe firmemente e não tolerará o uso de qualquer tecnologia, incluindo tecnologia de reconhecimento facial oferecida por outros fornecedores, para vigilância em massa, criação de perfis raciais, violações de direitos humanos e liberdades básicas ou qualquer finalidade que não seja consistente com nossos valores e Princípios de Confiança e Transparência.”

Prestação de contas

Como não há legislação significativa para regular as práticas de IA, não há nenhum mecanismo real de imposição para garantir que a IA ética seja praticada. Os incentivos atuais para que as empresas sejam éticas são as repercussões negativas de um sistema de IA antiético no lucro. Para preencher essa lacuna, surgiram frameworks éticos como parte de uma colaboração entre especialistas em ética e pesquisadores para regulamentar a construção e distribuição de modelos de IA na sociedade. No entanto, no momento, eles servem apenas para orientar. Algumas pesquisas⁴ mostram que a combinação de responsabilidade distribuída e falta de previsão de possíveis consequências não contribuem para evitar danos à sociedade.

Como escolher a plataforma de IA certa para aprendizado de máquina

A seleção de uma plataforma pode ser um processo desafiador, pois o sistema errado pode aumentar os custos ou limitar o uso de outras ferramentas ou tecnologias valiosas. Ao analisar vários fornecedores para selecionar uma plataforma de IA, muitas vezes há uma tendência de pensar que mais recursos = um sistema melhor. Talvez sim, mas os avaliadores devem começar pensando no que a plataforma de IA fará por sua organização. Quais recursoss de aprendizado de máquina precisam ser fornecidos e quais recursos são importantes para alcançá-los? Um recurso ausente pode arruinar a utilidade de um sistema inteiro. Aqui estão alguns recursos a serem considerados.

Recursos MLOps. O sistema possui:

uma interface unificada para facilitar o gerenciamento?
ferramentas de aprendizado de máquina automatizadas para a criação mais rápida de modelos com funcionalidade de pouco código e sem código?
decision optimization para simplificar a seleção e implementação de modelos de otimização?
modelagem visual para combinar ciência de dados visuais com bibliotecas de código aberto e interfaces baseadas em notebook em um estúdio unificado de dados e IA?
desenvolvimento automatizado para iniciantes começarem rapidamente e cientistas de dados mais avançados experimentarem?
gerador de dados sintéticos como alternativa ou complemento aos dados do mundo real quando os dados do mundo real não estão prontamente disponíveis?

Recursos da IA generativa. O sistema possui:

um gerador de conteúdo que pode gerar texto, imagens e outros conteúdos com base nos dados em que foi treinado?
classificação automatizada para ler e classificar inputs escritos, como avaliar e classificar reclamações de clientes ou revisar o sentimento do feedback do cliente?
um gerador de resumos que pode transformar um texto denso em um resumo de alta qualidade, capturar pontos-chave de relatórios financeiros e gerar transcrições de reuniões?
um recurso de extração de dados para classificar detalhes complexos e extrair rapidamente as informações necessárias de documentos grandes?

Tenha acesso ao poder da IA generativa + ML

Saiba como incorporar com confiança a IA generativa e o aprendizado de máquina em sua empresa.

Recursos

Aumente seu conhecimento especializado em ML

Aprenda conceitos fundamentais e desenvolva suas habilidades com laboratórios práticos, cursos, projetos guiados, avaliações e muito mais.

Tenha acesso ao poder da IA generativa + ML

Saiba como incorporar com confiança a IA generativa e o aprendizado de máquina em sua empresa.

Coloque a IA para trabalhar: como gerar ROI com a IA generativa

Quer ter mais retorno sobre seus investimentos em IA? Saiba como o dimensionamento da IA generativa em áreas importantes promove mudanças, ajudando suas melhores mentes a criar e oferecer soluções novas e inovadoras.

Como escolher o modelo de base certo

Saiba como selecionar o modelo de base de IA mais adequado para seu caso de uso.

Explore o IBM Granite

O IBM Granite é nossa família de modelos de IA abertos, de alto desempenho e confiáveis, personalizados para a empresa e otimizados para escalar suas aplicações de IA. Explore as opções de linguagens, código, séries temporais e proteções.

Como prosperar nesta nova era da IA com confiança e convicção

Aprofunde-se nos três elementos críticos de uma estratégia de IA forte: gerar vantagem competitiva, escalar a IA em toda a empresa e avançar na IA confiável.

Relatório “IA em ação”

Entrevistamos duas mil organizações a respeito de suas iniciativas de IA para descobrir o que está funcionando, o que não está e como se preparar.

Soluções relacionadas

IBM watsonx.ai

Treine, valide, ajuste e implemente recursos de IA generativa, modelos de base e recursos de aprendizado de máquina com o IBM watsonx.ai, um estúdio empresarial de última geração para construtores de IA. Crie aplicações de IA em uma fração do tempo com uma fração dos dados.

Conheça o watsonx.ai

Soluções de inteligência artificial

Use a IA a serviço de sua empresa com a experiência e o portfólio de soluções líder do setor da IBM à sua disposição.

Explore as soluções de IA

Consultoria e serviços em IA

Reinvente os fluxos de trabalho e operações críticos adicionando IA para maximizar experiências, tomadas de decisão em tempo real e valor de negócios.

Explore os serviços de IA

Dê o próximo passo

Obtenha acesso completo aos recursos que abrangem o ciclo de vida do desenvolvimento da IA. Produza soluções poderosas de IA com interfaces fáceis de usar, fluxos de trabalhos e acesso a APIs e SDKs padrão do setor.

Explore o watsonx.ai

Agende uma demonstração em tempo real

Notas de rodapé

¹ Deep Learning Basics: Introduction and Overview

² Insight - Amazon scraps secret AI recruiting tool that showed bias against women, Reuters, 10 de outubro de 2018

³ The Legal and Ethical Implications of Using AI in Hiring, Harvard Business Review, 25 de abril de 2019

⁴ The Ethics of AI Ethics, An Evaluation of Guidelines, Dr. Thilo Hagendorff

O que é aprendizado de máquina?