O aprendizado de máquina (ML) é uma ramificação da inteligência artificial (IA) focada em permitir que computadores e máquinas imitem a maneira como os seres humanos aprendem, realizem tarefas de forma autônoma e melhorem seu desempenho e precisão por meio da experiência e exposição a mais dados.
A UC Berkeleydivide o sistema de aprendizado de um algoritmo de aprendizado de máquina em três partes principais.
Boletim informativo do setor
Receba insights selecionados sobre as notícias mais importantes (e intrigantes) sobre IA. Inscreva-se no nosso boletim informativo semanal Think. Consulte a Declaração de privacidade da IBM.
Sua assinatura será entregue em inglês. Você encontrará um link para cancelar a assinatura em cada boletim informativo. Você pode gerenciar suas assinaturas ou cancelar a assinatura aqui. Consulte nossa Declaração de privacidade da IBM para obter mais informações.
Como o deep learning e o aprendizado de máquina tendem a ser usados de forma intercambiável, vale a pena observar as nuances entre os dois. Aprendizado de máquina, deep learning e redes neurais são todos subcampos da inteligência artificial. No entanto, as redes neurais são, na verdade, um subcampo do aprendizado de máquina, e o deep learning é um subcampo das redes neurais.
A forma como o deep learning e o aprendizado de máquina diferem está na maneira como cada algoritmo aprende. O aprendizado de máquina "profundo" pode usar conjuntos de dados rotulados, também conhecidos como aprendizado supervisionado, para informar seu algoritmo, mas não exige necessariamente um conjunto de dados rotulado. O processo de deep learning pode ingerir dados não estruturados em sua forma bruta (por exemplo, texto ou imagens) e pode determinar automaticamente o conjunto de funcionalidades que distinguem diferentes categorias de dados umas das outras. Isso elimina parte da intervenção humana necessária e permite o uso de grandes quantidades de dados. Você pode pensar no deep learning como "aprendizado de máquina escalável", como observa Lex Fridman nesta palestra no MIT1.
O aprendizado de máquina clássico ou "não profundo" depende mais da intervenção humana para aprender. Especialistas humanos determinam o conjunto de recursos para entender as diferenças entre as entradas de dados, geralmente exigindo dados mais estruturados para aprender.
As redes neurais, ou redes neurais artificiais (ANNs), são compostas por camadas de nós, contendo uma camada de entrada, uma ou mais camadas ocultas e uma camada de saída. Cada nó, ou neurônio artificial, se conecta a outro e tem um peso e um limite associados. Se a saída de qualquer nó individual estiver acima do valor de limiar especificado, esse nó será ativado, enviando dados para a próxima camada da rede. Caso contrário, nenhum dado será transmitido para a próxima camada da rede por esse nó. O "profundo" em deep learning está apenas se referindo ao número de camadas em uma rede neural. Uma rede neural que consiste em mais de três camadas, que incluiriam a entrada e a saída, pode ser considerada um algoritmo de deep learning ou uma rede neural profunda. Uma rede neural que tem apenas três camadas é apenas uma rede neural básica.
Deep learning e redes neurais são creditados por acelerar o progresso em áreas como visão computacional, processamento de linguagem natural (NLP) e reconhecimento de fala.
Veja a postagem do blog “IA x aprendizado de máquina x deep learning x redes neurais: qual é a diferença?”Para uma análise mais detalhada de como os diferentes conceitos se relacionam.
Os modelos de aprendizado de máquina se enquadram em três categorias principais.
Aprendizado supervisionado, também conhecido como aprendizado de máquina, é definido pelo uso de conjuntos de dados rotulados para treinar algoritmos para classificar dados ou prever resultados com precisão. À medida que os dados de entrada são alimentados no modelo, o modelo ajusta seus pesos até que tenha sido ajustado adequadamente. Isso ocorre como parte do processo de validação cruzada para garantir que o modelo evite overfitting ou underfitting. O aprendizado supervisionado ajuda as organizações a resolver diversos problemas do mundo real em escala, como classificar o spam em uma pasta separada de sua caixa de entrada. Alguns métodos usados no aprendizado supervisionado incluem redes neurais, Naïve Bayes, regressão linear, regressão logística, rendom forest e máquina de vetores de suporte (SVM).
Aprendizado não supervisionado, também conhecido como aprendizado de máquina não supervisionado, usa algoritmos de aprendizado de máquina para analisar e agrupar conjuntos de dados não rotulados (subconjuntos chamados clusters). Esses algoritmos descobrem padrões ocultos ou agrupamentos de dados sem a necessidade de intervenção humana.
A capacidade do aprendizado não supervisionado de descobrir semelhanças e diferenças nas informações o torna ideal para análise exploratória de dados, estratégias de vendas cruzadas, segmentação de clientes e reconhecimento de imagens e padrões. Também é usado para reduzir o número de funcionalidades em um modelo por meio do processo de redução de dimensionalidade. A análise de componentes principais (PCA) e a decomposição de valor singular (SVD) são duas abordagens comuns para isso. Outros algoritmos usados no aprendizado não supervisionado incluem redes neurais, clustering k-means e métodos de clustering probabilísticos.
O aprendizado semissupervisionado oferece um meio termo entre o aprendizado supervisionado e não supervisionado. Durante o treinamento, ele usa um conjunto de dados rotulado menor para orientar a classificação e a extração de funcionalidades de um conjunto de dados maior e não rotulado. O aprendizado semissupervisionado pode resolver o problema de não ter dados rotulados suficientes para um algoritmo de aprendizado supervisionado. Também ajuda se for muito caro rotular dados suficientes.
Para se aprofundar nas diferenças entre essas abordagens, confira "Aprendizado supervisionado versus não supervisionado: qual éa diferença? "
O aprendizado por reforço é um modelo de aprendizado de máquina semelhante ao aprendizado supervisionado, mas o algoritmo não é treinado usando dados de amostra. Esse modelo aprende à medida que avança usando tentativa e erro. Uma sequência de resultados bem-sucedidos será reforçada para desenvolver a melhor recomendação ou política para um determinado problema.
O sistema IBM Watson que ganhou o Jeopardy! desafio em 2011 é um bom exemplo. O sistema usou o aprendizado por reforço para aprender quando tentar uma resposta (ou pergunta, por assim dizer), qual quadrado selecionar no quadro e quanto apostar, especialmente em duplas diárias.
Vários algoritmos de aprendizado de máquina são comumente usados. Isso inclui:
As redes neurais simulam a maneira como o cérebro humano funciona, com um grande número de nós de processamento interligados. As redes neurais são boas em reconhecer padrões e desempenham um papel importante em aplicações, incluindo tradução de linguagem natural, reconhecimento de imagens, reconhecimento de fala e criação de imagens.
Esse algoritmo é usado para prever valores numéricos, com base em uma relação linear entre valores diferentes. Por exemplo, a técnica poderia ser usada para prever os preços das casas com base em dados históricos da área.
Esse algoritmo de aprendizado supervisionado faz previsões para variáveis de resposta categóricas, como respostas “sim/não” às perguntas. Ele pode ser usado para aplicações como classificação de spam e controle de qualidade em uma linha de produção.
Usando aprendizado não supervisionado, algoritmos de clustering podem identificar padrões em dados para que eles possam ser agrupados. Os computadores podem ajudar cientistas de dados ao identificar diferenças entre itens de dados que passaram despercebidas pelos seres humanos.
Decision trees podem ser usadas para prever valores numéricos (regressão) e classificar dados em categories. As decision trees usam uma sequência ramificada de decisões vinculadas, que podem ser representadas com um diagrama de árvore. Uma das vantagens das decision trees é que elas são fáceis de validar e auditar, ao contrário da caixa-preta da rede neural.
Em uma rendom forest, o algoritmo de aprendizado de máquina prevê um valor ou categoria ao combinar os resultados de várias decision trees.
Dependendo de seu orçamento, da necessidade de velocidade e da precisão exigida, cada tipo de algoritmo - supervisionado, não supervisionado, semissupervisionado ou de reforço - tem suas próprias vantagens e desvantagens.
Por exemplo, os algoritmos de decision trees são usados tanto para prever valores numéricos (problemas de regressão) quanto para classificar dados em categorias. As decision trees usam uma sequência ramificada de decisões vinculadas que podem ser representadas por um diagrama de árvore. Uma das principais vantagens das decision trees é que elas são mais fáceis de validar e auditar do que uma rede neural. A má notícia é que elas podem ser mais instáveis do que outros preditores de decisão.
Em geral, há muitas vantagens no aprendizado de máquina que as empresas podem aproveitar para obter novas eficiências. Isso inclui o aprendizado de máquina que identifica padrões e tendências em grandes volumes de dados que os seres humanos talvez não detectem. E essa análise requer pouca intervenção humana: basta alimentar o conjunto de dados de interesse e deixar que o sistema de aprendizado de máquina monte e refine seus próprios algoritmos, que melhorarão continuamente com a entrada de mais dados ao longo do tempo. Os clientes e usuários podem desfrutar de uma experiência mais personalizada, pois o modelo aprende mais com cada experiência com aquela pessoa.
No lado negativo, o aprendizado de máquina requer grandes conjuntos de dados de treinamento precisos e sem viés. GIGO é o fator operacional: garbage in/garbage out. A coleta de dados suficientes e a existência de um sistema robusto o suficiente para executá-los também podem consumir muitos recursos.
O aprendizado de máquina também pode ser propenso a erros, dependendo da entrada. Com uma amostra muito pequena, o sistema pode produzir um algoritmo perfeitamente lógico que esteja completamente errado ou seja enganoso. Para evitar desperdício de orçamento ou desagradar os clientes, as organizações devem agir de acordo com as respostas somente quando houver alta confiança no resultado.
Aqui estão apenas alguns exemplos de aprendizado de máquina que você pode encontrar todos os dias:
Reconhecimento de voz: também conhecido como reconhecimento automático de voz (ASR), reconhecimento de voz por computador, ou voz-para-texto, é um recurso que usa processamento de linguagem natural (PNL) para traduzir a voz humana em um formato escrito. Muitos dispositivos móveis incorporam o reconhecimento de fala em seus sistemas para realizar buscas por voz (por exemplo, Siri — ou melhore a acessibilidade para mensagens de texto.
Atendimento ao cliente: chatbots online estão substituindo agentes humanos ao longo da jornada do cliente, mudando a maneira como pensamos sobre engajamento do cliente em sites e plataformas de redes sociais. Os chatbots respondem a perguntas frequentes (FAQs) sobre tópicos como frete, ou fornecem conselhos personalizados, produtos de venda cruzada ou sugestões de tamanhos para os usuários. Os exemplos incluem agentes virtuais em sites de comércio eletrônico; bots de mensagens, usando Slack e Facebook Messenger; e tarefas geralmente feitas por assistentes virtuais e assistentes de voz.
Visão computacional: essa tecnologia de IA permite que os computadores obtenham informações significativas de imagens digitais, vídeos e outras entradas visuais e, em seguida, adotem a ação apropriada. Alimentada por redes neurais convolucionais, a visão computacional tem aplicações em marcações em fotos em redes sociais, geração de imagens de radiologia na área da saúde e carros autônomos no setor automotivo.
Mecanismos de recomendação: usando dados de comportamento de consumo passados, os algoritmos de IA podem ajudar a descobrir tendências de dados que podem ser usadas para desenvolver estratégias de venda cruzada mais eficazes. Os mecanismos de recomendação são usados por varejistas online para fazer recomendações de produtos relevantes aos clientes durante o processo de finalização da compra.
Automação robótica de processos (RPA): também conhecida como robótica de software, a RPA usa tecnologias de automação inteligente para realizar tarefas manuais repetitivas.
Negociação automatizada de ações: projetada para otimizar carteiras de ações, as plataformas de negociação de alta frequência orientadas por IA realizam milhares ou até milhões de negociações por dia sem intervenção humana.
Detecção de fraude: Bancos e outras instituições financeiras podem usar aprendizado de máquina para detectar transações suspeitas. A aprendizagem supervisionada pode treinar um modelo usando informações sobre transações fraudulentas conhecidas. A detecção de anomalias pode identificar transações que parecem atípicas e merecem uma investigação mais aprofundada.
Com o desenvolvimento da tecnologia de aprendizado de máquina, ela certamente facilitou nossa vida. Entretanto, a implementação do aprendizado de máquina nas empresas também levantou uma série de preocupações éticas sobre as tecnologias de IA. Alguns exemplos incluem:
Embora esse tópico atraia muita atenção do público, muitos pesquisadores não estão preocupados com a ideia de a IA superar a inteligência humana em um futuro próximo. A singularidade tecnológica também é chamada de IA forte ou superinteligência. O filósofo Nick Bostrum define superinteligência como "qualquer intelecto que supera amplamente os melhores cérebros humanos em praticamente todos os campos, incluindo criatividade científica, sabedoria geral e habilidades sociais".
Apesar do fato de que a superinteligência não é iminente na sociedade, a ideia levanta algumas questões interessantes quando consideramos o uso de sistemas autônomos, como carros autônomos. É irreal pensar que um carro sem motorista nunca teria um acidente, mas quem é responsável nessas circunstâncias? Ainda devemos desenvolver veículos autônomos, ou devemos limitar essa tecnologia a veículos semiautônomos que ajudam as pessoas a dirigir com segurança? Ainda não há consenso sobre isso, mas esses são os tipos de debates éticos que estão ocorrendo à medida que novas e inovadoras tecnologias de IA se desenvolvem.
Embora grande parte da percepção pública sobre a inteligência artificial gire em torno da perda de empregos, essa preocupação provavelmente deveria ser reformulada. Com cada nova tecnologia disruptiva, vemos que a demanda do mercado por funções específicas muda. Por exemplo, quando olhamos para o setor automotivo, muitos fabricantes, como a GM, estão mudando o foco para a produção de veículos elétricos, a fim de se alinhar às iniciativas ecológicas. O setor de energia não está desaparecendo, mas a fonte de energia está mudando de uma economia de combustível para uma elétrica.
Da mesma forma, a inteligência artificial deslocará a demanda por empregos para outras áreas. Serão necessários indivíduos para ajudar a gerenciar sistemas de IA. Ainda será necessário haver pessoas para lidar com problemas mais complexos dentro dos setores que são mais propensos a serem afetados por mudanças na demanda de trabalho, como o atendimento ao cliente. O maior desafio com a inteligência artificial e seu efeito no mercado de trabalho será ajudar as pessoas a fazer a transição para novas funções que estão em demanda.
A privacidade tende a ser discutida no contexto de privacidade de dados, proteção de dados e segurança de dados. Essas preocupações permitiram que os formuladores de políticas fizessem mais avanços nos últimos anos. Por exemplo, em 2016, a legislação GDPR foi criada para proteger os dados pessoais das pessoas na União Europeia e no Espaço Econômico Europeu, dando aos indivíduos mais controle sobre seus dados. Nos Estados Unidos, estados individuais estão desenvolvendo políticas, como a Lei de Privacidade do Consumidor da Califórnia (CCPA), que foi introduzida em 2018 e exige que as empresas informem os consumidores sobre a coleta de seus dados. Legislações como essa forçaram as empresas a repensar a forma como armazenam e usam informações de identificação pessoal (PII). Como resultado, os investimentos em segurança tornaram-se uma prioridade cada vez maior para as empresas, à medida que procuram eliminar quaisquer vulnerabilidades e oportunidades de vigilância, hackers e ataques cibernéticos.
Casos de viés e discriminação em vários sistemas de aprendizado de máquina levantaram muitas questões éticas em relação ao uso da inteligência artificial. Como podemos nos proteger contra vieses e discriminação quando os próprios dados de treinamento podem ser gerados por processos humanos com viés? Embora as empresas geralmente tenham boas intenções em seus esforços de automação, a Reuters2 destaca algumas das consequências imprevistas da incorporação da IA nas práticas de contratação. Em seu esforço para automatizar e simplificar um processo, a Amazon involuntariamente discriminou candidatos a emprego por gênero para cargos técnicos, e a empresa acabou tendo que descartar o projeto. A Harvard Business Review3 levantou outras questões pontuais sobre o uso da IA em práticas de contratação, como, por exemplo, quais dados você deve poder usar ao avaliar um candidato para um cargo.
O viés e a discriminação também não se limitam à função de recursos humanos; eles podem ser encontrados em uma série de aplicações, desde software de reconhecimento facial até algoritmos de mídia social.
À medida que as empresas se tornam mais conscientes dos riscos da IA, elas também se tornam mais ativas nessa discussão sobre ética e valores de IA. Por exemplo, a IBM desativou seus produtos de análise e reconhecimento facial de uso geral. O CEO da IBM, Arvind Krishna, escreveu: "A IBM se opõe firmemente e não tolerará o uso de qualquer tecnologia, incluindo tecnologia de reconhecimento facial oferecida por outros fornecedores, para vigilância em massa, criação de perfis raciais, violações de direitos humanos e liberdades básicas ou qualquer finalidade que não seja consistente com nossos valores e Princípios de Confiança e Transparência.”
Como não há legislação significativa para regular as práticas de IA, não há nenhum mecanismo real de imposição para garantir que a IA ética seja praticada. Os incentivos atuais para que as empresas sejam éticas são as repercussões negativas de um sistema de IA antiético no lucro. Para preencher essa lacuna, surgiram frameworks éticos como parte de uma colaboração entre especialistas em ética e pesquisadores para regulamentar a construção e distribuição de modelos de IA na sociedade. No entanto, no momento, eles servem apenas para orientar. Algumas pesquisas4 mostram que a combinação de responsabilidade distribuída e falta de previsão de possíveis consequências não contribuem para evitar danos à sociedade.
A seleção de uma plataforma pode ser um processo desafiador, pois o sistema errado pode aumentar os custos ou limitar o uso de outras ferramentas ou tecnologias valiosas. Ao analisar vários fornecedores para selecionar uma plataforma de IA, muitas vezes há uma tendência de pensar que mais recursos = um sistema melhor. Talvez sim, mas os avaliadores devem começar pensando no que a plataforma de IA fará por sua organização. Quais recursoss de aprendizado de máquina precisam ser fornecidos e quais recursos são importantes para alcançá-los? Um recurso ausente pode arruinar a utilidade de um sistema inteiro. Aqui estão alguns recursos a serem considerados.
Recursos MLOps. O sistema possui:
Recursos da IA generativa. O sistema possui:
Aprenda conceitos fundamentais e desenvolva suas habilidades com laboratórios práticos, cursos, projetos guiados, avaliações e muito mais.
Saiba como incorporar com confiança a IA generativa e o aprendizado de máquina em sua empresa.
Quer ter mais retorno sobre seus investimentos em IA? Saiba como o dimensionamento da IA generativa em áreas importantes promove mudanças, ajudando suas melhores mentes a criar e oferecer soluções novas e inovadoras.
Saiba como selecionar o modelo de base de IA mais adequado para seu caso de uso.
Treine, valide, ajuste e implemente recursos de IA generativa, modelos de base e recursos de aprendizado de máquina com o IBM watsonx.ai, um estúdio empresarial de última geração para construtores de IA. Crie aplicações de IA em uma fração do tempo com uma fração dos dados.
Use a IA a serviço de sua empresa com a experiência e o portfólio de soluções líder do setor da IBM à sua disposição.
Reinvente os fluxos de trabalho e operações críticos adicionando IA para maximizar experiências, tomadas de decisão em tempo real e valor de negócios.
1 Deep Learning Basics: Introduction and Overview
2 Insight - Amazon scraps secret AI recruiting tool that showed bias against women, Reuters, 10 de outubro de 2018
3 The Legal and Ethical Implications of Using AI in Hiring, Harvard Business Review, 25 de abril de 2019
4 The Ethics of AI Ethics, An Evaluation of Guidelines, Dr. Thilo Hagendorff
IBM web domains
ibm.com, ibm.org, ibm-zcouncil.com, insights-on-business.com, jazz.net, mobilebusinessinsights.com, promontory.com, proveit.com, ptech.org, s81c.com, securityintelligence.com, skillsbuild.org, softlayer.com, storagecommunity.org, think-exchange.com, thoughtsoncloud.com, alphaevents.webcasts.com, ibm-cloud.github.io, ibmbigdatahub.com, bluemix.net, mybluemix.net, ibm.net, ibmcloud.com, galasa.dev, blueworkslive.com, swiss-quantum.ch, blueworkslive.com, cloudant.com, ibm.ie, ibm.fr, ibm.com.br, ibm.co, ibm.ca, community.watsonanalytics.com, datapower.com, skills.yourlearning.ibm.com, bluewolf.com, carbondesignsystem.com, openliberty.io