Machine Learning

menu icon

Machine Learning

Esta introdução ao machine learning fornece uma visão geral de sua história, definições importantes, aplicações e preocupações dentro das empresas hoje.

O que é machine learning?

Machine learning é um ramo da inteligência artificial (IA) e da ciência da computação que se concentra no uso de dados e algoritmos para imitar a maneira como os humanos aprendem, melhorando gradualmente sua precisão.

A IBM tem um rico histórico com machine learning. Um dos seus colaboradores, Arthur Samuel, é creditado por cunhar o termo “machine learning” com sua pesquisa (PDF, 481 KB) (link externo à IBM) em torno do jogo de damas. Robert Nealey, o autoproclamado rei da dama, jogou o jogo em um computador IBM 7094 em 1962 e perdeu para o computador. Comparado ao que pode ser feito hoje, esse feito quase parece trivial, mas é considerado um marco importante no campo da inteligência artificial. Nas próximas décadas, os desenvolvimentos tecnológicos em torno do armazenamento e da capacidade de processamento permitirão alguns produtos inovadores que conhecemos e amamos hoje, como o mecanismo de recomendação da Netflix ou carros autônomos.

Machine learning é um componente importante do crescente campo da ciência de dados. Por meio do uso de métodos estatísticos, os algoritmos são treinados para fazer classificações ou previsões, revelando os principais insights em projetos de mineração de dados. Esses insights subsequentemente conduzem a tomada de decisões em aplicativos e negócios, impactando de forma ideal as principais métricas de crescimento. Conforme o big data continua a se expandir e crescer, a demanda do mercado por cientistas de dados aumentará, exigindo que eles auxiliem na identificação das questões de negócios mais relevantes e, posteriormente, os dados para respondê-las.

Machine Learning vs Deep Learning vs Redes neurais

Como o deep learning e o machine learning tendem a ser usados de maneira alternada, é importante observar as nuances entre os dois. Machine learning, deep learning e redes neurais são todos subcampos da inteligência artificial. No entanto, o deep learning é, na verdade, um subcampo do machine learning, e as redes neurais são um subcampo do deep learning.

A maneira pela qual o deep learning e o machine learning diferem é em como cada algoritmo aprende. O deep learning automatiza grande parte do processo de extração de recursos, eliminando parte da intervenção humana manual necessária e permitindo o uso de conjuntos de dados maiores. Você pode pensar em deep learning como "machine learning escalável", como Lex Fridman observa nesta palestra do MIT (00h30) (link externo à IBM). Clássico, ou "não profundo", o machine learning é mais dependente da intervenção humana para aprender. Os especialistas humanos determinam o conjunto de recursos para entender as diferenças entre os insumos de dados, geralmente exigindo dados mais estruturados para aprender.

O machine learning "deep" pode alavancar conjuntos de dados rotulados, também conhecidos como aprendizado supervisionado, para informar seu algoritmo, mas não requer necessariamente um conjunto de dados rotulado. Ele pode ingerir dados não estruturados em sua forma bruta (por exemplo, texto, imagens) e pode determinar automaticamente o conjunto de recursos que distinguem diferentes categorias de dados umas das outras. Ao contrário do machine learning, ele não requer intervenção humana para processar dados, o que nos permite ajustar a escalar do machine learning de maneiras mais interessantes. O deep learning e as redes neurais são creditados principalmente com a aceleração do progresso em áreas como visão computacional, processamento de linguagem natural e reconhecimento de fala.

Redes neurais, ou redes neurais artificiais (ANNs), são compostas por camadas de um nó, contendo uma camada de entrada, uma ou mais camadas ocultas e uma camada de saída. Cada nó, ou neurônio artificial, conecta-se a outro e tem um peso e um limite associados. Se a saída de qualquer nó individual estiver acima do valor do limite especificado, esse nó será ativado, enviando dados para a próxima camada da rede. Caso contrário, nenhum dado será transmitido junto à próxima camada da rede. O "deep" no deep learning está apenas se referindo à profundidade das camadas em uma rede neural. Uma rede neural que consiste em mais de três camadas, que incluiriam as entradas e a saída, pode ser considerada um algoritmo de deep learning ou uma rede neural profunda. Uma rede neural que só tem duas ou três camadas é apenas uma rede neural básica.

Veja o post do blog “ IA versus machine learning versus Deep Learning versus redes neurais: qual é a diferença entre eles?”, para obter uma análise mais detalhada de como os diferentes conceitos se relacionam.

Como o machine learning funciona

UC Berkeley (link externo à IBM) quebra o sistema de aprendizado de um algoritmo de machine learning em três partes principais.

  1. Um processo de decisão: Em geral, algoritmos de machine learning são usados para fazer uma predição ou classificação. Com base em alguns dados de entrada, que podem ser rotulados ou não rotulados, seu algoritmo produzirá uma estimativa sobre um padrão nos dados.
  2. Uma função de erro: Uma função de erro serve para avaliar a predição do modelo. Se houver exemplos conhecidos, uma função de erro poderá fazer uma comparação para avaliar a precisão do modelo.
  3. Um processo de otimização de modelo: Se o modelo pode se ajustar melhor aos pontos de dados no conjunto de treinamento, então os pesos são ajustados para reduzir a discrepância entre o exemplo conhecido e a estimativa do modelo. O algoritmo repetirá este processo de avaliação e otimização, atualizando os pesos de maneira autônoma até que um limite de precisão seja atingido.

Métodos de machine learning

Classificadores de machine learning encaixam-se em três categorias primárias.

Machine learning supervisionado

Aprendizado supervisionado, também conhecido como machine learning supervisionado, é definido pelo uso de conjuntos de dados rotulados para treinar algoritmos que classificam dados ou preveem resultados com precisão. Conforme os dados de entrada são alimentados no modelo, ele ajusta seus pesos até que o modelo tenha sido ajustado de maneira adequada. Isso ocorre como parte do processo de validação cruzada para garantir que o modelo evita super ajuste ou sub-ajuste. O aprendizado supervisionado ajuda as organizações a resolver uma variedade de problemas do mundo real em grande escala, como a classificação de spam em uma pasta separada da sua caixa de entrada. Alguns métodos usados na aprendizagem supervisionada incluem redes neurais, naïve bayes, regressão linear, regressão logística, floresta aleatória, máquina de vetores de suporte (SVM) e muito mais.

Machine learning não supervisionado

Aprendizado não supervisionado, também conhecido como machine learning não supervisionado, usa algoritmos de machine learning para analisar e agrupar conjuntos de dados não rotulados. Esses algoritmos descobrem padrões ocultos ou agrupamentos de dados sem a necessidade de intervenção humana. Sua capacidade de descobrir semelhanças e diferenças nas informações torna a solução ideal para análise exploratória de dados, estratégias de vendas cruzadas, segmentação de clientes, imagem e reconhecimento de padrões. Também é usado para reduzir o número de recursos em um modelo por meio do processo de redução de dimensionalidade, a análise de componente principal (PCA) e a decomposição de valor singular (SVD) são duas abordagens comuns para isso. Outros algoritmos usados no aprendizado não supervisionado incluem redes neurais, armazenamento em cluster de k-médias, métodos de armazenamento em cluster probabilístico e muito mais.

Aprendizado semissupervisionado

O aprendizado semissupervisionado oferece um bom meio-termo entre o aprendizado supervisionado e o não supervisionado. Durante o treinamento, ele usa um conjunto de dados rotulado menor para orientar a classificação e a extração de recursos de um conjunto de dados maior e não rotulado. O aprendizado semissupervisionado pode resolver o problema de não haver dados rotulados suficientes (ou não ser capaz de rotular dados suficientes) para o treinamento de um algoritmo de aprendizado supervisionado.

Para uma análise detalhada das diferenças entre essas abordagens, consulte"Aprendizado supervisionado versus não supervisionado: qual é a diferença?"

Machine learning de reforço

O machine learning de reforço é um modelo de machine learning comportamental semelhante ao aprendizado supervisionado, mas o algoritmo não é treinado usando dados de amostra. Este modelo aprende à medida que avança por meio de tentativa e erro. Uma sequência de resultados bem-sucedidos será reforçada para desenvolver a melhor recomendação ou política para um determinado problema.

O sistema IBM Watson® que venceu o desafio Jeopardy! em 2011 é um bom exemplo. O sistema usou aprendizado por reforço para decidir se tentava uma resposta (ou pergunta, por assim dizer), qual quadrado selecionar no tabuleiro e quanto apostar, especialmente nos "daily doubles".

Saiba mais sobre o aprendizado de reforço.

Casos de uso de machine learning do mundo real

Aqui estão apenas alguns exemplos de machine learning que talvez você encontre todos os dias:

Reconhecimento de fala: também é conhecido como reconhecimento automático de fala (ASR), reconhecimento de fala por computador ou fala para texto, e é um recurso que usa o processamento de linguagem natural (PNL) para processar a fala humana em um formato escrito. Muitos dispositivos móveis incorporam reconhecimento de voz em seus sistemas para realizar pesquisas por voz, por exemplo, Siri, ou fornecer mais acessibilidade para mensagens de texto.

Atendimento ao cliente: os robôs de chat on-line estão substituindo os agentes humanos ao longo da jornada do cliente. Eles respondem às perguntas mais frequentes (FAQs) sobre tópicos, como envio, ou fornecem aconselhamento personalizado, venda cruzada de produtos ou sugestões de tamanhos para os usuários, mudando a maneira como pensamos sobre o envolvimento do cliente em sites e plataformas de mídia social. Os exemplos incluem robôs de sistema de mensagens em sites de comércio eletrônico com agentes virtuais, aplicativos de mensagens, como Slack e Facebook Messenger, e tarefas geralmente realizadas por assistentes virtuais e assistentes de voz.

Visão computacional: esta tecnologia de IA permite que computadores e sistemas derivem informações significativas de imagens digitais, vídeos e outras entradas visuais e, com base nessas entradas, ela pode agir. Essa capacidade de fornecer recomendações o distingue das tarefas de reconhecimento de imagem. Impulsionada por redes neurais convolucionais, a visão computacional tem aplicações na marcação de fotos nas mídias sociais, imagens radiológicas na assistência médica e carros autônomos no mercado automotivo.

Mecanismos de recomendação: usando dados de comportamento de consumo anterior, os algoritmos de IA podem ajudar a descobrir tendências de dados que podem ser usados para desenvolver estratégias de vendas cruzadas mais eficazes. Isso é usado para fazer recomendações complementares relevantes aos clientes durante o processo de finalização da compra para varejistas on-line.

Negociação de ações automatizada: projetadas para otimizar carteiras de ações, as plataformas de negociação de alta frequência orientadas por IA fazem milhares ou até milhões de negociações por dia sem intervenção humana.

Desafios do machine learning

Com o avanço da tecnologia de machine learning, isso certamente tornou nossas vidas mais fáceis. No entanto, a implementação do machine learning nas empresas também levantou uma série de preocupações éticas em torno das tecnologias de IA. Algumas destas incluem:

Singularidade tecnológica

Embora este tópico atraia muita atenção do público, muitos pesquisadores não estão preocupados com a ideia de a IA ultrapassar a inteligência humana em um futuro próximo ou imediato. Isso também é conhecido como superinteligência, que Nick Bostrum define como "qualquer intelecto que supera amplamente os melhores cérebros humanos em praticamente todos os campos, incluindo criatividade científica, sabedoria geral e habilidades sociais". Apesar de a IA forte e a superinteligência não serem iminentes na sociedade, a ideia dela levanta algumas questões interessantes quando consideramos o uso de sistemas autônomos, como carros autônomos. Não é realista pensar que um carro sem motorista nunca sofreria um acidente de carro, mas quem seria o responsável legal nessas circunstâncias? Devemos ainda buscar veículos autônomos ou limitar a integração dessa tecnologia para criar apenas veículos semiautônomos que promovam a segurança entre os motoristas? O júri ainda não decidiu isso, mas esses são os tipos de debates éticos que estão ocorrendo à medida que novas e inovadoras tecnologias de IA são desenvolvidas.

Impacto de IA em tarefas:

Embora grande parte da percepção pública em torno da inteligência artificial gire em torno da perda de tarefas, essa preocupação provavelmente deve ser reformulada. A cada nova tecnologia disruptiva, vemos que a demanda do mercado por funções de tarefa específicas também muda. Por exemplo, quando olhamos para o mercado automotivo, muitos fabricantes, como a GM, estão mudando para se concentrar na produção de veículos elétricos para se alinhar às iniciativas verdes. O mercado de energia não irá acabar, mas a fonte de energia está mudando de uma economia de combustível para uma elétrica. A inteligência artificial deve ser vista de maneira semelhante, onde a inteligência artificial mudará a demanda de tarefas para outras áreas. Será necessário haver pessoas para ajudar a gerenciar esses sistemas à medida que os dados aumentam e mudam todos os dias. Ainda haverá necessidade de recursos para resolver problemas mais complexos dentro dos setores de mercado que são mais prováveis de serem afetados por mudanças na demanda de tarefas, como atendimento ao cliente. O aspecto importante da inteligência artificial e seu efeito no mercado de trabalho ajudará os indivíduos na transição para essas novas áreas de demanda do mercado.

Privacidade:

Privacidade tende a ser discutida no contexto de privacidade de dados, proteção de dados e segurança de dados, e essas preocupações permitiram que os legisladores fizessem mais avanços aqui nos últimos anos. Por exemplo, em 2016, a legislação GDPR foi criada para proteger os dados pessoais de pessoas na European Union and European Economic Area, dando aos indivíduos mais controle sobre seus dados. Nos Estados Unidos, alguns estados estão desenvolvendo políticas, como o California Consumer Privacy Act (CCPA), que exige que as empresas informem os consumidores sobre a coleta de seus dados. Essa legislação recente forçou as empresas a repensar como armazenam e usam dados de identificação pessoal (PII). Como resultado, os investimentos em segurança se tornaram uma prioridade cada vez maior para as empresas, à medida que buscam eliminar quaisquer vulnerabilidades e oportunidades de inspeção, hacking e ataques cibernéticos.

Preconceito e discriminação:

Casos de preconceito e discriminação em vários sistemas inteligentes levantaram muitas questões éticas relacionadas ao uso da inteligência artificial. Como podemos nos proteger contra preconceito e discriminação quando os próprios dados de treinamento podem levar ao preconceito? Embora as empresas normalmente sejam bem-intencionadas em relação aos seus esforços de automação, a Reuters (link externo à IBM) destaca algumas das consequências imprevistas da incorporação de IA nas práticas de contratação. Em seu esforço para automatizar e simplificar um processo, a Amazon, involuntariamente tendenciou candidatos a emprego em potencial por gênero para funções técnicas abertas e, no final das contas, tiveram que descartar o projeto. Conforme eventos como esses vêm à tona, a Harvard Business Review (link externo à IBM) levantou outras questões pontuais sobre o uso de IA nas práticas de contratação, como quais dados deve-se ser capaz de usar ao avaliar um candidato para uma função.

O preconceito e a discriminação também não se limitam à função de recursos humanos, isto pode ser encontrado em uma série de aplicativos, desde software de reconhecimento facial a algoritmos de mídia social.

À medida que as empresas se tornam mais conscientes dos riscos da IA, elas também se tornam mais ativas nessa discussão em torno da ética e dos valores da IA. Por exemplo, no ano passado, o CEO da IBM, Arvind Krishna, compartilhou que a IBM encerrou seus produtos de reconhecimento facial e análise de propósito geral IBM, enfatizando que “a IBM se opõe firmemente e não tolerará o uso de qualquer tecnologia, incluindo tecnologia de reconhecimento facial oferecida por outros fornecedores, para inspeção em massa, discriminação racial, violações de direitos humanos básicos e liberdades ou qualquer propósito que não seja consistente com nossos valores e Princípios de confiança e transparência”.

Para saber mais sobre isso, verifique o blog de políticas da IBM, relatando seu ponto de vista sobre "Uma abordagem de regulamentação de precisão para controlar exportações de tecnologia de reconhecimento facial".

Responsabilidade

Uma vez que não há legislação significativa para regular as práticas de IA, não existe um mecanismo real de aplicação para garantir que a IA ética seja praticada. Os incentivos atuais para que as empresas sigam essas diretrizes são as repercussões negativas de um sistema de IA antiético nos resultados financeiros. Para preencher a lacuna, estruturas éticas surgiram como parte de uma colaboração entre especialistas em ética e pesquisadores para governar o desenvolvimento e distribuição de modelos de IA na sociedade. No entanto, no momento, eles servem apenas para orientar, e a pesquisa (link externo à IBM) (PDF, 984 KB) mostra que a combinação de responsabilidade distribuída e falta de previsão das consequências potenciais não conduz necessariamente à prevenção de danos à sociedade.

Para saber mais sobre a posição da IBM em relação à ética em IA, veja mais sobre aqui.

Machine learning e IBM Cloud

IBM Watson Machine Learning oferece suporte ao ciclo de vida do machine learning de ponta a ponta. Ele está disponível em uma variedade de ofertas que permitem criar modelos de machine learning onde quer que seus dados estejam e implementá-los em qualquer lugar em seu ambiente de multicloud híbrida.

IBM Watson Machine Learning on IBM Cloud Pak for Data ajuda as equipes de ciência de dados corporativos e de IA a acelerar o desenvolvimento e a implementação de IA em qualquer lugar, em dados nativos de cloud e plataforma de IA. IBM Watson Machine Learning Cloud, um serviço gerenciado no ambiente da IBM Cloud, é a maneira mais rápida de migrar modelos de experimentação da área de trabalho para a implementação de cargas de trabalho de produção. Para equipes menores que buscam ajustar a escala de implementações de machine learning, o IBM Watson Machine Learning Server oferece uma instalação simples em qualquer cloud privada ou pública.

Para começar a usar, inscreva-se para obter um IBMid e crie sua conta IBM Cloud.