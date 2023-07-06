Esses termos da ciência da computação são frequentemente usados de forma intercambiável, mas quais diferenças tornam cada uma tecnologia única?
A tecnologia está se tornando cada vez mais incorporada em nossas vidas cotidianas. Para acompanhar o ritmo das expectativas dos consumidores, as empresas estão confiando mais em algoritmos de aprendizado de máquina para facilitar as coisas. Você pode ver sua aplicação nas redes sociais (por meio de reconhecimento de objetos em fotos) ou conversando diretamente com dispositivos (como Alexa ou Siri).
Enquanto inteligência artificial (IA), aprendizado de máquina (ML), deep learning e redes neurais são tecnologias relacionadas, os termos são frequentemente usados de forma intercambiável, o que frequentemente leva a confusão sobre suas diferenças. Esse post de blog esclarece parte da ambiguidade.
A maneira mais fácil de pensar sobre IA, aprendizado de máquina, deep learning e redes neurais é pensar nelas como uma série de sistemas de IA, do maior para o menor, cada um abrangendo o seguinte.
A IA é o sistema mais abrangente. O aprendizado de máquina é um subconjunto da IA. O deep learning é um campo do aprendizado de máquina, e as redes neurais formam a base dos algoritmos de deep learning. O que diferencia uma rede neural simples de um algoritmo de deep learning é a quantidade de camadas de nós, ou a profundidade, sendo que o deep learning exige mais de três camadas.
Inteligência artificial ou IA, o termo mais amplo dos três, é usado para classificar máquinas que imitam a inteligência humana e funções cognitivas humanas, como resolução de problemas e aprendizado. A IA usa previsões e automação para otimizar e resolver tarefas complexas que os humanos historicamente fizeram, como reconhecimento facial e de fala, tomada de decisões e tradução.
As três principais categorias de IA são:
A ANI é considerada IA "fraca", enquanto os outros dois tipos são classificados como IA "forte". Definimos IA fraca por sua capacidade de concluir uma tarefa específica, como ganhar um jogo de xadrez ou identificar um indivíduo específico em uma série de fotos. O processamento de linguagem natural e a computer vision, que permitem que as empresas automatizem tarefas e suportem chatbots e assistentes virtuais, como Siri e Alexa, são exemplos de ANI. A computer vision é um fator no desenvolvimento de carros autônomos.
Formas mais fortes de IA, como a AGI e a ASI, incorporam comportamentos humanos de forma mais proeminente, como a capacidade de interpretar tom e emoção. A IA forte é definida por sua capacidade em comparação com os humanos. A AGI teria um desempenho semelhante ao de outro humano, enquanto a ASI, também conhecida como superinteligência, superaria a inteligência e a capacidade de um ser humano. Ainda não existe nenhuma forma de IA forte, mas a pesquisa nesse campo está em andamento.
Um número crescente de empresas, cerca de 35% em todo o mundo, está usando IA, e outros 42% estão explorando a tecnologia. O desenvolvimento da IA generativa, que usa modelos de base poderosos que treinam com grandes quantidades de dados não rotulados, pode ser adaptado a novos casos de uso e traz flexibilidade e escalabilidade que provavelmente acelerarão significativamente a adoção da IA. Nos primeiros testes, a IBM observou que a IA generativa faz o time to value até 70% mais rápido do que a IA tradicional.
Se você usa aplicações de IA baseadas em ML ou em modelos de base, a IA pode dar à sua empresa uma vantagem competitiva. A integração de modelos de IA customizados em seus fluxos de trabalho e sistemas, e a automatização de funções como atendimento ao cliente, gestão da cadeia de suprimentos e cibersegurança, pode ajudar uma empresa a atender às expectativas dos clientes, tanto hoje quanto no futuro.
O segredo é identificar os conjuntos de dados certos desde o início para ajudar a garantir o uso de dados de qualidade para obter a vantagem competitiva mais substancial. Você também precisará criar uma arquitetura híbrida pronta para IA que possa usar dados onde quer que estejam, em mainframes, data centers, em nuvens públicas e na edge.
Sua IA precisa ser confiável, porque qualquer coisa menos do que isso significa arriscar prejudicar a reputação de uma empresa e acarretar multas regulatórias. Modelos enganosos e aqueles que contêm viés ou alucinações podem ter um alto custo para a privacidade, os direitos de dados e a confiança dos clientes. Sua IA deve ser explicável, justa e transparente.
O aprendizado de máquina é um subconjunto da IA que permite otimização. Quando configurado corretamente, ele ajuda a fazer previsões que minimizam os erros que surgem da simples suposição. Por exemplo, empresas como a Amazon usam o aprendizado de máquina para recomendar produtos a um cliente específico com base no que eles viram e compraram antes.
O aprendizado de máquina clássico ou "não profundo" depende da intervenção humana para permitir que um sistema computacional identifique padrões, aprenda, execute tarefas específicas e forneça resultados precisos. Especialistas humanos determinam a hierarquia das funcionalidades para entender as diferenças entre as entradas de dados, geralmente exigindo dados mais estruturados para aprender.
Por exemplo, digamos que eu mostre uma série de imagens de diferentes tipos de fast food: "pizza", "hambúrguer" e "taco". Um especialista humano trabalhando nessas imagens determinaria as características que distinguem cada imagem como um tipo específico de fast food. O pão em cada tipo de alimento pode ser uma funcionalidade distintiva. Ou então, eles podem usar rótulos, como "pizza", "hambúrguer" ou "taco" para simplificar o processo de aprendizado por meio do aprendizado supervisionado.
Embora o subconjunto da IA chamado aprendizado de máquina profundo possa aproveitar conjuntos de dados rotulados para informar seu algoritmo em aprendizado supervisionado, ele não exige necessariamente um conjunto de dados rotulado. Ele pode fazer ingestão de dados não estruturados em sua forma bruta (por exemplo, texto, imagens) e pode determinar automaticamente o conjunto de funcionalidades que distinguem "pizza", "hambúrguer" e "taco" um do outro. À medida que geramos mais big data, cientistas de dados usam mais aprendizado de máquina. Para saber mais sobre as diferenças entre essas abordagens, confira Aprendizado supervisionado versus não supervisionado: qual é a diferença?
Uma terceira categoria de aprendizado de máquina é o aprendizado por reforço, em que um computador aprende interagindo com o ambiente ao seu redor e obtendo feedback (recompensas ou penalidades) por suas ações. E o aprendizado online é um tipo de ML em que um cientista de dados atualiza o modelo de ML à medida que novos dados se tornam disponíveis.
Para saber mais sobre aprendizado de máquina, confira o vídeo a seguir:
Como nosso artigo sobre deep learning explica, ele é um subconjunto do aprendizado de máquina. A principal diferença entre o aprendizado de máquina e o deep learning é como cada algoritmo aprende e a quantidade de dados que cada tipo de algoritmo utiliza.
O deep learning automatiza grande parte da funcionalidade de extração de funcionalidade do processo, eliminando parte da intervenção humana manual necessária. Ele também possibilita o uso de grandes conjuntos de dados, ganhando o título de aprendizado de máquina escalável. Esse recurso é interessante à medida que exploramos ainda mais o uso de dados não estruturados, principalmente porque estima-se que mais de 80% dos dados de uma organização sejam não estruturados.
A observação de padrões nos dados permite que um modelo de deep learning agrupe entradas adequadamente. Tomando o mesmo exemplo anterior, podemos agrupar imagens de pizzas, hambúrgueres e tacos em suas respectivas categorias com base nas semelhanças ou diferenças identificadas nas imagens. Um modelo de deep learning requer mais pontos de dados para melhorar a precisão, enquanto um modelo de aprendizado de máquina depende de menos dados, dada sua estrutura de dados subjacente. As empresas geralmente usam o deep learning para tarefas mais complexas, como assistentes virtuais ou detecção de fraudes.
Redes neurais, também chamadas de redes neurais artificiais ou redes neurais simuladas, são um subconjunto de aprendizado de máquina e são a espinha dorsal dos algoritmos de deep learning. Eles são chamados de "neurais" porque imitam a forma como os neurônios do cérebro sinalizam uns aos outros.
As redes neurais são compostas por camadas de nós, uma camada de entrada, uma ou mais camadas ocultas e uma camada de saída. Cada nó é um neurônio artificial que se conecta ao próximo, e cada um tem um peso e um valor limite. Quando a saída de um nó está acima do valor limite, esse nó é ativado e envia seus dados para a próxima camada da rede. Se estiver abaixo do limite, nenhum dado será transmitido.
Os dados de treinamento ensinam as redes neurais e ajudam a melhorar sua precisão ao longo do tempo. Depois que os algoritmos de aprendizado são ajustados, eles se tornam poderosas ferramentas de ciência da computação e IA, pois nos permitem classificar e agrupar dados rapidamente. Usando redes neurais, as tarefas de reconhecimento de fala e imagem podem acontecer em minutos, em vez das horas que levam quando feitas manualmente. O algoritmo de busca do Google é um exemplo bem conhecido de uma rede neural.
Conforme mencionado na explicação das redes neurais acima, mas importante observar mais explicitamente, o "deep" no deep learning se refere à profundidade das camadas em uma rede neural. Uma rede neural de mais de três camadas, incluindo as entradas e a saída, pode ser considerada um algoritmo de deep learning. Isso pode ser representado pelo seguinte diagrama:
A maioria das redes neurais profundas é feed-forward, o que significa que elas fluem apenas em uma direção, da entrada para a saída. No entanto, você também pode treinar seu modelo por meio de retropropagação, o que significa mover-se na direção oposta, da saída para a entrada. A retropropagação nos permite calcular e atribuir o erro associado a cada neurônio, permitindo ajustar e ajustar o algoritmo adequadamente.
Embora todas essas áreas da IA possam ajudar a simplificar áreas de sua empresa e melhorar a experiência do cliente, atingir as metas da IA pode ser desafiador, pois primeiro é necessário garantir que você tenha os sistemas certos para construir algoritmos de aprendizado para gerenciar seus dados. O gerenciamento de dados é mais do que simplesmente construir os modelos que você usa para seus negócios. Você precisa de um local para armazenar seus dados e mecanismos para limpá-los e controlar vieses antes de começar a criar qualquer coisa.
Na IBM, estamos combinando o poder do aprendizado de máquina e da inteligência artificial em nosso novo estúdio para modelos de base, IA generativa e aprendizado de máquina, o IBM watsonx.ai.
