Esta é a oitava edição de uma série de blogs sobre edge computing e, em um dos posts anteriores, falamos sobre modelagem de aprendizado de máquina na edge. Nela, mencionamos como os modelos de aprendizado de máquina (ML) foram construídos e implementados nos nós da edge. Mas e quanto aos feeds de vídeo e outros dados não estruturados que estão sendo gerados por todos esses dispositivos do tipo Internet das coisas (IoT)? Todos esses dados podem ser analisados, e os resultados podem ser produzidos em tempo real? Como isso é feito? Se não puderem ser analisados na edge em tempo real, para onde esses dados são enviados, qual é o formato desses dados e com que rapidez eles podem ser analisados? Por fim, esses dados precisam ser armazenados e, em caso afirmativo, onde estão todos armazenados e por quê? Este post de blog tenta responder a essas perguntas. Alguns chamam isso de "análise de edge" ou "IA na edge".
Não deixe de conferir todas as partes nesta série de posts dr blogd sobre edge computing:
Boletim informativo do setor
Mantenha-se atualizado sobre as tendências mais importantes (e intrigantes) do setor em IA, automação, dados e muito mais com o boletim informativo Think. Consulte a Declaração de privacidade da IBM.
Sua assinatura será entregue em inglês. Você pode encontrar um link para cancelar a assinatura em todos os boletins informativos. Você pode gerenciar suas inscrições ou cancelar a inscrição aqui. Consulte nossa Declaração de privacidade da IBM para obter mais informações.
A definição de análise de dados de edge é simplesmente o processo de coletar, analisar e criar insights praticáveis em tempo real, diretamente dos dispositivos de IoT que geram os dados. Alguns argumentam que isso é edge computing; na verdade, a análise de dados de edge leva as coisas para o próximo nível, onde mais dados são capturados e análises complexas são feitas antes de ações rápidas serem tomadas. Edge computing é semelhante à construção "if/then" na programação de software; a análise de dados de edge adota a abordagem "e se".
Os puristas da inteligência artificial (IA) diriam que a análise de dados de edge lida com a previsão (inferência), ou seja, aplicar o conhecimento de um modelo de rede neural treinado e usá-lo para inferir um resultado.
O fato é que a geração de dados está ultrapassando a capacidade da rede. Portanto, precisamos ser inteligentes sobre quais dados analisar, quais dados enviar para a nuvem para armazenamento e, o mais importante, onde os dados devem ser analisados. Embora a resposta mais fácil para essas perguntas seja "depende", há motivos e recomendações de negócios e técnicos.
Dois fatores ditam essa resposta: o quão crítico é analisar os dados em tempo real e se análises adicionais precisam ser feitas com esses dados. Depois, há aquele requisito de armazenamento (ou não) para atender aos requisitos de conformidade comercial e jurisdicional.
Alguns dizem que a nuvem não é um ótimo lugar para análises em tempo real. Portanto, enviar todos os dados para a nuvem não é a resposta, porque a maioria dos dados armazenados na nuvem nunca é analisada. Chega em algum banco de dados ou bucket de bits, e fica lá.
Tomando o exemplo de uma câmera remota capturando vídeo, algumas das vantagens e desvantagens da análise de dados na edge versus a análise de dados no servidor são capturadas na tabela abaixo:
A consciência situacional é a percepção de elementos e eventos ambientais em relação ao tempo ou espaço, a compreensão de seu significado e a projeção de seu status futuro. Essa definição foi trazida da Wikipedia e os três níveis de consciência situacional são mostrados no gráfico abaixo. Como o tempo é o aspecto mais importante na consciência situacional, por extensão, podemos dizer que o tempo é uma força motriz para a análise de dados, especialmente análise de dados na edge:
Figura 1: Três níveis de consciência situacional.
Os eventos na edge implicariam em analisar o que a câmera está vendo ou o que o sensor está detectando em tempo real, para que as decisões possam ser tomadas rapidamente e ações imediatas possam ser tomadas. Quando dois carros estão em trajetória de colisão, não há tempo para enviar as informações para a nuvem ou notificar alguém; as consequências de permanecer no caminho atual podem ser previstas, e uma colisão pode ser evitada tomando ações imediatas. Quando a câmera inteligente que observa um robô pintor em uma montadora de automóveis vê a quantidade errada de tinta sendo aplicada em uma parte da carroceria de um carro, ela precisa de uma ação corretiva. Tudo isso só é possível com modelos criados previamente implementar nesses dispositivos ou sistemas.
Mas e quanto a situações novas ou até então não previstas? Nas zonas de construção, as câmeras podem ser treinadas para detectar alguém que não esteja usando capacete e fazer soar um alarme ou notificar o supervisor do local. Sensores de entrada podem detectar se as pessoas estão usando um crachá ou carregando armas etc. Em um desastre natural como uma pandemia, gostaríamos que esses mesmos dispositivos detectassem itens relacionados à saúde, como máscaras, luvas etc.
Os modelos existentes teriam que ser aprimorados ou novos modelos de aprendizado de máquina (ML) precisariam ser implementados para que esses dispositivos de ponta detectassem e analisassem essas situações e tomassem as medidas necessárias. A ação resultante é programável e depende da situação específica. Os alarmes podem ser ativados, o pessoal apropriado pode ser notificado, ou as pessoas podem ser impedidas de entrar. Isso é o poder da análise de edge.
Emitir um alerta quando um dispositivo atinge um determinado limite é bastante simples, mas o valor real está em produzir uma análise visual de múltiplas variáveis de dados em tempo real e encontrar significado preditivo no fluxo de dados. Isso pode ajudar as empresas a identificar possíveis valores discrepantes ou problemas que precisam para se aprofundar e realizar análises adicionais.
A análise de edge nem sempre é visual — há muitas outras facetas que produzem dados, como análise de choques e vibrações, detecção de ruído, detecção de temperatura, medidores de pressão, medidores de fluxo e análise de áudio e toms. Os sistemas de prevenção de colisões em carros fazem isso com sensores e não com câmeras. Embora as aplicações de análise de edge precisem trabalhar em dispositivos de edge que podem ter memória, capacidade de processamento ou restrições de comunicação, esses dispositivos seriam conectados a um servidor/gateway de edge onde as aplicações em contêineres são executadas.
Diferentes protocolos são usados para transmitir dados dos dispositivos para o servidor ou gateway (normalmente conhecido como primeira milha). Estes são alguns dos protocolos comuns, mas não é um conjunto completo:
A stack de software varia de acordo com o caso de uso de um determinado setor, mas, de modo geral, as topologias de análise de edge geralmente envolvem uma combinação de produtos. No edge, haveria dispositivos visuais, de áudio ou sensoriais – alguns que são capazes de executar um modelo de inferência em contêineres. Eles enviariam dados para um servidor de inferência, possivelmente executando o IBM Visual Insights e o IBM Edge Application Manager. Os dados não visuais seriam enviados para um backbone de evento usando o IBM Event Streams ou o Apache Kafka. E produtos de software como o IBM Watson que treinam/retreinam modelos, além de middleware como o IBM Cloud Pak for Data e IA, podem agregar, limpar e analisar dados na próxima camada.
Lembre-se do gráfico de consciência situacional mostrado acima; da percepção à ação, a análise de edge tem que operar em tempo real. O diagrama de arquitetura de blocos mostra vários componentes em jogo, com os tempos de latência mostrados em milissegundos entre as diferentes camadas:
Figura 2: Arquitetura de componente de análise de edge.
Acontece que os seres humanos são altamente ajustados e, em um nível cognitivo, operamos na faixa de milissegundos (e às vezes em microssegundos). Portanto, as respostas e decisões das máquinas e dispositivos precisam se aproximar disso e não levar 100 ou 500 milissegundos para enviar dados para a nuvem.
Um dos principais requisitos da análise de edge é melhorar a experiência, reduzindo a latência das respostas. O outro aspecto é a escalabilidade. O número cada vez maior de sensores e dispositivos de rede gerará cada vez mais dados. Isso aumentará a pressão sobre os recursos centrais de análise de dados. A análise de edge permite que as organizações para escalar seus recursos de processamento e análise de dados descentralizando para os locais onde os dados são realmente coletados.
Por fim, a análise de edge não substitui a análise de dados central. Ambas as opções podem e irão se complementar no fornecimento de insights de dados. Anteriormente, mencionamos o fato de que há certos cenários em que a análise de edge é preferível e há certos cenários em que a modelagem de dados e análise de dados centrais são a melhor resposta, uma vez que a latência é aceita como necessária para análise de dados detalhada. O principal objetivo da análise de edge é fornecer insights de negócios em tempo real (ou o mais próximo possível do tempo real).
O centro de arquitetura do IBM Cloud oferece muitas arquiteturas de referência híbrida e multinuvem, incluindo a arquitetura de referência de edge computing. Você também pode visualizar aarquitetura de referência automotiva recém-publicada, relacionada a edge.
Não deixe de verificar todas as partes nesta série de posts de blogs sobre edge computing e os recursos adicionais:
Agradecemos a David Booz por avaliar o artigo e a Andy Gibbs por fornecer a inspiração para o diagrama de arquitetura de blocos.
IBM Power é uma família de servidores equipados com processadores IBM Power, compatíveis com IBM AIX, IBM i e Linux.
Automatize operações, melhore experiências e fortaleça medidas de segurança com as soluções de edge computing da IBM.
A consultoria em estratégia de nuvem da IBM oferece serviços de transformação multinuvem híbrida para acelerar a jornada na nuvem e otimizar ambientes tecnológicos.