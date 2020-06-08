Il s’agit du huitième volet d’une série d’articles sur l’edge computing. Dans l’un des articles précédents, nous avons abordé la modélisation du machine learning à la périphérie (edge). Nous y avons décrit comment les modèles de machine learning (ML) étaient créés et déployés sur les nœuds périphériques. Cependant, qu’en est-il des flux vidéo et autres données non structurées générées par tous ces dispositifs de type Internet des objets (IdO) ? Toutes ces données peuvent-elles être analysées et les résultats peuvent-ils être produits en temps réel ? Comment cela fonctionne-t-il ? Si elles ne peuvent pas être analysées en temps réel à la périphérie, où sont-elles envoyées, quel est leur format et à quelle vitesse peuvent-elles être analysées ? Enfin, ces données doivent-elles être stockées et, si oui, où et pourquoi ? Nous allons tenter de répondre à ces questions dans cet article. Certains appellent cela « l’analytique edge » ou « l’IA à la périphérie ».
La définition de l'analytique edge est simplement le processus qui consiste à collecter, analyser et créer des informations exploitables en temps réel, directement à partir des appareils IdO qui génèrent les données. Certains pourraient soutenir qu'il s'agit d'informatique en périphérie ; en réalité, l'analyse en périphérie va plus loin, dans la mesure où davantage de données sont capturées et où des analyses complexes sont effectuées avant que des mesures rapides ne soient prises. L'informatique en périphérie s'apparente au développement si/alors (if/then) en programmation logicielle ; l'analytique edge adopte quant à elle l'approche et si (what if).
Les puristes de l’intelligence artificielle (IA) diraient que l’analytique edge consiste à prédire (inférence), c’est-à-dire à appliquer les connaissances d’un modèle de réseau de neurones entraîné et à les utiliser pour déduire un résultat.
Le fait est que la génération de données dépasse la capacité du réseau. Il est donc essentiel de faire preuve de discernement quant aux données à analyser, aux données à envoyer vers le cloud pour stockage et, surtout, à l'endroit où les données doivent être analysées. Bien que la réponse la plus simple à ces questions soit « cela dépend », il existe des raisons et des recommandations commerciales et techniques.
Deux facteurs déterminent cette réponse : l’importance d’analyser les données en temps réel et la nécessité ou non d’effectuer une analyse supplémentaire de ces données. Ensuite, il y a la question du stockage (ou non) pour répondre aux exigences de conformité métier et réglementaire.
Certains affirment que le cloud n'est pas un endroit idéal pour l'analytique en temps réel. Envoyer toutes les données vers le cloud n’est donc pas la solution, car la plupart des données stockées dans le cloud ne sont jamais analysées. Cela aboutit dans une base de données ou un espace de stockage, et y reste.
En prenant l'exemple d'une caméra à distance capturant des vidéos, certains des avantages et inconvénients de l'analytique edge par rapport à l'analytique sur serveur sont présentés dans le tableau ci-dessous :
La sensibilisation à la situation est la perception des éléments et des événements environnementaux en fonction du temps ou de l'espace, la compréhension de leur signification et la projection de leur état futur. Cette définition est empruntée de Wikipédia, et les trois niveaux de sensibilisation sont présentés dans le graphique ci-dessous. Étant donné que le temps est l'aspect le plus important de la connaissance de la situation, par extension, nous pouvons dire qu'il est un moteur pour l'analyse, en particulier pour l'analytique edge :
Figure 1 : Les trois niveaux de sensibilisation.
Les événements à la périphérie impliquent d’analyser en temps réel ce que la caméra voit ou ce que le capteur détecte afin de pouvoir prendre des décisions rapidement et agir immédiatement. Lorsque deux voitures sont sur une trajectoire menant à une collision, il n’y a pas le temps d’envoyer l’information au cloud ou d’avertir quelqu’un ; les conséquences de rester sur la trajectoire peuvent être anticipées, et une collision peut être évitée en prenant des mesures immédiates. Lorsque la caméra intelligente qui surveille un robot de peinture dans une usine automobile constate qu’une quantité incorrecte de peinture est appliquée sur une partie de la carrosserie, une action corrective est nécessaire. Tout cela n’est possible qu’avec des modèles prédéfinis déployés sur ces dispositifs ou systèmes.
Mais qu’en est-il des situations nouvelles ou imprévues ? Dans les zones de construction, les caméras peuvent être entraînées pour détecter toute personne ne portant pas de casque de sécurité et déclencher une alarme ou avertir le responsable du chantier. Les capteurs d’entrée peuvent détecter si les personnes portent un badge ou sont en possession d’armes, etc. En cas de catastrophe naturelle telle qu’une pandémie, il serait souhaitable que ces mêmes dispositifs détectent les équipements de protection individuelle tels que les masques faciaux, les gants, etc.
Les modèles existants devraient être améliorés ou de nouveaux modèles de machine learning (ML) devraient être déployés afin que ces appareils périphériques puissent détecter et analyser de telles situations et prendre les mesures nécessaires. L’action qui en résulte est programmable et dépend de la situation spécifique. Les alarmes peuvent être activées, le personnel concerné peut être informé ou l'accès peut être refusé. C'est toute la puissance de l'analytique edge.
L'émission d'une alerte lorsqu'un appareil atteint un certain seuil est assez simple, mais la véritable valeur réside dans la production d'une analyse visuelle de plusieurs variables de données en temps réel et dans la recherche d'une signification prédictive dans le flux de données. Cela peut aider les entreprises à identifier les données aberrantes potentielles ou les problèmes qu'elles doivent approfondir et effectuer des analyses plus approfondies.
L’analytique edge n’est pas toujours de nature visuelle : il existe de nombreux autres éléments générateurs de données, tels que l’analyse des chocs et des vibrations, la détection du bruit, la mesure de la température, les manomètres, les débitmètres et l’analyse audio et tonale. Les systèmes anticollision des voitures fonctionnent à l’aide de capteurs et non de caméras. Bien que les applications d’analytique edge doivent fonctionner sur des dispositifs périphériques qui peuvent présenter des contraintes en matière de mémoire, de puissance de traitement ou de communication, ces dispositifs seraient connectés à un serveur/une passerelle périphérique où s’exécutent les applications conteneurisées.
Différents protocoles sont utilisés pour transmettre les données des appareils vers le serveur ou la passerelle (généralement appelé « premier kilomètre »). Voici quelques-uns des protocoles courants, mais cette liste n’est pas exhaustive :
La pile logicielle varie en fonction du cas d’utilisation pour un secteur particulier, mais d’une manière générale, les topologies d’analytique edge impliquent généralement une combinaison de produits. À l’extrémité, on trouve des dispositifs visuels, audio ou sensoriels, dont certains ont la capacité d’exécuter un modèle d’inférence conteneurisé. Ils envoient des données à un serveur d’inférence, qui peut exécuter IBM Visual Insights et IBM Edge Application Manager. Les données non visuelles seraient envoyées à un réseau principal d’événements à l’aide d’IBM Event Streams ou d’Apache Kafka. Et des produits logiciels tels qu’IBM Watson qui entraînent/réentraînent les modèles, ainsi que du middleware tel qu’IBM Cloud Pak for Data and AI pourraient agréger, nettoyer et analyser les données dans la couche supérieure.
Rappelez-vous le graphique illustrant l’a conscience situationnelle présenté ci-dessus : de la perception à l’action, l’analytique edge doit fonctionner en temps réel. Le schéma de l’architecture modulaire montre les différents composants en jeu, avec les temps de latence indiqués en millisecondes entre les différentes couches :
Figure 2 : Architecture des composants d’analytique edge
Il s’avère que les humains sont hautement perfectionnés et, à un niveau cognitif, nous opérons à l’échelle de la milliseconde (et parfois, en microsecondes). Ainsi, les réponses et les décisions des machines et des appareils doivent s’en rapprocher et ne pas prendre 100 ou 500 millisecondes pour envoyer des données vers le cloud.
L’une des principales exigences de l’analytique edge est d’améliorer les expériences informatiques en réduisant la latence des réponses. L’autre aspect est l’évolutivité. Le nombre toujours croissant de capteurs et de dispositifs réseau générera de plus en plus de données. Cela augmentera la pression sur les ressources centrales d’analyse des données. L’analytique edge permet aux entreprises d’étendre leurs capacités de traitement et d’analyse en les décentralisant vers les emplacements où les données sont réellement collectées.
Enfin, l’analytique edge ne remplace pas l’analyse centralisée des données. Les deux options peuvent et se compléteront dans la fourniture d'informations sur les données. Précédemment, nous avons évoqué le fait qu’il existe certains scénarios où l’analytique edge est privilégiée, et d’autres scénarios où la modélisation de données et l’analytique centralisées sont la meilleure réponse, car la latence est acceptée comme l’analytique détaillée est requise. L’objectif principal de l’analytique edge est de fournir des informations métier en temps réel (ou en temps quasi réel).
Le centre d’architectures d’IBM Cloud propose de nombreuses architectures de référence hybrides et multicloud, dont l’architecture de référence pour l’edge computing. Vous pouvez également consulter la nouvelle architecture de référence pour l’automobile liée à l’edge.
Nous remercions David Booz pour la révision de cet article et Andy Gibbs pour avoir fourni l'inspiration pour le schéma de l'architecture modulaire.
