Cos'è la telemetria?

La telemetria è la raccolta e trasmissione automatizzata di dati e misurazioni da fonti distribuite o remote verso un sistema centrale per il monitoraggio, l'analisi e l'ottimizzazione delle risorse.

La telemetria svolge un ruolo fondamentale in vari settori, tra cui sanità, aerospaziale, automotive e tecnologia dell'informazione (IT), offrendo alle organizzazioni preziosi insight sulle prestazioni del sistema, sul comportamento degli utenti, sulla sicurezza e sull'efficienza operativa. Nei settori che si basano su asset fisici, come agricoltura, utility e trasporti, le organizzazioni utilizzano la telemetria per acquisire misurazioni come temperatura, pressione atmosferica, movimento e luce. In ambito sanitario, i sistemi di telemetria possono monitorare la frequenza cardiaca, la pressione sanguigna e i livelli di ossigeno.

In entrambi i casi, gli strumenti fisici e i sensori raccolgono dati del mondo reale e li inviano a un repository centrale. I dati vengono spesso trasmessi utilizzando un protocollo di comunicazione specializzato come Modbus, PROFINET, OPC Unified Architecture o EtherNet/IP per ulteriori analisi.

Tuttavia, i sensori fisici non sono progettati per acquisire indicatori di prestazioni digitali come tassi di errore, utilizzo della memoria, tempi di risposta, tempo di attività e latenza. Al contrario, i team IT si affidano alla strumentazione dei dispositivi, spesso tramite agenti basati su software, ovvero sensori digitali programmati per monitorare e raccogliere autonomamente i dati di sistema rilevanti. Questi dati sono spesso strutturati sotto forma di metriche, eventi, log e tracce (MELT), ognuno dei quali acquisisce una visione diversa del comportamento del sistema, dei workflow e delle tempistiche delle prestazioni.

I confini tra i sistemi di telemetria fisici e digitali stanno iniziando a confondersi, soprattutto perché le aziende adottano sempre più strategie di trasformazione digitale che mirano a integrare la tecnologia digitale in tutte le aree di un'azienda.

Ad esempio, un settore tradizionalmente fisico come quello manifatturiero potrebbe utilizzare sensori per rilevare il consumo di energia, il controllo della qualità e le condizioni ambientali. Allo stesso tempo, potrebbe fare affidamento su agenti software per il monitoraggio avanzato degli asset, la manutenzione preventiva e il monitoraggio del flusso di produzione. Per questo motivo, questo articolo si concentra principalmente sulla telemetria IT e sul suo ruolo in espansione negli ambienti aziendali moderni.

La telemetria IT prevede fondamentalmente cinque passaggi chiave:

Raccolta di metriche, eventi, log e tracce da fonti eterogenee remote con sensori o agenti software
Trasmissione dei dati a un repository centrale o router tramite Wi-Fi, satellite, radio o un altro mezzo di comunicazione
Elaborazione e organizzazione dei dati in entrata in modo che possano essere facilmente interrogati
Conservazione dei dati attraverso una soluzione di storage come un time series database, un data warehouse o un data lake
Analisi, interpretazione e visualizzazione dei dati per prendere decisioni aziendali più informate, spesso con l'aiuto di una piattaforma di observability

Le strategie di telemetria efficaci aiutano le organizzazioni a raggiungere la full stack observability, ovvero la capacità di comprendere lo stato interno di uno stack tecnologico dall'inizio alla fine in base ai suoi output.

La telemetria è anche un componente importante dell'Internet of Things (IoT), un framework che fornisce ai dispositivi sensori avanzati, software e connettività di rete, consentendo loro di comunicare e scambiare dati in tutto il sistema.

Newsletter di settore

Le ultime notizie nel campo della tecnologia, supportate dalle analisi degli esperti

Resta al passo con le tendenze più importanti e interessanti del settore relative ad AI, automazione, dati e oltre con la newsletter Think. Leggi l' Informativa sulla privacy IBM.

Come fanno i sistemi di telemetria a raccogliere e trasmettere i dati?

I sistemi di telemetria variano in base al settore e alla complessità del sistema. Le piattaforme tradizionali utilizzano dispositivi di registrazione, storicamente chiamati telemetri, per raccogliere dati in corrispondenza di un'attrezzatura o nelle sue vicinanze. Queste informazioni vengono elaborate, modificate e talvolta convertite da analogiche a digitali, in un processo chiamato condizionamento del segnale.

Successivamente, un multiplexer combina più flussi di dati in un segnale composito, che aiuta i dati a viaggiare in modo più efficiente. Questo segnale combinato viene poi trasmesso a una stazione ricevente remota tramite radio, satellite o un'altra forma di comunicazione. Infine, un demultiplexer analizza i segnali e li suddivide in filamenti eterogenei per prepararli all'analisi.

La telemetria funziona in modo diverso negli ambienti IT moderni. Anziché affidarsi a sensori fisici, i sistemi orientati all'IT utilizzano agenti software, ovvero programmi leggeri che vengono eseguiti accanto a servizi e applicazioni per acquisire metriche rilevanti. Negli ambienti Kubernetes, questi agenti spesso operano in un contenitore separato all'interno dello stesso cluster di servizi che monitorano. Altre configurazioni potrebbero utilizzare kit di sviluppo software (SDK) per incorporare agenti all'interno delle applicazioni stesse o utilizzare API personalizzate per facilitare i trasferimenti di dati.

Dopo la raccolta, i dati vengono trasportati attraverso una pipeline di telemetria, in grado di standardizzare i dati, filtrare il rumore, aggiungere metadati (come tag di ambiente e geolocalizzazione) e mascherare le informazioni sensibili per mantenere la conformità. Questi dati raffinati vengono quindi standardizzati con un formato come JSON o OpenTelemetry Protocol (OTLP).

Successivamente, i dati vengono indirizzati in modo intelligente a uno o più backend (ad esempio, i componenti lato server di un sistema software, server, database e logica di applicazione) tramite gRPC, HTTP o un altro protocollo di trasporto. Il backend è responsabile della memorizzazione di questi dati, dell'analisi, dell'interpretazione e della presentazione sotto forma di dashboard, avvisi, raccomandazioni e molto altro.

Un singolo sistema di telemetria può essere utilizzato per gestire l'intero workflow, dalla raccolta all'analisi. A volte, però, soprattutto negli ambienti multicloud e ibridi moderni, le organizzazioni potrebbero utilizzare più sistemi di telemetria specializzati per gestire diverse parti della pipeline di observability.

IBM DevOps

Cos'è DevOps?

Andrea Crawford spiega cos'è DevOps, il suo valore e in che modo le pratiche e gli strumenti DevOps ti aiutano a spostare le tue app nell'intera delivery pipeline, dall'ideazione alla produzione. Guidato dai principali leader di pensiero IBM, il curriculum è progettato con lo scopo di aiutare i leader aziendali ad acquisire le conoscenze necessarie per dare priorità agli investimenti nell'AI che possono promuovere la crescita.

Esplora DevOps

Quali sono i principali tipi di dati di telemetria?

In ambito IT, i tipi più comuni di telemetria sono le metriche, gli eventi, i log e le tracce, spesso denominati collettivamente dati "MELT". Le organizzazioni possono utilizzare piattaforme di observability per combinare e analizzare queste metriche, dando vita a un quadro completo della sicurezza della piattaforma, del comportamento degli utenti, dell'efficienza del sistema e molto altro.

Metriche

Le metriche sono misurazioni numeriche indicative dello stato di salute o delle prestazioni del sistema. Gli esempi includono i tassi di richieste, il throughput di rete, i tempi di risposta delle applicazioni, i tassi di conversione degli utenti e l'utilizzo della CPU.

Eventi

Gli eventi sono episodi distinti che si verificano all'interno del sistema. Spesso includono timestamp che mostrano quando un evento è iniziato e quando è terminato. Gli esempi includono notifiche, tentativi di accesso degli utenti, interruzioni del servizio, errori di pagamento e modifiche alla configurazione.

Log

I log forniscono una registrazione continua e una cronologia del comportamento del sistema, a differenza degli eventi, che segnalano solo incidenti particolari. Gli esempi includono riavvii, query del database, cronologie di accesso ai file e passaggi di esecuzione del codice. I log vengono spesso utilizzati per risolvere i problemi e per il debug degli errori, aiutando i team IT a individuare il momento preciso in cui si è verificato un errore.

Tracce

Le tracce riflettono il flusso end-to-end di una specifica richiesta o transazione utente attraverso un ambiente distribuito o di microservizi, con timestamp per ogni passaggio. Gli esempi includono chiamate API e HTTP, query al database e check-out nell'e-commerce. Le tracce possono identificare i colli di bottiglia e fornire insight sull'esperienza dell'utente.

Altri tipi di telemetria

Sebbene MELT mostri l'ampiezza dei dati di telemetria disponibili per le aziende, ci sono altri tipi di dati che non rientrano in questo framework ma svolgono comunque un ruolo critico nell'observability. I confini tra i tipi di telemetria non sono sempre netti e possono esserci delle sovrapposizioni. Ad esempio, la latenza può essere considerata sia una metrica che un punto dati della telemetria di rete. Altri tipi di dati di telemetria includono:

La telemetria di posizionamento utilizza sensori o ricevitori GPS per tracciare la posizione geografica di una persona o di un oggetto. Le applicazioni includono la gestione delle flotte di trasporto, i servizi di emergenza, il monitoraggio della fauna selvatica e la sicurezza dei lavoratori.
La telemetria di rete fornisce insight in tempo reale sul traffico di rete, sulla sicurezza e sulle prestazioni, monitorando l'utilizzo della larghezza di banda, i tassi di perdita dei pacchetti, le prestazioni delle API e i dati SNMP (Simple Network Management Protocol), ovvero informazioni relative a modem, router, server e altri dispositivi connessi.
La telemetria di sicurezza identifica comportamenti sospetti e vulnerabilità esaminando i log di autenticazione, i log del firewall, le query DNS, gli avvisi di rilevamento delle intrusioni e i dati di rilevamento e risposta degli endpoint (EDR).
La telemetria degli utenti tiene traccia dei modelli di utilizzo delle applicazioni, dei log degli errori, della durata delle sessioni, delle query di ricerca e di altri tipi di comportamento degli utenti. Questi dati vengono utilizzati per ottimizzare applicazioni e servizi, comprendere le tendenze dei clienti e mantenere sicura la rete.
La telemetria di profilazione mostra come il software e le applicazioni utilizzano CPU, memoria e altre risorse informatiche nel tempo. Offre dati granulari sulle prestazioni che possono aiutare gli sviluppatori a comprendere l'origine di un rallentamento e quali parti della base di codice sono più utilizzate.
La telemetria cloud raccoglie dati su prestazioni, monitoraggio dei costi e utilizzo dei cloud service. Questi dati potrebbero includere attività di storage, modifiche della configurazione, eventi a livello di identità e accessi e decisioni di routing.
La telemetria AI può tracciare le prestazioni del modello sia durante l'addestramento che durante la produzione. Le metriche chiave includono la deriva del modello (monitoraggio del modo in cui un modello di machine learning perde coerenza e precisione nel tempo), i punteggi di affidabilità (che determinano la sicurezza del modello nelle sue previsioni) e la latenza di inferenza (il tempo impiegato dal modello per rispondere a una query). Queste metriche possono aiutare gli sviluppatori a migliorare l'affidabilità, l'equità e le prestazioni dei modelli.

Telemetria, monitoraggio e observability a confronto

La telemetria è il processo di raccolta e trasmissione di più tipi di dati da sistemi e componenti distribuiti. È la base delle funzionalità di visibilità di un'organizzazione e offre insight sul comportamento e sulle prestazioni di ciascun componente. Le aziende si affidano alla telemetria per alimentare i propri sistemi di monitoraggio e observability.

Il monitoraggio si riferisce al modo in cui le organizzazioni utilizzano i dati di telemetria raccolti. Ad esempio, un sistema di monitoraggio della telemetria potrebbe utilizzare dashboard per aiutare i team DevOps a visualizzare le prestazioni del sistema. Le automazioni degli avvisi, invece, possono inviare notifiche ogni volta che si verifica un evento importante, come un'interruzione della rete o una violazione dei dati.

L'observability riguarda l'interpretazione dei dati operativi e la comprensione della correlazione tra i diversi flussi di dati e lo stato di salute e le prestazioni del sistema. L'observability non solo analizza i dati attuali, ma individua anche tendenze più ampie, utilizzandole per informare e ottimizzare il processo decisionale aziendale e l'uso delle risorse. Le moderne piattaforme di observability spesso includono funzioni di telemetria e monitoraggio integrate. L'observability svolge anche un ruolo chiave nel supportare le tecnologie emergenti, comprese le piattaforme di agentic AI e AI generativa.

Soluzioni comuni di telemetria IT

Un framework open source chiamato OpenTelemetry (OTel), una delle piattaforme di telemetria più diffuse, è apprezzato per la sua flessibilità (il suo design modulare facilita la personalizzazione), l'accessibilità (i suoi componenti principali sono disponibili gratuitamente) e la compatibilità (è compatibile con più fornitori e linguaggi di programmazione). OTel non gestisce lo storage o la visualizzazione della telemetria, bensì fornisce un set standard di SDK, API e altri strumenti per la raccolta e la trasmissione dei dati.

Quasi la metà delle organizzazioni IT utilizza OTel, mentre un ulteriore 25% prevede di implementare il framework in futuro, secondo un rapporto del 2025 della società AI Elastic. Le organizzazioni con sistemi di observability maturi hanno maggiori probabilità di utilizzare OTel rispetto alle aziende con workflow di observability meno sviluppati. IBM Instana, Datadog, Grafana, New Relic, Dynatrace e Splunk offrono ciascuno caratteristiche robuste di supporto OTel.

Un framework open source alternativo chiamato Prometheus condivide alcune somiglianze con OTel. La Cloud Native Computing Foundation (CNCF), essa stessa una consociata dell'organizzazione no profit Linux Foundation, ospita entrambe le soluzioni. A differenza di OTel, Prometheus offre alcune funzionalità di visualizzazione dei dati e data storage. Tuttavia, il suo ambito è leggermente più ristretto: mentre OTel può raccogliere diversi tipi di dati telemetrici, Prometheus lavora esclusivamente con le metriche.

Cos'è la normalizzazione della telemetria?

La normalizzazione della telemetria è il processo di conversione delle metriche in un formato standardizzato, affinché gli strumenti di analytics possano memorizzarle, leggerle e interpretarle. Esistono due approcci principali:

Schema-on-write

In questo approccio di elaborazione dei dati, tutti i dati devono corrispondere a un formato predefinito prima di poter essere memorizzati e recuperati. Sebbene lo schema-on-write sia altamente affidabile, può essere difficile da implementare nelle moderne architetture IT che coinvolgono più sistemi, ciascuno con formati e processi di archiviazione distinti.

Schema-on-write è comunemente usato negli repository di dati centralizzati, chiamati data warehouse. Queste soluzioni di storage possono conservare grandi quantità di dati di telemetria, ma solo se questi dati sono strutturati e organizzati in un formato predefinito. I data warehouse possono essere costosi da scalare e mantenere, tuttavia sono ideali per la business intelligence, l'analytics e altri workflow in cui la coerenza e l'affidabilità sono le massime priorità.

Schema-on-read

Questo approccio raccoglie i dati nel formato originale e li converte solo quando un utente li recupera. Sebbene sia più complesso dal punto di vista operativo, schema-on-read può gestire dati in più formati, rendendoli più flessibili rispetto a schema-on-write.

Schema-on-read è comune nei data lake, che sono come i data warehouse ma possono memorizzare e gestire sia dati semistrutturati che dati non strutturati, insieme ai dati strutturati. I data lake sono apprezzati per la loro convenienza e agilità, il che li rende particolarmente adatti per gli strumenti di analytics basati sul machine learning. Tuttavia, senza una solida governance, possono essere difficili da gestire e possono produrre dati non verificati o incoerenti.

Data Lakehouse

Un'alternativa emergente chiamata data lakehouse combina i migliori elementi dei data lake e dei data warehouse. Il framework supporta lo schema-on-read per i dati non strutturati e allo stesso tempo consente lo schema-on-write per i dati strutturati. Questo approccio ibrido aiuta le organizzazioni a mantenere la coerenza e l'accuratezza, beneficiando al contempo della flessibilità e dell'agilità dei data lake.

Sfide della telemetria

I dati di telemetria possono essere difficili da raccogliere, gestire e memorizzare, soprattutto nei moderni ambienti ibridi e multicloud. Alcune sfide comuni includono:

Compatibilità

I dispositivi e i servizi potrebbero utilizzare formati, protocolli e modelli diversi per registrare i dati di telemetria, limitando la loro capacità di comunicare con il repository centrale. Ad esempio, un dispositivo medico remoto potrebbe utilizzare un protocollo proprietario per misurare i parametri vitali di un paziente, mentre il sistema sanitario elettronico con cui comunica utilizza un protocollo standard. Questa incompatibilità potrebbe richiedere che un team DevOps crei un middleware su misura per facilitare la connessione.

Le incompatibilità possono anche rendere difficile per le organizzazioni mantenere la visibilità su ogni livello architettonico, portando a silos di dati, ostacoli verso l'innovazione e lacune nell'esperienza del cliente. Le aziende possono affrontare questa sfida stabilendo formati di dati coerenti, implementando rigidi guardrail, eseguendo audit di routine e applicando la sincronizzazione e il controllo delle versioni tra i componenti.

Storage

Dati ridondanti e disordinati possono comportare costi di storage incontrollati o analisi errate a causa del rumore eccessivo. Una governance forte può contribuire a mitigare questi rischi.

Ad esempio, i team DevOps possono implementare policy di conservazione dei dati, in cui i dati vengono eliminati automaticamente dopo un determinato periodo di tempo. Il campionamento (preservare un campione rappresentativo da un dataset più ampio), l'aggregazione (calcolare la media di un particolare set di dati) e lo storage su più livelli (trasferire i dati più vecchi verso soluzioni di storage più lente e convenienti) possono anche ridurre il carico di storage e i prezzi.

Conformità

Le aziende, in particolare quelle del settore sanitario, dei servizi legali e delle risorse umane, dove le informazioni di identificazione personale vengono spesso memorizzate e scambiate, sono soggette a rigide normative che riguardano la conservazione, la privacy e la sovranità dei dati. La conformità può rappresentare una sfida, a causa dell'enorme volume e della portata dei dati di telemetria che i moderni team DevOps sono tenuti a raccogliere e analizzare.

Per affrontare questa sfida, le organizzazioni possono implementare solide pratiche di crittografia e controlli tramite token, al fine di proteggere i dati sensibili da violazioni di sicurezza ed esposizioni accidentali. Gli audit possono aiutare le organizzazioni a esaminare le pipeline di telemetria e a individuare le vulnerabilità nelle fasi iniziali della pipeline. Allo stesso modo, i sistemi di filtraggio possono identificare e rimuovere i dati non conformi prima che raggiungano gli utenti. Infine, le aziende possono mantenere la conformità attraverso solidi framework di governance che applicano efficacemente le policy di conservazione e residenza dei dati.

Incoerenza dei dati

Il volume di dati generati dai sistemi di telemetria può sopraffare le aziende, oscurando tendenze significative e offuscando insight sulla sicurezza e l'efficienza dei sistemi. Nel frattempo, lo stress da avvisi causato da notifiche eccessive può distrarre i team DevOps dal completamento di attività ad alta priorità e mettere a dura prova le risorse computazionali. Le organizzazioni possono rispondere automatizzando le risposte agli avvisi, filtrando i dati ridondanti all'edge, stabilendo solide convenzioni di etichettatura e denominazione e applicando quote e limiti a livello di risorse.

Benefici della telemetria

La telemetria consente alle organizzazioni di trasformare i dati in insight fruibili che possono essere utilizzati per migliorare le prestazioni, l'efficienza del workflow, il budget, l'esperienza del cliente e molto altro.

Efficienza operativa

I dati di telemetria aiutano i team DevOps a identificare quali componenti e sistemi funzionano bene e quali devono essere aggiornati, riconfigurati o sostituiti. Supporta anche la manutenzione predittiva, quando i team analizzano le tendenze storiche e i dati sulle prestazioni in tempo reale, per mantenere in modo proattivo le attrezzature prevenendo i guasti critici. I sistemi di telemetria ordinano, organizzano e rimuovono in modo efficiente i dati obsoleti o irrilevanti, riducendo gli sprechi operativi.

A differenza dell'analisi manuale dei dati, i dati di telemetria vengono in genere raccolti automaticamente e in tempo reale. Questo processo aiuta a garantire che le aziende possano affrontare rapidamente i problemi prima che si traducano in tempi di inattività o in guasti costosi. I sistemi di telemetria possono anche consentire alle aziende di monitorare l'impatto degli aggiornamenti e delle innovazioni sul sistema, prima di distribuirli su larga scala.

Maggiore protezione

I sistemi di telemetria forniscono visibilità in tempo reale sul comportamento di utenti, applicazioni e sistemi. Il monitoraggio continuo aiuta a stabilire una baseline delle prestazioni, facilitando la rilevazione di anomalie, come traffico di rete insolito, ripetuti tentativi di accesso falliti, installazioni impreviste e altre attività sospette. La telemetria può anche smascherare lo shadow IT (componenti non autorizzati che agiscono al di fuori della governance centralizzata), contribuendo a eliminare i potenziali punti di ingresso per gli aggressori.

Solide policy di crittografia possono proteggere i dati in tutta la pipeline di telemetria, mentre l'applicazione della retention aiuta a garantire che i dati privati siano conservati solo quando necessario. I controlli degli accessi basati sui ruoli consentono agli stakeholder di accedere ai dati privati, mentre gli audit trail e i log forniscono una cronologia dettagliata delle azioni recenti del sistema, rendendo più accurate ed efficienti le indagini nell'ambito della sicurezza.

Scalabilità

La telemetria offre ai team insight più approfonditi sull'utilizzo del sistema nel tempo, consentendo loro di scalare dinamicamente le risorse per soddisfare le mutevoli esigenze del workload. I team possono utilizzare questi insight per ottimizzare l'utilizzo delle risorse e controllare i costi, mantenendo un ambiente stabile e sicuro per i clienti.

Processo decisionale più intelligente

Le piattaforme di telemetria aiutano i team a sintetizzare i dati provenienti da tutta l'organizzazione per prendere decisioni aziendali più informate e basate sui dati. Le piattaforme di observability si basano sui dati di telemetria per analizzare lo stato di salute del sistema, i percorsi dei clienti, il coinvolgimento degli utenti e altri indicatori chiave di prestazioni. Di fatto, la telemetria raccoglie e integra i dati provenienti da applicazioni e sistemi distribuiti, offrendo alle aziende una visione olistica di come le decisioni aziendali influiscono sull'intero ambiente, non solo sui singoli componenti.

Distribuisci il software in modo efficiente

Migliorare l'efficienza della distribuzione del software è fondamentale per le organizzazioni che devono affrontare situazioni economiche sfavorevoli e concentrarsi sull'automazione DevOps è fondamentale.

Cos'è la telemetria?