Apache Kafka (Kafka) è una piattaforma di streaming open source distribuita che consente (tra le altre cose) lo sviluppo di applicazioni in tempo reale basate sugli eventi. Quindi, cosa significa tutto ciò?
Oggi, miliardi di fonti di dati generano un flusso continuo di record di dati, inclusi i flussi di eventi. Un evento è un record digitale di un'azione che si è verificata e della data/ora in cui si è verificata. Generalmente, un evento è un'azione che favorisce un'altra azione come parte di un processo. Alcuni esempi di eventi sono un cliente che effettua un ordine, sceglie un posto su un aereo o inoltra un modulo di registrazione. Un evento non deve necessariamente coinvolgere una persona - ad esempio, il report della temperatura di un termostato collegato in un dato momento rappresenta anch'esso un evento.
Questi flussi offrono opportunità per le applicazioni che rispondono ai dati o agli eventi in tempo reale. Una piattaforma di streaming consente agli sviluppatori di realizzare applicazioni che utilizzano ed elaborano continuamente questi flussi a velocità estremamente elevate, con un alto livello di fedeltà e accuratezza, in base al corretto ordine in cui si verificano.
LinkedIn ha sviluppato Kafka nel 2011 come broker di messaggi con un'elevata velocità di trasmissione per uso proprio, quindi lo ha reso open source e lo ha donato alla fondazione Apache Software Foundation (link esterno a ibm.com). Oggi, Kafka si è evoluto nella piattaforma di streaming più utilizzata, in grado di acquisire ed elaborare bilioni di record al giorno senza alcun ritardo percettibile nelle prestazioni, al crescere del volume dei dati. Le organizzazioni Fortune 500, come ad esempio Target, Microsoft, AirBnB e Netflix, si affidano a Kafka per offrire ai propri clienti esperienze basate sui dati e in tempo reale.
Il seguente video fornisce ulteriori informazioni su Kafka (9:10):