Kafka è spesso utilizzato con diverse altre tecnologie Apache come parte di una più ampia elaborazione di flussi, un'architettura basata sugli eventi o una soluzione di analytics di big data.

Apache Spark

Apache Spark è un motore di analytics per l'elaborazione dei dati su larga scala. Puoi utilizzare Spark per eseguire l'analytics sui flussi forniti da Apache Kafka e produrre applicazioni di elaborazione dei flussi in tempo reale, come la già citata analisi del flussi di clic.

Apache NiFi

Apache NiFi è un sistema di gestione del flusso di dati con un'interfaccia visiva con trascinamento della selezione. Poiché può essere eseguito come un producer Kafka e un consumer Kafka, NiFI è lo strumento ideale per gestire le sfide relative al flusso di dati che Kafka non è in grado di affrontare.

Apache Flink

Apache Flink è un motore per l'esecuzione di calcoli sui flussi di eventi su larga scala con velocità elevata e latenza ridotta in modo sistematico. Flink è in grado di inserire i flussi come un consumer Kafka, eseguire operazioni basate su tali flussi in tempo reale e pubblicare i risultati in Kafka o in un'altra applicazione.

Apache Hadoop

Apache Hadoop è un framework di software distribuito che consente di archiviare enormi quantità di dati in un cluster di computer da utilizzare per l'analytics di big data, il machine learning, il data mining e altre applicazioni basate sui dati che elaborano dati strutturati e non strutturati. Kafka viene spesso utilizzato per creare una pipeline dei dati di streaming in tempo reale su un cluster Hadoop.