Apache Spark, il più grande progetto open source nel trattamento dei dati, è l'unico framework di elaborazione che combina dati e intelligenza artificiale (AI). Questo consente agli utenti di eseguire trasformazioni dei dati su larga scala e analisi, e poi di eseguire algoritmi all'avanguardia di machine learning (ML) e AI.

L'ecosistema Spark è composto da cinque moduli principali: