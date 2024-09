HDFS è un file system distribuito che gestisce dataset di grandi dimensioni in esecuzione sull'hardware commerciale. Viene utilizzato per aumentare le dimensioni di un singolo cluster Apache Hadoop a centinaia (e anche migliaia) di nodi. HDFS è uno dei principali componenti di Apache Hadoop, gli altri sono MapReduce e YARN. HDFS non deve essere confuso o sostituito da Apache HBase, un sistema di gestione database non relazionale a colonne che risiede al livello superiore di HDFS e può supportare meglio le esigenze di dati in tempo reale grazie al motore di elaborazione in-memory.