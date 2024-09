HDFS est un système de fichiers distribué qui gère de grands ensembles de données s'exécutant sur du matériel de base. Il est utilisé pour faire évoluer un seul cluster Apache Hadoop vers des centaines (voire des milliers) de nœuds. HDFS est l'un des principaux composants de Apache Hadoop, les autres étant MapReduce et YARN. HDFS ne doit pas être confondu avec ou remplacé par Apache HBase , qui est un système de gestion de base de données non relationnelle orienté colonnes qui repose sur HDFS et peut mieux prendre en charge les besoins des données en temps réel grâce à son moteur de traitement en mémoire.