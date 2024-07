Hadoop Distributed File System ist ein verteiltes Dateisystem, das große Datenmengen verarbeitet, die auf Standardhardware ausgeführt werden. Es wird dazu verwendet, einen einzelnen Apache Hadoop-Cluster auf Hunderte (und sogar Tausende) von Knoten zu skalieren. Hadoop Distributed File System ist eine der übergeordnet Komponenten von Apache Hadoop, die anderen sind MapReduce und Yet Another Resource Negotiator (YARN). Hadoop Distributed File System sollte nicht verwechselt oder ersetzt werden durch Apache HBase, das ein spaltenorientiertes, nicht-relationales Datenbankverwaltungssystem ist, das am Anfang von Hadoop Distributed File System sitzt und mit seiner speicherinternen Verarbeitungsengine Echtzeitdaten besser unterstützen kann.