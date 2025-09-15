Als NoSQL-Datenbanken unterstützen sowohl Apache Cassandra als auch MongoDB verteilte Systeme mit Datenspeicher über mehrere Rechenressourcen, um Ausfallzeit zu minimieren. Aber wie bei ihren Datenmodellen unterscheidet sich auch die dieser Verteilung zugrunde liegende Architektur grundlegend.

Apache Cassandra basiert auf einer Peer-to-Peer-Architektur. Jeder Knoten in einem Cassandra-Cluster ist gleich, es gibt keine Abhängigkeit von einem Master-Knoten. Wenn Daten in einen Cluster eingefügt werden, wird eine Hash-Funktion auf den Partitionsschlüssel der Zeile angewendet und die Ausgabe wird verwendet, um Daten bestimmten Knoten zuzuweisen. Die Daten werden auch auf andere Knoten kopiert.

Der Replikationsfaktor einer Cassandra-Datenspeicher beschreibt die Anzahl der Kopien der Daten, die in der Datenbank gespeichert sind. Die Speicher-Engine von Cassandra verwendet einen schrittweisen Ablauf (oder Schreibpfad), der aus einem Commit-Protokoll, einer In-Memory-Tabelle (memtable) und sortierten String-Tabellen-Dateien (SSTable) besteht.

Im Gegensatz zu Cassandra verwendet MongoDB ein primäres/sekundäres Modell für seine verteilte Architektur. In MongoDB besteht ein Replikatsatz (eine Gruppe von Instanzen) aus einem primären Knoten, der alle Schreiboperationen (Datenergänzungen oder -änderungen) abwickelt, und sekundären Knoten, die Daten im primären Knoten wiedergeben.

Große Datensätze in MongoDB können auch durch einen Prozess, der als Sharding bekannt ist, auf mehrere Maschinen verteilt werden. Die Informationen werden in Sharding-Cluster unterteilt – mehrere Replikatgruppen und ein Router, der Abfragen von Anwendungen an die Replikatgruppen überträgt – um die Kapazität des Systems zur Verarbeitung von Datenanforderungen zu verbessern.

Die Datenbanken verwenden auch unterschiedliche Indizierungsmethoden. In Apache Cassandra ist der primäre Index der Partitionsschlüssel, obwohl die Cassandra-Dokumentation die speichergebundene Indizierung (die Funktionen für Nicht-Partitionsspalten enthält) als für den meisten Anwendungsfall angemessen anführt. 4 Cassandra verfügt auch über Sekundärindizes, bei denen es sich um lokale Indizes handelt, die in Tabellen gespeichert sind, die von den indizierten Werten getrennt sind. MongoDB unterstützt mehrere verschiedene Indextypen für verschiedene Anwendungsfälle, einschließlich Geodatenindizes, Multikey-Indizes und Textindizes.