NoSQLデータベースとして、Apache CassandraとMongoDBはいずれも分散システムをサポートし、複数のコンピューティング・リソースにデータを分散保存することでダウンタイムを軽減します。しかし、その分散を支えるアーキテクチャーは、データモデルと同様に根本的に異なります。

Apache Cassandraはピア・ツー・ピア型アーキテクチャーを採用しています。Cassandraクラスター内のすべてのノードは対等であり、マスター・ノードに依存しません。データがクラスターに投入されると、その行のパーティション・キーにハッシュ関数が適用され、その出力によってデータが特定のノードに割り当てられます。さらに、そのデータは他のノードにもコピーされます。

Cassandraデータベースの複製要因は、データベース内に保存されるデータのコピー数を表します。Cassandraのストレージ・エンジンは、コミット・ログ、インメモリー・テーブル（memtable）、ソート済み文字列テーブル（SSTable）ファイルからなるステップ・バイ・ステップのフロー（書き込みパス）を使用しています。

これに対してMongoDBは、分散アーキテクチャーにプライマリー／セカンダリー・モデルを採用しています。MongoDBではレプリカ・セット（インスタンスのグループ）がプライマリー・ノードとセカンダリー・ノードで構成され、プライマリー・ノードがすべての書き込み処理（データの追加や変更）を担当し、セカンダリー・ノードはプライマリー・ノードのデータを反映します。

MongoDBでは、大規模データセットをシャーディングと呼ばれるプロセスを通じて複数のマシンに分散することも可能です。情報はシャード化されたクラスター（複数のレプリカ・セットと、アプリケーションからのクエリーをレプリカ・セットに転送するルーター）に分割され、データ要求を処理するシステムの能力を高めます。

両データベースはインデックス手法も異なります。Apache Cassandraではパーティション・キーがプライマリー・インデックスですが、Cassandraのドキュメントには、非パーティション列に対してインデックスを作成するストレージアタッチド・インデックスがほとんどのユースケースに適していると記されています。4また、Cassandraにはセカンダリー・インデックスもあり、インデックス対象の値とは別のテーブルに保存されるローカル・インデックスとして動作します。MongoDBは、地理空間インデックス、マルチキー・インデックス、テキスト・インデックスなど、ユースケースに応じて複数のインデックスタイプをサポートします。