Sebelum membandingkan Apache Cassandra dan MongoDB, ada baiknya untuk membangun pemahaman tentang database NoSQL.

NoSQL database, juga disebut sebagai basis data “bukan hanya SQL” atau “non-SQL”, adalah basis data terdistribusi. Artinya, informasi di dalamnya mengalami replikasi ke berbagai node (server individual yang menyimpan data). Arsitektur terdistribusi ini mendukung ketersediaan dan daya tahan tinggi; jika satu atau lebih node offline, sisa basis data dapat terus berjalan.

Namun, yang paling penting, database NoSQL dirancang untuk menyimpan dan meminta data di luar struktur tradisional yang ditemukan dalam sistem manajemen basis data relasional (RDBMS). Daripada mengikuti struktur tabular ketat yang melekat pada database relasional tradisional, desain database non-relasional tidak memerlukan skema yang kaku. Hal ini memungkinkan skalabilitas cepat untuk mengelola kumpulan data besar, termasuk kumpulan data terstruktur, semi-terstruktur, dan tidak terstruktur.

(Penting untuk dicatat bahwa skalabilitas yang dihargai dalam database NoSQL, termasuk Cassandra dan MongoDB, adalah skalabilitas horizontal atau “penskalaan keluar.” Dalam skalabilitas, beban kerja dapat dibagi di antara server, berbeda dengan skalabilitas vertikal atau "peningkatan skala" yang terkait dengan SQL Database, yang memerlukan penambahan memori ke perangkat keras yang ada.)

Karena kinerja, skalabilitas, dan fleksibilitasnya, database NoSQL telah muncul sebagai pilihan utama untuk mendukung aplikasi big data dan beban kerja real-time. Selain Apache Cassandra dan MongoDB, basis data NoSQL populer lainnya termasuk DynamoDB (disediakan oleh AWS), Redis, dan CouchDB.