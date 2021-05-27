Spark هو تحسين Hadoop لنظام MapReduce، فالفارق الأساسي بين Spark وMapReduce يكمن في أن Spark يعالج البيانات ويحتفظ بها في الذاكرة للخطوات اللاحقة، في حين يعالج MapReduce البيانات على القرص. ونتيجةً لذلك، بالنسبة إلى أعباء العمل الأصغر، تكون سرعات معالجة البيانات لـ Spark أسرع بما يصل إلى 100 مرة أكثر من MapReduce (محتوى الرابط موجود خارج موقع ibm.com).

علاوة على ذلك، وبعكس عملية التنفيذ ذات المرحلتَين في MapReduce، ينشئ Spark الرسم البياني باتجاه واحد (DAG) لجدولة المهام وتنسيق العقد عبر مجموعة Hadoop. فهذه العملية لتتبع المهام تتيح التسامح مع الأخطاء، فتتم إعادة تطبيق العمليات المسجلة على البيانات من حالة سابقة.

لنلقِ نظرة فاحصة على الفروقات الرئيسية بين Hadoop وSpark في ستة سياقات حاسمة: