ما هو Apache Avro؟

ما هو Avro؟

Avro هو مشروع مفتوح المصدر يوفر خدمات تسلسل البيانات وتبادل البيانات لـ Apache Hadoop. يمكن استخدام هذه الخدمات معًا أو بشكل مستقل.

يسهّل Avro تبادل البيانات الضخمة بين البرامج المكتوبة بأي لغة. وباستخدام خدمة التسلسل (serialization)، يمكن للبرامج تسلسل البيانات بفعالية إلى ملفات أو رسائل. ويُعد تخزين البيانات باستخدام Avro مضغوطًا وفعالًا. حيث يُخزِّن Avro تعريف البيانات والبيانات ذاتها في ملف أو رسالة واحدة.

يخزّن Avro تعريف البيانات بصيغة JSON، ما يجعله سهل القراءة والفهم، بينما تُخزَّن البيانات نفسها بصيغة ثنائية، ما يجعلها مضغوطة وعالية الكفاءة. تتضمن ملفات Avro وسوم يمكن استخدامها لتقسيم مجموعات البيانات الكبيرة إلى مجموعات فرعية مناسبة لمعالجة Apache MapReduce. تستخدم بعض خدمات تبادل البيانات منشئ التعليمات البرمجية لتفسير تعريف البيانات وإنتاج رمز للوصول إلى البيانات. لا تتطلب Avro هذه الخطوة، مما يجعلها مثالية للغات البرمجة النصية.

الميزة الرئيسية لـ Avro هي الدعم القوي لمخططات البيانات التي تتغير بمرور الوقت — وغالبًا ما يُطلق عليه تطور المخططات. يعالج Avro التغييرات في المخطط مثل الحقول المفقودة والحقول المضافة والحقول المتغيرة؛ ونتيجة لذلك، يمكن للبرامج القديمة قراءة البيانات الجديدة ويمكن للبرامج الجديدة قراءة البيانات القديمة. يتضمن Avro واجهات برمجة تطبيقات لـ Java و Python و Ruby و C و C ++ والمزيد. يمكن تمرير البيانات المخزنة باستخدام Avro من برامج مكتوبة بلغات مختلفة، حتى من لغة مترجمة مثل C إلى لغة برمجة نصية مثل Apache Pig.

تصميم ثلاثي الأبعاد لكرات تتدحرج على مسار

أحدث الأخبار والرؤى حول الذكاء الاصطناعي 


تتوفر معارف وأخبار منسقة بمهارة حول الذكاء الاصطناعي والسحابة وغيرها في نشرة Think الإخبارية الأسبوعية. 

Mixture of Experts | 25 أبريل، الحلقة 52

فك تشفير الذكاء الاصطناعي: تقرير إخباري أسبوعي

انضم إلى لجنة عالمية المستوى من المهندسين والباحثين وقادة المنتجات وغيرهم في أثناء سعيهم للتغلب على الفوضى والضوضاء المحيطة بالذكاء الاصطناعي لتزويدك بأحدث أخباره والرؤى المتعلقة به.

حلول ذات صلة
IBM Knowledge Catalog

تفعيل البيانات للذكاء الاصطناعي والتحليلات من خلال الفهرسة الذكية وإدارة السياسات. يُعَد IBM Knowledge Catalog برنامجًا لإدارة البيانات يوفر كتالوج بيانات يتيح أتمتة اكتشاف البيانات، وإدارة جودة البيانات، وحماية البيانات.

اكتشف Knowledge Catalog
حلول ذكاء البيانات من IBM

تمكَّن من تحويل البيانات غير المنسقة إلى رؤى قابلة للتنفيذ بسرعة، وتوحيد إدارة البيانات، والجودة، ودورة حياة البيانات، والمشاركة، وتمكين مستهلكي البيانات من الحصول على بيانات ملائمة للسياق وموثوق بها.

اكتشِف حلول ذكاء البيانات
خدمات الاستشارات في مجال البيانات والتحليلات

استفِد من قيمة بيانات المؤسسة مع IBM Consulting لبناء مؤسسة تعتمد على الرؤى لتحقيق ميزة تنافسية في الأعمال.

اكتشف خدمات التحليلات
اتخِذ الخطوة التالية

استكشف البيانات وأصول المعرفة وعلاقاتها، وافهمها ونسِّقها وتفاعل معها أينما كانت - سواء في البيئات السحابية أو البيئات المحلية. يُعَد IBM Knowledge Catalog برنامجًا مصممًا لحوكمة البيانات يوفر كتالوج بيانات لأتمتة اكتشاف البيانات، وإدارة جودتها، وحمايتها.

استكشف IBM Knowledge Catalog استكشف حلول ذكاء البيانات