Avro هو مشروع مفتوح المصدر يوفر خدمات تسلسل البيانات وتبادل البيانات لـ Apache Hadoop. يمكن استخدام هذه الخدمات معًا أو بشكل مستقل.
يسهّل Avro تبادل البيانات الضخمة بين البرامج المكتوبة بأي لغة. وباستخدام خدمة التسلسل (serialization)، يمكن للبرامج تسلسل البيانات بفعالية إلى ملفات أو رسائل. ويُعد تخزين البيانات باستخدام Avro مضغوطًا وفعالًا. حيث يُخزِّن Avro تعريف البيانات والبيانات ذاتها في ملف أو رسالة واحدة.
يخزّن Avro تعريف البيانات بصيغة JSON، ما يجعله سهل القراءة والفهم، بينما تُخزَّن البيانات نفسها بصيغة ثنائية، ما يجعلها مضغوطة وعالية الكفاءة. تتضمن ملفات Avro وسوم يمكن استخدامها لتقسيم مجموعات البيانات الكبيرة إلى مجموعات فرعية مناسبة لمعالجة Apache MapReduce. تستخدم بعض خدمات تبادل البيانات منشئ التعليمات البرمجية لتفسير تعريف البيانات وإنتاج رمز للوصول إلى البيانات. لا تتطلب Avro هذه الخطوة، مما يجعلها مثالية للغات البرمجة النصية.
الميزة الرئيسية لـ Avro هي الدعم القوي لمخططات البيانات التي تتغير بمرور الوقت — وغالبًا ما يُطلق عليه تطور المخططات. يعالج Avro التغييرات في المخطط مثل الحقول المفقودة والحقول المضافة والحقول المتغيرة؛ ونتيجة لذلك، يمكن للبرامج القديمة قراءة البيانات الجديدة ويمكن للبرامج الجديدة قراءة البيانات القديمة. يتضمن Avro واجهات برمجة تطبيقات لـ Java و Python و Ruby و C و C ++ والمزيد. يمكن تمرير البيانات المخزنة باستخدام Avro من برامج مكتوبة بلغات مختلفة، حتى من لغة مترجمة مثل C إلى لغة برمجة نصية مثل Apache Pig.
تفعيل البيانات للذكاء الاصطناعي والتحليلات من خلال الفهرسة الذكية وإدارة السياسات. يُعَد IBM Knowledge Catalog برنامجًا لإدارة البيانات يوفر كتالوج بيانات يتيح أتمتة اكتشاف البيانات، وإدارة جودة البيانات، وحماية البيانات.
تمكَّن من تحويل البيانات غير المنسقة إلى رؤى قابلة للتنفيذ بسرعة، وتوحيد إدارة البيانات، والجودة، ودورة حياة البيانات، والمشاركة، وتمكين مستهلكي البيانات من الحصول على بيانات ملائمة للسياق وموثوق بها.
استفِد من قيمة بيانات المؤسسة مع IBM Consulting لبناء مؤسسة تعتمد على الرؤى لتحقيق ميزة تنافسية في الأعمال.