Apa itu Apache Avro?

Para pebisnis menggunakan tablet digital di kantor

Apa itu Avro?

Avro adalah proyek sumber terbuka yang menyediakan layanan serialisasi data dan pertukaran data untuk Apache Hadoop. Layanan ini dapat digunakan bersama atau secara independen.

Avro memfasilitasi pertukaran big data antara program yang ditulis dalam bahasa apa pun. Dengan layanan serialisasi, program dapat secara efisien melakukan serialisasi data ke dalam file atau ke dalam pesan. Penyimpanan datanya ringkas dan efisien. Avro menyimpan definisi data dan data bersama-sama dalam satu pesan atau file.

Avro menyimpan definisi data dalam format JSON sehingga mudah dibaca dan ditafsirkan; data itu sendiri disimpan dalam format biner sehingga ringkas dan efisien. File Avro menyertakan penanda yang dapat digunakan untuk membagi kumpulan data besar menjadi subset yang cocok untuk pemrosesan Apache MapReduce. Beberapa layanan pertukaran data menggunakan generator kode untuk menafsirkan definisi data dan menghasilkan kode untuk mengakses data. Avro tidak memerlukan langkah ini, sehingga ideal untuk bahasa skrip.

Fitur utama Avro adalah dukungan kuat untuk skema data yang berubah dari waktu ke waktu—sering disebut evolusi skema. Avro menangani perubahan skema seperti bidang yang hilang, bidang yang ditambahkan, dan bidang yang diubah; sebagai hasilnya, program lama dapat membaca data baru dan program baru dapat membaca data lama. Avro menyertakan API untuk Java, Python, Ruby, C, C ++ dan banyak lagi. Data yang disimpan menggunakan Avro dapat diteruskan dari program yang ditulis dalam bahasa yang berbeda, bahkan dari bahasa yang dikompilasi seperti C ke bahasa skrip seperti Apache Pig.

Desain 3D bola yang menggelinding di lintasan

Berita + Insight AI terbaru 


Temukan insight dan berita yang dikurasi oleh para pakar tentang AI, cloud, dan lainnya di Buletin Think mingguan. 

Gabungan Para Pakar | 28 Agustus, episode 70

Decoding AI: Rangkuman Berita Mingguan

Bergabunglah dengan panel insinyur, peneliti, pemimpin produk, dan sosok kelas dunia lainnya selagi mereka mengupas tuntas tentang AI untuk menghadirkan berita dan insight terbaru seputar AI.

Solusi terkait
IBM Knowledge Catalog

Aktifkan data untuk AI dan analitik dengan katalog cerdas dan manajemen kebijakan. IBM Knowledge Catalog adalah perangkat lunak tata kelola data yang menyediakan katalog data untuk mengotomatiskan penemuan data, manajemen kualitas data, dan perlindungan data.

Temukan Knowledge Catalog
Solusi IBM data intelligence

Ubah data mentah menjadi insight yang dapat ditindaklanjuti dengan cepat, satukan tata kelola, kualitas, silsilah, dan pembagian data, serta berdayakan konsumen data dengan data yang andal dan kontekstual.

Temukan solusi intelijen data
Layanan konsultasi data dan analitik

Buka nilai data perusahaan dengan IBM Consulting, membangun organisasi berbasis insight yang memberikan keuntungan bisnis.

Temukan layanan analitik
Ambil langkah selanjutnya

Temukan, pahami, kurasi, dan akses data, aset pengetahuan, dan hubungannya, di mana pun mereka berada—di cloud atau on premises. IBM Knowledge Catalog adalah perangkat lunak tata kelola data yang menyediakan katalog data untuk mengotomatiskan penemuan data, manajemen kualitas data, dan perlindungan data.

Jelajahi Katalog Pengetahuan Jelajahi solusi kecerdasan data