My IBM Se connecter S’abonner

Accueil

Thèmes

Avro

Qu’est-ce qu’Apache Avro ?

Qu’est-ce qu’Apache Avro ?

Découvrir la solution Avro d’IBM S’inscrire pour recevoir les dernières informations sur l’IA
Illustration par un collage de pictogrammes représentant des nuages, un diagramme circulaire, des pictogrammes de graphique
Qu’est-ce qu’Avro ?

Qu’est-ce qu’Avro ?

Avro est un projet open source qui fournit des services de sérialisation et d’échange de données pour Apache Hadoop. Ces services peuvent être utilisés ensemble ou indépendamment.

Avro facilite l’échange de big data entre tous les programmes, quel que soit le langage utilisé. Grâce au service de sérialisation, les programmes peuvent sérialiser efficacement les données dans des fichiers ou des messages. Le stockage des données est compact et efficace. Avro stocke à la fois la définition des données et les données dans un seul message ou fichier.

Avro stocke la définition des données au format JSON, ce qui facilite sa lecture et son interprétation. Les données elles-mêmes sont stockées dans un format binaire, ce qui les rend compactes et efficaces. Les fichiers Avro incluent des marqueurs qui peuvent être utilisés pour diviser de grands jeux de données en sous-ensembles adaptés au traitement Apache MapReduce . Certains services d’échange de données utilisent un générateur de code pour interpréter la définition des données et produisent du code pour accéder aux données. Avec Avro, cette étape est inutile, ce qui le rend idéal pour les langages de script.

L’une des principales caractéristiques d’Avro, c’est la prise en charge robuste des schémas de données qui changent au fil du temps, ce que l’on appelle souvent l’évolution du schéma. Avro gère les changements apportés au schéma : champs manquants, champs ajoutés et champs modifiés. Par conséquent, les anciens programmes peuvent lire de nouvelles données, et les nouveaux programmes peuvent lire les anciennes données. Avro inclut des API pour Java, Python, Ruby, C, C++ et d’autres langages. Les données stockées à l’aide d’Avro peuvent être transmises à partir de programmes écrits dans différents langages, même à partir d’un langage compilé comme C vers un langage de script comme Apache Pig.

Créez des fworkflows d’IA responsables avec la gouvernance de l’IA

Découvrez les éléments constitutifs et les bonnes pratiques pour aider vos équipes à accélérer l’IA responsable.

Contenu connexe Obtenir le rapport IDC
Solutions connexes

Solutions connexes

Améliorez et accélérez vos analyses avec les solutions Hadoop d’IBM

IBM et Cloudera se sont associés pour offrir une distribution Hadoop d’entreprise de pointe, comprenant un écosystème intégré de produits et de services pour accélérer les analyses à grande échelle.

Découvrir les opportunités en matière de big data avec IBM
Ressources

Ressources

L’évolution de l’entrepôt de données : une base pour l’excellence analytique

Explorez une approche performante de la gestion des données et découvrez comment les entreprises privilégient les technologies de données pour stimuler leur croissance et leur efficacité.

Comprendre le big data au-delà du battage médiatique

Lisez cette introduction pratique à la nouvelle génération d’architectures de données. Elle présente le rôle du cloud et des technologies NoSQL et aborde les aspects pratiques de la sécurité, de la confidentialité et de la gouvernance.

Passez à l’étape suivante

Faites évoluer les workloads d’IA pour toutes vos données n’importe où avec IBM watsonx.data, un entrepôt de données adapté à vos besoins basé sur une architecture data lakehouse ouverte.

Découvrir watsonx.data Réserver une démo en direct