O que é o Apache Avro?

O que é o Avro?

O Avro é um projeto de código aberto que fornece serviços de serialização e troca de dados para o Apache Hadoop. Esses serviços podem ser usados em conjunto ou de forma independente.

O Avro facilita a troca de big data entre programas escritos em qualquer linguagem. Com o serviço de serialização, os programas podem serializar dados de forma eficiente em arquivos ou em mensagens. O armazenamento de dados é compacto e eficiente. O Avro armazena a definição de dados e os dados juntos em uma mensagem ou arquivo.

O Avro armazena a definição de dados no formato JSON, facilitando a leitura e a interpretação; os dados em si são armazenados em formato binário, tornando-os compactos e eficientes. Os arquivos do Avro incluem marcadores que podem ser usados para dividir grandes conjuntos de dados em subconjuntos adequados para o processamento do Apache MapReduce. Alguns serviços de troca de dados usam um gerador de código para interpretar a definição de dados e produzir código para acessar os dados. O Avro não exige essa etapa, o que o torna ideal para linguagens de script.

Uma característica fundamental do Avro é o suporte robusto para esquemas de dados que mudam ao longo do tempo, muitas vezes chamados de evolução do esquema. O Avro lida com alterações de esquema, como campos ausentes, campos adicionados e campos alterados; como resultado, programas antigos podem ler dados novos e programas novos podem ler dados antigos. O Avro inclui APIs para Java, Python, Ruby, C, C++ e muito mais. Os dados armazenados usando o Avro podem ser transmitidos de programas escritos em diferentes linguagens, mesmo de uma linguagem compilada como C, para uma linguagem de script como o Apache Pig.

Projeto 3D de bolas rolando em uma pista

As últimas notícias e insights sobre IA 


Descubra insights selecionados por especialistas e notícias sobre IA, nuvem e outros assuntos no boletim informativo semanal Think. 

Mixture of Experts | 25 de abril, episódio 52

Decodificando a IA: resumo semanal das notícias

Junte-se ao nosso painel de engenheiros, pesquisadores, líderes de produto e outros especialistas de classe mundial enquanto eles cortam o ruído da IA para trazer a você as últimas notícias e insights sobre IA.

Soluções relacionadas
IBM Knowledge Catalog

Aproveite seus dados para IA e análise de dados com catalogação inteligente e gestão de políticas. O IBM Knowledge Catalog é uma solução de governança de dados que disponibiliza um catálogo para automatizar a descoberta, o controle de qualidade e a proteção de dados.

Conheça o Knowledge Catalog
Soluções de inteligência de dados da IBM

Transforme dados brutos em insights praticáveis com rapidez, unifique a governança, a qualidade, a linhagem e o compartilhamento de dados, e disponibilize informações confiáveis e contextualizadas aos consumidores de dados.

Conheça as soluções de inteligência de dados
Serviços de consultoria de dados e análise de dados

Libere o valor dos dados empresariais com a IBM® Consulting, construindo uma organização orientada por insights que proporciona vantagem comercial.

Conheça os serviços de análise de dados
Dê o próximo passo

Localize, entenda, selecione e acesse dados, ativos de conhecimento e as relações entre eles, onde quer que eles estejam, na nuvem ou no local. O IBM Knowledge Catalog é um software de governança de dados que disponibiliza um catálogo de dados para automatizar a descoberta, o gerenciamento da qualidade e a proteção dos dados.

Conheça o IBM Knowledge Catalog Explore soluções de inteligência de dados