Minha IBM Efetue login Inscreva-se
O que é o Apache Avro?

O que é o Apache Avro?

Explore a solução Avro da IBM Inscreva-se para receber atualizações sobre IA
Ilustração com colagem de pictogramas de nuvens, gráfico de pizza, pictogramas de gráficos
O que é o Avro?

O que é o Avro?

O Avro é um projeto de código aberto que fornece serviços de serialização e troca de dados para o Apache Hadoop. Esses serviços podem ser usados em conjunto ou de forma independente.

O Avro facilita a troca de big data entre programas escritos em qualquer linguagem. Com o serviço de serialização, os programas podem serializar dados de forma eficiente em arquivos ou em mensagens. O armazenamento de dados é compacto e eficiente. O Avro armazena a definição de dados e os dados juntos em uma mensagem ou arquivo.

O Avro armazena a definição de dados no formato JSON, facilitando a leitura e a interpretação; os dados em si são armazenados em formato binário, tornando-os compactos e eficientes. Os arquivos do Avro incluem marcadores que podem ser usados para dividir grandes conjuntos de dados em subconjuntos adequados para o processamento do Apache MapReduce. Alguns serviços de troca de dados usam um gerador de código para interpretar a definição de dados e produzir código para acessar os dados. O Avro não exige essa etapa, o que o torna ideal para linguagens de script.

Uma característica fundamental do Avro é o suporte robusto para esquemas de dados que mudam ao longo do tempo, muitas vezes chamados de evolução do esquema. O Avro lida com alterações de esquema, como campos ausentes, campos adicionados e campos alterados; como resultado, programas antigos podem ler dados novos e programas novos podem ler dados antigos. O Avro inclui APIs para Java, Python, Ruby, C, C++ e muito mais. Os dados armazenados usando o Avro podem ser transmitidos de programas escritos em diferentes linguagens, mesmo de uma linguagem compilada como C, para uma linguagem de script como o Apache Pig.

Crie fluxos de trabalho de IA responsáveis com controle de IA

Aprenda os fundamentos e as melhores práticas para ajudar suas equipes a acelerar a IA responsável.

Conteúdo relacionado Cadastre-se para receber o relatório da IDC
Soluções relacionadas

Soluções relacionadas

Gere análise de dados melhor e mais rápida com soluções Hadoop da IBM

A IBM e a Cloudera firmaram uma parceria para oferecer uma distribuição do Hadoop de nível empresarial líder do setor, incluindo um ecossistema integrado de produtos e serviços para viabilizar análise de dados mais rápida em escala.

Explore oportunidades de big data com a IBM
Recursos

Recursos

A evolução do data warehouse: uma base para a excelência analítica

Explore a melhor abordagem da categoria para gerenciamento de dados e como as empresas estão priorizando as tecnologias de dados para gerar crescimento e eficiência.

Entendendo o big data além do agito

Leia esta introdução prática à próxima geração de arquiteturas de dados. Ela apresenta o papel das tecnologias de nuvem e NoSQL e discute os aspectos práticos de segurança, privacidade e governança.

Dê o próximo passo

Escale cargas de trabalho de IA para todos os seus dados, em qualquer lugar, com o IBM watsonx.data, um armazenamento de dados feito sob medida, construído em uma arquitetura aberta de data lakehouse.

Explore o watsonx.data Agende uma demonstração em tempo real