¿Qué es Apache Avro?

¿Qué es Avro?

Avro es un proyecto de código abierto que proporciona servicios de serialización e intercambio de datos para Apache Hadoop. Estos servicios se pueden utilizar de forma conjunta o independiente.

Avro facilita el intercambio de big data entre programas escritos en cualquier lenguaje. Con el servicio de serialización, los programas pueden serializar eficazmente los datos en archivos o en mensajes. El almacenamiento de datos es compacto y eficiente. Avro almacena tanto la definición de datos como los datos juntos en un mensaje o archivo.

Avro almacena la definición de los datos en formato JSON, lo que facilita su lectura e interpretación; los propios datos se almacenan en formato binario, lo que los hace compactos y eficientes. Los archivos Avro incluyen marcadores que se pueden utilizar para dividir grandes conjuntos de datos en subconjuntos adecuados para el procesamiento de Apache MapReduce. Algunos servicios de intercambio de datos utilizan un generador de código para interpretar la definición de datos y producir código para acceder a los datos. Avro no requiere este paso, por lo que es ideal para lenguajes de scripting.

Una característica clave de Avro es la sólida compatibilidad con los esquemas de datos que cambian con el tiempo, lo que a menudo se denomina evolución del esquema. Avro gestiona los cambios de esquema, como los campos que faltan, los campos añadidos y los campos modificados; como resultado, los programas antiguos pueden leer datos nuevos y los programas nuevos pueden leer datos antiguos. Avro incluye API para Java, Python, Ruby, C, C++ y más. Los datos almacenados con Avro se pueden pasar desde programas escritos en diferentes lenguajes, incluso desde un lenguaje compilado como C hasta un lenguaje de scripting como Apache Pig.

Diseño 3D de bolas rodando por un circuito

Las últimas noticias + conocimientos de IA 


Descubra ideas y noticias de expertos sobre IA, nube y mucho más en el boletín semanal Think. 

Mixture of Experts | 25 de abril, episodio 52

Descifrar la IA: resumen semanal de noticias

Únase a nuestro panel de ingenieros, investigadores, responsables de producto y otros profesionales de talla mundial que se abren paso entre el bullicio de la IA para ofrecerle las últimas noticias y conocimientos al respecto.

Soluciones relacionadas
IBM Knowledge Catalog

Active los datos para la IA y el análisis con catalogación inteligente y gestión de políticas. IBM Knowledge Catalog es un software de gobierno del dato que proporciona un catálogo de datos para automatizar el descubrimiento, la gestión de la calidad y la protección de los datos.

Descubra Knowledge Catalog
Soluciones IBM Data Intelligence

Transforme rápidamente los datos sin procesar en conocimiento práctico, unifique el gobierno, la calidad, el linaje y el uso compartido de los datos, y capacite a los consumidores de datos con datos fiables y contextualizados.

Descubra soluciones de inteligencia de datos
Servicios de asesoramiento sobre datos y análisis

Desbloquee el valor de los datos empresariales con IBM Consulting y cree una organización impulsada por conocimientos que ofrezca ventajas empresariales.

Descubra los servicios de análisis
Dé el siguiente paso

Encuentre, entienda, conserve y acceda a datos, activos de conocimiento y sus relaciones, dondequiera que residan, en la nube o en las instalaciones. IBM Knowledge Catalog es un software de gobierno del dato que proporciona un catálogo de datos para automatizar la detección, la calidad y la protección de datos.

Explore IBM Knowledge Catalog Explore soluciones de inteligencia de datos