Inicio

Topics

Avro

¿Qué es Apache Avro?
Explore la solución Avro de IBM Regístrese para recibir actualizaciones sobre IA
Ilustración con collage de pictogramas de nubes, gráfico circular, pictogramas gráficos
¿Qué es Avro?

Avro es un proyecto de código abierto que proporciona servicios de serialización e intercambio de datos para Apache Hadoop. Estos servicios se pueden utilizar de forma conjunta o independiente.

Avro facilita el intercambio de big data entre programas escritos en cualquier lenguaje. Con el servicio de serialización, los programas pueden serializar eficazmente los datos en archivos o en mensajes. El almacenamiento de datos es compacto y eficiente. Avro almacena tanto la definición de datos como los datos juntos en un mensaje o archivo.

Avro almacena la definición de los datos en formato JSON, lo que facilita su lectura e interpretación; los propios datos se almacenan en formato binario, lo que los hace compactos y eficientes. Los archivos Avro incluyen marcadores que se pueden utilizar para dividir grandes conjuntos de datos en subconjuntos adecuados para el procesamiento de Apache MapReduce. Algunos servicios de intercambio de datos utilizan un generador de código para interpretar la definición de datos y producir código para acceder a los datos. Avro no requiere este paso, por lo que es ideal para lenguajes de scripting.

Una característica clave de Avro es la sólida compatibilidad con los esquemas de datos que cambian con el tiempo, lo que a menudo se denomina evolución del esquema. Avro gestiona los cambios de esquema, como los campos que faltan, los campos añadidos y los campos modificados; como resultado, los programas antiguos pueden leer datos nuevos y los programas nuevos pueden leer datos antiguos. Avro incluye API para Java, Python, Ruby, C, C++ y más. Los datos almacenados con Avro se pueden pasar desde programas escritos en diferentes lenguajes, incluso desde un lenguaje compilado como C hasta un lenguaje de scripting como Apache Pig.

Cree flujos de trabajo de IA responsables con gobernanza de IA

Descubra los componentes básicos y las buenas prácticas para ayudar a sus equipos a acelerar la IA responsable.

Contenido relacionado Regístrese para leer el informe de IDC
Soluciones relacionadas
Consiga un análisis mejor y más rápido con las soluciones Hadoop de IBM

IBM y Cloudera se han asociado para ofrecer una distribución de Hadoop de nivel empresarial líder en la industria, que incluye un ecosistema integrado de productos y servicios para respaldar análisis más rápidos a escala.

Explore las oportunidades de big data con IBM
Recursos El almacén de datos ha evolucionado: una base para la excelencia analítica

Explore el mejor enfoque de la gestión de datos y cómo las empresas están dando prioridad a las tecnologías de datos para impulsar el crecimiento y la eficiencia.

Entender el big data más allá de la publicidad

Lea esta introducción práctica a la próxima generación de arquitecturas de datos. Presenta el papel de las tecnologías en la nube y NoSQL y analiza los aspectos prácticos de la seguridad, la privacidad y el gobierno.

Dé el siguiente paso

Escale cargas de trabajo de IA, para todos sus datos, en cualquier lugar con IBM watsonx.data, un almacén de datos adaptado construido sobre una arquitectura de lakehouse de datos abierta.

Explore watsonx.data Solicite una demostración en directo