什么是 Apache Avro？

什么是 Avro？

Avro 是一个开源项目，旨在为 Apache Hadoop 提供数据序列化和数据交换服务。这些服务可以一起使用，也可以单独使用。

Avro 支持在使用不同语言编写的程序之间进行大数据交换。利用序列化服务，程序可以高效快速地将数据序列化为文件或消息。数据存储不仅紧凑，而且高效。Avro 将数据定义和数据本身一起存储在同一个消息或文件中。

Avro 以 JSON 格式存储数据定义，方便读取和解释；而数据本身以二进制格式存储，既紧凑又高效。Avro 文件中包含的标记可用于将大型数据集拆分为大小适合的若干子集，以便于 Apache MapReduce 进行处理。一些数据交换服务会使用代码生成器来解释数据定义，并生成用于获取数据的代码。Avro 省去了此步骤，因此非常适合脚本语言。

Avro 的一个关键功能是，能够有力支持随时间变化的数据模式，这种变化通常称为模式演变。Avro 可处理模式变更，如缺失的字段、新添的字段和更改的字段。因此，旧程序可读取新数据，新程序也可读取旧数据。Avro 包含适用于 Java、Python、Ruby、C、C++ 等编程语言的 API。使用 Avro 存储的数据可通过不同语言编写的程序进行传递，Avro 甚至可以从 C 这样的编译语言传递到诸如 Apache Pig 之类的脚本语言。

辅以专家洞察分析的最新科技新闻

通过 Think 时事通讯，了解有关 AI、自动化、数据等方面最重要且最有趣的行业趋势。请参阅 IBM 隐私声明。

数据领导者的 AI 就绪数据指南

了解数据负责人可以采取哪些操作步骤来克服挑战，构建可信的数据基础，整合您的组织数据，为推动 AI 进程做好准备。

资源

多个图标排成一排的 3D 效果图，例如相机、音量旋钮和剪贴板

AI 智能体基于数据运行——您的数据准备好了吗？

您的数据就是您的竞争优势。在这期简短的网络研讨会中，了解如何安全地解锁数据价值，并从 AI 中获得可衡量的投资回报率。

Gartner 徽标

IBM 被评为元数据管理领导者

了解 IBM 为何凭借 watsonx.data intelligence 在《2025 年 Gartner 元数据管理魔力象限》中被评为领导者。

沿曲线排列的应用程序图标

您的数据是否已为生成式 AI 做好准备？

探索我们的 Data Matters 中心，了解如何应对整合等数据和 AI 挑战。

屏幕上有人们在讨论数据的插图

将数据战略转化为 AI 影响力

了解如何借助坚实的数据基础扩展 AI、交付可解释且可治理的成果，并将实际经验应用到自己的 AI 路线图中。

三位同事在休闲工作区讨论话题

数据智能：让您的数据不再沉没于黑暗

了解数据智能如何将治理、质量、溯源和共享融为一体，将原始数据转化为您可以信赖的洞察。

Heather Gentile 微笑的肖像

为数据与 AI 建立统一信任框架

了解为何将人员、流程与技术相结合的严谨数据与 AI 方法，能够加快技术落地、推动创新并提升投资回报率。

一名专业人员手持平板电脑站在数据中心走廊

从数据到洞察：规划您的数据智能之旅

深入了解从数据智能中获得切实可行的洞察分析的变革过程和最佳实践。

多个图标排成一排的 3D 效果图，例如相机、音量旋钮和剪贴板

高级管理层如何将信息转化为影响

在这份面向数据领导者的跨行业报告中，深入了解 1700 位 CDO 的洞察分析。

相关解决方案

IBM Knowledge Catalog

通过智能编目和策略管理激活数据以用于 AI 和分析。IBM Knowledge Catalog 是一款数据治理软件，通过提供数据目录来自动执行数据发现、数据质量管理和数据保护等任务。

探索 Knowledge Catalog

IBM 数据智能解决方案

快速将原始数据转化为可操作的洞察分析，统一数据治理、质量、沿袭和共享，为数据消费者提供可靠的情境化数据。

探索数据智能解决方案

数据和分析咨询服务

通过 IBM Consulting 发掘企业数据的价值，建立以洞察分析为导向的组织，实现业务优势。

了解分析服务

采取后续步骤

查找、理解、整理和访问数据、知识资产及其关系，无论它们位于云端，还是本地。IBM Knowledge Catalog 是一款数据治理软件，通过提供数据目录来自动化数据发现、数据质量管理和数据保护等任务。