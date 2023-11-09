Apache Kafka 是一个高性能、高可扩展性的事件流平台。要充分释放 Kafka 的潜力，您需要审慎规划应用程序的设计。编写性能低下或最终遭遇可扩展性瓶颈的 Kafka 应用程序实在太容易了。自 2015 年起，IBM 提供了 IBM Event Streams 服务——这是在 IBM Cloud 上运行的完全托管的 Apache Kafka 服务。自此，该服务已帮助众多客户及 IBM 内部团队解决了他们编写的 Kafka 应用程序存在的可扩展性与性能问题。
本文阐述了 Apache Kafka 的一些常见问题，并就如何避免应用程序遭遇可扩展性难题提供了建议。
某些 Kafka 操作需要通过客户端向代理发送数据并等待响应来完成。一次完整的往返可能耗时 10 毫秒，这听起来很快，但会将吞吐量限制在每秒最多 100 次操作。因此，建议您尽量避免此类操作。幸运的是，Kafka 客户端提供了避免等待这些往返时间的方法。您只需确保充分利用这些功能。
提升吞吐量的技巧：
如果您读完上述内容后心想：“糟糕，这会不会让我的应用程序更复杂？”——答案是肯定的，很可能会。在吞吐量和应用程序复杂度之间需要做出权衡。网络往返时间之所以成为一个特别隐蔽的陷阱，是因为一旦触及此限制，可能需要对应用程序进行深度修改才能进一步提升吞吐量。
Kafka 的一项实用功能是监控消费应用程序的“活跃度”，并断开那些可能已发生故障的客户端连接。其实现机制是：代理会跟踪每个消费客户端最后一次调用“poll”（Kafka 中用于获取更多消息的术语）的时间。如果某个客户端调用 poll 不够频繁，与其连接的代理就会判定该客户端必定已发生故障，随即断开其连接。这样设计的目的是让未出现问题的客户端能够介入，接手故障客户端的工作。
遗憾的是，在这种机制下，Kafka 代理无法区分一个客户端是在花费较长时间处理已接收的消息，还是确实已发生故障。假设某个消费应用程序按以下流程循环：1）调用 poll 并获取一批消息；2）处理该批次中的每条消息，每条消息耗时 1 秒。
若该消费者每次接收 10 条消息的批次，那么两次调用 poll 的间隔将约为 10 秒。默认情况下，Kafka 允许 poll 调用间隔最长为 300 秒（5 分钟）才会断开客户端连接，因此在此场景下一切运行正常。但如果遇到业务高峰日，当应用程序消费的主题开始堆积消息积压时，会发生什么情况呢？此时应用程序每次调用 poll 可能获取的不是 10 条消息，而是 500 条消息（默认情况下这是单次 poll 调用可返回的最大记录数）。这将导致处理时间过长，使得 Kafka 判定该应用程序实例已失效并断开其连接。这种情况非常不利。
而更糟糕的是，还可能形成一种反馈循环。当 Kafka 因客户端调用 poll 频率不足而开始断开连接时，处理消息的应用程序实例数量就会减少。这进一步增加了主题上消息大量积压的可能性，从而导致更多客户端更有可能获取到大批量消息并因处理超时被断开连接。最终，所有消费应用程序实例都会陷入重启循环，无法完成任何有效工作。
您可以采取哪些措施来避免这种情况发生？
我们将在本文后续讨论消费者故障的议题，重点分析其如何引发消费者组重平衡及其可能造成的系统紊乱。
深入了解 Kafka 消费者接收消息的底层协议通过向 Kafka 代理发送“获取”请求实现。在该请求中，客户端会指定当代理没有可用消息时的处理方式，包括代理在返回空响应前应等待的时长。默认情况下，Kafka 消费者会指示代理最多等待 500 毫秒（由“fetch.max.wait.ms”消费者配置项控制），以获取至少 1 字节的消息数据（由“fetch.min.bytes”配置项控制）。
500 毫秒的等待时间看似合理，但如果应用程序中存在大量处于空闲状态的消费者实例（例如扩展到 5000 个实例），则每秒可能产生 2500 次无效请求。每个这样的请求都会消耗代理的 CPU 处理资源，极端情况下可能影响那些正在处理实际业务的 Kafka 客户端的性能与稳定性。
通常 Kafka 的扩展方案是增加代理，然后在所有新旧代理间均衡重分布主题分区。但若客户端持续向 Kafka 发送无效获取请求，这种扩展方案可能无法解决问题。每个客户端都会向其所消费主题分区的领导代理发送获取请求。因此即使扩展了 Kafka 集群并重新分布分区，大多数客户端仍会向绝大多数代理发送获取请求。
那么，该如何应对呢？
若您从其他发布-订阅系统（例如 MQTT）转向 Kafka，可能会误以为 Kafka 主题是极度轻量级、近乎瞬时的存在。但事实并非如此。Kafka 更擅长处理以千为量级的主题数目，且预期主题具有相对长期的生命周期。诸如创建主题仅用于接收单条回复消息随后立即删除的做法，在 Kafka 生态中并不常见，也无法充分发挥 Kafka 的优势。
因此，应规划具有长期存续周期的主题。这些主题的生命周期可能与某个应用程序或业务活动同步。同时要将主题数量控制在数百或至多数千的量级。这可能需要以不同视角来审视哪些消息应交织在特定主题中。
经常出现的相关问题是：“我的主题应设置多少个分区？”传统建议是预留充足余量，因为主题创建后增加分区不会改变主题上现有数据的分区分布（从而可能影响依赖分区机制实现分区内消息顺序处理的消费者）。这是很好的建议；但我们还想补充几点考量：
大多数消费消息的 Kafka 应用程序会利用消费者组功能来协调客户端与主题分区的对应关系。若您对消费者组的记忆有些模糊，以下是要点回顾：
随着 Kafka 的成熟，日益精密的重新平衡算法已经（并持续）被设计出来。在 Kafka 早期版本中，当消费者组重新平衡时，组内所有客户端都必须停止消息消费，待主题分区在组内新成员间重新分配后，所有客户端才能重新开始消费。这种方式存在两个缺陷（请放心，这些问题现已得到改进）：
最新版本的重新平衡算法通过引入“粘滞性”与“协同机制”（沿用 Kafka 术语）实现了重大改进：
尽管最新重新平衡算法已实现这些增强，但如果您的应用频繁经历消费者组重新平衡，仍会对整体消息吞吐量造成影响，且会因客户端丢弃和重新获取缓冲消息数据而浪费网络带宽。以下是一些可行的改进建议：
