Java 多租户简介

了解 IBM Java 8 beta 中适用于云系统的一项新特性

IBM Multitenant JVM 最近是作为 IBM Java™ 8 beta 的一部分提供的。通过在单一的多租户 JVM 中运行多个应用程序,云系统可以加快应用程序的启动时间,并减少其内存占用。本文将介绍多租户云 JVM 背后的技术,并讨论主要成本和收益。

Graeme Johnson, J9 虚拟机开发经理, IBM

Graeme Johnson 在 IBM 的 J9 Virtual Machine 团队担任开发经理和技术总监。他在 1994 年加入 IBM 之后(之前曾在 Object Technology International 任职)一直在开发虚拟机和调试程序,并且曾经负责过 VisualAge for Java 和 IBM/OTI Smalltalk 运行时。最近,Graeme 专注于 Apache Harmony 项目以及 IBM 的 Project Zero 的 Java/PHP 运行时支持。Graeme 经常在会议上发表关于各种主题的演讲,包括:JavaOne 2006 上的 Apache Harmony、EclipseCon 2007 上的多平台 C 开发以及 International PHP 2006 上对 PHP 运行时深入探讨。



2013 年 11 月 21 日

云供应商必须权衡运行系统和提供服务所需的基础架构的成本与供应商所获得的效益。这些成本效益考虑因素促使供应商考虑采用多种架构。他们的选择范围涵盖从无共享 架构到共享多租户 架构的一系列架构。在无共享架构中,供应商提供完全专用于每个客户的硬件、软件和应用程序。在共享多租户的架构中,可以使用单个应用程序支持多个客户的应用程序,而且所有底层的硬件和软件都是共享的。

沿着这个架构系列进行发展时的主要权衡因素是隔离密度。密度是由一组特定的硬件和软件交付的系统和服务的数量。共享的资源越多,密度就越高。密度越高,供应商的成本也就越低。同时,更多共享可以降低 租户 之间的隔离水平,这里的租户指的是所提供的单独系统或服务。隔离是一个租户对其他租户的活动和数据的影响程度。

对于基于 Java 的租户,在架构系列中的定位包括共享或不共享 JVM。在共享顶层应用程序的任何架构中,必须共享 JVM。共享 JVM 既能节省内存,又能节省处理器时间。但是,如果使用传统的 JVM 技术,那么共享 JVM 通常会从基础架构层中删除所有剩余的隔离,要求顶层应用程序自身提供这种隔离。在 IBM 最新的 Java 8 beta 中,提供了对本文介绍的多租户功能的试用(请参阅 参考资料)。此特性使得用户可以通过部署获得共享 JVM 的优点,此外,该特性保持的隔离水平比共享传统 JVM 时可以实现的水平更高。

多租户 JVM 的成本和效益

使用多租户 JVM 的主要优势是,可以通过部署来避免通常与使用多个标准 JVM 有关的内存消耗。此开销是由以下几个原因造成的:

  • Java 堆消耗数百 MB 的内存。即使对象是相同的,JVM 之间也无法共享堆对象。此外,JVM 往往会使用分配给它们的所有堆,即使它们只在很短的时间内需要峰值量。
  • 即时(JIT)编译器占用了几十 MB 的内存,因为生成的代码是私有的,所以会占用内存。生成代码也需要大量的处理器周期,这会从应用程序中窃取时间。
  • 类的内部构件(其中的许多构件,比如 StringHashtable,都存在于所有应用程序中)占用了内存。每个 JVM 都存在所有这些构件的一个实例。
  • 在默认情况下,每个 JVM 都有垃圾收集器辅助线程(一个核心一个),还有多个编译线程。编译或垃圾收集活动可以同时出现在一个或多个 JVM 中,这可能是次优方案,因为 JVM 会竞争有限的处理器时间。

除了降低内存和处理成本,多租户 JVM 还提供比在单一传统 JVM 中运行多个应用程序更好的隔离。

另一个好处是,从共享 JVM 的第一租户开始,后续的应用程序需要更少的时间来启动,因为 JVM 已经在运行。减少启动时间对于短期运行的应用程序特别有用,这些应用程序通常用于脚本。

使用多租户 JVM 的主要成本是,相对于在单独的 JVM 中运行的多个应用程序,租户的隔离水平较低。例如,多租户 JVM 中的本机崩溃会影响所有租户。

另外,JVM 为了实现多租户扩展而做的必要工作会导致微小的性能下降。不过,这种性能影响会随着租户数量的增加而降低 — 因为在同一系统中运行多个 JVM 可以避免增加处理器和内存成本。


使用多租户 JVM

为了选择与其他租户共享一个运行时,当启动应用程序时,应用程序用户在命令行中添加一个参数 -Xmt。例如:

java -Xmt -jar one.jar

其结果是,应用程序的行为(由于我们在本文稍后描述的 限制)就好像它在一个专用 JVM 上运行一样。但在现实中,它与其他应用程序并行运行。多租户 JVM 中的扩展支持这种方式的启动,并提供了共享 JVM 的租户之间的隔离。

当租户启动时,JVM 启动程序要么会定位现有的共享 JVM 守护进程 (javad),要么会启动它(如有必要),如图 1 所示:

图 1. JVM 启动程序自动定位了共享的 JVM 守护进程(如果有必要,则会启动它)
屏幕截图和图表显示了自动定位和启动共享的 JVM 守护进程 (javad) 的 JVM 启动程序

当第二个租户启动时,租户会发现现有的共享 JVM 守护进程,并在该 JVM 内运行,如图 2 所示:

图 2. JVM 启动程序定位并连接到现有的 JVM 守护进程
屏幕截图和图表显示了定位并连接到现有的 JVM 守护进程 (javad) 的 JVM 启动程序

其结果是生成了一个引导代码副本,该结果对于 javad 进程中的两个租户是相同的。这样的安排使得租户可以共享大部分运行时结构。

使用多租户 JVM 运行现有的应用程序很容易,因为只需更改有限的命令行即可。


实现隔离

在相同的(常规) JVM 中运行的两个或两个以上的应用程序通常不会彼此隔离。每个应用程序的活动都会影响另一个应用程序的结果。此外,通过静态字段共享的数据也可以供所有应用程序访问。多租户 JVM 有两种解决这些问题的方法:静态字段隔离资源约束

静态字段隔离

在多租户 JVM 中,各租户之间共享类的不变的部分。这些部分包括编译后的方法代码、JVM 使用的数据结构,以及其他类似的构件。此分享可以节省内存,因为不必在使用多个 JVM 的情况下提供独立的副本。然而,多租户 JVM 为每个租户提供它们自己的静态字段副本。由于静态字段隔离(以及每个租户通常只能访问自己创建的实例的对象这个事实),每个租户只能访问与自身相关联的数据。其结果是租户之间的数据隔离。

资源约束:应对不良行为

在一个完美的世界中,租户能够以适当的方式共同运营和使用共享资源。然而,在这个不完美的世界中,程序错误和恶意行为都可能出现。多租户 JVM 提供了可配置的控制,以限制租户执行错误操作和以影响其他租户的方式使用资源的能力。可以控制的值包括:

  • 处理器时间
  • 堆大小
  • 线程数量
  • 文件 I/O:读带宽、写带宽
  • 套接字 I/O:读带宽、写带宽

可以在 -Xmt 命令行中指定这些控制。例如:

  • -Xlimit:cpu=10-30(最小 10% 的 CPU,最大 30%)
  • -Xlimit:cpu=30(最大 30% 的 CPU)
  • -Xlimit:netIO=20M(最大带宽为 20 Mbps)
  • -Xms8m-Xmx64m(初始的堆大小为 8 MB,最大值 64 MB)

Java 8 文档包括所有可用选项的信息(请参阅 参考资料)。


性能和内存占用

为了比较无共享 JVM 和多租户 JVM 上的应用程序性能和内存占用,在该测试中,我们将应用程序添加到每个 JVM 配置,直到执行系统置换(system swap)。(当系统置换时,我们认为该系统是 “满的”。)在无共享的情况下,我们在单独的 JVM 中运行应用程序,并为每个额外的应用程序启动一个新的 JVM。在多租户的情况下,我们在单一的多租户 JVM 中将应用程序作为另一个租户运行。

表 1表 2 显示我们使用一台配置了 1 GB 内存的计算机和一个 64 位 JVM(压缩的引用 JVM,采用在所有情况下的均衡垃圾回收策略)所得到的结果。在两个表中的 “手工调整” 列显示了我们手工调整了命令行选项,以尽量达到最佳密度(表 1)或启动时间(表 2)后,从常规 JVM 获得的结果。“默认” 列显示使用常规 JVM 与默认选项的结果。

多租户 JVM 实现了无共享 JVM 的 1.2 倍至 4.9 倍的密度(根据不同的应用而有所不同),如表 1 所示:

表 1. 并发应用程序的最大数量
应用程序描述多租户手工调整默认通过多租户 JVM 实现的提高
Hello World 打印 "HelloWorld" 然后进入睡眠状态30973634.2 倍到 4.9 倍
Jetty启动 Jetty 并等待请求34-181.9 倍
Tomcat启动 Tomcat 并等待请求28-132.1 倍
JRuby启动 JRuby 并等待请求3226151.2 倍到 2.1 倍

更高的密度来自关键构件的共享,这些构件包括:

  • 通过引导和扩展类来加载器加载的类和相关构件、加载器加载的每个类的堆 Class 对象,以及可以安全地跨租户共享的堆对象(例如,实习 String)。
  • JIT 编译的代码和 JIT 编译的类的元数据。
  • 堆:若其他租户不需要使用堆中的可用空间,那么租户可以使用这些空间。

表 2 显示,我们通过多租户 JVM 实现了快 1.2 倍到 6 倍的平均启动时间:

表 2. 启动时间(第一个/平均)
应用程序描述多租户手工调整默认通过多租户 JVM 实现的提高
Hello World打印 "HelloWorld" 然后进入睡眠状态5709/138ms514/400ms3361/460ms3.3 倍
Jetty启动 Jetty 并等待请求7478/2116ms-6296/12624ms6 倍
Tomcat启动 Tomcat 并等待请求9333/6005ms-7802/7432ms1.2X
JRuby启动 JRuby 并等待请求12391/3277ms14847/4101ms7849/6058ms1.25 倍到 1.8 倍

表 2 中可以看到,多租户 JVM 上的第一个应用程序实例的启动时间通常比标准 JVM 上的慢。这是预料之中的结果,因为多租户扩展会造成额外的路径长度,导致第一个实例出现一些额外的启动延时。后续实例的启动时间始终是多租户 JVM 更好。

这些早期的结果是因为使用开发 JVM 而产生的,有可能获得更大的改进。此外,这些示例并不影响当应用程序在不同时间需要资源时进行的共享。在一个典型的 JVM 中,在其整个生命周期中,每个 JVM 需要的内存占用往往会不断增大。在标准 JVM 中,这种内存占用不是共享的。如果使用多租户 JVM,在资源需求不重叠时,可以更容易地共享堆的内存和本机构件。


限制

多租户 JVM 的一个目标是无需修改就能运行所有 Java 应用程序。这在目前是不可能实现的,原因是 Java 规范方面的一些限制以及我们目前的实现中的一些限制。关键的已知限制包括:

  • Java Native Interface (JNI) natives:多租户 JVM 没有为 JNI natives 提供隔离。如果使用多租户 JVM,运行包含用户提供的 JNI natives 的应用程序可能不安全。此类应用程序可能会影响整体 JVM 操作和其他租户对数据的访问。在需要对 natives 有足够 “信任” 的情况下(例如,知名的中间件),风险可能是可以接受的。此外,操作系统允许共享的 JVM 进程加只载一个共享库副本,即 natives 所在的位置。其结果是,如果多个租户在同一个共享库中,他们无法加载相同的 natives。
  • Java Virtual Machine Tool Interface (JVMTI):因为调试和分析活动会影响共享 JVM 服务器的所有租户,所以目前多租户 JDK 不支持这些特性。这是我们计划投入更多工作的一个领域。
  • GUI 程序:SWT 等库在原生层保持全局状态,因此在多租户 JDK 中也不支持它们。

结束语

本文介绍了多租户 JVM、如何使用它,以及使用它的成本和收益。我们希望本文激起了您的兴趣,并且希望您会试用 beta,并向我们提供反馈。我们相信,多租户 JVM 可以为适当的环境提供明显的好处。

参考资料

学习

获得产品和技术

讨论

  • 加入 developerWorks 社区。探索由开发人员推动的 博客、论坛、组和维基,并与其他 developerWorks 用户进行交流。

条评论

developerWorks: 登录

标有星(*)号的字段是必填字段。


需要一个 IBM ID?
忘记 IBM ID?


忘记密码?
更改您的密码

单击提交则表示您同意developerWorks 的条款和条件。 查看条款和条件

 


在您首次登录 developerWorks 时,会为您创建一份个人概要。您的个人概要中的信息(您的姓名、国家/地区,以及公司名称)是公开显示的,而且会随着您发布的任何内容一起显示,除非您选择隐藏您的公司名称。您可以随时更新您的 IBM 帐户。

所有提交的信息确保安全。

选择您的昵称



当您初次登录到 developerWorks 时,将会为您创建一份概要信息,您需要指定一个昵称。您的昵称将和您在 developerWorks 发布的内容显示在一起。

昵称长度在 3 至 31 个字符之间。 您的昵称在 developerWorks 社区中必须是唯一的,并且出于隐私保护的原因,不能是您的电子邮件地址。

标有星(*)号的字段是必填字段。

(昵称长度在 3 至 31 个字符之间)

单击提交则表示您同意developerWorks 的条款和条件。 查看条款和条件.

 


所有提交的信息确保安全。


static.content.url=http://www.ibm.com/developerworks/js/artrating/
SITE_ID=10
Zone=Java technology, Cloud computing
ArticleID=953431
ArticleTitle=Java 多租户简介
publish-date=11212013