IBM Support

DB2 for IBM i 再次一鸣惊人

Technical Blog Post


Abstract

DB2 for IBM i 再次一鸣惊人

Body

原文链接:http://db2fori.blogspot.com/2013/08/db2-for-i-hitting-mark-again.html

 

DB2 for IBM i再次一鸣惊人

 

我非常激动能够邀请到RobSusan Bestgen与我们分享一些激动人心的好消息。在我看来,这些消息更能够证明DB2 for IBM i 以数据为中心的强大处理能力。

如果您是本博客的长期读者,您也许已经知道,Rob DB2 for IBM i 查询优化引擎的首席架构师,他的妻子Susan 属于IBM i开发团队中的SAP团队。她的主要工作包括阐释以及运行SAP的基准测试, 这些基准是SAP提供给像IBM这样的解决方案供应商的。同时,今年夏初正是RobSusanIBM i 工作25周年纪念日。再次祝贺两位!

Susan Rob,现在是你们两位的时间了。

Mike, 谢谢你! 我们非常开心与大家分享这些激动人心的消息...

201388日,SAP为他们的Enhanced Mixed Load benchmark(增强混合负载基准BW-EML)发表了最新的供应商认证, 这是不断发展的商业智能的最新基准。

哪个供应商取得了最新基准的第一名呢?

IBM

那么现在,我们更加关心是IBM的哪个平台达到了这么高的基准呢?

运行在Power系统上的IBM i

如果你想了解基准测试结果,请看这里

所以我们可以这样说,IBM i 再一次通过它具有业界强力的操作系统以及DB2 for i数据库管理系统显示了它的强大。

也许你很好奇 IBM i 是怎样成功完成这个基准的呢?

首先以及重要的是,基准全部是按照SAP的规格以及由SAP认证的结果。

IBM i   是不是新增加了纵列数据库功能呢?

IBM i 是不是使用了一些不会公开给客户使用的特殊程序或者隐藏选项?

当然不是,这里没有特殊代码,更没有隐藏选项。

好吧,那么IBM i 基准团队肯定是使用了一些通常客户没有或者不能实际应用的技术。

不,当然没有,运行这个基准的所有技术都是现成的-每个人都可以使用。

实际上,这个基准能够取得成功的主要原因就是使用这些强大的、已经存在DB2 for IBM  i 多年的专利技术。

让我们挖掘的更加深入一些

这个基准是结合了硬件以及软件创建出一个适合商业智能(BI)的环境,运行在一个32个核,512G内存的Power 7+系列750 型号的单一分区上。Power的同步多线程(SMT)提供了每个内核同时运行多个线程的能力。对于存储,组合使用了硬盘(HDD)以及固态盘(SSD 以达到在一个合理的价位上取得最好性能的配置。SSD用来存储‘热点’数据,HDD存储其余数据。

图像

通常一个数据库包含了一大部分不经常使用的数据(‘冷’数据) 以及一小部分经常使用的数据(‘热’数据),SSD对于热点数据提供了很好的性能,而硬盘对于不经常访问的数据提供了最佳的存储成本。

在这个基准方案中,通过UNIT 参数将使用率高的数据库表以及索引放在SSD 提高IO响应时间。 这样可以取得可以与内存数据库相当的响应时间以及吞吐量。用户可以通过IBM i 提供的一系列应用程序知识以及工具,例如SQL Plan Cache CL命令TRCASPBAL来识别热点数据。完成基准测试中所使用到的所有工具用户都可以应用到自己的环境中。

IBM i 操作系统提供了系统的整体管理功能,特别是单级存储SLS)提供有效的内存以及硬盘管理功能有效地消除对缓冲池以及存储池的管理。并且对于前面提到的“热点”数据管理,SLS 还能够设置自动跟踪以及平衡数据功能,通过使用TRCASPBALSTRASPBAL 这两个CL命令完成跟踪以及数据移入/移出SSD。在基准测试中使用的标记对象方法以及SLS 提供的跟踪和平衡选项都是完成良好数据分布的有效方法。使用哪种技术在不同的客户之间是不一样的,这取决于客户对数据模型以及实际数据分布的了解。

说到数据库管理系统,DB2 for i 称得上基准测试取得成功的最大明星。SAP设计的EML数据库是星型模型(实际上是雪花模型),这一模型是行业对数据仓库以及数据市场使用的标准方法。测试团队通过在以数据为中心的设计上实践各种最佳应用,在基准测试过程中充分地利用了查询优化以及数据库引擎的功能。

编码矢量索引(EVI)是这个基准成功的主要因素。EVI是一种高级的索引技术,它在不影响基本表本身的情况下提供了纵列数据库的性能优势,而且避免了纵列数据库的劣势。简单(单列) EVI常常能够用于避免特定的、过于复杂的索引环境。

当然,索引只有在这个星型模型数据库优化以及运行技术中真正被使用到了才能发挥作用。DB2 for i 通过其专利技术前瞻性谓词生成技术LPG)极好地发挥了它的作用。LPG是一种查询重写技术,它能够根据连接条件产生本地选择谓词,从而减少对大数据库(事实)表的访问。LPG主要应用于星型模型,另外在必要的情况下,DB2 for i 通过索引的Anding ORing 技术能够组合多个索引,满足单一查询中多个选择条件的查询。更厉害的是,当EVI创建之后,不需要任何提示以及修改,DB2 for i 都能够自动使用这些技术,

物化查询表(MQT),通常叫做用户定义汇总表,用来提前计算一些汇总结果。一旦启用MQT, 它就可以被查询优化器用在查询的各个部分。由于EML 基准查询的随机性,以及为了实现基准团队尽量减少特殊处理的承诺,基准测试使用的MQT定义通常较为通用,以此来限制环境的复杂性。

在商业智能环境中,对称多处理SMP)会用来提高查询性能。由于查询用户数很高,SMP对于这个基准的临时报表部分并非有益。但是,对于基准要求的实时更新,SMP在不影响查询性能的情况下在数据加载时间方面提高了效率。

在更加全面的介绍中,需要提到这一点,即基于代价的查询优化器选择合适的查询计划的能力来自于数据库内置的自动收集的统计信息。

IBM 白皮书提供了这个基准详细信息。

最好的部分?

这个基准中所用到的DB2 for i 技术都已经存在了很多年,没有未证实、有风险的技术,没有“尖端技术”的惊喜,没有任何“基准专用”技术。只是多年经客户证明,业界过硬的技术。这个基准技术已经为客户的使用做好准备,现在等待耳目一新的变化吧。

作为本博客的读者,你应该已经知道Center of Excellence 团队已经做好为客户提供任何这个项目中所用的DB2 for i 技术的咨询和帮助。帮助用户利用好这个基准测试中使用的技术是这个团队的职责之一。

作者:Mike Cain

翻译:王佳

 

[{"Business Unit":{"code":"BU058","label":"IBM Infrastructure w\/TPS"},"Product":{"code":"SWG60","label":"IBM i"},"Component":"","Platform":[{"code":"PF025","label":"Platform Independent"}],"Version":"","Edition":"","Line of Business":{"code":"LOB57","label":"Power"}}]

UID

ibm11144672