墨西哥工业大学 (Mexican Technical Institute)/蒂华纳理工学院 (Technological Institute of Tijuana)
在 IBM Power 系统上利用突破性计算技术开展顶级社会科学研究
了解更多信息

蒂华纳理工学院正致力于研究现实世界中需要机器学习的各种领域,包括社会科学问题。他们原有的 x86 基础架构不具备所需的性能和可扩展性,无法实现他们的目标。该学院在 IBM Power Systems S822LC for High Performance Computing 上部署了 IBM Cloud Private 和 Docker。

业务挑战

蒂华纳理工学院正致力于在需要机器学习和优化的许多领域开展顶级研究,包括社会科学问题。他们原有的 x86 基础架构不具备执行此类工作所需的计算性能和可扩展性。

变革

蒂华纳理工学院与 IBM 合作,在 IBM Power Systems S822LC for High Performance Computing 上部署了 IBM Cloud Private 和 Docker,构建了 IT 基础架构,以开发基于突破性计算技术的机器学习系统。

结果 计算时间
比 x86 快 100 倍以上
处理时间
从 4 小时缩短到 1 分钟
可扩展至
100 多万个数据点和数十万个功能
业务挑战案例
为顶级研究机构构建 IT 基础架构

蒂华纳理工学院是位于墨西哥下加利福尼亚州蒂华纳市的一所高等教育机构。该学院成立于 1971 年 9 月 17 日,是该州最早的高等教育机构之一。两个校区共提供 21 个学士学位、6 个硕士学位和 3 个博士学位,是该地区专业和科学人才的重要来源。其职能是根据该地区的技能需求提供本科、硕士和博士高等教育服务。

该学院一直在研究可以用机器学习技术解决的现实问题,如人类移民模式,以及其他与墨西哥和美国边境城市相关的社会科学问题。他们有一个非常庞大的数据集,他们正在其中开发自己的算法。这些算法将用于预测人类迁移模式和其他影响社会的问题。他们开始确定现有的基础设架构是否具备对这些问题进行最高级别研究的能力。

该学院的研究实验室现在配备着安装有 Intel Xeon 处理器的戴尔服务器。该团队得出的结论是,这些服务器的带宽和功能无法满足他们利用大数据进行研究的需要,尤其是在执行复杂的优化和学习过程时。他们需要配备 GPU 的加速服务器来处理高性能计算工作负载。这些服务器还必须扩大规模,以满足其数据集的需求。

蒂华纳理工学院电气与电子工程系研究教授 Leonardo Trujillo 博士开始研究可以实现高性能计算的 IT 基础架构,使他们能够进行最高水平的研究。他们了解 IBM 和 NVIDIA 在企业人工智能和高性能计算方面的关系,因此他们开始考虑使用 Power Systems 来构建他们的研究基础架构。在与 IBM 交谈并研究了用于实现高性能计算的 Power Systems 后,团队确信这就是他们需要的方向。他们开始使用 IBM Power Systems 构建新的研究基础架构。

变革案例
更快的计算时间和更高的可扩展性

蒂华纳理工学院与 IBM 合作,在 Power Systems S822LC for High Performance Computing 上部署了 IBM Cloud Private。Power Systems S822LC for High Performance Computing 是采用 NVIDIA Tesla GPU 和 NVLink 技术的加速服务器,可加快 CPU 与 GPU 之间的通信。IBM Cloud Private on Power 是一个开放式 Kubernetes 平台,可帮助开发人员轻松构建和部署容器化应用程序。借助 IBM Cloud Private on Power,Trujillo 博士和他的团队可以放心地在本地部署的私有云环境中快速部署他们的高性能计算应用,安全且具有最佳可用性。

该学院还在其新的 IBM Power Systems 基础架构上部署了 Docker 容器。对于希望开始使用基于容器的应用程序的开发人员,Docker 提供的企业级容器软件是理想选择。通过在 IBM Power Systems 上使用 Docker,Trujillo 博士和他的团队可以将人工智能算法容器化,在大型数据集上进行特定搜索。他们可以将大数据集内的搜索划分为若干部分,并启动一个 Docker 容器,只专注于特定的搜索,从而减少了寻找特定洞察所花费的时间,并使他们能够以非常简单高效的方式完成复杂的先进搜索模式。

借助 Power Systems 上的 IBM Cloud Private 和 Docker,该团队能够将其研究工作负载的计算时间从使用旧的戴尔和 Intel Xeon 基础架构时的 4 小时左右缩短到一两分钟,速度提高了 100 倍以上。在 IBM Power Systems 上使用 NVIDIA NVLink 技术,数据在 CPU 和 GPU 之间的传输速度比传统架构更快。IBM Power Systems 的 I/O 带宽比 x86 Server 高出 5.6 倍,可减少高性能计算工作负载的瓶颈。Trujillo 博士和他的团队还能够在 CPU 和 GPU 之间共享 RAM,获得更高的性能。基于容器的方法还缩短了部署时间,降低了加入实验室的年轻研究人员和学生的学习曲线。

与以前的传统基础架构相比,Trujillo 博士和他的团队还能更快更远地扩大规模。可扩展性对于他们正在进行的工作至关重要,因为这可以让他们以更精确的方式更好地描述搜索模型的动态特征,从而用于研究应用。使用旧的传统基础架构,他们只能使用 1,000 到 2,000 个数据搜索点运行工作站。现在,他们可以利用 Power Systems 扩展到超过一百万个数据点。这种可扩展性使他们能够获得以前无法实现的数据新洞察。

我们目前正致力于突破性计算和机器学习的交叉领域的工作,这个领域被称为遗传编程,可以利用复杂的搜索和优化方法自动生成强大的预测工具,但这样做需要极强的计算能力,幸运的是,配备 NVIDIA GPU 的 IBM POWER8 HPC 平台提供的计算能力绰绰有余。 Leonardo Trujillo 博士 研究教授 蒂华纳理工学院
案例成果
解决社会科学问题

蒂华纳理工学院现在拥有了所需的 IT 基础架构,可以在许多需要最先进的机器学习和优化技术的现实世界领域(包括社会科学问题)开展顶尖研究。例如,在这一领域,机器学习可以让 Trujillo 博士和他们的团队探索墨西哥和美国边境的移民模式,这对蒂华纳市来说是一个特别重要的问题,因为它是世界上最大、最重要的边境城市之一。IBM Power Systems 拥有现代高性能计算和数据密集型工作负载所需的性能。利用这项技术,他们的目标是生成计算模型,帮助对来到蒂华纳和其他边境城镇的人的移民模式进行分类和预测。他们还在相关领域开展新的研究项目,例如从零开始开发新的人工智能算法,对软件系统进行自动代码修复和代码改进,通过机器学习了解新材料的纳米技术特性,自动生成计算机视觉算法,以及为不同领域开发功能强大的机器学习平台。IBM Power Systems 拥有开展其他新研究计划所需的计算能力。

Trujillo 博士和他的团队惊喜地发现,学习曲线开始就很平缓,容易上手。在很短的时间内,他们就能启动并运行新的高性能计算平台,开始新的研究项目。他们很快就能将研究算法部署到新的基础架构上,并迅速启动数据计划。

该学院目前正致力于下一步实施 IBM Watson Machine Learning Accelerator。Watson Machine Learning Accelerator 通过将开源深度学习框架与高效的开发工具和加速的 IBM Power Systems 服务器相结合,使深度学习和机器学习更易于使用。有了 Watson Machine Learning Accelerator,Trujillo 博士和他的团队将拥有一个完整的数据科学环境,能够进行更复杂、更有影响力的研究。他们还将拥有在越来越大的数据集上处理深度学习所需的可扩展性。

此外,Leonardo Trujillo 博士和他的团队还在考虑进一步扩大与其他研究机构和大学的合作伙伴关系。将 IBM Cloud Private 和 Power Systems 置于其研究基础架构的中心,与其他机构的合作将比单独合作更有效。他们的新基础架构还有助于巩固他们在墨西哥和北美顶级研究机构的地位。蒂华纳理工学院期待利用 IBM Power Systems 解决重要的社会科学问题。

在 IBM 和 NVIDIA GPU 的帮助下,我们可以解决许多领域的大规模问题,以高效的方式探索可能的解决方案空间,并使我们能够构建工具和收集以前无法获得的见解。 Leonardo Trujillo 博士 研究教授 蒂华纳理工学院
墨西哥工业大学徽标
墨西哥工业大学 (Mexican Technical Institute)/蒂华纳理工学院 (Technological Institute of Tijuana)

蒂华纳理工学院(链接位于 ibm.com 外部)是一所位于墨西哥下加利福尼亚州蒂华纳市的高等教育机构。该学院成立于 1971 年 9 月 17 日,是该州最早的高等教育机构之一。两个校区共提供 21 个学士学位、6 个硕士学位和 3 个博士学位,是该地区专业和科学人才的重要来源。其职能是根据该地区的技能需求提供本科、硕士和博士高等教育服务。

采取后续步骤

要了解有关 IBM Power Systems S822LC for High Performance Computing 服务器的更多信息,请联系您的 IBM 代表或 IBM 合作伙伴。

要了解有关 IBM Cloud Private on Power 的更多信息,请联系您的 IBM 代表或 IBM 合作伙伴,或访问 https://www.ibm.com/cn-zh/products/power-private-cloud-edition

要了解有关 IBM Watson Machine Learning Accelerator 的更多信息,请联系您的 IBM 代表或 IBM 合作伙伴,或访问 https://www.ibm.com/cn-zh/products/deep-learning-platform

查看更多案例研究
脚注

© Copyright IBM Corporation 2018. 1 New Orchard Road, Armonk, New York 10504-1722 United States. 2019 年 3 月在美国制作。

IBM、IBM 徽标、ibm.com、IBM Power Systems、IBM Watson 和 IBM Cloud Private 是 International Business Machines Corp. 在全球许多司法辖区的注册商标。其他产品和服务名称可能是 IBM 或其他公司的商标。ibm.com/legal/copytrade.shtml 上的“Copyright and trademark information”部分提供了 IBM 商标的最新列表。

IBM 并不一定在开展业务的所有国家或地区提供所有产品或服务。

文中引用的性能数据和客户实例仅作说明之用。实际性能结果可能因具体配置和操作条件而异。

以上所有引用或描述的客户实例的展示取决于部分客户使用 IBM 产品的方式以及他们可能取得的结果。实际的环境成本和性能特征会因具体客户配置和情况而有所不同。请联系 IBM,咨询 IBM 产品和服务详情。

客户负责确保遵守适用的法律和法规。IBM 不提供任何法律咨询,也不声明或保证其服务或产品经确保客户遵循任何法律或法规。

关于 IBM 未来方向、意向的声明仅仅表示了目标和意愿而已,可能会随时更改或撤销,恕不另行通知。