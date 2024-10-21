采用生成式 AI (gen AI) 不再是将来的推测之事。凭借其巨大潜力，各公司正全力利用AI来简化运营、提高生产力，并将这些益处最终带给客户。
这种转型伴随着新的挑战。当客户开始在本地部署中实施 AI 时，第一步是评估其数据中心是否已准备就绪：升级 IT 基础架构（包括充足的电力和散热能力）、准备好网络以处理大量数据、优化和扩展基础架构容量以及实施保护措施，同时实现可扩展性。根据 IBM 商业价值研究院 (IBM IBV) 与牛津经济研究院合作发布的一份报告，该报告对 34 个国家/地区、26 个行业的 2,500 名负责人进行了调查，43% 的首席技术高管表示，在过去六个月中，由于生成式 AI 的出现，他们对自身技术基础架构的担忧有所增加，且目前正在专注于升级基础架构以实现技术扩展。
组织必须制定实施策略，该策略应有助于确保高效运营、极短的停机时间并能快速响应 IT 需求，同时应对法规合规性、道德考量和安全威胁。拥有一个具备内部 AI 专业知识且能够管理此底层基础设施全生命周期的关键合作伙伴，对于利用此类技术演进的优势至关重要。
IBM Technology Lifecycle Services (TLS) 提供用于基础设施支持和服务的全面解决方案组合，范围从部署到淘汰，帮助组织以高可用性和弹性优化其 IT 基础设施。IBM TLS 协助数据中心升级至支持 AI 就绪，利用全球供应链和物流框架，大规模地满足 IBM 产品及各种原始设备制造商 (OEM) 对高强度 AI 工作负载的需求。以下是数据中心在运行 AI 工作负载时可能面临的一些主要挑战，以及 IBM TLS 应对这些挑战的方法：
由于采用 AI 并依赖来自多供应商的技术，当今的数据中心已变得更加复杂。根据 TechTarget Enterprise Strategy Group 的报告 Navigating the Evolving AI Infrastructure Landscape， 30% 的组织 期望在混合云环境中部署 AI，这凸显了拥有现代化基础设施和有效连接性的必要性。
保持运营弹性需要最新的基础设施和前瞻性风险管理，但监督各种合同和排查问题对于 IT 内部员工而言可能既困难又昂贵。IBM TLS 增强客户现有能力，不仅通过部署和支持 IBM 产品（IBM Z、 Power 和 Storage），还通过集成新的、AI 兼容的 多供应商技术来实现。
大型语言模型需要大量资源以及在大型网络集群配置中并行运行的多台计算机。作为基础设施的支柱，该网络必须支持高带宽、低延迟和可扩展的架构，并对 GPU 通信、存储访问和分布式 AI 任务进行特定优化。IDC“AI View”报告指出，该网络是生成式 AI 训练中最大的基础设施支出项目，占比高达 44%。IBM TLS 依托遍布全球的专业团队和战略伙伴关系，提供注重弹性和可用性的集成式整体方法，从而为客户提供一站式服务，并充当采购、规划、部署、支持、优化和更新数据中心基础设施（服务器、网络、存储和软件）方面的顾问，从而助力平稳过渡到 AI 就绪环境。
如果 AI 给数据中心带来日益复杂的障碍，那么解决这些问题也可能受益于 AI 本身的使用。处于这一转变的前沿，IBM TLS 将 AI 集成到工具和流程中，以赋能代理并增强客户体验。 要更详细地了解 IBM TLS 如何使用 AI，请阅读 IBM基础设施 TLS 支持服务副总裁 Bina Hallman 的发言。
依赖 GPU、网络和存储等复杂组件的生成式 AI 系统，可能因工作负载强度大而面临更高的故障率，并且正在处理和共享的海量数据也可能增加漏洞。 计划外停机时间和潜在的数据泄露对企业而言代价高昂，但主动支持能加速问题解决并在问题发生前进行预测。
IBM IBV调查 CEO生成式 AI 指南：平台、数据与治理显示，其中大多数受访者表示对数据沿袭和溯源 (61%) 以及数据安全 (57%) 的担忧将成为采用生成式 AI 的障碍。为应对这些挑战，IBM TLS 提供诸如 IBM Support Insights 之类的解决方案，该方案管理着超过 3000 家客户和 350 万个 IT 资产的清单，识别并警示超过 150 万个有效安全漏洞，同时提供解决建议。此方法有助于维护 AI 基础设施的完整性，减少因合同过期导致的中断和支持问题。此外，IBM TLS 协助客户清除遗留资产中的数据，并提供介质销毁服务，帮助确保清理过程符合美国国家标准与技术研究院 (NIST) 的《介质清理指南》。
数据中心因 AI 集成度提高而不断增长的能源需求，可能导致因电力消耗和碳排放产生的更高运营支出，阻碍可持续发展目标。据 国际能源署 (IEA) 1 月份报告，全球数据中心电力消耗在 2026 年可能升至超过 1000 太瓦时，高于 2022 年估计的 460 太瓦时。AI 的采用绝不能忽视可持续性目标， IBM TLS 产品组合通过评估工作负载需求和基础设施利用率，以及监控功耗和碳足迹，帮助客户做出明智决策。IBM IT Sustainability Optimization Assessment 使用 IBM Turbonomic 软件，该软件运行选定的“假设”规划场景，以理解数据中心优化的可能性和影响。评估结束后，客户会收到一份详细报告，其中包含建议措施、预估的成本削减、预计的能耗以及碳足迹的改善，帮助他们将AI计划与可持续性目标对齐。
随着新障碍的出现，做好充分准备、预见潜在问题并与可信赖且经验丰富的 IT 支持和服务合作伙伴合作，能够影响 AI 采用和持续维护的成功。几十年来，IBM 一直遵循支持采用多供应商技术构建完整 AI 解决方案堆栈的核心原则。无论客户处于旅程的哪个阶段，IBM 都能利用其专业知识，在 AI 机遇基础设施、定制化产品供应、广泛咨询、技术生命周期服务以及与我们的广阔合作伙伴生态系统协作方面为组织提供帮助。
使用开源框架和工具，将 AI 和机器学习应用于 IBM® zSystems 大型机上最有价值的企业数据。
IBM 提供 AI 基础设施解决方案并通过混合设计战略来加快对整个企业产生的影响。
通过 IBM Consulting 发掘企业数据的价值，建立以洞察分析为导向的组织，实现业务优势。