企业正通过现代化数据存储基础设施来挖掘 AI、ML 及高级分析技术的商业潜力。然而,数据与工作负载分散在不同地域、AI 训练与推理工作负载耗时增加等问题正带来挑战。此外还需应对图形处理器 (GPU) 等按需资源的成本压力与稀缺性问题。
IBM 商业价值研究院 (IBV) 的研究表明,62% 的高管人员预计其所在企业将在三年内全面应用 AI 技术。但仅 8% 的受访者认为现有 IT 基础架构能完全满足其 AI 需求。
展望未来,仅 42% 的受访者相信现有基础设施能承载高级 AI 模型的数据量与计算需求。同样,仅 46% 的受访者预计现有设施可支持大规模实时推理任务。
AI 工作负载需要能够减少数据处理瓶颈的系统——这些瓶颈会拖慢模型训练、微调及推理进程。同时还需要可扩展的存储系统来处理持续增长的数据集,尤其是生成式 AI 与大语言模型 (LLM) 工作负载相关的数据。
为满足这些需求,AI 存储可通过应用编程接口 (API),与开源及专有的 ML、深度学习框架实现无缝集成。此功能能够加速 LLM 训练与模型开发进程,并提升整个 AI 系统的整体性能。
了解更多信息,请查阅:《AI 基础设施:存储为何至关重要》。
传统数据存储适用于通用商业应用程序,而 AI 存储则为高效且经济地训练和运行复杂的数据密集型 AI 模型提供基础支撑。
传统存储虽能处理结构化和非结构化数据,但其设计针对具有可预测模式的典型商业工作负载,并不适用于分布式系统上的模型训练及大规模推理任务。
AI 存储指用于存储和管理数据以训练和运行 AI 基础设施的系统,包括数据湖、云存储及数据库。它专为处理海量非结构化数据(如图像、音频、视频、传感器数据)而设计。
这类数据需要能够提供高 IOPS(每秒输入/输出操作次数)和超低延迟的存储系统,在模型训练与推理阶段尤为关键。
总而言之,传统存储与 AI 存储的核心差异可归结为工作负载规格的不同。传统存储为稳定、可预测的操作而构建,而 AI 工作负载 在其全生命周期中具有独特且严苛的需求。
AI 存储为优化 AI 工作流与基础设施性能提供关键优势,包括:
在医疗保健领域,AI 存储通过处理海量基因组数据集、医学影像文件及电子健康记录,加速药物研发并支持临床决策辅助系统(例如英伟达 BioNeMo、IBM® watsonx 平台)。
Netflix 和 Amazon 等流媒体服务商运用 AI 数据存储大规模处理观看历史数据,实现能提供个性化内容的实时推荐引擎。
AI 存储通过快速访问文档、图片及非结构化数据,支持自动化承保与理赔处理。这种方式使得自然语言处理 (NLP) 与图像识别模型能够加速风险评估并缩短理赔周期。
使用开源框架和工具,将 AI 和机器学习应用于 IBM® zSystems 大型机上最有价值的企业数据。
IBM 提供 AI 基础设施解决方案并通过混合设计战略来加快对整个企业产生的影响。
通过 IBM Consulting 发掘企业数据的价值,建立以洞察分析为导向的组织,实现业务优势。
1 “人工智能驱动存储市场规模与预测(2025-2034 年)”, Precedence Research,2025 年 7 月 15 日。