高吞吐量数据加载器的想法源于研究科学家在模型训练过程中观察到的实际问题，因为他们的工作需要一种能够跨多个设备处理大量数据的工具——同时还要跟上日益高效的 GPU 发展步伐。正如 IBM Research 在其关于该版本发布的博客中所指出的：“这完全要归功于一支研究人员团队，他们只是构建了完成工作所需的工具。”

IBM Research 的 Davis Wertheimer 解释了大规模训练中可能出现的一些挑战：“在大规模训练方面，存在某种 80/20 法则。已发表文献的 80% 都在研究 GPU 内存、通信与计算之间的算法权衡。但当你真正尝试构建某些东西时，80% 的时间，你都会依赖于所有这些其他实际问题的漫长解决过程，因为管道的运行速度取决于最窄的瓶颈。”

在 IBM 团队开发其训练平台的过程中，他们持续遇到瓶颈。“随着我们越来越擅长使用 GPU，瓶颈越来越频繁地出现在数据加载器上，”Wertheimer 指出。

这一认识引发了一个双重开发过程。“这是一段并行的旅程：一方面，发展我们的训练平台；另一方面，持续改进我们的数据加载器，以满足训练平台的速度需求，避免形成瓶颈，”他解释说。