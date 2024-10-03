고처리량 데이터 로더에 대한 아이디어는 연구 과학자들이 모델 학습 중에 관찰한 실질적인 문제에서 비롯되었습니다. 그들의 작업에는 점점 더 효율적인 GPU에 맞춰가면서 여러 장치에서 대량의 데이터를 처리할 수 있는 도구가 필요했습니다. IBM Research는 블로그에서 이번 릴리스에 대해 "단순히 작업을 완료하는 데 필요한 도구를 구축한 연구팀 덕분"이라고 언급했습니다.

IBM Research의 Davis Wertheimer는 대규모 교육 시 발생할 수 있는 몇 가지 문제를 다음과 같이 설명합니다. "대규모 교육에는 80/20 규칙이 있습니다. 발표된 모든 문헌의 80%는 GPU 메모리와 통신 및 연산 간의 알고리즘 트레이드오프에 대해 살펴보고 있습니다. 하지만 실제로 무언가를 구축하려고 할 때, 80%, 파이프라인이 가장 좁은 병목현상의 속도로 실행되기 때문에 다른 모든 실질적인 문제들의 긴 꼬리에 의존할 수 있습니다."

IBM 팀은 교육 플랫폼을 개발하면서 계속해서 병목 현상을 겪었습니다. "GPU 사용이 점점 더 능숙해짐에 따라 데이터 로더에서 병목 현상이 발생하는 경우가 점점 더 많아지고 있습니다."라고 Wertheimer는 말합니다.

이러한 깨달음은 이중 개발 프로세스로 이어졌습니다. "교육 플랫폼을 발전시키는 한편, 병목 현상을 방지하기 위해 교육 플랫폼의 속도 요구 사항을 따라잡기 위해 데이터 로더를 지속적으로 발전시키는 과정이 병행되어 왔습니다."라고 그는 설명합니다.