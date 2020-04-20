최근 조직에서 컴퓨팅 노드를 구매하고 인공 지능(AI)을 시작하기로 결정했을 수도 있습니다. AI 워크로드에 대비할 때, 특히 스토리지 시스템을 포함하여 IT 인프라 및 기술 환경의 여러 측면을 면밀히 검토해야 합니다. AI는 데이터에 의해 구동되며, 데이터를 저장하는 방식은 AI 프로젝트의 결과에 큰 영향을 미칠 수 있습니다. 뿐만 아니라 AI의 네 가지 단계(수집, 준비, 훈련, 추론)는 각각 다른 스토리지 요구 사항과 필요성을 가지고 있습니다.
안타깝게도 일부 조직에서는 AI의 컴퓨팅 측면에만 집중하고 스토리지 측면을 간과하는 경우가 있습니다. 이렇게 한 곳에만 집중하면 AI 프로젝트가 중단되거나 완전히 실패할 수 있으며, 때로는 그렇게 되기도 합니다. AI 훈련 단계를 원활하게 진행하려면 방대한 양의 데이터가 필요합니다. 이 데이터는 수집, 저장, 준비가 되어 훈련 단계에 "공급"될 수 있어야 합니다. 교육에 필요한 데이터를 수집, 저장, 소비할 수 있는 기능이 없으면 프로젝트는 실패할 위험이 있습니다.
AI 프로젝트에는 뛰어난 성능, 확장성, 유연성을 갖춘 스토리지 인프라가 필요합니다. 좋은 소식은 오늘날의 스토리지 시스템은 AI 프로젝트의 요구 사항을 충족하도록 특별히 설계할 수 있다는 점입니다. 그 좋은 예로 세계에서 가장 강력한 슈퍼컴퓨터인 Sierra와 Summit이 있습니다.
이제 몇 가지 요구 사항을 살펴보겠습니다.
AI 파이프라인의 각 단계에 대한 요구 사항은 AI 애플리케이션의 예상 워크로드에 맞게 검토되어야 합니다. 워크로드는 다양하지만 대규모 데이터 세트를 사용하는 일부 기업에서는 장기간에 걸쳐 훈련할 수 있습니다. 훈련이 완료되면 해당 데이터는 새로운 워크로드에 대비하기 위해 중요한 스토리지 플랫폼에서 이동되는 경우가 많습니다. 데이터를 수동으로 관리하는 것은 어려울 수 있으므로 스토리지에 데이터를 배치하는 방법과 훈련이 완료된 후 데이터가 어디로 이동할지 미리 생각하는 것이 현명합니다. 데이터를 자동으로 이동할 수 있는 플랫폼을 찾으면 효율적이고 유능한 AI용 스토리지 관리에 한 걸음 더 다가갈 수 있습니다.
워크로드 요구 사항의 의미를 검토한 후, AI 컴퓨팅 인프라와 프로젝트에 가장 적합한 스토리지 기술을 결정할 수 있습니다.
데이터 수집. AI 워크로드의 원시 데이터는 다양한 정형 및 비정형 데이터 소스에서 가져올 수 있으며, 데이터를 저장할 매우 안정적인 장소가 필요합니다. 스토리지 매체는 특히 실시간 분석을 위해 대용량 데이터 레이크 또는 플래시 스토리지와 같은 빠른 계층이 될 수 있습니다.
데이터 준비. 일단 저장된 데이터는 '원시' 형식이므로 준비해야 합니다. 나머지 단계에서 사용할 수 있도록 데이터를 처리하고 형식을 지정해야 합니다. 이제 무작위 읽기와 쓰기가 혼합되어 있으므로 이 단계에서 파일 I/O 성능은 매우 중요한 고려 사항입니다. 시간을 내어 AI 파이프라인에 필요한 성능이 무엇인지 파악하세요. 데이터 형식이 지정되면 훈련을 위해 신경망에 입력됩니다.
훈련 및 추론. 이러한 단계는 컴퓨팅 집약적이며 일반적으로 훈련 모델에 데이터를 스트리밍해야 합니다. 훈련은 모델을 만드는 데 사용되는 설정과 재설정이 필요한 반복적인 과정입니다. 추론은 데이터와 훈련의 합계로 생각할 수 있습니다. 짧은 지연 시간, 높은 처리량, 빠른 응답 시간이 필요하기 때문에 서버의 GPU와 스토리지 인프라가 매우 중요해집니다. 스토리지 네트워크는 데이터 수집 및 준비뿐만 아니라 이러한 요구 사항도 처리할 수 있도록 설계되어야 합니다. 규모가 커지면 많은 스토리지 시스템, 특히 AI 워크로드에 대비하지 않은 스토리지 시스템에 스트레스가 가해지므로 스토리지 플랫폼이 비즈니스 목표에 따라 워크로드 요구 사항을 처리할 수 있는지 구체적으로 고려하는 것이 중요합니다.
또한 다음 사항도 고려하세요. 스토리지 인프라가 쉽게 확장되나요? 데이터 요구가 증가함에 따라 스토리지 시스템을 확장할 수 있나요? 이러한 질문은 AI 인프라 요구 사항에 직접적인 영향을 미치는 매우 중요한 질문입니다.
비즈니스의 데이터 증가에 맞춰 운영 중단을 최소화하거나 최소화하면서 스토리지 인프라를 확장 및 축소할 수 있는지 확인하세요. AI 인프라의 다양한 요구 사항에 따라 다양한 스토리지 구성을 고려할 수 있을 만큼 유연해야 합니다.
AI 서버 및 모델링 요구 사항을 스토리지 인프라에 맞춰 신중하게 계획하면 투자를 최대한 활용하고 AI 프로젝트의 성공으로 이어질 수 있습니다.
이러한 권장 사항은 시작점에 불과합니다. 조직에 올바른 AI 스토리지 인프라를 설계하고 구현할 수 있는 전문 지식이 없는 경우, 공급업체와 협력하여 스토리지 시스템을 AI에 맞게 준비할 수 있도록 지원해야 한다는 점을 항상 염두에 두세요.
