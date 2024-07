Triton Inference Server는 Nvidia에서 개발한 오픈 소스 모델 서버로, CPU 및 GPU 장치 모두에서 모델 추론을 지원합니다. s390x(Linux on Z)를 포함하여 다양한 플랫폼과 아키텍처에서 널리 사용되고 있습니다. 특히 Triton은 Linux on Z에서 AI 프레임워크를 활용하여 SIMD 아키텍처와 IBM Integrated Accelerator for AI를 모두 사용하여 성능을 최적화할 수 있습니다.