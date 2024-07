Der Triton Inference Server ist ein von Nvidia entwickelter Open-Source-Modellserver, der die Modellinferenz sowohl auf CPU- als auch auf GPU-Geräten unterstützt. Er ist auf verschiedenen Plattformen und Architekturen weit verbreitet, einschließlich s390x (Linux on Z). Speziell unter Linux on Z kann Triton KI-Frameworks nutzen, um sowohl die SIMD-Architektur als auch den IBM Integrated Accelerator for AI zu verwenden und so die Leistung zu optimieren.