AI on IBM LinuxONE

확장 가능하고 전력 효율적이며 안전한 내장형 AI
Telum II 프로세서 칩

AI 기반 성능 및 혁신

인공지능(AI)은 산업을 변화시키고 있으며, 기업에는 AI 워크로드를 효율적이고 안전하게 처리할 수 있는 인프라가 필요합니다.

IBM LinuxONE은 IBM Telum 프로세서로 운영되며, AI 가속 기능을 칩에 직접 통합하여 지연 시간을 최소화하면서 여러 AI 모델이 실시간으로 추론할 수 있도록 합니다. 이러한 첨단 기능은 예측 AI 및 대규모 언어 모델과 결합하여 데이터가 위치한 곳에서 분석을 수행하며, 고급 사기 탐지, 위험 분석, 의료 영상 처리와 같은 미션 크리티컬 애플리케이션에 대해 더 빠르고 심층적인 인사이트를 제공합니다.

실시간 AI 인사이트

칩 내 AI 가속기는 트랜잭션이 발생하는 동시에 데이터를 분석하며, 지연 시간이 낮은 추론을 가능하게 합니다. 메모리 일관성과 직접 패브릭 액세스를 통해 병목 현상을 제거하여 원활한 AI 실행을 보장합니다.

AI 처리량 증가

IBM LinuxONE Emperor 5의 OLTP 워크로드에서 단일 Integrated Accelerator for AI를 사용하면 13코어 X86 Server에서 추론을 실행할 때와 동일한 처리량을 얻을 수 있습니다.1

AI 성능 가속화

IBM LinuxONE Emperor 5는 신용카드 사기 탐지 딥 러닝 모델을 통해 1ms의 응답 시간으로 하루에 최대 4,500억 건의 추론 작업을 처리할 수 있습니다.2

성능 저하 없는 확장성

IBM LinuxONE Emperor 5를 사용하면 신용카드 사기 탐지 딥 러닝 모델을 사용하여 1ms 미만의 응답 시간으로 초당 최대 500만 건의 추론 작업을 처리할 수 있습니다.3

복잡한 워크로드를 위한 확장 가능한 AI

PCIe 카드 IBM® Spyre Accelerator 카드

IBM Spyre Accelerator 카드는 128GB LPDDR5 메모리를 갖춘 75W PCIe Gen 5x AI 가속기로, 생성형 AI 및 멀티모달 LLM에 최적화되어 있습니다.8 32(+2) 코어와 코어당 2MB 스크래치패드, >55% 코어 활용도를 갖춘 Spyre는 카드 및 드로어별로 확장할 수 있어 기업 애플리케이션 전반에서 복잡한 AI 추론을 효율적으로 처리할 수 있습니다.

IBM® Spyre Accelerator 카드를 IBM LinuxONE 5에 추가하면 생성형 AI를 포함한 추가 사용 사례를 활용할 수 있습니다. 

Spire Accelerator에 대한 블로그 읽기
데모: IBM LinuxONE에서 고성능 실시간 보험 사기 탐지.

IBM LinuxONE용 AI 소프트웨어 및 솔루션

AI Toolkit for IBM LinuxONE
IBM LinuxONE Integrated Accelerator for AI에 최적화된 선별된 AI 프레임워크 세트는 IBM Elite Support와 함께 성능을 개선합니다.
IBM Synthetic Data Sets
AI 모델 학습과 LLM을 향상하는 인공 생성 데이터 세트 제품군으로, 금융 분야에서 IBM LinuxONE이 AI 이니셔티브를 위한 풍부하고 적절한 데이터에 빠르게 액세스할 수 있도록 지원합니다.
Red Hat OpenShift AI
하이브리드 클라우드 환경 전반에서 예측 및 생성형 AI 모델의 라이프사이클을 대규모로 관리하는 개방형 플랫폼입니다.
ONNX
다양한 프레임워크 간 호환성을 가능하게 하는 휴대형 모델 포맷으로, AI 개발자가 한 번 모델을 빌드하면 다양한 런타임, 도구 및 컴파일러에서 배포할 수 있습니다.
TensorFlow
LinuxONE에 최적화된 풍부한 에코시스템을 제공하는 강력한 오픈소스 프레임워크로, 모델 개발, 학습, 추론을 지원합니다.
IBM SnapML
고속 머신 러닝 학습과 추론을 위해 설계되었으며, IBM Integrated Accelerator for AI를 활용하여 Random Forest, Extra Trees, Gradient Boosting 모델의 성능을 향상합니다.
Triton Inference Server
Linux on Z에 최적화된 오픈 소스 모델 서버로, CPU와 GPU 추론을 모두 지원하며 SIMD와 IBM Integrated Accelerator for AI를 활용합니다.
IBM Z 딥 러닝 컴파일러
IBM Z에서 딥러닝 모델 배포를 간소화하는 도구로, 데이터 과학자가 미션 크리티컬 환경에 맞게 AI 모델을 최적화할 수 있도록 지원합니다.

ISV 애플리케이션

IBM은 IBM LinuxONE 에코시스템과 협력하여 ISV가 오늘날의 AI, 지속가능성, 사이버 보안 문제에 해결책을 제시하도록 지원합니다.

금융 및 의료 기관에 특화된 혁신적인 솔루션 2종을 살펴보세요. 사기 행위를 실시간으로 방지해주는 IBM® LinuxONE 4 Express용 Clari5 Enterprise Fraud Management와 대규모 고급 AI 솔루션을 위해 LinuxONE에서 사용하는 Exponential AI의 Enso Decision Intelligence Platform을 소개합니다.

Clari5 살펴보기 Exponential AI 살펴보기
다음 단계 안내

IBM 담당자와의 30분 무료 미팅을 예약하여 AI on IBM LinuxONE에 대해 자세히 알아보세요.

IBM LinuxONE 5 살펴보기
AI on IBM LinuxONE 블로그

AI on IBM LinuxONE이 실시간 인사이트와 엔터프라이즈급 성능을 통해 비즈니스 성장과 효율성을 높이는 방법에 대한 개요를 읽어보세요. 

블로그 읽기
IBM LinuxONE 5, AI 성능 대폭 강화

Cambrian-AI 연구 논문을 통해 LinuxONE 5의 기술과 이 엔터프라이즈급 서버에 적합할 것으로 예상되는 AI 사용 사례를 살펴보세요.

Cambrian-AI 논문 읽기
LinuxONE에서 AI로의 여정 시작하기

AI 사용 사례를 계획할 때의 주요 고려 사항을 살펴보고, Telum 칩으로 가능한 기능을 확인하며, 시작을 위한 다음 단계를 파악해 보세요.

AI 시작하기
각주

1 면책 조항: 성능 결과는 머신 유형 9175의 IBM 시스템 하드웨어에서 실행되는 IBM 내부 테스트를 기반으로 합니다. OLTP 애플리케이션과 PostgreSQL은 IBM 시스템 하드웨어에 배포되었습니다. CCFD(Credit Card Fraud Detection) 앙상블 AI 설정은 두 가지 모델(LSTM, TabFormer)로 구성됩니다. IBM 시스템 하드웨어에서는 OLTP 애플리케이션을 IBM Z Deep Learning Compiler(zDLC)로 컴파일된 jar 파일과 IBM Z Accelerated for NVIDIA Triton Inference Server를 로컬에서 실행하고, 코어 및 Integrated Accelerator for AI에서 AI 추론 작업을 처리했습니다.비교군은 OLTP 애플리케이션을 로컬에서 실행하고, 원격 X86 Server(CPU에서 OpenVINO™ 런타임 백엔드와 AMX가 활성화된 NVIDIA Triton Inference Server 실행)에서 AI 추론 작업을 처리했습니다. 64명의 병렬 사용자가 있는 Apache JMeter™ 5.6.3에서 각 시나리오를 구동했습니다. IBM 시스템 하드웨어 구성: SMT 활성화된 전용 7코어, 256GB 메모리, IBM FlashSystem 9500 스토리지를 탑재한 Ubuntu 24.04 기반 LPAR 1개. 네트워크 어댑터는 Linux에서 작동하는 NETH 전용입니다. X86 Server 구성: Hyper-Threading이 활성화된 28코어 Emerald Rapids Intel Xeon Gold CPU(2.20 GHz), 1TB 메모리, 로컬 SSD, 최대 성능 프로필이 설정된 UEFI, CPU P-State Control 및 C-States 비활성화 상태의 Ubuntu 24.04 기반 x86 Server 1대. 결과는 경우에 따라 다를 수 있습니다.

2, 3 면책 조항: 성능 결과는 IBM 시스템 하드웨어(머신 유형 9175)에서 수행된 IBM 내부 테스트를 기반으로 추정된 값입니다. IBM Integrated Accelerator for AI를 활용하기 위해 LSTM 기반 합성 신용카드 사기 탐지 모델을 사용하여 로컬 추론 작업을 수행하는 1개 스레드로 벤치마크를 실행했습니다. 배치 크기는 160이었습니다. IBM 시스템 하드웨어 구성: SMT 활성화된 6코어, 128GB 메모리를 탑재한 Red Hat Enterprise Linux 9.4 기반 LPAR 1개. 결과는 경우에 따라 다를 수 있습니다.