IBM, 2022년 Gartner® Magic Quadrant™ for Data Integration Tools에서 17년 연속 리더로 선정
개요
멀티클라우드, AI 기반 데이터 통합
IBM® DataStage®는 데이터를 이동하고 변환하는 작업을 설계, 개발, 실행할 수 있도록 지원하는 업계 최고의 데이터 통합 툴입니다. 기본적으로 추출, 변환, 로드(ETL) 패턴과 추출, 로드, 변환(ELT) 패턴을 지원합니다. 소프트웨어의 기본 버전은 사내 구축형 배포로 사용 가능하지만, DataStage for IBM Cloud Pak for Data®로 업그레이드하면 데이터 통합 시간과 비용을 절감할 수 있을 뿐만 아니라 하이브리드 또는 멀티클라우드 환경에서 강력한 자동 통합 기능을 경험할 수 있습니다.
IBM, 2021년 Gartner Magic Quadran for Data Integration Tools에서 리더로 선정
차세대 DataStage
DataStage for IBM Cloud Pak for Data란 무엇인가요?
IBM Cloud Pak for Data란 무엇인가요? Red Hat® OpenShift® 컨테이너 오케스트레이션 플랫폼을 기반으로 구축된 이 클라우드 네이티브 인사이트 플랫폼은 데이터 패브릭 아키텍처 내에서 데이터를 수집, 구성, 분석하는 데 필요한 툴을 통합합니다. 분산된 환경 전반에서 데이터를 동적이면서도 지능적으로 조직하여 데이터 소비자가 즉각적으로 사용할 수 있는 정보 네트워크를 구축합니다. IBM Cloud Pak for Data는 IBM Cloud®에서 사내 구축형 서비스로 배포하거나 공급업체 클라우드에 구축할 수 있습니다.
DataStage는 IBM Cloud Pak for Data 소프트웨어 라이센스의 추가 기능으로 제공되거나 IBM Cloud Pak for Data as a Service를 통해 사용할 수 있습니다.
특징
데이터 및 AI 서비스의 전체 스펙트럼
IBM Cloud Pak for Data 플랫폼에서 데이터를 관리하고 라이프사이클을 분석합니다.
서비스에는 데이터 사이언스, 이벤트 메시징, 데이터 가상화 , 데이터 웨어하우징이 포함됩니다.
병렬 엔진 및 자동 로드 밸런싱
처리량을 최대화하는 동종 최고의 병렬 엔진과 로드 밸런싱을 통해 ETL 성능을 최적화함으로써 데이터를 규모에 따라 처리합니다.
메타데이터를 통한 정책 기반 데이터 액세스 지원
IBM Watson® Knowledge Catalog를 사용하는 메타데이터 교환을 통해 중요한 데이터를 보호합니다. 데이터 계보를 사용하여 변환 및 통합 과정 중의 데이터 플로우를 확인합니다.
제작용 파이프라인 자동 공급
개발에서 테스트, 제작에 이르기까지 지속적인 통합/연속 제공(CI/CD) 작업 파이프라인을 자동화함으로써 개발 비용을 절감합니다.
사전 구축된 광범위한 커넥터 및 스테이지 세트
사전 구축된 연결성과 스테이지를 사용하여 여러 클라우드 소스와 데이터 웨어하우스(예: IBM Netezza® 및 IBM Db2® Warehouse on Cloud) 간에 데이터를 이동할 수 있습니다.
IBM DataStage 플로우 설계자
사용자 친화적인 인터페이스의 머신 러닝 지원 설계를 통해 개발자의 생산성을 높이고 개발 비용을 절감합니다.
전송 중인 데이터 품질
IBM InfoSphere® QualityStage®를 사용하여 신뢰할 수 있는 데이터를 제공함으로써 대상 환경에서 데이터가 수집되는 동안 자동으로 품질 문제를 해결합니다.
자동 장애 감지
인프라 관리 작업을 65%~85%²로 줄여 사용자가 더 중요한 작업에 집중할 수 있도록 지원합니다.
분산 데이터 처리
데이터 주권을 유지하고 비용을 최소화하면서 데이터가 상주하는 모든 곳에서 원격으로 클라우드 런타임을 실행합니다.
배치 옵션
서비스형
IBM Cloud에서 완벽하게 관리되는 통합 서비스 세트의 구독 모델인 IBM Cloud Pak for Data as a Service에서 IBM DataStage의 일부로 제공되는 모든 최신 기능에 액세스할 수 있습니다.
사내 구축형 또는 기타 클라우드
사내 구축형 또는 기타 클라우드에서 워크로드를 실행하려면 IBM Cloud Pak for Data as a Service의 IBM DataStage에 IBM DataStage Enterprise (또는 IBM DataStage Enterprise Plus)를 추가합니다.
사내 구축형
IBM Cloud Pak for Data as a Service에서 IBM DataStage를 사용하여 사내 구축형으로 기본 ETL 작업을 실행합니다. 병렬 처리 및 엔터프라이즈 연결을 통해 확장 가능한 플랫폼을 제공합니다.
어디에서나 AI기반 데이터를 제공하는 DataStage for IBM Cloud Pak for Data로 기존 기능을 현대화할 수 있습니다.
제품 이미지
데이터 파이프라인 구축

데이터 파이프라인 구축
사용자 친화적인 인터페이스를 갖춘 노코드/로우 코드 환경에서 데이터 통합 작업을 효율적으로 수행합니다. 사전 구축된 수백 개의 기능과 커넥터는 개발 시간을 단축하고 설계 및 배치의 일관성을 개선합니다.
자동 워크로드 밸런싱

자동 워크로드 밸런싱
DataStage는 상당한 양의 데이터 볼륨을 처리할 수 있는 확장성이 뛰어난 동종 최고의 병렬 엔진을 갖추고 있습니다. 내장된 자동 워크로드 밸런싱은 컴퓨팅 리소스에 대한 고성능의 탄력적 관리를 제공합니다.
연결, 통합

플랫폼 연결 및 통합 지점
데이터 가상화, 거버넌스, 비즈니스 인텔리전스, 데이터 사이언스 서비스를 비롯해, IBM Cloud Pak for Data의 타제품과 공유 플랫폼을 연결하고 통합함으로써 DataOps를 가속화합니다.
고객의 소리
SaaS 및 IBM Cloud Pak for Data의 DataStage는 IBM의 데이터 패브릭 에코시스템에 원활하게 통합될 수 있어, 최신 하이브리드 클라우드 아키텍처에서 데이터를 이동 및 변환하는 최고의 유연성을 제공합니다.
케빈 번리 (Kevin Burnley),
유럽·중동·아프리카 테크니컬 세일즈 디렉터
Mastech InfoTrellis
DataStage for IBM Cloud Pak for Data와의 협업을 통해 개방적이고 명료한 방법론을 사용함으로써 고급 분석 혁신을 이루어냈습니다.
필립 블랙 (Philip Black),
TechD 고객 서비스 담당 부사장
관련 제품
IBM InfoSphere® Information Server Enterprise Edition
양질의 데이터를 정리, 모니터링, 변환, 제공할 수 있도록 지원하는 엔드투엔드 데이터 통합 플랫폼
IBM InfoSphere® Information Server for Data Integration
모든 스타일의 데이터를 추출 및 변환하고 모든 시스템에 데이터를 로드하는 툴
IBM DataStage로 시작하기
¹ Forrester, New Technology: IBM Cloud Pak For Data의 예상 총 경제효과(PDF, 1.3 MB), 2020년 2월