IBM® DataStage®는 데이터를 이동하고 변환하는 작업을 설계, 개발, 실행할 수 있도록 지원하는 업계 최고의 데이터 통합 툴입니다. 기본적으로 추출, 변환, 로드(ETL) 패턴과 추출, 로드, 변환(ELT) 패턴을 지원합니다. 소프트웨어의 기본 버전은 온프레미스 배포로 사용 가능하지만, DataStage for IBM Cloud Pak for Data®로 업그레이드하면 데이터 통합 시간과 비용을 절감할 수 있을 뿐만 아니라 하이브리드 또는 멀티클라우드 환경에서 강력한 자동 통합 기능을 경험할 수 있습니다.
AI 구현을 위한 신뢰할 수 있는 데이터 기반 구축을 시작하세요.IBM 데이터 통합 툴 중 하나인 DataStage와 IBM의 차세대 데이터 저장소인 watsonx.data가 실제로 작동하는 모습을 보려면 참여하세요.
IBM Cloud Pak for Data란 무엇인가요? Red Hat® OpenShift® 컨테이너 오케스트레이션 플랫폼을 기반으로 구축된 이 클라우드 네이티브 인사이트 플랫폼은 데이터 패브릭 아키텍처 내에서 데이터를 수집, 구성, 분석하는 데 필요한 툴을 통합합니다. 분산된 환경 전반에서 데이터를 동적이면서도 지능적으로 조직하여 데이터 소비자가 즉각적으로 사용할 수 있는 정보 네트워크를 구축합니다. IBM Cloud Pak for Data는 IBM Cloud®에서 온프레미스 서비스로 배포하거나 공급업체 클라우드에 구축할 수 있습니다.
DataStage는 IBM Cloud Pak for Data 소프트웨어 라이센스의 추가 기능으로 제공되거나 IBM Cloud Pak for Data as a Service를 통해 사용할 수 있습니다.
SQL 푸시다운을 통해 대량 데이터를 추출, 로드 및 변환합니다.
Cloud Pak for Data 4.7이 출시되었습니다.새로운 기능 알아보기
aaS 출시에 대해 알아보기
제품 문서 보기
2022년 Gartner® Magic Quadrant™ 데이터 통합 툴 부문 등록
워크로드 밸런싱 및 병렬 엔진을 통해 워크로드 실행 속도 30% 향상
기존 데이터에 데이터 통합 기능 제공 작업 설계 후 데이터가 상주하는 곳으로 런타임 이동
기존 DataStage 투자를 보존하면서 기능을 확장합니다.
IBM Cloud Pak for Data의 거버넌스 기능을 사용합니다.
IBM Cloud Pak for Data 플랫폼에서 데이터를 관리하고 라이프사이클을 분석합니다.서비스에는 데이터 사이언스, 이벤트 메시징, 데이터 가상화 및 데이터 웨어하우징이 포함됩니다.
처리량을 최대화하는 동종 최고의 병렬 엔진과 로드 밸런싱을 통해 ETL 성능을 최적화함으로써 데이터를 규모에 따라 처리합니다.
IBM Watson® Knowledge Catalog를 사용하는 메타데이터 교환을 통해 중요한 데이터를 보호합니다. 데이터 계보를 사용하여 변환 및 통합 과정 중의 데이터 플로우를 확인합니다.
개발에서 테스트, 제작에 이르기까지 지속적인 통합/연속 제공(CI/CD) 작업 파이프라인을 자동화함으로써 개발 비용을 절감합니다.
사전 구축된 연결성과 스테이지를 사용하여 여러 클라우드 소스와 데이터 웨어하우스(예: IBM Netezza® 및 IBM Db2® Warehouse on Cloud) 간에 데이터를 이동할 수 있습니다.
사용자 친화적인 인터페이스의 머신 러닝 지원 설계를 통해 개발자의 생산성을 높이고 개발 비용을 절감합니다.
IBM InfoSphere® QualityStage®를 사용하여 신뢰할 수 있는 데이터를 제공함으로써 대상 환경에서 데이터가 수집되는 동안 자동으로 품질 문제를 해결합니다.
인프라 관리 작업을 65%~85%²로 줄여 사용자가 더 중요한 작업에 집중할 수 있도록 지원합니다.
데이터 주권을 유지하고 비용을 최소화하면서 데이터가 상주하는 모든 곳에서 원격으로 클라우드 런타임을 실행합니다.
IBM Cloud에서 완벽하게 관리되는 통합 서비스 세트의 구독 모델인 IBM Cloud Pak for Data as a Service에서 IBM DataStage의 일부로 제공되는 모든 최신 기능에 액세스할 수 있습니다.
온프헤미스 또는 기타 클라우드에서 워크로드를 실행하려면 IBM Cloud Pak for Data as a Service의 IBM DataStage에 IBM DataStage Enterprise(또는 IBM DataStage Enterprise Plus)를 추가합니다.
IBM Cloud Pak for Data as a Service에서 IBM DataStage를 사용하여 온프레미스로 기본 ETL 작업을 실행합니다. 병렬 처리 및 엔터프라이즈 연결을 통해 확장 가능한 플랫폼을 제공합니다.
모든 클라우드에서 실행되는 확장 가능한 개방형 데이터 및 AI 플랫폼입니다. 모두에게 신뢰할 수 있는 데이터를 제공하는 솔루션을 확인해 보세요.
양질의 데이터를 정리, 모니터링, 변환, 제공할 수 있도록 지원하는 엔드투엔드 데이터 통합 플랫폼
모든 스타일의 데이터를 추출 및 변환하고 모든 시스템에 데이터를 로드하는 툴
1 IBM Cloud Pak for Data의 IBM DataStage를 사용한 워크로드 밸런싱(PDF), 2020년 11월
2 Forrester, 신기술: IBM Cloud Pak For Data의 예상 총 경제효과(PDF), 2020년 2월