데이터의 속박에서 벗어나 새로운 비즈니스 인사이트를 개발

IBM Cloud® Object Storage를 사용하여 기업들은 중앙 집중식 데이터 저장소를 구축함으로써 어떤 소스에서든 모든 유형의 거의 무제한 용량의 데이터를 수집하고 저장할 수 있도록 해주는 비용 효과적인 확장형 스토리지를 활용할 수 있습니다. 데이터는 고유 형식을 유지하며 IBM Cloud Object Storage 안팎으로의 이동이 필요하지 않습니다. 오히려 IBM Cloud Object Storage 기반 데이터 레이크는 분석용 지속적 데이터 저장소입니다.
IBM Cloud Object Storage는 IBM Analytics Engine, IBM Watson® Studio, IBM Cloud SQL Query 및 기타 IBM Cloud 서비스와 통합되어 기존 솔루션의 확장성, 보안 및 비용 효율성을 능가하는 셀프 서비스 데이터 분석과 비즈니스 인텔리전스 솔루션을 제공합니다.

일반 유스케이스

HDFS 클러스터에서 IBM Cloud Object Storage로 데이터 이동

Hadoop에서 IBM Cloud Object Storage로 대량의 데이터를 효율적으로 마이그레이션하여 고비용 Hadoop 클러스터의 공간을 확보하세요.

원본 위치 데이터 조회

저장 데이터을 직접 분석할 수 있게 해주는 즉시 쿼리 기능으로 다양한 빅데이터 분석 유스케이스에 이용할 작업공간으로 사용하세요.

오브젝트 스토리지에 저장된 데이터에 대해 직접 Apache Spark Analytics 수행

최적화되어 연결된 Apache Spark에서 분석을 위해 확장 가능한 저비용 지속적 스토리지 계층으로 사용하세요.

AI 트레이닝 모델의 데이터 저장

비즈니스에 AI를 도입하는 데 필요한 머신 러닝과 딥 러닝 워크플로우를 가속화하세요. 단일 통합 환경에서 AI 모델을 구축/트레이닝하고 데이터를 준비/분석하세요.

IoT 파이프라인을 구축하고 분석

방대한 양의 IoT 데이터를 낮은 비용으로 저장하고 분석 프레임워크가 해당 데이터에 직접 액세스할 수 있도록 허용하세요. 데이터 파이프라인을 손쉽게 설치하고 관리하여 분석 준비된 데이터를 생성하세요.

고객 성공 사례: Skåne University Hospital

안정적이고 비용 효율적이며 글로벌하게 사용 가능하고 가장 중요하게는 거의 무제한의 용량을 제공하므로, Skåne University Hospital은 IBM Cloud Object Storage를 사용하여 가급적 많은 외과 수술 정보를 수집하고 이를 보관할 수 있습니다.

주요 기능

HDFS 클러스터에서 IBM Cloud Object Storage로 손쉽게 데이터 이동

데이터 일관성이 보장된 지속적 복제를 제공할 수 있도록 Hadoop 데이터 클러스터와 IBM Cloud Object Storage 간에 효율적으로 데이터를 이동하기 위해 IBM Big Replicate를 사용하여 고가의 Hadoop 클러스터에서 공간을 확보합니다. Hadoop에서 IBM Cloud Object Storage로 대량의 데이터를 마이그레이션하기 위한 오픈 소스 툴인 IBM Cloud Object Storage Distributed Copy(DistCp)를 사용할 수도 있습니다.

원본 위치 데이터 조회

IBM Cloud SQL Query는 개발자가 ANSI SQL문을 사용하여 다양한 형식의 여러 파일들 간에 저장된 데이터를 분석하고 변환할 수 있도록 해주는 종합 관리 서비스입니다. 이 서비스는 사전에 데이터의 이동이나 변환 없이도 IBM Cloud Object Storage에 저장된 CSV, Parquet, JSON 및 ORC 파일들 간에 조회할 수 있습니다. IBM Cloud SQL Query는 데이터의 저지연, 임시 분석을 위해 최적화된 오픈 소스의 빠른 확장형 인메모리 데이터 처리 엔진인 Apache Spark를 사용합니다.

Apache Spark 분석 수행

IBM Cloud Object Storage는 다양한 소스의 데이터를 저장하고 빠르게 인사이트를 얻을 수 있도록 Apache Spark 서비스에 대한 최적화된 연결을 제공합니다. Spark 분석에서 IBM Cloud Object Storage를 사용하면 컴퓨팅과 스토리지 티어의 완벽한 디커플링이 가능하므로, 사용자는 오브젝트 스토리지 계층에 데이터를 저장할 수 있으며 사용자 자신에 필요할 때 컴퓨팅 노드의 클러스터를 정확하게 스핀업할 수 있습니다. 이 모델을 사용하여 컴퓨팅과 스토리지를 확장하고 이를 개별적으로 구매할 수 있으므로 실행 중인 작업이 없는 경우 컴퓨팅 비용을 0으로 낮출 수 있습니다. 인사이트는 IBM Cloud Object Storage에 남아 있으며, 데이터는 향후 분석을 위해 다시 수집될 수 있습니다.

Watson 머신 러닝과 딥 러닝 워크플로우의 데이터 저장

IBM Watson Studio는 데이터를 분석하고 이를 사용하여 AI 모델을 구축하고 배치할 수 있도록 최상의 오픈 소스와 IBM 툴을 기반으로 구축된 하이브리드 클라우드 플랫폼입니다. IBM Cloud Object Storage는 IBM Watson Studio on IBM Cloud와 통합되어 있습니다. 머신 러닝 프로젝트가 IBM Watson Studio에서 구축된 경우에는 머신 러닝과 딥 러닝 모델의 트레이닝과 배치에 필요한 데이터를 더욱 빠르게 처리할 수 있도록 IBM Cloud Object Storage의 인스턴스가 자동으로 작성됩니다.

지능형 데이터 검색과 제어 수행

일단 데이터가 IBM Cloud Object Storage에 있으면, 거버넌스의 개선을 위해 데이터를 세그먼트화하고 보호하는 데이터 프로파일러를 사용하여 IBM Watson Knowledge Catalog를 통해 이를 통제할 수 있습니다. 메타데이터 카탈로그를 구현함으로써, IBM Watson Knowledge Catalog는 해당 데이터가 무엇인지와 어떤 정책이 이에 적용 가능한지에 대해 기본적으로 파악한 후 이를 구현합니다. IBM Watson Knowledge Catalog에는 지능형 데이터 검색이 포함되어 있으며, 이는 IBM Watson Studio와 통합됨으로써 기업에서 정보의 '검색'으로부터 정보의 '활용'으로 완벽하게 전환할 수 있도록 해줍니다.

IoT 데이터 파이프라인을 손쉽게 구축하고 분석

오브젝트 스토리지는 저렴한 비용으로 방대한 양의 IoT 데이터를 저장함은 물론 분석 프레임워크에서 이를 바로 이용할 수 있도록 설계되어 있습니다. IBM Cloud는 각각 IBM Events Streams 및 Apache Spark as a Service를 포함하는 Apache Kafka 및 Apache Spark 기반 서비스를 제공합니다. IBM Event Streams에서 오브젝트 스토리지로의 데이터 파이프라인을 손쉽게 설정하고 관리함으로써 Apache Spark as a Service를 사용하여 IBM Watson이 직접 분석할 수 있는 분석 준비된 데이터를 생성할 수 있습니다. 또한 IBM Watson IoT Platform을 사용하여 IoT 디바이스 데이터를 캡처한 후 이를 IBM Event Streams로 전송할 수도 있습니다.

사례연구

비용 효율적이고 안전하며 항상 사용 가능한 데이터

손쉬운 데이터 콜렉션과 수집

IBM에서는 네트워크 상의 빠른 데이터 전송을 위해, 기본적으로 통합된 Aspera® 고속 데이터 전송 기능을 포함하여, 데이터를 IBM Cloud Object Storage로 가져오는 다양한 방법을 제공합니다. 또한 IBM Event Streams 등의 서비스를 사용하면 실시간 데이터 수집이 용이합니다. IBM Big Replicate는 Hadoop 데이터 클러스터와 IBM Cloud Object Storage 간에 효율적으로 데이터를 이동하고 연속 복제를 제공할 수 있으며, 오픈 소스 툴인 IBM Cloud Object Storage Distributed Copy(DistCp)를 사용하여 대량의 데이터를 Hadoop에서 IBM Cloud Object Storage로 마이그레이션할 수 있습니다.

비용 효율성과 유연성

IBM Cloud Object Storage를 사용하여 기업들은 중앙집중식 데이터 저장소를 구축함으로써 어떤 소스에서든 모든 유형의 사실상 무제한 용량의 데이터를 수집하고 저장할 수 있도록 해주는 가성비 높은 확장형 스토리지를 활용할 수 있습니다. 데이터는 고유 형식으로 저장되며 사전 변환이 필요하지 않습니다.

언제나 사용 가능

IBM Cloud Object Storage는 기업의 데이터 사이언티스트, 비즈니스 분석가 및 앱 개발자가 실제로 타의 추종을 불허하는 가용성을 통해 데이터를 손쉽게 이용할 수 있도록 지원합니다. 이는 99.999999999% 내구성을 제공하도록 설계되었으며*, 데이터가 암호화되어 여러 IBM 데이터 센터 시설의 여러 디바이스들 간에 분산되는 특허 기술을 통해 가용성이 보장됩니다.

*IBM 내부의 고객 데이터 분석에 근거합니다. 개별적인 고객 결과는 다양할 수 있습니다.

높은 보안성

IBM Cloud Object Storage는 자동 서버측 암호화를 사용하여 데이터를 보호하며, 사용자가 관리하는 키를 통한 암호화 또는 IBM Key Protect 키 관리 시스템에서 관리하는 키를 통한 암호화 옵션을 제공합니다. IBM Identity and Access Management와의 통합은 사용자 역할에 따라 데이터 버킷 레벨에 이르기까지 세분화된 액세스 제어를 보장합니다.