데이터의 속박에서 벗어나 새로운 비즈니스 인사이트를 개발

디지털 혁신의 가속화를 모색 중인 회사들은 효과적인 의사결정에 사용 가능한 방대한 양의 데이터를 분석하고 활용해야 합니다. 확장 가능한 지속적 클라우드 스토리지의 클라우드 기반 분석을 활용하여 회사들은 자사 데이터의 속박을 제거하고 새 비즈니스 인사이트를 개발할 수 있습니다. IBM Cloud™ Object Storage를 사용하여 조직은 중앙 집중식 데이터 저장소를 구축할 수 있으며, 모든 소스에서 모든 유형의 거의 무제한의 데이터를 수집하고 저장할 수 있게 해주는 비용 효율적인 확장형 스토리지를 활용할 수 있습니다. 데이터는 고유 형식을 유지하며 IBM Cloud Object Storage 안팎으로의 이동이 필요하지 않습니다. 오히려 IBM Cloud Object Storage 기반 데이터 레이크는 분석용 지속적 데이터 저장소입니다. IBM Cloud Object Storage는 IBM Analytics Engine, IBM Watson® Studio, IBM Cloud SQL Query 및 기타 IBM Cloud 서비스와 통합되어 기존 솔루션의 확장성, 보안 및 비용 효율성을 능가하는 셀프 서비스 데이터 분석과 비즈니스 인텔리전스 솔루션을 제공합니다.

일반 유스케이스

HDFS 클러스터에서 IBM Cloud Object Storage로 데이터 이동

Hadoop에서 IBM Cloud Object Storage로 대량의 데이터를 효율적으로 마이그레이션하여 고비용 Hadoop 클러스터의 공간을 확보하세요.

원본 위치 데이터 조회

저장 데이터을 직접 분석할 수 있게 해주는 즉시 쿼리 기능으로 다양한 빅데이터 분석 유스 케이스에 이용할 작업공간으로 사용하세요.

오브젝트 스토리지에 저장된 데이터에 대해 직접 Apache Spark Analytics 수행

최적화되어 연결된 Apache Spark에서 분석을 위해 확장 가능한 저비용 지속적 스토리지 계층으로 사용하세요.

AI 트레이닝 모델의 데이터 저장

비즈니스에 AI를 도입하는 데 필요한 머신 러닝과 딥 러닝 워크플로우를 가속화하세요. 단일 통합 환경에서 AI 모델을 구축/트레이닝하고 데이터를 준비/분석하세요.

IoT 파이프라인을 구축하고 분석

방대한 IoT 데이터를 저비용으로 저장하세요. 분석 프레임워크는 데이터에 직접 액세스할 수 있습니다. 데이터 파이프라인을 손쉽게 설치하고 관리하여 분석 준비된 데이터를 생성하세요.

주요 기능

HDFS 클러스터에서 IBM Cloud Object Storage로 손쉽게 데이터 이동

IBM Big Replicate로 고비용 Hadoop 클러스터의 공간을 확보하여 Hadoop 데이터 클러스터와 IBM Cloud Object Storage 간에 효율적으로 데이터를 이동하고 데이터 일관성이 보장된 연속 복제를 제공하세요. 대량의 데이터를 Hadoop에서 IBM Cloud Object Storage로 마이그레이션하는 오픈 소스인 IBM Cloud Object Storage Distributed Copy(DistCp)를 사용할 수도 있습니다.

원본 위치 데이터 조회

IBM Cloud SQL Query는 개발자가 ANSI SQL문을 사용하여 여러 형식의 여러 파일 간에 저장된 데이터를 분석하고 변환할 수 있도록 해주는 종합 관리 서비스입니다. 이 서비스는 데이터의 사전 이동이나 변환 없이도 IBM Cloud Object Storage에 저장된 CSV, Parquet, JSON 및 ORC 파일 간에 조회할 수 있습니다. IBM Cloud SQL Query는 데이터의 낮은 지연, 임시 분석에 최적화된 오픈 소스의 빠른 확장 가능 인메모리 데이터 처리 엔진인 Apache Spark를 사용합니다.

Apache Spark 분석 수행

IBM Cloud Object Storage는 여러 소스의 데이터를 저장하고 이로부터 빠르게 인사이트를 얻기 위해 Apache Spark 서비스에 최적화된 연결을 제공합니다. Spark 분석에서 IBM Cloud Object Storage를 사용하면 컴퓨팅과 스토리지 티어를 완전히 분리할 수 있으며, 사용자가 오브젝트 스토리지 계층에 데이터를 저장하고 필요 시에 컴퓨팅 노드의 클러스터를 스핀업할 수 있습니다. 이 모델에서는 컴퓨팅과 스토리지를 독립적으로 확장(하고 구매)할 수 있으므로 실행 중인 작업이 없으면 컴퓨팅 비용을 0으로 낮출 수 있습니다. IBM Cloud Object Storage의 지속적 인사이트로 향후 분석을 위해 데이터를 재수집할 수 있습니다.

Watson 머신 러닝과 딥 러닝 워크플로우의 데이터 저장

Watson Studio는 데이터를 분석하고 이를 사용하여 AI 모델을 구축하고 배치할 수 있도록 최상의 오픈 소스와 IBM 도구를 기반으로 구축된 하이브리드 클라우드 플랫폼입니다. IBM Cloud Object Storage는 Watson Studio on IBM Cloud와 통합되어 있습니다. Watson Studio에서 머신 러닝 프로젝트가 작성되면, 머신 러닝과 딥 러닝 모델의 트레이닝과 배치에 필요한 데이터의 처리를 가속화할 수 있도록 IBM Cloud Object Storage의 인스턴스가 자동으로 작성됩니다.

지능형 데이터 검색과 제어 수행

일단 데이터가 IBM Cloud Object Storage에 있으면, 데이터를 분류하고 보호하는 데이터 프로파일러를 사용하여 Watson Knowledge Catalog에서 데이터 관리가 가능하며, 개인식별정보나 기타 개인정보 등의 데이터를 보다 효율적으로 관리할 수 있습니다. 메타데이터 카탈로그를 구현함으로써 Watson Knowledge Catalog는 데이터가 무엇인지와 어떤 데이터 정책을 이에 적용할 수 있는지를 기본적으로 파악한 후 해당 정책을 구현합니다. Watson Knowledge Catalog에는 지능형 데이터 검색이 포함되어 있으며, 이는 기업 전체의 정보를 '검색'에서 '활용'으로 완벽하게 전환할 수 있도록 Watson Studio와 통합되어 있습니다.

IoT 데이터 파이프라인을 손쉽게 구축하고 분석

오브젝트 스토리지는 방대한 양의 IoT 데이터를 저비용으로 저장하고 분석 프레임워크가 이 데이터를 직접 이용할 수 있도록 하는 데 완벽하게 적합합니다. IBM Cloud는 각각 IBM Events Streams 및 Apache Spark as a Service를 포함하는 Apache Kafka 및 Apache Spark 기반 서비스를 제공합니다. IBM Event Streams에서 오브젝트 스토리지로의 데이터 파이프라인을 손쉽게 설정하고 관리함으로써 Apache Spark as a Service를 사용하여 Watson이 직접 분석할 수 있는 분석 준비된 데이터를 생성할 수 있습니다. 또한 Watson IoT Platform을 사용하여 IoT 디바이스 데이터를 캡처하고 이를 IBM Event Streams에 전송할 수 있습니다.

성공 사례

비용 효율적이고 안전하며 항상 사용 가능한 데이터

손쉬운 데이터 콜렉션과 수집

IBM에서는 네트워크 상의 빠른 데이터 전송을 위해, 기본적으로 통합된 Aspera 고속 데이터 전송 기능을 포함하여, 데이터를 IBM Cloud Object Storage로 가져오는 다양한 방법을 제공합니다. 또한 IBM Event Streams 등의 서비스를 사용하면 실시간 데이터 수집이 용이합니다. IBM Big Replicate는 Hadoop 데이터 클러스터와 IBM Cloud Object Storage 간에 효율적으로 데이터를 이동하고 연속 복제를 제공할 수 있으며, 오픈 소스 도구인 IBM Cloud Object Storage Distributed Copy(DistCp)를 사용하여 대량의 데이터를 Hadoop에서 IBM Cloud Object Storage로 마이그레이션할 수 있습니다.

비용 효율성과 유연성

IBM Cloud Object Storage를 사용하여 조직은 중앙 집중식 데이터 저장소를 구축할 수 있으며, 모든 소스에서 모든 유형의 사실상 무제한의 데이터를 수집하고 저장할 수 있도록 하는 비용 효율적인 확장 가능 스토리지를 활용할 수 있습니다. 데이터는 고유 형식으로 저장되며 사전 변환이 필요하지 않습니다.

언제나 사용 가능

IBM Cloud Object Storage는 조직의 데이터 사이언티스트, 비즈니스 분석가와 앱 개발자가 타의 추종을 불허하는 가용성으로 데이터를 손쉽게 사용할 수 있도록 만들어졌습니다. 이는 99.999999999%(무려 11개의 9)의 내구성을 제공하도록 설계되었으며, 데이터가 암호화되어 여러 IBM 데이터 센터 시설의 여러 디바이스 간에 분산되는 특허 기술로 가용성이 보장됩니다.

높은 보안성

IBM Cloud Object Storage는 서버측 자동 암호화를 사용하여 데이터를 보호하며, IBM Key Protect(키 관리 시스템)에서 관리하는 키의 암호화 옵션이나 사용자가 관리하는 키의 암호화 옵션을 제공합니다. IBM Identity and Access Management와의 통합은 사용자 역할에 따라 데이터 버킷 레벨에 이르기까지 세분화된 액세스 제어를 보장합니다.