지금 작성 중인 것이 데이터 레이크인가요, 또는 데이터 늪인가요?

Hadoop이나 Hortonworks 데이터 플랫폼에 데이터를 보관하는 것만으로는 분석 작업 속도가 빨라지지 않습니다. 적절한 관리나 품질이 보장되지 않으면 데이터 레이크가 순식간에 관리할 수 없는 데이터 늪으로 변해버릴 수 있습니다. 데이터 사용자는 자신에게 필요한 데이터가 이러한 데이터 늪에 있다는 것은 알지만, 명확한 데이터 거버넌스 전략이 없이는 그러한 데이터를 찾거나, 신뢰하거나, 사용할 수 없습니다.
관리형 데이터 레이크에는 찾고, 접근하고, 관리하며, 보호하기가 용이한 정형 소스 및 비정형 소스와 관련된 데이터가 잘 정리된 상태로 보관되어 있습니다. 데이터가 보관된 플랫폼은 강력한 보안을 제공하며 신뢰할 수 있습니다. 데이터 레이크에 수집되는 데이터는 적시에 적절한 방법으로 정리, 분류 및 보호되며, 데이터 수집을 제어하여 신뢰할 수 있는 정보 자산과 메타데이터로 데이터 레이크를 채우고 문서화합니다.

이점

데이터 사용자의 권한 강화
조직의 모든 데이터 이용자가 신뢰성 있고 비즈니스에 적합한 데이터에 셀프 서비스 방식으로 액세스하여 데이터 기반의 스마트한 의사결정을 할 수 있게 지원합니다.

 

증가하는 데이터 및 비용 관리
데이터가 증가하는 경우 유형 및 구조와 관계없이 데이터를 확장하고 데이터 레이크에 수집할 수 있습니다. 기존 스토리지에서 이동하여 비용을 절감하세요.

데이터 준비 및 전환 시간 단축
데이터 레이크로 정형 데이터와 비정형 데이터를 이동하여 데이터 준비와 전환에 드는 시간과 리소스를 절약할 수 있습니다. IT 팀이 혁신에 집중할 수 있도록 지원하세요.

데이터 보안 및 컴플라이언스 준수 구현
데이터 레이크에 보관된 데이터를 제어하여 더 유리한 위치에서 더욱 엄격해지는 규정과 컴플라이언스 준수 요구사항을 충족시킬 수 있습니다.

민첩성을 높이고 가치 실현 시간 단축
더 빠른 속도로 신뢰할 수 있는 의사결정을 내리세요. 셀프 서비스 방식으로 데이터에 액세스할 수 있게 하여 데이터 사용자의 권한을 강화하고 상세한 분석을 실행하여 더 나은 결과를 얻으세요.

 

기능

수집된 데이터
기업 데이터는 여러 시스템과 저장소에 저장됩니다. 연속된 실시간 데이터가 각각의 시스템에서 데이터 레이크로 이동하도록 해야 합니다. 모든 데이터 소스에서 정형 데이터와 비정형 데이터를 수집하여 데이터 레이크의 데이터를 최신 상태로 유지하세요.

시작하기

→ IBM InfoSphere® DataStage

→ IBM InfoSphere Data Replication

→ IBM BigInsights® BigIntegrate

→ IBM BigInsights BigReplicate

데이터 수집을 나타내는 아이콘

데이터 카탈로그화
엔터프라이즈 데이터 카탈로그를 사용하여 모든 정형/비정형 엔터프라이즈 정보 자산의 인벤토리를 용이하게 작성할 수 있습니다. 지능형 메타데이터 카탈로그를 사용하여 데이터를 비즈니스 용어로 정의하고, 데이터의 계보를 추적하고, 시각적으로 데이터를 탐색함으로써 데이터 레이크의 데이터를 더 잘 이해할 수 있습니다.
시작하기

→ IBM InfoSphere Information Governance Catalog

→ 산업 모델

→ IBM Watson® Knowledge Catalog

데이터 카탈로그화를 나타내는 아이콘

데이터 제어
거버넌스 정책을 통해 데이터의 무결성 및 신뢰성을 보호하세요. 잘 정리되고 관리된 데이터 레이크를 구축하여 규제를 준수하고 감사에 적합한 상태로 데이터를 유지하세요.
시작하기

→ IBM InfoSphere Information Governance Catalog 

→ 산업 모델

데이터 제어 기능을 나타내는 아이콘

셀프 서비스 방식의 데이터 액세스 제공
데이터 이용자가 셀프 서비스 방식으로 데이터에 접근할 수 없다면 데이터 레이크를 구축해도 소용이 없습니다. 데이터 과학자, 데이터 관리자, 거버넌스 팀과 컴플라이언스 준수 팀에 신뢰할 수 있는 고품질의 데이터를 제공하고 조직의 분석 관련 목표를 달성할 수 있게 그러한 데이터 이용자의 권한을 강화하세요. IBM 분석 솔루션을 사용하여 데이터 레이크에서 관리되는 데이터를 더 편리하게 사용하세요.
시작하기

→ IBM Watson Knowledge Catalog

→ IBM Cognos® Analytics 

→ IBM Data Science

셀프 서비스 방식의 데이터 액세스 기능 제공을 나타내는 아이콘

리소스

산업 모델과 통합된 거버넌스를 통한 데이터 레이크 관리
관리된 데이터 레이크를 효율적으로 사용하는 데 있어 비즈니스 어휘와 메타데이터 관리가 필수적인 이유에 대해 알아보세요.

 

데이터 레이크 구축을 시작하시겠습니까?

데이터 레이크 구축 작업을 시작하고 있다면 이 Little Bee 서적이 유용할 수 있습니다.

지금 IBM Industry Models로 시작하기
자체 관리 데이터 레이크를 작성할 때 적용되는 산업 고유의 비즈니스 어휘와 컴플라이언스 준수에 대해 자세히 알아보세요.

데이터 레이크에서 데이터 중심적인 조직을 만들기까지 계속되는 여정

ING가 데이터 레이크에서 데이터 중심적인 조직을 구축하기까지의 여정에 대해 알아보세요.