사후 대응에서 사전 예방형 데이터 품질로 전환

Autodesk + IBM

사무실에서 노트북으로 작업하는 두 사람 (한 명은 서 있고 다른 한 명은 앉아 있음)
사후 대응적인 데이터 인시던트 해결 접근 방식

Steve Gotlieb은 여러 산업 분야에 걸쳐 소프트웨어 제품을 제공하는 다국적 소프트웨어 기업인 Autodesk의 데이터 엔지니어링 및 시각화 부문 선임 관리자입니다. 그는 북미와 싱가포르의 글로벌 데이터 엔지니어링 및 플랫폼 팀을 관리하고 있습니다. 그의 팀은 데이터 기반 솔루션을 지원하는 강력하고 안정적인 데이터 플랫폼을 위해 재사용 가능한 구성 요소를 구축하는 데 중점을 두고 있습니다.

Steve는 자체 데이터 활용 접근 방식을 촉진하고 조직 전체에서 원활한 데이터 통합 및 활용을 가능하게 하는 데이터 메시 개념을 지원하기 위해 데이터 품질을 핵심 플랫폼 구성 요소로 강조하며 팀을 이끌고 있습니다.

Steve의 팀과 Autodesk의 다른 데이터 엔지니어링 팀이 반복적으로 직면한 한 가지 중요한 과제는 데이터 문제가 발생했을 때 너무 늦게 문제를 인식하는 경우가 많다는 것입니다. Steve의 팀은 데이터 누락, 지연되거나 오래된 데이터, null 값이 있는 잘못된 데이터 등의 문제를 해결하기 위해 사후 대응적으로 접근할 수밖에 없었습니다.

팀에서 데이터 문제를 인지할 무렵에는 이미 문제가 발생한 지 한 달 이상이 지나 회사의 귀중한 시간과 리소스가 소모되기 일쑤였습니다.

"이전에 맞춤형 데이터 품질 관리(DQM) 시스템이 있었지만 수동적이고 확장할 수 없는 솔루션이었습니다." Steve는 이렇게 설명합니다. "DQM 시스템은 쿼리 실행을 통해 실행 횟수를 모니터링했지만 데이터 품질 문제를 사전에 탐지하지는 못했습니다. 데이터 문제에 대한 알림은 일관되지 않고 지연되었으며, 명확한 소유권 없이 이메일이나 Slack 메시지를 통해 도착하는 경우가 많았습니다."

우리는 인시던트를 해결할 책임자가 명확하지 않은 상태로 반복적인 데이터 인시던트를 대책 없이 처리하는 데 지쳐 있었습니다. IBM® watsonx.data integration(이전 Databand)을 통해 평균 탐지 시간을 거의 0에 가깝게 줄일 수 있었습니다. Autodesk는 혁신을 장려하는 문화가 있어 이를 비즈니스에 데이터 관측 가능성을 도입할 수 있는 내부 기회로 보았습니다.
Steve Gotlieb 데이터 엔지니어링 및 시각화 부문 선임 관리자 Autodesk
Autodesk, 데이터 품질 프로세스 혁신

Steve와 그의 팀은 사전 예방적인 기능이 강화된 접근 방식의 필요성을 인식하고 데이터 관측성 솔루션을 평가하기 시작했습니다. Monte Carlo Data와 Datafold를 포함한 다양한 옵션을 검토했지만, IBM watsonx.data integration(이전 Databand) 소프트웨어의 데이터 관측 가능성 기능이 특히 두드러졌습니다. Autodesk의 혁신 문화에 힘입어 혁신 스프린트를 구성하여 여러 부서의 팀을 한데 모아 잠재적인 솔루션을 살펴보고 소개했습니다. Autodesk의 수석 데이터 엔지니어인 Preeti Taneja는 이 평가에서 중추적인 역할을 했습니다. 그녀의 팀은 단 1주일 동안 데이터 관측 가능성이 데이터 품질 프로세스를 어떻게 변화시킬 수 있는지를 입증해야 했습니다.

IBM watsonx.data integration(이전 Databand)이 소스 시스템의 변화를 감지하고 워크플로 실패 시 실시간 알림을 제공할 수 있는지 평가했습니다. 결과는 놀라웠습니다. Apache Airflow, dbt, Spark, Snowflake와 같은 Autodesk의 현대적인 데이터 스택과의 원활한 통합과 즉각적인 알림 제공 기능이 강한 인상을 남겼습니다.

“현대적인 데이터 스택과의 손쉬운 통합 덕분에 즉시 가치를 확인할 수 있었습니다.”라고 Preeti는 말합니다. “즉각적인 알림을 받기 시작했을 때, 이는 선제적인 데이터 품질 관리 기능의 진가를 실감하는 순간이었습니다.”

내부 평가 이후 IBM watsonx.data integration(이전 Databand)은 명확한 선택지로 선정되었고, 팀은 해당 솔루션 도입을 추진하게 되었습니다.

Steve의 팀은 다양한 활용 사례 전반에서 데이터 사고를 모니터링하기 위해 IBM watsonx.data integration(이전 Databand)을 매일 사용하고 있으며, 주요 사례는 다음과 같습니다.

  • 탐지 시간 단축: 몇 주, 며칠이 걸리던 탐지 시간이 0으로 단축됩니다.

  • 배치 처리 모니터링: 1,000개 이상의 DAG를 적극적으로 모니터링합니다.

  • 인라인 테스트: 팀은 인라인 테스트 기능을 활용해 데이터 품질 문제를 실시간으로 감지하며, 이는 데이터 무결성을 유지하는 데 매우 중요합니다.

  • 데이터 제품 지원: Autodesk 고객에게 분석 정보와 제품 내 메시지를 제공하는 파이프라인을 지원합니다.

  • 머신러닝(ML) 및 AI 파이프라인 모니터링: ML 및 AI 팀을 지원하는 파이프라인을 모니터링해 데이터 처리 전 과정에서 데이터 품질이 유지되도록 지원합니다.
이상적으로는 Autodesk의 모든 데이터 엔지니어링 팀이 IBM watsonx.data integration(이전 Databand)을 사용하길 원합니다. IBM 팀은 로드맵 요청에 매우 신속하게 대응해 주었으며, 곧 더 많은 팀이 도입할 것이라는 확신을 가지고 있습니다.
Steve Gotlieb 데이터 엔지니어링 및 시각화 부문 선임 관리자 Autodesk
데이터 품질 및 운영 효율성 향상

IBM watsonx.data integration(이전 Databand) 도입은 Autodesk의 데이터 품질 관리에 즉각적이고 중요한 개선을 가져왔습니다.

  1. 탐지 시간 단축:  데이터 품질 문제를 탐지하는 시간을 며칠에서 몇 분으로 줄였습니다. 이러한 즉각적인 탐지를 통해 큰 장애로 이어지기 전에 문제를 해결할 수 있게 되었습니다.

  2. 평균 해결 시간(MTTR) 단축: 데이터 문제 해결에 걸리는 평균 시간이 몇 주에서 며칠로 감소했습니다. 늦게 도착하는 데이터, 스키마 변경 및 파이프라인 오류와 같은 인시던트를 탐지하여 조직 내에서 신뢰성과 효율성을 유지하는 데 도움이 됩니다

  3. 근본 원인 분석: 고급 근본 원인 분석 기능을 제공해 팀이 문제의 원인을 신속하게 파악하고 해결할 수 있도록 합니다

  4. 원활한 통합: Spark, Airflow, dbt Core 파이프라인을 다시 작성할 필요 없이 Autodesk의 기존 플랫폼과 솔루션을 원활하게 통합할 수 있었습니다. 일괄 처리, 내부 파이프라인 및 Snowflake 환경의 저장된 데이터 모니터링이 이러한 통합 범위에 포함됩니다

  5. 비용 절감: Autodesk는 문제를 조기에 감지하고 재실행을 방지함으로써 클라우드 사용 비용을 절감했습니다.

Autodesk는 데이터 품질과 운영 효율성을 개선하는 데 있어 가시적인 성과를 거두었습니다. 기능 요청에 대한 투명한 추적은 파트너십을 더욱 공고히 하여 지속적인 개선과 혁신을 가능하게 했습니다.

Autodesk 로고
Autodesk 소개

전 세계의 디자이너, 엔지니어, 설계자 및 제작자들은 주거용 및 사무용 건물, 자동차, 교량에 이르기까지 다양한 건축물의 설계 및 제작에 Autodesk(ibm.com 외부 링크)를 이용합니다. 매일 사용하는 제품이나 영감을 주는 영화와 게임까지도 Autodesk를 통해 탄생했습니다. Autodesk의 Design and Make Platform은 데이터의 이점을 활용하여 인사이트를 가속화하고 프로세스를 자동화함으로써 주변의 세상을 창조하고 비즈니스와 지구를 위해 더 나은 결과를 제공할 수 있는 기술을 고객에게 제공합니다. 자세한 내용은 autodesk.com을 참조하세요.(ibm.com 외부 링크)

솔루션 컴포넌트 IBM watsonx.data 통합 IBM Databand
IBM watsonx.data integration
 

지속적인 데이터 관측성을 통해 신뢰할 수 있고 안정적인 데이터 제공

  1. 인터랙티브 데모 살펴보기
  2. Gartner 보고서 읽기
법률

© Copyright IBM Corporation 2024. IBM, IBM 로고, Databand는 미국 및/또는 기타 국가에서 사용되는 IBM Corp.의 상표 또는 등록 상표입니다.

이 문서는 최초 발행일을 기준으로 최신 상태로 업데이트된 문서로, 내용은 언제든지 IBM에 의해 변경될 수 있습니다. IBM이 현재 영업 중인 모든 국가에서 모든 제품이 제공되는 것은 아닙니다.

고객 사례는 해당 고객이 IBM 제품을 사용한 방법과 달성한 결과에 대한 예시로서 제공됩니다. 다른 운영 환경에서는 실제 성능, 비용, 절감 또는 그 외 결과가 다르게 나타날 수 있습니다.