사례 연구 Autodesk 사후 대응에서 사전 예방형 데이터 품질로 전환
Autodesk + IBM Databand
사무실에서 노트북으로 작업하는 두 사람 (한 명은 서 있고 다른 한 명은 앉아 있음)
사후 대응적인 데이터 인시던트 해결 접근 방식

Steve Gotlieb은 여러 산업 분야에 걸쳐 소프트웨어 제품을 제공하는 다국적 소프트웨어 기업인 Autodesk의 데이터 엔지니어링 및 시각화 부문 선임 관리자입니다. 그는 북미와 싱가포르의 글로벌 데이터 엔지니어링 및 플랫폼 팀을 관리하고 있습니다. 그의 팀은 데이터 기반 솔루션을 지원하는 강력하고 안정적인 데이터 플랫폼을 위해 재사용 가능한 구성 요소를 구축하는 데 중점을 두고 있습니다.

Steve는 자체 데이터 활용 접근 방식을 촉진하고 조직 전체에서 원활한 데이터 통합 및 활용을 가능하게 하는 데이터 메시 개념을 지원하기 위해 데이터 품질을 핵심 플랫폼 구성 요소로 강조하며 팀을 이끌고 있습니다.

Steve의 팀과 Autodesk의 다른 데이터 엔지니어링 팀이 반복적으로 직면한 한 가지 중요한 과제는 데이터 문제가 발생했을 때 너무 늦게 문제를 인식하는 경우가 많다는 것입니다. Steve의 팀은 데이터 누락, 지연되거나 오래된 데이터, null 값이 있는 잘못된 데이터 등의 문제를 해결하기 위해 사후 대응적으로 접근할 수밖에 없었습니다.

팀에서 데이터 문제를 인지할 무렵에는 이미 문제가 발생한 지 한 달 이상이 지나 회사의 귀중한 시간과 리소스가 소모되기 일쑤였습니다.

"이전에 맞춤형 데이터 품질 관리(DQM) 시스템이 있었지만 수동적이고 확장할 수 없는 솔루션이었습니다." Steve는 이렇게 설명합니다. "DQM 시스템은 쿼리 실행을 통해 실행 횟수를 모니터링했지만 데이터 품질 문제를 사전에 탐지하지는 못했습니다. 데이터 문제에 대한 알림은 일관되지 않고 지연되었으며, 명확한 소유권 없이 이메일이나 Slack 메시지를 통해 도착하는 경우가 많았습니다."

인시던트를 해결할 책임자가 명확하지 않은 상태로 반복적인 데이터 인시던트를 대책 없이 처리하는 데 지쳐 있었습니다. 그러던 중 Databand를 통해 평균 탐지 시간을 거의 0에 가깝게 단축할 수 있었습니다. Autodesk는 이를 계기로 혁신을 촉진하기 위해 Databand의 데이터 관측성을 비즈니스에 도입하기로 했습니다. Steve Gotlieb 데이터 엔지니어링 및 시각화 부문 선임 관리자 Autodesk
Databand를 통한 데이터 품질 프로세스 혁신

Steve와 그의 팀은 사전 예방적인 기능이 강화된 접근 방식의 필요성을 인식하고 데이터 관측성 솔루션을 평가하기 시작했습니다. Monte Carlo Data 및 Datafold를 비롯한 다양한 옵션을 살펴보았지만, IBM® Databand 관측성 소프트웨어가 단연 돋보였습니다. Autodesk의 혁신 문화에 힘입어 혁신 스프린트를 구성하여 여러 부서의 팀을 한데 모아 잠재적인 솔루션을 살펴보고 소개했습니다. Autodesk의 수석 데이터 엔지니어인 Preeti Taneja는 이 평가에서 중추적인 역할을 했습니다. Taneja의 팀이 Databand를 통해 어떻게 데이터 품질 프로세스를 혁신할 수 있는지 증명하는 데 주어진 시간은 단 일주일에 불과했습니다.

이들은 Databand가 소스 시스템의 변경 사항을 탐지하고 워크플로우 오류 발생 시 실시간 알림을 제공할 수 있는지 평가했습니다. 결과는 놀라웠습니다. Databand와 Autodesk의 최신 데이터 스택(예: Apache Airflow, dbt, Spark 및 Snowflake)이 원활하게 통합되고 즉각적인 알림을 제공하는 것은 강한 인상을 남겼습니다.

"Databand를 최신 데이터 스택과 손쉽게 통합하여 즉시 가치를 실현할 수 있었습니다." Preeti는 이와 같이 설명합니다. "즉각적인 알림을 받기 시작했을 때 Databand의 사전 예방적 데이터 품질 기능을 실감하고 놀라지 않을 수 없었습니다."

내부 평가 결과 Databand가 확실한 승자로 떠올랐고, 팀은 이 솔루션의 구현을 추진하기 시작했습니다.

Steve의 팀은 매일 Databand를 사용하여 다음과 같이 다양한 사용 사례에서 데이터 인시던트를 모니터링합니다.

  • 일괄 처리 모니터링: Databand는 생산 일괄 처리를 모니터링하는 데 광범위하게 사용됩니다. 1,000개 이상의 DAG가 Databand로 모니터링됩니다.

  • 인라인 테스트: Databand의 인라인 테스트 기능을 사용하여 데이터 품질 문제를 실시간으로 탐지하며 이 기능은 데이터 무결성을 유지하는 데 중요한 역할을 합니다.

  • 데이터 제품 지원: Databand는 Autodesk 고객에게 인사이트와 제품 내 메시징을 제공하는 파이프라인을 지원합니다.

  • 머신 러닝(ML) 및 AI 파이프라인 모니터링: Databand는 또한 ML 및 AI 팀을 지원하는 파이프라인을 모니터링하여 데이터 처리의 모든 단계에서 데이터 품질을 유지하는 데 기여합니다.
가능하면 모든 Autodesk 데이터 엔지니어링 팀이 Databand를 사용하기를 원합니다. Databand 팀은 로드맵 요청에 매우 신속하게 대응해 왔으며 곧 더 많은 팀이 Databand를 채택하게 될 것이라고 확신합니다. Steve Gotlieb 데이터 엔지니어링 및 시각화 부문 선임 관리자 Autodesk
데이터 품질 및 운영 효율성 향상

Databand 구현으로 Autodesk의 데이터 품질 관리는 즉각적으로 크게 개선되었습니다.

  1. 탐지 시간 단축: Databand는 데이터 품질 문제를 탐지하는 데 걸리는 시간을 며칠 수준에서 몇 분 수준으로 단축했습니다. 이러한 즉각적인 탐지를 통해 대규모 중단이 발생하기 전에 문제를 해결할 수 있었습니다.

  2. 평균 해결 시간(MTTR) 단축: Databand를 사용하면 데이터 문제를 해결하는 데 걸리는 평균 시간이 몇 주에서 며칠 수준으로 단축됩니다. 늦게 도착하는 데이터, 스키마 변경 및 파이프라인 오류와 같은 인시던트를 탐지하여 조직 내에서 신뢰성과 효율성을 유지하는 데 도움이 됩니다

  3. 근본 원인 분석: Databand의 고급 근본 원인 분석 기능을 통해 문제를 발생 지점에서 신속하게 파악하고 해결할 수 있었습니다

  4. 원활한 통합: Spark, Airflow, dbt Core 파이프라인을 다시 작성할 필요 없이 Autodesk의 기존 플랫폼과 솔루션을 원활하게 통합할 수 있었습니다. 일괄 처리, 내부 파이프라인 및 Snowflake 환경의 저장된 데이터 모니터링이 이러한 통합 범위에 포함됩니다

  5. 비용 절감: Autodesk는 문제를 조기에 탐지하고 재실행을 방지함으로써 클라우드 사용 비용을 절감했습니다.

Autodesk는 데이터 품질과 운영 효율성을 개선하는 데 있어 가시적인 성과를 거두었습니다. 기능 요청에 대한 투명한 추적은 파트너십을 더욱 공고히 하여 지속적인 개선과 혁신을 가능하게 했습니다.

Bluesky Creations 로고
Autodesk 소개

전 세계의 디자이너, 엔지니어, 설계자 및 제작자들은 주거용 및 사무용 건물, 자동차, 교량에 이르기까지 다양한 건축물의 설계 및 제작에 Autodesk(ibm.com 외부 링크)를 이용합니다. 매일 사용하는 제품이나 영감을 주는 영화와 게임까지도 Autodesk를 통해 탄생했습니다. Autodesk의 Design and Make Platform은 데이터의 이점을 활용하여 인사이트를 가속화하고 프로세스를 자동화함으로써 주변의 세상을 창조하고 비즈니스와 지구를 위해 더 나은 결과를 제공할 수 있는 기술을 고객에게 제공합니다. 자세한 내용은 autodesk.com을 참조하세요.(ibm.com 외부 링크)

IBM Databand

지속적인 데이터 관측성을 통해 신뢰할 수 있고 안정적인 데이터 제공

인터랙티브 데모 살펴보기 Gartner 보고서 읽기
법률

© Copyright IBM Corporation 2024. IBM, IBM 로고, Databand는 미국 및/또는 기타 국가에서 사용되는 IBM Corp.의 상표 또는 등록 상표입니다.

이 문서는 최초 발행일을 기준으로 최신 상태로 업데이트된 문서로, 내용은 언제든지 IBM에 의해 변경될 수 있습니다. IBM이 현재 영업 중인 모든 국가에서 모든 제품이 제공되는 것은 아닙니다.

고객 사례는 해당 고객이 IBM 제품을 사용한 방법과 달성한 결과에 대한 예시로서 제공됩니다. 다른 운영 환경에서는 실제 성능, 비용, 절감 또는 그 외 결과가 다르게 나타날 수 있습니다.