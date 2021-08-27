데이터 운영은 데이터를 생성, 처리하고 유지 관리하기 위해 인프라를 구성하는 프로세스일 뿐만 아니라, 이 업무를 수행하는 팀의 이름이기도 합니다. 이 팀을 흔히 데이터 운영(DataOps) 팀이라고 부릅니다. 그렇다면 DataOps의 역할은 무엇일까요? 회사가 데이터 파이프라인을 운영하고 있다면 이 파이프라인을 관리하기 위해 DataOps라는 이름으로 하나의 팀을 출범시키는 것만으로도, 기존에는 부족했던 조직화와 통제력을 가져올 수 있습니다.

DataOps는 데이터를 판매하는 기업만을 위한 것이 아닙니다. 최근의 역사를 보면 데이터의 출처나 용도에 관계없이 데이터 운영 팀이 필요하다는 것이 입증되었습니다. 내부 고객이든 외부 고객이든 모두 동일합니다. 파이프라인을 구축하거나, 현실적으로는 기존 파이프라인을 물려받아 다시 구축하려면, 하나의 팀이 필요합니다. 이 팀은 관측 가능성 및 추적 툴을 구현하고, 데이터의 네 가지 속성 전반에 걸쳐 데이터 품질을 모니터링하는 역할을 맡아야 합니다(많은 조직에서는 이 역할을 한 명이 담당하기도 합니다).

물론, 파이프라인을 구축한 사람들이 대시보드가 다운되었을 때 받는 두려운 PagerDuty 알림을 직접 받아야 합니다. 이는 처벌을 위한 것이 아니라 교육을 위한 것입니다. 자신이 책임을 지고 있는 상황에서는 사람들의 설계 방식이 달라집니다. 이는 좋은 동기 부여가 되며, 문제 해결 능력을 높이고 보다 신속한 대응을 가능하게 합니다.

마지막으로, 데이터 운영 팀에는 단순히 A 지점에서 B 지점으로 데이터를 이동하는 것을 넘어서는 사명이 필요합니다. 이것이 바로 팀명에서 '운영(operations)'이라는 부분이 중요한 이유입니다.