理想的数据运营组织架构

工作时看显示器的女士

组织的外部沟通往往能反映其内部沟通。这正是 Melvin Conway 带给我们的启示,而这一理念同样适用于数据工程领域。如果企业没有明确界定的数据运营(即 “DataOps”)团队,那么数据输出结果终将和原始输入一样混乱无序。

因此,企业很可能需要组建一支数据运营团队,且必须进行合理的组织架构设计。

 

辅以专家洞察分析的最新科技新闻

通过 Think 时事通讯,了解有关 AI、自动化、数据等方面最重要且最有趣的行业趋势。请参阅 IBM 隐私声明

谢谢!您已订阅。

您的订阅将以英语提供。每份时事通讯都包含取消订阅链接。您可以在此管理您的订阅或取消订阅。更多相关信息,请参阅我们的 IBM 隐私声明

那么首先我们回溯核心问 ——数据运营是什么?

数据运营是组装基础设施以生成和处理数据,以及维护数据的过程。这一术语同时也指代负责(或理应负责)此类工作的团队——数据运营团队(即 DataOps 团队)。那么数据运营团队的核心职责是什么?事实上,若组织需要维护数据管道,组建一支义数据运营为定位的专属团队来管理这些管道,能够建立起此前缺失的规范化管理体系与管控机制。

数据运营也不仅仅适用于出售数据的企业。近期实践已充分证明,无论数据的来源或用途如何,企业都亟需组建数据运营团队。无论是服务内部客户还是外部客户,这一需求均无差异。企业需要专门的团队负责数据管道的搭建(更客观地说,是接手现有管道后进行重构)。同时,也需由该团队(对于许多组织而言,实际上可能只是专人)部署可观测性与追踪工具,并围绕数据的四大核心维度开展数据质量监控工作。

当然,负责搭建数据管道的团队,理应在仪表板出现故障并触发令人棘手的 PagerDuty 告警时,成为第一响应者——这并非出于惩罚目的,而是为了形成实战化学习机制。当团队与数据管道的运行效果存在直接利益关联时,其搭建思路会截然不同。这种机制既能形成有效的激励导向,更能推动问题得到更高效的解决,同时加快故障处置速度。

最后同样重要的是,数据运营团队需要一个核心使命。这一使命绝不能止步于“将数据从 A 点转移到 B 点”的简单层面。而这也正是其名称中“运营”二字的核心价值所在。

Mixture of Experts | 12 月 12 日,第 85 集

解码 AI:每周新闻摘要

加入我们世界级的专家小组——工程师、研究人员、产品负责人等将为您甄别 AI 领域的真知灼见,带来最新的 AI 资讯与深度解析。

数据运营与数据管理有何区别?

数据运营的核心是构建具备韧性的流程,确保数据流转始终服务于其预设目标。所有数据的移动都应具备明确动因。这一动因往往与收入直接相关。若数据运营团队无法在最终业务目标(例如销售团队获得更精准的预测能力并实现营收提升)与自身的数据管道管理工作之间建立清晰的关联链路,那么团队的定位与价值便存在核心问题。

如果没有运营,问题就会随着规模的扩大而出现:

  • 数据重复
  • 协作壁垒
  • 数据滞后
  • 临时修补留下隐患
  • 数据探查难题
  • 工具割裂
  • 日志记录不一致
  • 缺乏流程
  • 责任归属模糊且无服务等级协议

若存在任何一处脱节,本质上只是在进行传统意义上的数据管理。数据管理仅属于数据运营中机械性的维护层面。这虽然至关重要,但不具有战略意义。当团队陷入维护模式时,工作重心会局限于排查缺失字段或数据管道故障的原因并进行临时修补,而无暇开展规划与优化工作。

只有当团队能够将问题工单转化为可复用的解决方案时,其工作才真正具备“运营”属性。例如:发现合作方数据源存在转换错误时,通过电子邮件沟通推动对方在数据接入管道前完成修复;或在高管仪表板增设“异常告警”模块,提示数据异常状态,便于决策者知晓需等待数据刷新后再开展分析。数据运营与开发人员运营一样,核心目标是构建可复用、可测试、可解释且易用的标准化体系,最终为所有相关方降低工作复杂度。

那是数据运营与数据管理。那么接下来的问题就是应该如何构建数据运营团队?

高绩效数据运营团队架构的组织原则

让我们回到最初的核心论点——系统输出结果始终映射着的组织架构。若数据运营团队仅徒有“运营”之名,实际仍以维护为主,那么团队必将面临需求工单持续积压的困境。你将无暇推进更换系统、优化流程等长期维护性改进工作。你将深陷 Jira 或 ServiceNow 的响应漩涡中难以喘息。

相反,若你所组建(或重组)的数据运营团队具备清晰的核心原则与完善的组织架构,其产出的数据也将充分体现企业内部高质量的管理体系。良好的数据运营团队架构产出优质数据

原则 1:按全栈职能工作组模式搭建团队

将数据工程师、数据科学家与分析师整合为一个小组(或称“功能单元”),让他们协同处理原本可能各自独立推进的工作。这三个角色的视角互补,必然能促成更优决策、减少跨角色推诿,并提升工作前瞻性。例如,数据科学家无需先编写逻辑晦涩的代码笔记再移交工程师(避免反复沟通的低效循环),而是可以与分析师共同明确需求场景,工程师则同步说明技术实现路径与可行性。
许多数据运营团队已采用这种工作模式。优步的 Krishna Puttaswamy 与 Suresh Srinivas 指出:“团队应致力于打造‘全栈化’配置,确保具备足够的数据工程能力,从而对数据全生命周期进行长远规划。”旅游平台 Agoda 的工程团队也基于同样的理念,采用功能单元模式开展工作。

原则 2:发布数据运营团队的组织架构图

即便团队仅有一人,也应这样做。每个角色本质上都是一份“职责分工”,必须有人承担。要打造高效运转的数据运营团队,明确各项职责的归属、界定不同数据资产的负责人至关重要;同时,还需将每个人的管理跨度控制在合理范围内。或许通过这样的架构梳理,能更有力地支撑团队招聘的必要性论证。

什么是数据运营团队管理?在功能单元架构之上,需增设一层协调角色,承担“服务型领导”职责。他们负责项目管理、团队辅导与障碍清除。理想情况下,该角色应是团队中专业能力最全面的核心成员。

我们已构建出一套理想的团队架构(如图所示),尽管该架构仍在持续优化中。值得重点强调的是,需有专人(副总裁层级)以数据战略愿景为核心统筹全局。其下设置多名负责人(总监层级),引领各数据专业领域向统一愿景推进;再往下则是跨职能团队,确保数据组织与数据功能模块协同运转。(感谢我们的数据解决方案架构师 Michael Harper 提出这些构想。)

原则 3:发布包含数据运营北极星指标的指导文档

选择北极星指标有助于所有相关方明确优化核心方向。若缺乏这一共同共识,极易引发分歧与争议。例如,内部数据 “用户” 可能抱怨数据交付速度迟缓。但实际上,速度慢的背后是你知晓他们未明确表达的核心诉求——优先保障数据质量。

数据运营的共同北极星指标:数据质量、自动化(可重复流程)和流程去中心化(即终端用户自给自足)。

确定北极星指标后,你还可以制定指向该指标的次级指标或次级原则——而北极星指标本身几乎总是一项滞后指标。

原则 4:保留一定的跨职能协作重叠空间

通过团队架构设计,确保内部不同小组需频繁开展跨组协作、相互对接需求。事实证明,这些互动是无价的。agoda 高级工程经理 Amir Arad 表示:“当数据科学家与工程师深入了解彼此的工作模式后,团队的运转效率会显著提升,产出也会大幅增加。”

Amir 表示,他发现跨职能冗余的一大隐性价值在于:能让不同背景的成员提出该团队内部无人曾想到的问题。

“这种工程领域的知识差异其实很有价值。它会促使非技术背景的成员要求我们简化方案,”Amir 说道,“他们可能会问‘为什么不能换种更简单的方式实现?’而有时候我们回头梳理会发现,原本的代码或服务器配置其实并非必需。很多时候,非专业人士反而能带来全新思路。”

原则 5:面向自助服务

正如开发运维一样,最好的数据运营团队是隐形的,并不断努力使自己变得多余。与其扮演拯救所有人的英雄,但最终会让体系变得脆弱,不如扮演服务型领导。正如老子所言,团队管理的理想境界是:“功成事遂,百姓皆谓我自然。”

应将数据运营团队视为产品团队进行管理。深入研究用户需求。建立问题修复清单并持续跟进。核心目标是打造足够实用的工具与数据服务,确保数据真正被业务场景有效利用。

原则 6: 从第一天起就构建完整的数据可观察性

数据监测和可观测性没有“太早”一说。常被用来为拖延监控工作找借口的比喻是:“我们正在飞行中组装飞机”。不妨想象一下这个场景。这难道不足以让你认清长期存续所需的关键前提吗?一个远更贴切的比喻其实是基础架构建设。地基搭建得越晚,投入的成本就越高,而缺乏地基所引发的问题也会越多。

阅读:什么是数据可观察性?

原则 7:确保获得高管对长期思维的支持

正如马克西姆斯将军所言,你当下在数据基础设施上做出的决策,必将“影响深远、流传后世”。如今看似能快速拉动增长的权宜之计,未来可能演变为需要大规模数据重构的内部系统混乱噩梦。你需要争取管理层的支持,果断做出看似棘手但正确的决策——例如明确告知所有人:需暂停新的数据需求申请,因为团队需要一个季度的时间来修复现有问题、夯实基础。

原则 8:使用 CASE 方法(注明信息来源)

CASE 是“复制借鉴所有可用资源”的缩写,这一略带调侃的说法核心是倡导“切勿凡事从零构建”。如今已有大量实用的微服务与开源方案可供选用。不妨“站在巨人的肩膀上”——将重心聚焦于数据管道中仅需定制开发的 40% 核心模块,并将其打磨完善。

若今日暂无余力推进其他事项,务必优先完成此事

去看看你待办事项清单里的工单。你究竟是在被动应对问题,还是主动预防问题?在你已处理的问题中,有多少能明确找到根本原因?又有多少实现了永久性解决?主动预防的比例越高,团队就越接近真正的数据运营团队。而数据可观察性也会随之发挥更大价值。全面的可见性支持,能帮助你从单纯的维护模式,向主动优化模式转型。

积极改进自身架构的团队会积极改进其数据。内部和谐带来外部和谐,这种联系让 Melvin Conway 感到自豪。

了解更多关于 IBM Databand 持续数据可观察性平台的信息,探索其如何助力企业更早检测数据异常、更快解决数据问题,并向业务部门交付更可靠的数据。如果准备深入了解,请立即预约演示

相关解决方案
DataOps 平台解决方案

使用 IBM DataOps 平台解决方案整理您的数据,使其值得信赖并为 AI 做好业务准备。

深入了解 DataOps 解决方案
IBM Databand

发现 IBM Databand,用于数据管道的可观测性软件。该软件会自动收集元数据来构建历史基线、检测异常并创建工作流程,以修复数据质量问题。

深入了解 Databand
数据和分析咨询服务

通过 IBM Consulting 发掘企业数据的价值,建立以洞察分析为导向的组织,实现业务优势。

探索分析服务
采取后续步骤

使用 IBM DataOps 平台解决方案整理您的数据,使其值得信赖并为 AI 做好业务准备。

深入了解 DataOps 解决方案 深入了解分析服务