数据质量衡量数据集在准确性、完整性、有效性、一致性、唯一性、及时性和适用性等方面较之标准的优良程度,它对组织内的所有数据治理计划都至关重要。
数据质量标准可确保公司做出以数据为导向的决策,从而实现业务目标。如果重复数据、缺失值、异常值等数据问题没有得到妥善解决,企业就会增加产生负面业务结果的风险。根据 Gartner 的一份报告,数据质量不佳导致企业每年平均损失1,290 万美元1。因此,出现了数据质量工具来减轻与数据质量差相关的负面影响。
当数据质量符合其预期用途的标准时,数据消费者可以信任数据并利用数据来改进决策,从而帮助制定新的业务策略或优化现有的业务策略。但是,当无法达到标准时,数据质量工具会通过帮助企业诊断基础数据问题来提供价值。根本原因分析使团队能够快速有效地纠正数据质量问题。
数据质量不仅是日常业务运营的优先事项,随着企业将人工智能 (AI) 和自动化技术整合到其工作流程中,高质量的数据对于有效采用这些工具至关重要。正如老话所说:“垃圾进,垃圾出”,这也适用于机器学习算法。如果算法正在学习根据不良数据进行预测或分类,我们可以预期它将产生不准确的结果。
数据质量、数据完整性和数据概况都是相互关联的。数据质量是一个更广泛的类别,组织用来评估其数据的准确性、完整性、有效性、一致性、唯一性、及时性和适用性。数据完整性只关注这些属性的一部分,特别是准确性、一致性和完整性。它还从数据安全的角度更多地关注这个问题,实施保障措施以防止恶意参与者损坏数据。
另一方面,数据分析侧重于检查和清理数据,以维持组织内的数据质量标准的过程。这还可以包括支持这些过程的技术。
数据质量可根据多个维度进行评估,这些维度可能因信息来源的不同而有所不同。这些维度用于对数据质量指标进行分类:
这些指标可帮助团队在整个组织中进行数据质量评估,以评估数据针对给定目的的信息量和有用性。
在过去十年中,混合云、人工智能、物联网 (IoT) 和边缘计算的发展导致大数据呈指数级增长。因此,主数据管理 (MDM) 的实践变得更加复杂,需要更多的数据管理员和严格的保护措施来确保良好的数据质量。
企业依靠数据质量管理来支持其数据分析计划,如商业智能仪表板。否则,可能会产生毁灭性的后果,甚至是道德后果,具体取决于行业(例如医疗保健)。数据质量解决方案可帮助企业最大限度地利用数据,并带来以下主要优点:
设计数据战略,消除数据孤岛、降低复杂性并提高数据质量,以获得卓越的客户和员工体验。
watsonx.data 支持您通过开放、混合和已治理数据,利用您的所有数据(无论位于何处)来扩展分析和 AI。
通过 IBM® Consulting 发掘企业数据的价值,建立以洞察分析为导向的组织,实现业务优势。