什么是数据市场？

数据市场是数据仓库的一个子集，专注于特定的业务线、部门或主题领域。数据市场可以提高团队效率、降低成本并促使企业做出更明智的战术业务决策。

数据市场向特定用户组提供特定数据，这使这些用户能够快速访问关键见解，而无需浪费时间搜索整个数据仓库。例如，许多公司的数据市场可能与业务中的特定部门（例如财务、销售或市场营销）保持一致。

辅以专家洞察分析的最新科技新闻

通过 Think 时事通讯，了解有关 AI、自动化、数据等方面最重要且最有趣的行业趋势。请参阅 IBM 隐私声明。

数据市场、数据仓库和数据湖是至关重要的中央数据存储库，但它们满足组织内的不同需求。

数据仓库是一种系统，它将多个来源的数据汇聚到一个单一、集中、一致的数据存储库中，以支持数据挖掘、人工智能 (AI) 和机器学习，这最终可增强高级的分析和商业智能。通过这种战略性的收集过程，数据仓库解决方案可以整合不同来源的数据，以统一的形式提供给用户。

数据市场（如上所述）是数据仓库的集中版本，其中包含对组织内的单个团队或选定用户组十分重要且为其所需的一小部分数据。数据市场是从现有的数据仓库（或其他数据源）通过复杂程序构建的，该程序涉及多种技术和工具，用于设计和构建物理数据库，向其中填充数据，并设置复杂的访问和管理协议。

虽然这是一个具有挑战性的过程，但与使用更广泛的数据仓库数据集相比，它能使业务线更快地发现更有针对性的见解。例如，营销团队可能会因从现有仓库创建数据市场而受益，因为其活动通常独立于业务的其他部分。因此，团队不需要访问所有企业数据。

数据湖也是数据的存储库。数据湖提供获取自多个来源的大量非结构化或原始数据的存储，但这些信息尚未被处理或正准备进行分析。由于能够以原始格式存储数据，数据湖比数据仓库更易于访问且更具成本效益。采集之前无需清理和处理数据。

例如，政府可以利用技术跟踪有关交通行为、用电量和航道的数据，并将其存储在数据湖中，同时研究如何使用这些数据来建设“更智慧的城市”，提供更高效的服务。

AI Academy

深入了解为什么高质量数据对于成功使用生成式 AI 至关重要。

数据市场旨在通过相对狭义的数据主体来满足特定群体的需求。虽然数据市场仍然包含数百万条记录，但其目标是在最短的时间内为业务用户提供最相关的数据。

凭借其更小、更集中的设计，数据市场为最终用户带来一些益处，包括以下几点：

成本效益：在建立数据市场时要考虑很多因素，如范围、整合以及提取、转换和加载 (ETL) 流程。然而，数据市场通常仅为数据仓库成本的一小部分。
简化数据访问：数据市场仅保存一小部分数据，因此与处理数据仓库中更广泛的数据集相比，用户可以快速检索所需数据，且投入的工作量更少。
更快地获得见解：从数据仓库获得的符合直觉的知识可支持企业层面的战略决策，这会影响业务的整体。数据市场可辅助商业智能和分析，指导部门层面的决策。团队可以在牢记具体目标的情况下利用有针对性的数据见解。随着团队在更短的时间内识别和提取有价值的数据，企业将受益于更快的业务流程和更高的生产力。
更简单的数据维护：数据仓库承载着多条业务线的大量商业信息。数据市场专注于单一业务线，容量低于 100GB，可减少混乱且更易于维护。
实施更方便快捷：数据仓库需要大量的实施时间，尤其是在大型企业中，因为它要从大量内部和外部来源收集数据。另一方面，在设置数据市场时，您只需要一小部分数据，因此实施往往会更高效，并且设置时间也更少。

数据市场分为三种类型，它们因为与数据仓库的关系以及每个系统各自的数据来源不同而存在差异。

从属数据市场是企业数据仓库中的分区片段。这种自上而下的方法首先将所有业务数据存储在一个中心位置。新创建的数据市场可根据分析需要随时从主数据中提取确定的子集。
独立数据市场充当不依赖于数据仓库的独立系统。分析师可以从内部或外部数据源提取有关特定主题或业务流程的数据，进行处理，然后将其存储在数据市场存储库中，直到团队需要它们。
混合数据市场结合了来自现有数据仓库和其他操作源的数据。这种统一的方法利用了自上而下方法带来的速度和用户友好界面，同时提供了独立方法的企业级集成。