标签

什么是 Milvus？

作者

Matthew Kosinski

Staff Editor

IBM Think

什么是 Milvus？

Milvus 是 Zilliz 开发的开源矢量数据库。Milvus 以为大量矢量嵌入提供可扩展的存储空间，以及支持矢量数据的高性能相似性搜索而闻名。

Zilliz 于 2017 年首次开发了 Milvus，并于 2020 年将该项目贡献给 Linux 基金会。Milvus 现在既可以作为 Apache License 2.0 下的开源软件使用，也可以作为 Zilliz 的云服务使用。

什么是矢量数据库，为什么它们很重要？

矢量数据库以矢量形式存储和管理数据集。它们可以帮助组织管理非结构化数据，对于高级人工智能 (AI) 和机器学习 (ML) 工作至关重要

。

矢量是表示复杂概念和对象（如文字和图像）的数字阵列。

非结构化数据（如文本、视频和音频）占当今企业数据的很大一部分，但传统数据库通常不适合组织和管理这些数据。

组织可以将这些数据提供给专门的深度学习嵌入模型，这些模型输出称为“嵌入”的矢量表示。例如，单词“cat”可能由矢量 [0.2, -0.4, 0.7] 表示，而单词“dog”可能由矢量 [0.6, 0.1, 0.5] 表示。

将数据转换为矢量使组织能够以共享格式将不同种类的非结构化数据存储在一个矢量数据库中。

矢量还可以帮助组织解锁这些数据在 AI 和 ML 中的价值。矢量捕获元素之间的语义关系，使得大型语言模型 (LLM) 和生成式 AI 工具能够进行有效处理。大多数先进的 AI 和 ML 应用程序今天依赖于矢量进行训练和内容生成。

与其他矢量数据库一样，Milvus 为组织提供了一种管理和组织嵌入矢量的方法。Milvus 矢量数据库的高度可扩展的存储空间和高效的矢量搜索功能使其成为检索增强生成、推荐系统和其他 AI 应用程序的热门选择。

了解有关向量数据库的更多信息

Milvus 的架构

Milvus 是一个云原生矢量数据库，采用基于微服务的多层架构。Milvus 将存储和计算资源分离，使组织能够独立、水平地扩展每一层。

Milvus 兼容多种不同的嵌入模型。组织可以将他们的模型连接到 Milvus，Milvus 会采集嵌入以及元数据和其他相关信息。Milvus 支持流式和批量嵌入上传。

Milvus 有 4 层：

访问层：这是面向外部的一层，接受来自用户和服务的输入并返回输出。

协调器服务：Zilliz 将这一层称为系统的“大脑”，因为它负责协调负载平衡、数据管理、查询执行和其他重要任务。

工作节点：该层执行查询、更新数据和构建索引。

对象存储层：该层包括元数据存储、记录实时数据变更的日志代理，以及保存日志快照、索引文件和中间计算结果的对象存储。

Milvus 部署类型

Milvus Lite：一个 Python 库，让用户能够在本地环境中运行 Milvus。Milvus Lite 目前支持 Ubuntu 和 MacOS，但不支持 Microsoft Windows。
Milvus 单机版：完整的 Milvus 数据库，打包在单个 Docker 映像中，并在单个计算机上运行。
Milvus Cluster：分布式矢量数据库，可在 Kubernetes 集群中的节点组之间分布服务。
Zilliz Cloud：Milvus 的完全托管版本。

Mixture of Experts | 12 月 12 日，第 85 集

解码 AI：每周新闻摘要

加入我们世界级的专家小组——工程师、研究人员、产品负责人等将为您甄别 AI 领域的真知灼见，带来最新的 AI 资讯与深度解析。

观看 Mixture of Experts 所有剧集

Milvus 的关键特征和功能

高级搜索功能

Milvus 支持高性能矢量相似性搜索，这是一种返回语义上与查询相似的结果的矢量搜索。相似性搜索的优点在于，它不像传统的关键字搜索那样仅限于完全匹配。

例如，关键词搜索“最好的披萨餐厅”只会返回包含“最好”、“披萨”和“餐厅”字样的结果。如果对同一关键词进行相似性搜索，即使内容中没有使用“最好的披萨餐厅”这样的精确词，也会找到任何被强烈推荐的披萨店的结果。

Milvus 支持多种相似性搜索类型，包括 top-k 近似最近邻 (ANN) 和范围 ANN。

Milvus 还支持混合搜索，将语义矢量搜索与元数据过滤或关键词搜索等其他标准结合起来。

混合搜索可以提高搜索效率、相关性更高。考虑将关键字搜索和矢量搜索相结合的搜索。搜索可以首先使用特定关键字来基于完全匹配来筛选结果，然后使用矢量相似性搜索在这些筛选结果中搜索语义最相关的内容。

索引

Milvus 支持多种索引类型，包括分层可导航小世界 (HNSW)、倒排文件 (IVF) 和基于 GPU 的索引。

索引矢量可以帮助加快搜索速度。例如，在索引构建过程中，HNSW 将相似的矢量聚类在一起，从而更容易更快地找到相关结果

。

可扩展性

Milvus 的层可以相互独立扩展，这可以为组织提供一种经济高效和资源有效的方式来处理大量矢量数据和密集搜索。

整合与兼容性

Milvus 提供大量软件开发套件 (SDK)，以支持各种语言的开发，包括 Python (pymilvus)、Java 和 Go。

Milvus 还可以与 Apache Spark 等分析工具、LangChain 等框架以及 IBM watsonx、Meta 的 Llama 和 OpenAI 的 GPT 模型等生成式 AI 模型集成。

开放式源代码

大型开源社区为 Milvus 的 GitHub 存储库贡献了修复、更新和其他增强功能。

Milvus 与其他矢量数据库

Milvus 与 Pinecone

Pinecone 和 Milvus 都提供低延迟搜索和可扩展存储，但 Pinecone 是专有的矢量数据库，仅作为托管服务提供。

Milvus 与 Weaviate

与Milvus一样，Weaviate也是开源的，支持混合搜索。一个关键区别是，Milvus提供的索引类型比 Weaviate 多。

Milvus 与 Qdrant

Qdrant 是另一个开源矢量数据库，以其强大的功能而闻名。虽然 Qdrant 非常适合中等规模用途，但 Milvus 通常可以处理更多的矢量数据。

Milvus 与 Chroma

Chroma 注重易用性和快速本地部署。Chroma 没有分布式架构，因此可扩展性较差。虽然 Chroma 通常用于原型设计和测试，但 Milvus 可以支持更广泛的用例。

常见 Milvus 用例

组织使用 Milvus 支持众多 AI 应用场景，包括：

检索增强生成 (RAG)
推荐系统
媒体搜索
异常和欺诈检测

检索增强生成 (RAG)

RAG 是一种架构，可将 AI 模型与外部知识库连接起来，帮助模型提供相关性更高、更准确的结果。

Milvus 在 RAG 实现中很常见，因为它支持高效的混合搜索。通过将语义搜索的上下文理解与关键字搜索和元数据过滤的精确性相结合，Milvus 可以帮助从 RAG 源中获取相关文档、代码片段和其他信息。

CacheGPT，是 Zilliz 开发的 LLM 开源语义缓存，也有助于 Milvus 支持 RAG 实现。CacheGPT William 将来自生成式 AI 应用程序的响应存储为矢量嵌入。

互联服务（如 RAG 接口）无需为每次搜索都向生成式 AI 进行 API 调用。而是可以先检查缓存，仅在答案不存在时才调用生成式 AI。

媒体搜索

Milvus 的相似性搜索功能可以帮助简化图像搜索、音频搜索、视频搜索和其他媒体搜索。

异常和欺诈检测

Milvus 可通过比较产品图像矢量和代表产品正常形态的矢量，帮助发现产品缺陷。矢量之间的差异可能表明存在缺陷。

Milvus 还可以帮助发现其他环境中的异常情况。在网络安全领域，代表授权网络活动的矢量可与代表已知恶意活动的矢量进行比较。同样，在金融领域，可以分析表示交易的矢量，以识别可能表明欺诈的偏差。

开始实现投资回报率：智能体 AI 实践指南

了解如何扩展智能体式 AI，以在整个企业中实现可衡量的投资回报率。本运行手册将概述限制影响力的主要障碍、如何有效衡量投资回报率以及用于推动全企业成功采用的框架。

如何选择合适的 AI 基础模型

了解如何选择正确的方法来准备数据集和使用 AI 模型，如何使用模型选择框架来平衡性能要求与成本、风险、部署需求和利益相关者要求。

资源

2030 年的企业：为持续创新而设计

了解我们对 2030 年最成功企业的五大预测，以及领导者可以采取哪些步骤来获得 AI 优先优势。

开始实现投资回报率：智能体 AI 实践指南

探索领先之道，成功将 AI 扩展至整个业务并取得真实成效。

提升你的 AI 专业知识

立即购买个人或多用户订阅，访问我们包含 100 多门在线课程的全部目录。以低价扩展您在 IBM 广泛产品中的技能。

2024 年 AI 实际应用

我们对 2,000 家组织进行了调查，旨在了解他们的 AI 计划，以发现哪些方法有效、哪些方法无效，以及如何才能取得领先。

从推行 AI 项目到实现盈利：智能体式 AI 如何维持财务回报

了解组织如何从从零散试点转向在核心业务中以 AI 驱动变革。

提升你的 AI 专业知识

立即购买单用户或多用户订阅，即可访问我们完整的包含 100 多个在线课程的目录，以低廉的价格扩展您的技能。

深入了解 IBM Granite

IBM® Granite 是一系列开放、高性能且值得信赖的 AI 模型系列，专为业务设计并经过优化，可扩展您的 AI 应用。深入了解语言、代码、时间序列和护栏方面的选项。

IBM AI Academy

本课程由 IBM 资深思想领袖带领，旨在帮助企业领导者获得所需的知识，以便划分可以推动增长的 AI 投资的优先级。

让 AI 充分发挥作用：利用生成式 AI 提高投资回报率

想要从 AI 投资中获得更好的回报吗？了解如何通过帮助您最优秀的人才构建和提供创新的新解决方案，在关键领域扩展生成式人工智能来推动变革。

解锁生成式 AI + ML 的强大功能

了解如何自信地将生成式 AI 和机器学习融入您的业务中。

树立信任，从容自信在 AI 新时代蓬勃发展

深入了解强大 AI 战略的 3 个关键要素：创造竞争优势、在整个企业中扩展 AI 以及推进值得信赖的 AI。

什么是 Milvus？

作者

什么是 Milvus？

什么是矢量数据库，为什么它们很重要？

最新的 AI 新闻 + 洞察分析

Milvus 的架构

Milvus 部署类型

解码 AI：每周新闻摘要

Milvus 的关键特征和功能

Milvus 与其他矢量数据库

Milvus 与 Pinecone

Milvus 与 Weaviate

Milvus 与 Qdrant

Milvus 与 Chroma

常见 Milvus 用例

检索增强生成 (RAG)

推荐系统

媒体搜索

异常和欺诈检测

Share

资源