Balises

Qu’est-ce que Milvus ?

Gros plan sur un doigt touchant un écran

Auteurs

Staff Editor

IBM Think

Qu’est-ce que Milvus ?

Milvus est une base de données vectorielle open source développée par Zilliz. Milvus permet un stockage évolutif des grandes quantités de plongements vectoriels, ainsi qu’une recherche de similarités ultra-performante sur les données vectorielles.

Zilliz a développé Milvus pour la première fois en 2017 et a contribué au projet de la Linux Foundation en 2020. Milvus est désormais disponible à la fois en tant que logiciel open source sous licence Apache 2.0 et en tant que service cloud entièrement géré par Zilliz.

Que sont les bases de données vectorielles et pourquoi sont-elles importantes ?

Les bases de données vectorielles stockent et gèrent des jeux de données sous forme de vecteurs. Elles peuvent aider les entreprises à gérer des données non structurées et sont essentielles aux efforts d’intelligence artificielle (IA) et de machine learning (ML) avancés.

Les vecteurs sont des tableaux de nombres qui représentent des concepts et des objets complexes, tels que des mots et des images.

Les données non structurées (telles que le texte, la vidéo et l’audio) représentent aujourd’hui une part importante des données d’entreprise, mais les bases de données traditionnelles sont souvent mal adaptées à l’organisation et à la gestion de ces données.

Les organisations peuvent alimenter ces données dans des modèles de plongements d’apprentissage profond spécialisés, qui produisent des représentations vectorielles appelées « plongements » . Par exemple, le mot « chat » peut être représenté par le vecteur [0,2 ; -0,4 ; 0,7], tandis que le mot « chien » peut être représenté par [0,6 ; 0,1 ; 0,5].

La transformation des données en vecteurs permet de stocker différents types de données non structurées dans un format partagé au sein d’une seule et même base de données vectorielle.

Les vecteurs aident également les organisations à exploiter la valeur de ces données pour l’IA et le ML. Les vecteurs capturent les relations sémantiques entre les éléments, ce qui permet un traitement efficace par les grands modèles de langage (LLM) et les outils d’IA générative. La plupart des applications avancées d’IA et de ML s’appuient aujourd’hui sur des vecteurs pour l’entraînement et la génération de contenu.

Comme d’autres bases de données vectorielles, Milvus permet aux entreprises de gérer et d’organiser les plongements vectoriels. Associant stockage hautement évolutif et recherche vectorielle efficace, la base de données vectorielle Milvus est une solution de choix pour la génération augmentée par récupération (RAG), les systèmes de recommandation, ainsi que d’autres applications d’IA.

En savoir plus sur les bases de données vectorielles

Design 3D de balles roulant sur une piste

Les dernières actualités et informations en matière d’IA  

La newsletter hebdomadaire Think vous apporte toute l’actualité sur l’IA, le cloud et bien d’autres sujets.

L’architecture de Milvus

Milvus est une base de données vectorielle cloud native dotée d’une architecture multicouche basée sur des microservices. Milvus sépare les ressources de stockage et de calcul, ce qui permet aux organisations de faire évoluer chaque couche indépendamment et horizontalement.

Milvus est compatible avec plusieurs modèles d’intégration différents. Les organisations peuvent connecter leurs modèles à Milvus, qui ingère les intégrations ainsi que les métadonnées et autres informations pertinentes. Milvus prend en charge les téléchargements en continu et par lots.

Ce système comporte quatre couches :

Couche d’accès : cette couche externe accepte les entrées des utilisateurs et des services et renvoie les sorties.

Service de coordination : Zilliz considère cette couche comme le « cerveau » du système, car elle orchestre l’équilibrage de charge, la gestion des données, l’exécution des requêtes et d’autres tâches importantes.

Nœuds de travail : cette couche exécute les requêtes, met à jour les données et construit les index.

Couche de stockage d’objets : cette couche comprend un magasin de métadonnées, un log broker (courtier en journaux) qui enregistre les modifications apportées aux données en temps réel, ainsi qu’un magasin d’objets qui regroupe instantanés de journaux, fichiers d’index et résultats de calcul intermédiaires.

Types de déploiement Milvus

Milvus Lite : une bibliothèque Python qui permet aux utilisateurs d’exécuter Milvus dans des environnements locaux. Elle prend actuellement en charge Ubuntu et MacOS, mais pas Microsoft Windows.
Milvus Standalone : une base de données Milvus complète, regroupée dans une seule image Docker et exécutée sur une seule machine.
Milvus Cluster : une base de données vectorielle distribuée qui répartit les services entre des groupes de nœuds dans un cluster Kubernetes.
Zilliz Cloud : la version entièrement gérée de Milvus.

Mixture of Experts | 12 décembre, épisode 85

Décryptage de l’IA : Tour d’horizon hebdomadaire

Rejoignez notre panel d’ingénieurs, de chercheurs, de chefs de produits et autres spécialistes de premier plan pour connaître l’essentiel de l’actualité et des dernières tendances dans le domaine de l’IA.

Regardez tous les épisodes de Mixture of Experts

Principales caractéristiques et capacités de Milvus

Fonctionnalités de recherche avancées

Milvus prend en charge les recherches de similarité vectorielle haute performance, un type de recherche vectorielle qui renvoie des résultats sémantiquement similaires à une requête. L’avantage de la recherche de similarité est qu’elle n’est pas limitée aux correspondances exactes, comme le serait une recherche par mot-clé traditionnelle.

Par exemple, une recherche par mot-clé pour « meilleur restaurant de pizza » ne renverrait que des résultats contenant les mots « meilleur », « restaurant » et « pizza ». Une recherche de similarité pour le même mot-clé trouverait tous les résultats pour les pizzerias hautement recommandées, même si les mots exacts « meilleur restaurant de pizza » ne sont pas utilisés dans le contenu.

Milvus prend en charge plusieurs types de recherche de similarité, y compris la recherche approximative des plus proches voisins (ANN) top-k et l’ANN de portée.

Milvus propose également des recherches hybrides, qui associent des recherches vectorielles sémantiques à d’autres critères, tels que le filtrage des métadonnées ou la recherche par mot-clé.

Les recherches hybrides peuvent améliorer l’efficacité et la pertinence des résultats. Prenons l’exemple d’une recherche alliant mots-clés et vecteurs. Elle peut d’abord utiliser des mots-clés spécifiques pour filtrer les résultats en fonction de correspondances exactes, puis se servir de la recherche de similarité vectorielle pour parcourir ces résultats filtrés en quête du contenu le plus pertinent sur le plan sémantique.

Indexation

Milvus prend en charge plusieurs types d’indexation, notamment les index HNSW (Hierarchical navigable Small World), les index de fichiers inversés (IVF) et les index basés sur le processeur graphique (GPU).

L’indexation des vecteurs peut contribuer à accélérer les recherches. Par exemple, le HNSW regroupe les vecteurs similaires pendant le processus de construction de l’index, ce qui facilite et accélère la recherche de résultats pertinents.

Évolutivité

Les couches de Milvus peuvent évoluer indépendamment les unes des autres, ce qui permet aux entreprises de gérer de manière rentable et efficace des volumes considérables de données vectorielles et des recherches intensives.

Intégrations et compatibilité

Milvus propose de nombreux kits de développement logiciel (SDK) pour prendre en charge le développement dans différents langages, notamment Python (pymilvus), Java et Go.

Milvus peut également s’intégrer à des outils d’analyse tels qu’Apache Spark, à des cadres tels que LangChain et à des modèles d’IA générative tels que IBM Watson, Llama de Meta et GPT d’OpenAI.

Code source ouvert

Une vaste communauté open source contribue à la correction des bogues, aux mises à jour et à d’autres améliorations des dépôts GitHub de Milvus.

Milvus et les autres bases de données vectorielles

Milvus et Pinecone

Pinecone et Milvus offrent tous deux une recherche à faible latence et un stockage évolutif, mais Pinecone est une base de données vectorielle propriétaire et n’est disponible que sous forme de service géré.

Milvus et Weaviate

Comme Milvus, Weaviate est open source et prend en charge les recherches hybrides. Toutefois, Milvus offre plus de types d’indexation que Weaviate.

Milvus et Qdrant

Autre base de données vectorielle open source, Qdrant est réputée pour ses puissantes capacités de filtrage des métadonnées. Si Qdrant est bien adaptée aux utilisations à échelle modérée, Milvus peut généralement traiter des volumes plus importants de données vectorielles.

Milvus et Chroma

Chroma met l’accent sur la facilité d’utilisation et la rapidité des déploiements locaux. Moins évolutif, Chroma ne possède pas d’architecture distribuée. Si Chroma est couramment utilisé pour le prototypage et les tests, Milvus peut prendre en charge un plus large éventail de cas d’utilisation.

Cas d’utilisation courants de Milvus

Les entreprises font appel à Milvus pour prendre en charge de nombreuses applications d’IA, notamment :

Génération augmentée par récupération (RAG)
Les systèmes de recommandation
Les recherches dans les médias
La détection des anomalies et des fraudes

La génération augmentée de récupération (RAG)

La RAG est une architecture qui relie les modèles d’IA à des bases de connaissances externes pour les aider à fournir des résultats plus pertinents et plus précis.

Milvus est couramment employé dans les implémentations de RAG en raison de sa prise en charge des recherches hybrides efficaces. En alliant la compréhension contextuelle de la recherche sémantique à la précision de la recherche par mot-clé et du filtrage des métadonnées, Milvus peut aider à faire émerger des documents, des extraits de code et d’autres informations pertinents à partir de sources RAG.

CacheGPT, un cache sémantique open source pour les LLM développé par Zilliz, aide également Milvus à prendre en charge les implémentations RAG. CacheGPT stocke les réponses des applications d’IA générative sous forme de plongements vectoriels.

Les services connectés (tels que les interfaces RAG) n’ont pas besoin d’effectuer un appel API à l’IA générative pour chaque recherche. En effet, ils peuvent d’abord consulter le cache et appeler l’IA générative uniquement si la réponse n’y figure pas.

Les systèmes de recommandation

Milvus est populaire dans les systèmes de recommandation qui font correspondre le contenu, les produits et les publicités aux utilisateurs en fonction de leurs comportements passés.

Les préférences des utilisateurs peuvent être représentées sous forme de vecteurs, et une recherche de similarité peut faire apparaître les représentations vectorielles des produits, publicités et contenus similaires aux préférences de l’utilisateur.

Les recherches dans les médias

Les capacités de recherche de similarité de Milvus peuvent aider à rationaliser la recherche d’images, de fichiers audio, de vidéos et d’autres médias.

La détection des anomalies et des fraudes

Milvus permet de repérer les défauts des produits en comparant les vecteurs des images de produits à ceux représentant la forme appropriée de ces derniers. Les différences entre les vecteurs sont susceptibles d’indiquer la présence de défauts.

Milvus peut également aider à repérer des anomalies dans d’autres contextes. En matière de cybersécurité, les vecteurs représentant l’activité autorisée sur le réseau peuvent être comparés à ceux représentant une activité malveillante connue. De même, dans le secteur financier, les vecteurs représentant les transactions peuvent être analysés pour identifier les écarts susceptibles d’indiquer une fraude.

Réalisez votre ROI dès maintenant : le guide pratique de l’IA agentique

Découvrez comment dimensionner l’IA agentique pour un ROI mesurable dans toute l’entreprise. Ce protocole décrit les principaux obstacles qui limitent l’impact, explique comment mesurer efficacement le ROI et fournit un cadre pour favoriser une adoption réussie à l’échelle de l’entreprise.

Ressources

Concevoir une compagnie aérienne native de l’IA à l’échelle de l’entreprise

Lorsque les marges sont faibles, la moindre inefficacité compte. Alors que les systèmes hérités continuent de limiter le potentiel de l’IA dans le secteur de l’aviation, Riyadh Air a choisi une voie différente. En partenariat avec IBM, la société a créé la première compagnie aérienne native de l’IA au monde, réinventant ainsi une façon plus intelligente, plus rapide et plus intuitive de voyager.

L’entreprise en 2030 : conçue pour l’innovation perpétuelle

Découvrez nos cinq prédictions sur ce qui définira les entreprises les plus performantes en 2030 et les étapes que les dirigeants peuvent suivre pour obtenir un avantage axé sur l’IA.

Réalisez votre ROI dès maintenant : le guide pratique de l’IA agentique

Découvrez des moyens pour prendre une longueur d’avance et étendre avec succès l’IA à l’ensemble de votre entreprise, avec des résultats concrets.

Renforcer votre expertise en matière d’IA

Achetez dès aujourd’hui un abonnement individuel ou multi-utilisateurs pour accéder à notre catalogue complet de plus de 100 cours en ligne. Développez vos compétences sur une large gamme de nos produits à un prix avantageux.

Développez vos compétences en IA

Achetez dès aujourd’hui un abonnement individuel ou multi-utilisateurs pour accéder à l’ensemble de notre catalogue de plus de 100 cours en ligne. Renforcez vos compétences sur un large éventail de nos solutions, à un prix avantageux.

Commencer à générer du ROI avec l’IA agentique

Découvrez comment prendre une longueur d’avance en déployant l’IA à grande échelle dans votre organisation, tout en obtenant des résultats concrets.

Objectifs 2026

Les responsables IA doivent orchestrer les systèmes multi‑agents, renforcer la gouvernance, intégrer la sécurité partout et relier l’IA à un ROI mesurable.

Solutions d'intelligence artificielle

Mettez l’IA au service de votre entreprise grâce à l’expertise de pointe d’IBM et à son portefeuille de solutions leader du marché.

IBM AI Academy

Dirigé par des leaders d’opinion IBM, ce programme a pour but d’aider les chefs d’entreprise à acquérir les connaissances nécessaires qui leur permettront d’orienter leurs investissements IA vers les opportunités les plus prometteuses.

Libérez la puissance de l’IA générative et du ML

Découvrez comment intégrer en toute confiance l’IA générative et le machine learning dans votre entreprise.

Comment prospérer en toute confiance dans cette nouvelle ère de l’IA

Explorez les trois éléments clés d’une stratégie d’IA réussie : créer un avantage concurrentiel, étendre l’IA à l’ensemble de l’entreprise et faire progresser l’IA digne de confiance.

Solutions connexes

IBM® watsonx Orchestrate

Concevez facilement des assistants et des agents d’IA évolutifs, automatisez les tâches répétitives et simplifiez les processus complexes avec IBM watsonx Orchestrate.

Explorez watsonx Orchestrate

Solutions d’intelligence artificielle

Mettez l’IA au service de votre entreprise grâce à l’expertise de pointe d’IBM en matière d’IA et à son portefeuille de solutions.

Découvrir les solutions d’IA

Conseil et services en intelligence artificielle

IBM® Consulting et ses services d’IA accompagnent les entreprises dans la redéfinition de leurs activités avec l’intelligence artificielle pour mener leur transformation.

Découvrir les services d’IA

Passer à l’étape suivante

Que vous choisissiez de personnaliser des applications et des compétences prédéfinies ou de créer et de déployer des services agentiques personnalisés à l’aide d’un studio d’IA, la plateforme IBM watsonx est là pour vous.

Qu’est-ce que Milvus ?

Qu’est-ce que Milvus ?

Que sont les bases de données vectorielles et pourquoi sont-elles importantes ?

Les dernières actualités et informations en matière d’IA

L’architecture de Milvus

Types de déploiement Milvus

Décryptage de l’IA : Tour d’horizon hebdomadaire

Principales caractéristiques et capacités de Milvus

Milvus et les autres bases de données vectorielles

Milvus et Pinecone

Milvus et Weaviate

Milvus et Qdrant

Milvus et Chroma

Cas d’utilisation courants de Milvus

La génération augmentée de récupération (RAG)

Les systèmes de recommandation

Les recherches dans les médias

La détection des anomalies et des fraudes

Share

Ressources

Les dernières actualités et informations en matière d’IA