O que é Milvus?

Autores

Staff Editor

IBM Think

O que é Milvus?

Milvus é um banco de dados de vetores de código aberto desenvolvido pela Zilliz. É conhecido por fornecer armazenamento escalável para grandes quantidades de incorporações vetoriais e permitir pesquisas de similaridade de dados vetoriais de alto desempenho.

A Zilliz desenvolveu o Milvus pela primeira vez em 2017 e contribuiu com o projeto para a Linux® Foundation em 2020. O Milvus agora está disponível tanto como um software de código aberto sob a Apache License 2.0 quanto como um serviço de nuvem totalmente gerenciado da Zilliz.

O que são bancos de dados de vetores e por que eles são importantes?

Os bancos de dados de vetores armazenam e gerenciam conjuntos de dados na forma de vetores. Eles ajudam as organizações a gerenciar dados não estruturados e são críticos para os esforços avançados em inteligência artificial (IA) e aprendizado de máquina (ML).

Vetores são matrizes de números que representam conceitos e objetos complexos, como palavras e imagens.

Dados não estruturados, como texto, vídeo e áudio, constituem uma parte significativa dos dados empresariais atualmente, mas os bancos de dados tradicionais costumam não ser adequados para organizar e gerenciar esses dados.

As organizações podem alimentar esses dados com modelos especializados de incorporação de deep learning, que produzem representações vetoriais chamadas “incorporações”. Por exemplo, a palavra “cat” (gato) pode ser representada pelo vetor [0,2, -0,4, 0,7], enquanto a palavra “dog” (cachorro) pode ser representada por [0,6, 0,1, 0,5].

A transformação de dados em vetores permite que as organizações armazenem diferentes tipos de dados não estruturados em um formato compartilhado em um banco de dados de vetores.

Os vetores também ajudam as organizações a liberar o valor desses dados para IA e ML. Eles capturam as relações semânticas entre elementos, permitindo o processamento eficaz por grandes modelos de linguagem (LLMs) e ferramentas de IA generativa. A maioria das aplicações avançadas de IA e ML atualmente depende de vetores para treinamento e geração de conteúdo.

Assim como outros bancos de dados de vetores, o Milvus oferece às organizações uma maneira de gerenciar e organizar vetores de incorporação. O armazenamento altamente escalável e os recursos de pesquisa de vetores eficientes do banco de dados de vetores Milvus o tornaram uma escolha popular para geração aumentada de recuperação (RAG), sistemas de recomendação e outras aplicações de IA.

Saiba mais sobre bancos de dados vetoriais

Projeto 3D de bolas rolando em uma pista

As últimas notícias e insights sobre IA  

Descubra insights selecionados por especialistas e notícias sobre IA, nuvem e outros assuntos no boletim informativo semanal Think.

Arquitetura do Milvus

O Milvus é um banco de dados de vetores nativo da nuvem com uma arquitetura de várias camadas baseada em microsserviços. O Milvus separa armazenamento e recursos de computação, o que permite que as organizações escalem cada camada de forma independente e horizontal.

O Milvus é compatível com vários modelos de incorporação diferentes. As organizações podem conectar seus modelos ao Milvus, que realiza a ingestão das incorporações juntamente com metadados e outras informações pertinentes. O Milvus aceita uploads de streaming e incorporação em lote.

O Milvus possui quatro camadas:

Camada de acesso: esta é a camada externa, que aceita inputs de usuários e serviços e retorna produções.

Serviço de coordenação: a Zilliz se refere a essa camada como o “cérebro” do sistema, pois coordena o balanceamento de carga, o gerenciamento de dados, a execução de consultas e outras tarefas importantes.

Nós de trabalho: essa camada executa consultas, atualiza dados e cria índices.

Camada de armazenamento de objetos: essa camada inclui um armazenamento de metadados, um intermediário de logs que registra mudanças de dados em tempo real e um armazenamento de objetos que contém instantâneos de logs, arquivos de índice e resultados de computação intermediários.

Tipos de implementação do Milvus

Milvus Lite: uma biblioteca Python que permite aos usuários executar o Milvus em ambientes locais. Atualmente, o Milvus Lite é compatível com Ubuntu e MacOS, mas não com Microsoft Windows.
Milvus Standalone: um banco de dados Milvus completo empacotado em uma única imagem do Docker e executado em uma única máquina.
Milvus Cluster: um banco de dados de vetores distribuído que propaga serviços entre grupos de nós em um cluster do Kubernetes.
Zilliz Cloud: a versão totalmente gerenciada do Milvus.

Mixture of Experts | 12 de dezembro, episódio 85

Decodificando a IA: resumo semanal das notícias

Participe do nosso renomado painel de engenheiros, pesquisadores, líderes de produtos e outros enquanto filtram as informações sobre IA para trazerem a você as mais recentes notícias e insights sobre IA.

Veja todos os episódios de Mixture of Experts

Principais características e recursos do Milvus

Recursos avançados de pesquisa

O Milvus permite pesquisas por similaridade vetorial de alto desempenho, um tipo de pesquisa vetorial que retorna resultados semanticamente semelhantes a uma consulta. O benefício da pesquisa por similaridade é que ela não se limita a correspondências exatas, como seria uma pesquisa tradicional por palavras-chave.

Por exemplo, uma pesquisa por palavra-chave de “melhor restaurante pizza” retornaria somente resultados contendo as palavras “melhor”, “restaurante” e “pizza”. Uma pesquisa por similaridade com a mesma palavra-chave encontraria qualquer resultado para pizzarias altamente recomendadas, mesmo que as palavras exatas “melhor restaurante pizza” não fossem usadas no conteúdo

O Milvus aceita vários tipos de pesquisa por similaridade, incluindo pesquisa aproximada dos k vizinhos mais próximos (ANN) e ANN dentro de um intervalo.

O Milvus também permite pesquisas híbridas, que combinam pesquisas vetoriais semânticas com outros critérios, como filtragem de metadados ou pesquisa de palavras-chave.

Pesquisas híbridas podem ser mais eficientes e relevantes. Considere uma pesquisa que combine pesquisa por palavra-chave e vetorial. A pesquisa pode primeiro usar palavras-chave específicas para filtrar os resultados com base em correspondências exatas e, em seguida, usar a pesquisa por similaridade vetorial para pesquisar esses resultados filtrados pelo conteúdo mais semanticamente relevante

Indexação

O Milvus aceita vários tipos de indexação, incluindo mundo pequeno navegável hierárquico (HNSW), arquivo invertido (IVF) e índices baseados em GPU.

A indexação de vetores ajuda a acelerar as pesquisas. Por exemplo, o HNSW agrupa vetores semelhantes durante o processo de construção do índice, facilitando a localização mais rápida de resultados relevantes.

Escalabilidade

As camadas do Milvus podem ser escaladas de forma independente umas das outras, o que pode proporcionar às organizações uma maneira eficiente em termos de custo e recursos para lidar com grandes volumes de dados vetoriais e pesquisas intensivas.

Integrações e compatibilidade

O Milvus oferece vários kits de desenvolvimento de software (SDKs) para permitir o desenvolvimento em várias linguagens, incluindo Python (pymilvus), Java e Go.

O Milvus também pode se integrar a ferramentas de análise de dados, como Apache Spark, frameworks como LangChain e modelos de IA generativa, como IBM® watsonx, Llama da Meta e modelos GPT da OpenAI.

Software livre

Uma grande comunidade de código aberto contribui com correções de bugs, atualizações e outras melhorias para os repositórios do GitHub do Milvus.

Milvus vs. outros bancos de dados vetoriais

Milvus vs. Pinecone

Tanto o Pinecone quanto o Milvus oferecem pesquisa de baixa latência e armazenamento escalável, mas o Pinecone é um banco de dados de vetores proprietário e está disponível apenas como um serviço gerenciado.

Milvus vs. Weaviate

Assim como o Milvus, o Weaviate é de código aberto e permite pesquisas híbridas. Uma diferença fundamental é que o Milvus oferece mais tipos de indexação do que o Weaviate.

Milvus vs. Qdrant

Outro banco de dados de vetores de código aberto é o Qdrant, conhecido por seus sólidos recursos de filtragem de metadados. Embora o Qdrant seja adequado para usos em escala moderada, o Milvus geralmente pode lidar com volumes maiores de dados vetoriais.

Milvus vs. Chroma

O Chroma se concentra na facilidade de uso e na rápida implementação local. Ele não possui uma arquitetura distribuída, o que o torna menos escalável. Enquanto o Chroma é muito usado para prototipagem e testes, o Milvus possibilita uma maior variedade de casos de uso.

Casos de uso comuns do Milvus

As organizações utilizam o Milvus para várias aplicações de IA, incluindo:

Geração aumentada de recuperação (RAG)
Sistemas de recomendação
Pesquisas de mídia
Detecção de anomalias e fraudes

Geração aumentada de recuperação (RAG)

RAG é uma arquitetura que conecta modelos de IA a bases de conhecimento externas para ajudá-los a fornecer resultados mais relevantes e precisos.

O Milvus é comum em implementações de RAG devido à sua compatibilidade com pesquisas híbridas eficientes. Ao combinar a compreensão contextual da pesquisa semântica com a precisão da pesquisa de palavras-chave e da filtragem de metadados, o Milvus ajuda a exibir documentos relevantes, trechos de código e outras informações de fontes de RAG.

CacheGPT, um cache semântico de código aberto para LLMs desenvolvido pela Zilliz, também ajuda o Milvus a viabilizar implementações de RAG. O CacheGPT armazena respostas de aplicações de IA generativa como incorporações de vetores.

Os serviços conectados, como as interfaces RAG, não precisam fazer uma chamada de API para a IA generativa a cada pesquisa. Em vez disso, eles podem verificar o cache primeiro e solicitar a IA generativa somente se a resposta não estiver lá.

Sistemas de recomendação

O Milvus é popular em sistemas de recomendação que combinam conteúdo, produtos e anúncios com usuários de acordo com comportamentos anteriores.

As preferências do usuário podem ser representadas como vetores, e uma pesquisa por similaridade pode apresentar as representações vetoriais de produtos, anúncios e conteúdo que estão próximos das preferências do usuário.

Pesquisas de mídia

Os recursos de pesquisa por similaridade do Milvus ajudam a otimizar a pesquisa de imagens, áudio, vídeo e outras pesquisas de mídia.

Detecção de anomalias e fraudes

O Milvus pode ser usado para detectar defeitos em produtos, comparando os vetores de imagens de produtos com outros que representam as formas adequadas desses produtos. Diferenças entre os vetores podem indicar defeitos.

O Milvus também serve para detectar anomalias em outros contextos. Na cibersegurança, os vetores que representam atividades de rede autorizadas podem ser comparados àqueles que representam atividades maliciosas conhecidas. Da mesma forma, em finanças, os vetores que representam transações podem ser analisados para identificar desvios indicativos de fraude.

Comece a obter ROI: Guia prático para a IA agêntica

Aprenda como escalar a IA agêntica para um ROI mensurável em toda a sua empresa. Este playbook descreve as principais barreiras que limitam o impacto, como medir o ROI de forma eficaz e um framework prático para impulsionar a adoção bem-sucedida em toda a empresa.

Recursos

Projetando uma companhia aérea nativa em IA em escala empresarial

Quando as margens são apertadas, cada ineficiência conta. Embora os sistemas legados continuem limitando o potencial da IA em toda a aviação, a Riyadh Air escolheu um caminho diferente. Em parceria com a IBM, a Riyadh Air construiu a primeira companhia aérea nativa em IA do mundo, redefinindo uma maneira mais inteligente, rápida e intuitiva de viajar.

A empresa em 2030: projetada para inovação perpétua

Descubra nossas cinco previsões sobre o que definirá as empresas mais bem-sucedidas em 2030 e as medidas que os líderes podem tomar para obterem uma vantagem que priorize a IA.

Comece a obter ROI: Guia prático para a IA agêntica

Descubra maneiras de progredir, escalando com sucesso a IA em toda a sua empresa com resultados reais.

Aumente o nível da sua expertise em IA

Adquira uma assinatura individual ou multiusuário hoje mesmo para acessar nosso catálogo completo de mais de 100 cursos online. Expanda suas habilidades em uma ampla gama de nossos produtos por um preço baixo.

De projetos de IA a lucros: como a IA agêntica pode sustentar retornos financeiros

Descubra como as organizações estão evoluindo de projetos-piloto isolados de IA para impulsionar a transformação dos principais processos de negócios com IA agêntica.

Explore o IBM Granite

O IBM® Granite é uma família de modelos de IA abertos, de alto desempenho e confiáveis, projetados para empresas e otimizados para escalar suas aplicações de IA. Explore opções de linguagem, código, séries temporais e proteções.

IBM AI Academy

Conduzido pelos principais líderes de pensamento da IBM, o currículo dessa experiência foi desenvolvido para ajudar líderes empresariais a terem o conhecimento necessário para priorizar os investimentos em IA que podem estimular o crescimento.

Libere o poder da IA generativa e do aprendizado de máquina

Saiba como incorporar com confiança a IA generativa e o aprendizado de máquina em sua empresa.

Como prosperar nesta nova era de IA com confiança e convicção

Aprofunde-se nos três elementos críticos de uma estratégia de IA sólida: criar uma vantagem competitiva, escalar a IA em toda a empresa e avançar em direção a uma IA confiável.

Soluções relacionadas

IBM watsonx Orchestrate

Projete assistentes e agentes de IA escaláveis com facilidade, automatize tarefas repetitivas e simplifique processos complexos com o IBM watsonx Orchestrate.

Explore o watsonx Orchestrate

Soluções de inteligência artificial

Coloque a IA em ação na sua empresa com a experiência em IA líder do setor e com o portfólio de soluções da IBM.

Explore as soluções de IA

Consultoria e serviços em inteligência artificial

Os serviços de IA da IBM Consulting ajudam a reimaginar a forma como as empresas trabalham com a IA para gerar transformação.

Explore os serviços de IA

Dê o próximo passo

Seja para personalizar aplicativos e habilidades pré-construídos ou para desenvolver e implementar serviços agênticos personalizados com um estúdio de IA, a plataforma IBM watsonx oferece tudo o que você precisa.

O que é Milvus?

O que é Milvus?

O que são bancos de dados de vetores e por que eles são importantes?

As últimas notícias e insights sobre IA

Arquitetura do Milvus

Tipos de implementação do Milvus

Decodificando a IA: resumo semanal das notícias

Principais características e recursos do Milvus

Milvus vs. outros bancos de dados vetoriais

Milvus vs. Pinecone

Milvus vs. Weaviate

Milvus vs. Qdrant

Milvus vs. Chroma

Casos de uso comuns do Milvus

Geração aumentada de recuperação (RAG)

Sistemas de recomendação

Pesquisas de mídia

Detecção de anomalias e fraudes

Share

Recursos

As últimas notícias e insights sobre IA