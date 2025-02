O índice de armazenamentos de vetores é comumente usado em aplicações de LLMs seguindo o padrão RAG, pois ele se destaca no tratamento de consultas de linguagem natural. A precisão da recuperação de consultas de linguagem natural depende da pesquisa semântica, ou pesquisa baseada no significado em vez da correspondência de palavras-chave.7 A pesquisa semântica é habilitada ao converter dados de entrada em incorporações vetoriais. Uma incorporação vetorial é uma representação numérica da semântica dos dados que o LLM pode processar. A relação matemática entre incorporações vetoriais permite que os LLMs recuperem dados com base no significado dos termos de consulta para obter respostas mais ricas em contexto.

O "VectorStoreIndex" pega as coleções de dados, ou objetos "documentos" e os divide em "nós", que são unidades atômicas de dados que representam um "fragmento" dos dados de origem ("documento"). Depois que a coleta de dados é dividida em fragmentos, as incorporações vetoriais de cada bloco de dados são criadas. Os dados integrados agora estão em um formato no qual o LLM pode executar consultas. Esses índices vetoriais podem ser armazenados para evitar a reindexação. A maneira mais simples de armazenar dados é mantê-los em disco, mas o LlamaIndex se integra a vários bancos de dados vetoriais e modelos de incorporação.8

Para pesquisar inserções, a consulta do usuário é primeiro convertida em uma incorporação vetorial. Em seguida, um processo matemático é usado para classificar todas as incorporações com base em sua semelhança semântica com a consulta.

O índice de armazenamentos de vetores usa a recuperação semântica top-k para retornar as incorporações mais semelhantes como seus fragmentos de texto correspondentes. O LlamaIndex foi projetado para facilitar a criação e o gerenciamento de índices de grande escala para a recuperação eficiente de informações.