A natureza dos dados mudou drasticamente nos últimos anos. Não está mais confinada a informações estruturadas armazenadas ordenadamente nas linhas e colunas dos bancos de dados tradicionais. Os dados não estruturados– incluindo postagens em mídias sociais, imagens, vídeos e áudio – estão crescendo em volume e valor, remodelando as estratégias de IA empresarial e ao mesmo tempo colocando novas demandas na infraestrutura de dados.
Os bancos de dados relacionais tradicionais são excelentes no gerenciamento de conjuntos de dados estruturados e semiestruturados dentro de esquemas definidos. Entretanto, carregar e preparar dados não estruturados em um banco de dados relacional para cargas de trabalho de IA é trabalhoso.
A busca tradicional agrava essa limitação: ela se baseia em tokens discretos, como palavras-chave, tags ou metadados, e retorna os resultados com base em correspondências exatas. Uma busca por "smartphone", por exemplo, retorna apenas conteúdos que contenham esse termo específico.
Os bancos de dados de vetores adotam uma abordagem fundamentalmente diferente. Em vez de linhas e colunas, os pontos de dados são representados como vetores densos, onde cada dimensão representa uma característica aprendida dos dados. Essas representações vetoriais de alta dimensão existem no espaço vetorial, onde as relações entre os itens podem ser medidas geometricamente.
Como cada dimensão representa uma funcionalidade latente, uma característica inferida aprendida por meio de modelos matemáticos e algoritmos, as representações vetoriais capturam padrões ocultos. Uma pesquisa vetorial por "smartphone" também pode retornar resultados semanticamente relacionados, como "celular" ou "dispositivo móvel", mesmo que essas palavras exatas não apareçam.
Ao modelar dados em um espaço de alta dimensão e aplicar técnicas de indexação especializadas, o banco de dados vetorial possibilita realizar buscas similares de baixa latência em grandes conjuntos de dados, algo que os bancos de dados relacionais não foram projetados para suportar.