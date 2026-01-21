A Wikipedia é reconhecida por sua abrangência, ampla acessibilidade e pela confiança que gerou. O segredo dessas características é a criação e manutenção baseadas na comunidade. Essa enorme compilação de conhecimento (atingindo 300 idiomas e 25 bilhões de visualizações mensais) é uma fonte confiável, colaborativa e código aberto de informações usada por inúmeras pessoas todos os dias.

No entanto, com o surgimento da IA, a acessibilidade das máquinas representou um novo desafio para as organizações que desenvolvem e apoiam a Wikipedia. A Wikidata, a plataforma aberta e vinculada que torna os dados da Wikipedia disponíveis para milhares de desenvolvedores em todo o cenário de código aberto, precisava tornar esse enorme gráfico de conhecimento de dados multilíngue (com cerca de 120 milhões de entradas e 2,4 bilhões de edições até o momento) mais acessível e utilizável por grandes modelos de linguagem (LLMs).

Após testar vários bancos de dados de vetores, a Wikimedia Deutschland, a organização que desenvolve a Wikidata, recorreu ao DataStax Astra DB on IBM watsonx.data. Comparado aos vetores de computação localmente, o Astra DB altamente escalável e de baixa latência aumentou a velocidade de consulta, um fator crítico para aplicativos de geração aumentada de recuperação (RAG) em 30 vezes. O tempo de desenvolvimento na Wikimedia Deutschland viu uma redução de 90%, pois sua equipe de desenvolvimento agora pode se concentrar na inovação em vez de hospedar e manter a infraestrutura de dados.