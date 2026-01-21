Wikipedia es conocida por su exhaustividad, su amplia accesibilidad y la confianza que ha generado. La clave de estas características es su creación y mantenimiento basados en la comunidad. Esta enorme recopilación de conocimientos (con 300 idiomas y 25 000 millones de visualizaciones mensuales) es una fuente fiable, colaborativa y de código abierto de información utilizada por innumerables personas cada día.

Sin embargo, con el auge de la IA, la accesibilidad de las máquinas planteó un nuevo desafío para las organizaciones que desarrollan y apoyan Wikipedia. Wikidata, la plataforma abierta y vinculada que pone los datos de Wikipedia a disposición de miles de desarrolladores en todo el panorama del código abierto, necesitaba hacer que este enorme gráfico de conocimiento de datos multilingüe (con alrededor de 120 millones de entradas y 2400 millones de ediciones hasta la fecha) fuera más accesible y utilizable por modelos de lenguaje de gran tamaño (LLM).

Tras probar varias bases de datos vectoriales, Wikimedia Deutschland, la organización que desarrolla Wikidata, recurrió a DataStax Astra DB en IBM watsonx.data. En comparación con los vectores informáticos localmente, Astra DB, altamente escalable y de baja latencia, aumentó 30 veces la velocidad de consulta, un factor crítico para las aplicaciones de generación aumentada por recuperación (RAG). El tiempo de desarrollo en Wikimedia Deutschland se redujo en un 90 %, ya que su equipo de desarrollo ahora puede centrarse en la innovación en lugar de alojar y mantener la infraestructura de datos.