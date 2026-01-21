Wikipédia est réputé pour sa rigueur, sa grande accessibilité et la confiance qu’il suscite. La clé de ses atouts réside dans sa création et sa maintenance communautaires. Cette immense compilation de connaissances, qui compte 300 langues et 25 milliards de vues mensuelles, est une source d’information fiable, collaborative et open source, utilisée chaque jour par d’innombrables personnes.

Cependant, avec l’essor de l’IA, l’accessibilité des machines a posé un nouveau défi aux entreprises qui développent et soutiennent Wikipédia. Wikidata, la plateforme ouverte liée qui met les données de Wikipédia à la disposition de milliers de développeurs dans l’environnement open source, devait rendre cet énorme graphe de connaissances multilingues (avec environ 120 millions d’entrées et 2,4’milliards de modifications à ce jour) plus accessible aux grands modèles de langage (LLM) et plus facile à utiliser.

Après avoir testé plusieurs bases de données vectorielles, Wikimedia Deutschland, l’entreprise qui développe Wikidata, s’est tournée vers DataStax Astra DB sur IBM watsonx.data. Par rapport au calcul local des vecteurs, la base de données Astra DB, hautement évolutive et à faible latence, a permis de multiplier par 30 la vitesse des requêtes, un facteur critique pour les applications de génération augmentée par récupération (RAG). Le temps de développement chez Wikimedia Deutschland a été réduit de 90 %, car son équipe de développement peut désormais privilégier l’innovation au lieu de se concentrer sur l’hébergement et la maintenance de l’infrastructure de données.