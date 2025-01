De l’écriture créative à la RAG, l’IA générative est en fin de compte un moteur qui fonctionne à partir de données. Le véritable potentiel des grands modèles de langage demeure inexploité si certaines de ces données sont piégées dans des formats que les modèles ne peuvent pas reconnaître. Les LLM sont relativement nouveaux, mais le problème ne l’est pas : comme le déclarait un titre du Washington Post datant d’une dizaine d’années, « les solutions à tous nos problèmes sont peut-être enfouies dans des PDF que personne ne lit ».

C’est pourquoi IBM Deep Search a développé Docling, un outil puissant pour analyser des documents dans des formats populaires tels que PDF, DOCX, images, PPTX, XLSX, HTML et AsciiDoc et les convertir dans des formats adaptés aux modèles comme Markdown ou JSON. Ces documents – et les informations qu’ils contiennent – sont ainsi facilement accessibles par des modèles tels que Granite à des fins de RAG et d’autres workflows. Docling facilite l’intégration aux frameworks agentiques tels que LlamaIndex, LangChain et Bee, ce qui permet aux développeurs d’incorporer son assistance dans l’écosystème de leur choix.

En accès open source sous licence permissive MIT, Docling est une solution sophistiquée qui va au-delà de la simple reconnaissance optique de caractères (OCR) et de l’extraction de texte. Comme l’explique William Caban de Red Hat, Docling intègre un certain nombre de techniques de prétraitement contextuel et basées sur les éléments : si un tableau s’étend sur plusieurs pages, Docling sait qu’il faut l’extraire comme un seul tableau ; si une page donnée mélange corps de texte, images et tableaux, chaque élément doit être extrait séparément en fonction de son contexte d’origine.

L’équipe à l’origine de Docling s’emploie à mettre au point des fonctionnalités supplémentaires, notamment l’extraction d’équations et de code et l’extraction de métadonnées. Pour voir Docling en action, consultez ce tutoriel sur la création d’un système de réponse aux questions sur les documents avec Docling et Granite.