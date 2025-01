Desde la escritura creativa hasta la RAG, la IA generativa es, en última instancia, un motor que ejecuta datos. El verdadero potencial de los grandes modelos de lenguaje no puede aprovecharse si algunos de esos datos están atrapados en formatos que los modelos no pueden reconocer. Los LLM son bastante nuevos, pero el problema no es, como proclamaba un titular del Washington Post de hace una década, "las soluciones a todos nuestros problemas pueden estar enterradas en PDF que nadie lee".

Por eso IBM Deep Search ha desarrollado Docling, una potente herramienta para analizar documentos en formatos populares, incluyendo PDF, DOCX, imágenes, PPTX, XLSX, HTML y AsciiDoc, y convertirlos en formatos aptos para modelos, como Markdown o JSON. Esto permite que modelos como Granite puedan acceder fácilmente a esos documentos, y a la información que contienen, a efectos de RAG y otros flujos de trabajo. Docling permite una fácil integración con marcos agénticos, como LlamaIndex, LangChain y Bee, lo que permite a los desarrolladores incorporar su ayuda al ecosistema de su elección.

Con código abierto bajo la permisiva licencia MIT, Docling es una solución sofisticada que va más allá del simple reconocimiento óptico de caracteres (OCR) y la extracción de texto. Como explica William Caban de Red Hat, Docling integra una serie de técnicas de preprocesamiento contextuales y basadas en elementos: si una tabla abarca varias páginas, Docling sabe que debe extraerla como una sola tabla; si una página determinada mezcla cuerpo de texto, imágenes y tablas, cada uno debe extraerse por separado de acuerdo con su contexto original.

El equipo detrás de Docling está trabajando activamente en características adicionales, incluyendo la extracción de ecuaciones y códigos y la extracción de metadatos. Para ver Docling en acción, consulte este tutorial para crear un sistema de respuesta a preguntas sobre documentos con Docling y Granite.