¿Qué es la fragmentación agéntica?

Autores

Staff writer

Staff Editor, AI Models

IBM Think

La fragmentación agentiva es el uso de inteligencia artificial (IA) para segmentar entradas de texto largas en bloques más pequeños y semánticamente coherentes conocidos como fragmentos. Si bien muchas estrategias tradicionales de fragmentación tienden a utilizar fragmentos de tamaño fijo al dividir el texto, la fragmentación agentiva segmenta dinámicamente el texto en función del contexto.

Los modelos de lenguaje de gran tamaño (LLM) no pueden procesar una gran secuencia de entrada basada en texto en su totalidad. La ventana de contexto de un modelo de procesamiento de lenguaje natural (PLN) determina la cantidad máxima de contenido que el modelo puede ingerir mientras mantiene la comprensión contextual. Los sistemas de machine learning (ML) utilizan técnicas de fragmentación para dividir los documentos en partes que se ajusten a la ventana de contexto del LLM.

Las últimas tendencias de IA presentadas por expertos

Obtenga insights curados sobre las noticias más importantes e intrigantes de la IA. Suscríbase a nuestro boletín semanal Think. Consulte la Declaración de privacidad de IBM .

Fragmentación y RAG

El desarrollo de la generación aumentada por recuperación (RAG), que conecta los LLM a fuentes de datos externas, requirió la creación de sistemas de fragmentación. Los sistemas RAG surgieron para ayudar a contrarrestar el problema de las alucinaciones: cuando los LLM ofrecían respuestas que no reflejaban resultados o información del mundo real.

Los sistemas RAG ayudan a los LLM a generar respuestas más precisas y útiles combinándolas con bases de conocimiento adicionales. En muchos casos, las bases de conocimiento de RAG son bases de datos vectoriales que contienen documentos que dan acceso al LLM conectado a conocimientos específicos del dominio. Los modelos de incorporación convierten documentos en vectores matemáticos, luego hacen lo mismo para las consultas de los usuarios.

El sistema RAG encuentra incorporaciones dentro de su base de datos vectorial que representan información relevante y coinciden con la consulta del usuario. Luego, el LLM utiliza los datos recuperados para proporcionar a los usuarios respuestas más relevantes y precisas.

Pero debido a las limitaciones de la ventana de contexto, el LLM no puede procesar un solo documento a la vez. La fragmentación surgió como la solución. Al dividir un documento en partes, el LLM puede encontrar eficientemente fragmentos relevantes en tiempo real mientras mantiene la comprensión contextual.

AI Academy

Conviértase en un experto en IA

Obtenga el conocimiento para priorizar las inversiones en IA que impulsan el crecimiento del negocio. Comience hoy mismo con nuestra AI Academy gratuita y lidere el futuro de la IA en su organización.

Ver la serie

Otros métodos de fragmentación

La fragmentación de agentes permite a los LLM crear fragmentos significativos que les ayudan a proporcionar mejores respuestas, como con el caso de uso de RAG. Algunos métodos de fragmentación también tienen en cuenta la semántica, mientras que otros dividen los documentos en fragmentos más pequeños de longitud fija.

Otros métodos de fragmentación incluyen:

Fragmentación de tamaño fijo

La estrategia más simple, la fragmentación de tamaño fijo, divide el texto en bloques del mismo tamaño, en función de un carácter preestablecido o un recuento de token. Un token es la cantidad mínima de texto que el LLM puede procesar, a menudo una palabra o una parte de ella.

Para evitar dividir oraciones, muchas implementaciones de fragmentación de tamaño fijo incluyen una característica que repite el final de un fragmento al comienzo del siguiente. La fragmentación de tamaño fijo es simple y computacionalmente ligera, pero es rígida: no puede tener en cuenta la densidad del contenido o la estructura del documento y puede crear fragmentos semánticamente incoherentes.

Fragmentación recursiva

La fragmentación recursiva utiliza una lista jerárquica de separadores de texto predefinidos para dividir el texto de una manera que probablemente sea más coherente. Los separadores incluyen estructuras naturales, como párrafos, oraciones o palabras. En un documento de programación de Python, los separadores pueden incluir definiciones de clases y funciones.

En comparación con la fragmentación de tamaño fijo, la fragmentación recursiva crea fragmentos más coherentes siguiendo las separaciones naturales en el texto. El uso de Markdown también puede ayudar al algoritmo de fragmentación, o chunker, a descubrir dónde hacer divisiones. RecursiveCharacterTextSplitter es un fragmentador popular disponible en LangChain.

Pero si el texto carece de separadores claros, los algoritmos de fragmentación recursiva no sabrán dónde crear nuevos fragmentos. La fragmentación recursiva también es más intensiva desde el punto de vista computacional que la fragmentación de tamaño fijo.

Fragmentación semántica

La fragmentación semántica utiliza modelos de incorporación para crear representaciones matemáticas de cada oración. Luego, el algoritmo de fragmentación crea fragmentos de oraciones semánticamente similares, creando un nuevo fragmento que detecta un cambio en la semántica. La fragmentación semántica se atribuye a Greg Kamradt, quien habló sobre la técnica en Github.¹

La fragmentación semántica es consciente del contexto, creando fragmentos en torno al flujo natural y el significado semántico del documento. Cuando el tema cambia, se crea un nuevo fragmento. Sin embargo, pueden surgir problemas cuando los párrafos tratan varios temas o si el umbral de fragmentación no se establece correctamente para el tipo y la estructura del documento.

La fragmentación semántica es más intensiva desde el punto de vista computacional que la fragmentación recursiva y de tamaño fijo, y requiere modelos avanzados para identificar el contenido semántico dentro del texto.

¿Cómo funciona la fragmentación agéntica?

La fragmentación agéntica es un ejemplo de automatización agéntica: usando agentes de IA para automatizar un flujo de trabajo. En este caso, el flujo de trabajo que se automatiza de forma inteligente es el proceso de determinar cómo dividir un documento en fragmentos más pequeños que se ajusten a la ventana de contexto de un LLM.

IA agéntica se refiere al uso de sistemas de IA para tomar decisiones autónomas y actuar sin intervención humana. Con la fragmentación agéntica, el agente actúa por sí solo para determinar cómo separar el texto y etiquetar los fragmentos.

La fragmentación agéntica se basa en otros métodos de fragmentación para crear secciones superpuestas y división recursiva, luego aplica IA generativa para etiquetar cada fragmento con metadatos para facilitar la recuperación de RAG.

La fragmentación agéntica aún se encuentra en las etapas exploratorias. Los creadores comparten y debaten sus enfoques en GitHub. A menudo se crean con el lenguaje de programación Python utilizando marcos LLM como Llamaindex y Langchain junto con LLM de código abierto disponibles en Huggingface.

Un flujo de trabajo de IA típico para la fragmentación agéntica puede contener estos pasos:

1. Preparación del texto

Mediante herramientas de automatización inteligentes, el texto se extrae del documento de origen, como un PDF, y se limpia. La limpieza de texto implica la eliminación de elementos superfluos, como números de página y pies de página, para que el LLM reciba solo texto sin procesar.

2. División de texto

Los algoritmos de fragmentación recursiva dividen el texto en pequeños fragmentos para evitar cortar las oraciones en pedazos. Al igual que la fragmentación semántica, la fragmentación agéntica divide dinámicamente el texto en función del significado, la estructura y la concientización del contexto mediante la técnica de superposición de fragmentos.

3. Etiquetado de fragmentos

Los LLM, como GPT de OpenAI, procesan, combinan y enriquecen los fragmentos. Los fragmentos más pequeños se combinan en otros más grandes que mantienen la coherencia semántica. El LLM enriquece cada fragmento con metadatos que incluyen un título y un resumen del contenido del fragmento. Los metadatos generados ayudan a los usos posteriores, como con los sistemas RAG agentivos.

4. Incorporación

Cada fragmento se convierte en una incorporación y se almacena en una base de datos vectorial. Los modelos de recuperación consultan la base de datos, utilizan la búsqueda semántica para encontrar fragmentos con metadatos relevantes y los incluyen en las instrucciones para el LLM en el sistema RAG.

La configuración de prompt_template en LangChain determina la instrucción de entrada dada al LLM. Aprenda más sobre cómo optimizar la fragmentación de RAG con LangChain y watsonx.ai.

Beneficios de la fragmentación agéntica

En comparación con los métodos tradicionales de fragmentación, el dinamismo de la fragmentación agéntica y el etiquetado de metadatos lo convierten en una excelente opción para la implementación de RAG. Los beneficios incluyen:

Recuperación eficiente: los títulos y resúmenes generados por IA para cada fragmento pueden ayudar a los sistemas RAG a encontrar información relevante más rápido en conjuntos de datos conectados.
Respuestas precisas: la fragmentación semánticamente coherente con metadatos generados por IA puede ayudar a los sistemas RAG a aumentar las respuestas generadas con datos relevantes para obtener mejores respuestas.
Flexibilidad: la fragmentación impulsada por IA puede manejar una amplia gama de tipos de documentos. Los sistemas de fragmentación de agentes pueden integrarse con varias cadenas LLM y RAG para seguir el ritmo del crecimiento y la expansión del proyecto.
Preservación del contenido: los sistemas de fragmentación de agentes se basan en métodos de fragmentación anteriores para crear fragmentos que preserven el significado semántico y la coherencia.

Comience a obtener el retorno de la inversión (ROI): una guía práctica para la IA agéntica

Aprenda a escalar la IA agéntica para obtener un retorno de la inversión (ROI) medible en toda su empresa. Este playbook describe las principales barreras que limitan el impacto, cómo medir eficazmente el ROI y un marco práctico para impulsar una adopción exitosa en toda la empresa.

Recursos

La empresa en 2030: diseñada para la innovación perpetua

Descubra nuestras cinco predicciones sobre lo que definirá a las empresas más exitosas en 2030 y las medidas que los líderes pueden tomar para obtener una ventaja que prioriza la IA.

El imperativo de la gobernanza de la IA: regulaciones en evolución y aparición de la IA agéntica

Descubra cómo la evolución de las regulaciones y la aparición de los agentes de IA están transformando la necesidad de contar con infraestructuras sólidas de gobernanza de la IA.

Explicación de la IA agéntica

Techsplainers de IBM desglosa los aspectos esenciales de la IA agéntica, desde conceptos clave hasta casos de uso del mundo real. Los episodios claros y rápidos le ayudan a aprender los fundamentos rápidamente.

Desbloquee el retorno de la inversión (ROI) de la IA: una guía táctica para la productividad empresarial

Aprenda estrategias comprobadas para impulsar la productividad y potenciar la transformación empresarial con IA e innovación en el núcleo.

Cómo los agentes de IA y asistentes pueden beneficiar a su organización

Sumérjase en esta guía completa que desglosa los casos de uso clave y las capacidades principales, además de proporcionar recomendaciones paso a paso para ayudarle a elegir las soluciones adecuadas para su negocio.

Reinvente la productividad empresarial con agentes y asistentes de IA

Descubra cómo los agentes y asistentes de IA pueden trabajar juntos para alcanzar nuevos niveles de productividad.

Pruebe watsonx Orchestrate

Explore cómo los asistentes de IA generativa pueden aligerar su carga de trabajo y mejorar la productividad.

De los proyectos de IA a los beneficios: Cómo la IA agéntica puede mantener la rentabilidad financiera

Descubra cómo las organizaciones están pasando de lanzar IA en pilotos Dispar a usarla para impulsar la Transformación en el núcleo.

Informe de Omdia sobre inteligencia potenciada: el impacto de los agentes de IA

Descubra cómo puede desbloquear todo el potencial de la IA generativa con agentes de IA.

Cómo los agentes de IA reinventarán la productividad

Aprenda formas de utilizar la IA para tener más creatividad y eficiencia, y comenzar a adaptarse a un futuro que implica trabajar en estrecha colaboración con los agentes de IA.

El comienzo de la empresa agéntica: poner la IA a trabajar en todo su patrimonio tecnológico

Manténgase actualizado sobre los nuevos agentes de IA emergentes, un punto de inflexión fundamental en la revolución de la IA.

El futuro de los agentes, el consumo de energía de la IA, el uso informático de Anthropic y el texto generado por IA con marcas de agua de Google

Manténgase a la vanguardia con nuestros expertos en IA en este episodio de Mixture of Experts mientras investigan a profundidad el futuro de los agentes de IA y otros temas.

Cómo Comparus utiliza un "asistente bancario"

Comparus utilizó soluciones de watsonx.ai y demostró de manera impresionante el potencial de la banca conversacional como un nuevo modelo de interacción.

Soluciones relacionadas

Agentes de IA para empresas

Cree, implemente y gestione poderosos asistentes y agentes de IA que automaticen flujos de trabajo y procesos con IA generativa.

Explore watsonx Orchestrate

Soluciones de agentes de IA de IBM

Construya el futuro de su empresa con soluciones de IA en las que pueda confiar.

Explorar las soluciones de agentes de IA

Servicios de IA de IBM Consulting

Los servicios de IA de IBM Consulting ayudan a reinventar la forma en que las empresas trabajan con IA para la transformación.

Explorar los servicios de inteligencia artificial

Dé el siguiente paso

Ya sea que elija personalizar aplicaciones y habilidades predefinidas o crear y desplegar servicios agénticos personalizados utilizando un estudio de IA, la plataforma IBM watsonx responde a sus necesidades.