La receta para RAG: cómo los servicios en la nube permiten resultados de IA generativa en todas las industrias

Dos personas sentadas en un escritorio mirando una computadora portátil juntas

Autor

Uwe Fassnacht

Product Director for IBM Cloud Code Engine

Según una investigación de IBM, alrededor del 42 % de las empresas encuestadas utilizan IA en sus actividades. De todos los casos de uso, muchos de nosotros estamos ahora muy familiarizados con los chatbots de IA de procesamiento de lenguaje natural que pueden responder a nuestras preguntas y ayudarnos con tareas, como redactar correos electrónicos o ensayos. Sin embargo, incluso con la adopción generalizada de estos chatbots, las empresas siguen experimentando ocasionalmente algunos retos. Por ejemplo, estos chatbots pueden producir resultados incoherentes, ya que se basan en grandes almacenes de datos que podrían no ser relevantes para la consulta en cuestión.

Afortunadamente, la generación aumentada por recuperación (RAG) ha surgido como una solución prometedora para fundamentar modelos de lenguaje grande (LLM) en la información más precisa y actualizada. Como infraestructura de IA, la RAG trabaja para mejorar la calidad de las respuestas generadas por LLM basando el modelo en fuentes de conocimiento para complementar la representación interna de información del LLM. IBM presentó su nueva cartera de productos de IA, watsonx, que ofrece RAG, en mayo de 2023.

En términos simples, aprovechar la RAG es como hacer que el modelo tome un examen de libro abierto mientras le pide al chatbot que responda a una pregunta con toda la información disponible. Pero, ¿cómo opera la RAG a nivel de infraestructura? Con una combinación de servicios de plataforma como servicio (PaaS), la RAG puede ejecutarse correctamente y facilidad, lo que permite obtener resultados de IA generativa para organizaciones de todas las industrias que utilizan LLM.

La importancia de los servicios PaaS para la RAG

La IA de nivel empresarial, incluida la IA generativa, requiere una infraestructura distribuida altamente sostenible, con uso intensivo en cómputo y datos. Si bien la IA es el componente clave de la infraestructura RAG, otros "ingredientes", como las soluciones PaaS, son parte integral de la mezcla. Estas ofertas, en particular las ofertas sin servidor y de almacenamiento, operan diligentemente entre bastidores, lo que permite que los datos se procesen y almacenen con mayor facilidad, lo que proporciona resultados cada vez más precisos de los chatbots.

La tecnología sin servidor admite cargas de trabajo de uso intensivo en cómputo, como las generadas por RAG, mediante la gestión y protección de la infraestructura que las rodea. Esto devuelve tiempo a los desarrolladores, para que puedan concentrarse en la programación. La computación sin servidor permite a los desarrolladores crear y ejecutar código de aplicaciones sin aprovisionar ni gestionar servidores o infraestructura de backend.

Si un desarrollador está cargando datos en un LLM o chatbot, pero no sabe cómo preprocesar los datos para que estén en el formato correcto o filtrados para puntos de datos específicos, IBM® Cloud Code Engine puede hacer todo esto por ellos, lo que facilita el proceso general de obtener los resultados correctos de los modelos de IA. Como plataforma sin servidor totalmente gestionada, IBM Cloud Code Engine puede escalar la aplicación con facilidad a través de capacidades de automatización que gestionan y protegen la infraestructura subyacente.

Además, si un desarrollador está cargando las fuentes para los LLM, es importante disponer de un almacenamiento altamente seguro, resistente y duradero. Esto es especialmente crítico en industrias muy reguladas, como los servicios financieros, la salud y las telecomunicaciones.

IBM Cloud Object Storage, por ejemplo, proporciona seguridad y durabilidad de los datos para almacenar grandes volúmenes de datos. Gracias a sus capacidades de retención de datos inmutables y controles de auditoría, IBM Cloud Object Storage es compatible con la arquitectura RAG, lo que ayuda a salvaguardar sus datos de la manipulación o alteración por ataques de ransomware y a garantizar que cumplan con los requisitos normativos y de negocio.

Con la pila tecnológica de IBM que incluye IBM Code Engine y Cloud Object Storage, las organizaciones de industrias pueden aprovechar la RAG perfectamente y enfocarse en usar la IA más efectivamente para sus negocios.

El poder de la nube y la IA en la práctica

Hemos establecido que la RAG es extremadamente valiosa para permitir resultados de IA generativa, pero ¿cómo se ve esto en la práctica?

Blendow Group, un proveedor líder de servicios legales en Suecia, maneja una amplia gama de documentos legales, analizando, resumiendo y evaluando estos documentos que van desde sentencias judiciales hasta legislación y jurisprudencia. Con un equipo relativamente pequeño, Blendow Group necesitaba una solución escalable para ayudar en su análisis legal. Al trabajar con IBM Client Engineering y NEXER, Blendow Group creó una innovadora herramienta impulsada por IA, aprovechando las capacidades integrales para mejorar la investigación y el análisis, y agiliza el proceso de creación de contenido legal, todo mientras mantiene la máxima confidencialidad de los datos sensibles.

Mediante la pila de tecnología de IBM, que incluye IBM Cloud Object Storage e IBM Code Engine, la solución de IA se adaptó para aumentar la eficiencia y la amplitud del análisis de documentos legales de Blendow.

La Mawson’s Huts Foundation también es un excelente ejemplo de cómo aprovechar la RAG para permitir mejores resultados de IA. La fundación tiene la misión de preservar del legado de Mawson, que incluye el reclamo territorial del 42 por ciento de Australia sobre la Antártida, y educar a los escolares y a otras personas sobre la Antártida y la importancia de mantener su entorno prístino.

Con The Antarctic Explorer, una plataforma de aprendizaje impulsada por IA que se ejecuta en IBM Cloud, Mawson está brindando a los niños y a otras personas acceso a la Antártida desde un navegador dondequiera que estén. Los usuarios pueden enviar preguntas a través de una interfaz basada en el navegador y la plataforma de aprendizaje utiliza las capacidades de procesamiento de lenguaje natural (NLP) impulsadas por IA y proporcionadas por  IBM® watsonx Assistant para interpretar las preguntas y ofrecer las respuestas adecuadas con los medios asociados (videos, imágenes y documentos), que se almacenan y recuperan de IBM Cloud Object Storage.

Al aprovechar las ofertas de infraestructura como servicio junto con watsonx, tanto Mawson Huts Foundation como Blendow Group pueden obtener mayores insights de sus modelos de IA al facilitar el proceso de gestión y almacenar los datos que contienen.

Habilitación de resultados de IA generativa con la nube

La IA generativa y los LLM ya han demostrado tener un gran potencial para transformar organizaciones en todas las industrias. Ya sea para educar a la población en general o analizar documentos legales, las soluciones PaaS dentro de la nube son críticas para el éxito de la RAG y la ejecución de modelos de IA.

En IBM, creemos que las cargas de trabajo de IA probablemente formarán la columna vertebral de las cargas de trabajo de misión crítica y, en última instancia, albergarán y gestionarán los datos más confiables, por lo que la infraestructura que las rodea debe ser confiable y resiliente por diseño. Con IBM Cloud, las empresas de todas las industrias que usan IA pueden aprovechar mayores niveles de resiliencia, rendimiento, seguridad, cumplimiento y costo total de propiedad. Aprenda más sobre IBM Cloud Code Engine e IBM Cloud Object Storage a continuación.

Soluciones relacionadas
IBM Red Hat OpenShift

Red Hat OpenShift on IBM Cloud es una plataforma de contenedores OpenShift (OCP) totalmente gestionada.

Conozca Red Hat OpenShift
Soluciones de contenedores

Las soluciones de contenedores ejecutan y amplían cargas de trabajo en contenedores con seguridad, innovación de código abierto y despliegue rápido.

Explorar contenedores
Servicios de consultoría en la nube 

Desbloquee nuevas capacidades e impulse la agilidad empresarial con los servicios de IBM de asesoramiento sobre la nube. Descubra cómo crear conjuntamente soluciones, acelerar la transformación digital y optimizar el rendimiento a través de estrategias de nube híbrida y asociaciones de expertos.

Servicios en la nube
Dé el siguiente paso

Modernice su infraestructura con las soluciones de contenedores de IBM. Ejecute, escale y gestione cargas de trabajo en contenedores en todos los entornos con flexibilidad, seguridad y eficiencia mediante el uso de la plataforma integral de contenedores de IBM.

Explore las soluciones de contenedores Cree su cuenta gratuita de IBM Cloud