La receta para RAG: cómo los servicios en la nube permiten resultados de IA generativa a través de sectores

Dos personas sentadas en un escritorio mirando juntas un ordenador portátil

Autor

Uwe Fassnacht

Product Director for IBM Cloud Code Engine

Según una investigación de IBM, alrededor del 42 % de las empresas encuestadas utilizan la IA en sus negocios. De todos los casos de uso, muchos de nosotros estamos ya muy familiarizados con los ai chatbots de procesamiento del lenguaje natural que pueden responder a nuestras preguntas y ayudarnos con tareas como la redacción de correos electrónicos o ensayos. Sin embargo, incluso con la adopción generalizada de estos chatbots, las empresas siguen experimentando ocasionalmente algunos retos. Por ejemplo, estos chatbots pueden producir resultados inconsistentes porque extraen información de grandes almacenes de datos que podrían no ser relevantes para la consulta en cuestión.

Afortunadamente, la generación aumentada por recuperación (RAG) ha surgido como una solución prometedora para basar modelos de lenguaje de gran tamaño (LLM) en la información más precisa y actualizada. Como marco de IA, RAG trabaja para mejorar la calidad de las respuestas generadas por LLM basando el modelo en fuentes de conocimiento para complementar la representación interna de información del LLM. IBM presentó su nuevo portfolio de productos de IA, watsonx, que ofrece RAG, en mayo de 2023.

En términos sencillos, aprovechar la RAG es como hacer que el modelo realice un examen a libro abierto, ya que se le pide al chatbot que responda a una pregunta con toda la información disponible. Pero ¿cómo opera RAG a nivel de infraestructura? Con una combinación de servicios de plataforma como servicio (PaaS), RAG puede ejecutarse con éxito y facilidad, lo que permite obtener resultados de IA generativos para organizaciones de todos los sectores que utilizan LLM.

Cómo los servicios PaaS son críticos para RAG

La IA de nivel empresarial, incluida la IA generativa, requiere una infraestructura distribuida altamente sostenible y con un uso intensivo de datos y ordenadores. Aunque la IA es el componente clave del marco RAG, otros "ingredientes" como las soluciones PaaS forman parte integral de la mezcla. Estas ofertas, específicamente las ofertas sin servidor y de almacenamiento, operan diligentemente entre bastidores, permitiendo que los datos se procesen y almacenen más fácilmente, lo que proporciona resultados cada vez más precisos de los chatbots.

La tecnología sin servidor admite cargas de trabajo de computación intensiva, como las generadas por RAG, mediante la gestión y la protección de la infraestructura que las rodea. De este modo, los desarrolladores disponen de más tiempo para concentrarse en la codificación. La computación sin servidor permite a los desarrolladores crear y ejecutar código de aplicaciones sin aprovisionar ni gestionar servidores o infraestructura de backend.

Si un desarrollador está cargando datos en un chatbot o LLM, pero no está seguro de cómo preprocesar los datos para que estén en el formato correcto o filtrados para puntos de datos específicos, IBM Cloud Code Engine puede hacer todo esto por ellos, facilitando el proceso general de obtener resultados correctos de los modelos de IA. Como plataforma sin servidor totalmente gestionada, IBM Cloud Code Engine puede escalar la aplicación con facilidad a través de capacidades de automatización que gestionan y protegen la infraestructura subyacente.

Además, si un desarrollador está cargando las fuentes de los LLM, es importante contar con un almacenamiento altamente seguro, resiliente y duradero. Esto es especialmente crítico en sectores altamente regulados como los servicios financieros, la sanidad y las telecomunicaciones.

IBM Cloud Object Storage, por ejemplo, proporciona seguridad y durabilidad de datos para almacenar grandes volúmenes de datos. Con capacidades de retención de datos inmutables y control de auditoría, IBM Cloud Object Storage da soporte a RAG ayudando a salvaguardar sus datos de la manipulación o alteración por ataques de ransomware y ayuda a garantizar que cumple los requisitos de conformidad y de negocio.

Con la vasta pila de tecnología de IBM, que incluye Code Engine y Cloud Object Storage, las organizaciones de todos los sectores pueden aprovechar RAG de manera fluida y concentrarse en aprovechar la IA de manera más efectiva para sus negocios.

El poder de la nube y la IA en la práctica

Hemos establecido que la GAR es extremadamente valiosa para permitir resultados generativos de IA, pero ¿cómo es esto en la práctica?

Blendow Group, un proveedor líder de servicios legales en Suecia, gestiona una amplia variedad de documentos legales: analiza, resume y evalúa estos documentos que van desde fallos judiciales hasta legislación y jurisprudencia. Con un equipo relativamente pequeño, Blendow Group necesitaba una solución escalable para ayudar en su análisis legal. Al trabajar con IBM Client Engineering y NEXER, Blendow Group creó una innovadora herramienta impulsada por IA que aprovecha las capacidades integrales para mejorar la investigación y el análisis, y agiliza el proceso de creación de contenido legal, todo ello manteniendo la máxima confidencialidad de los datos confidenciales.

Al utilizar la pila tecnológica de IBM, incluidos IBM Cloud Object Storage e IBM Code Engine, la solución de IA se adaptó para aumentar la eficiencia y la amplitud del análisis de documentos jurídicos de Blendow.

La Mawson's Huts Foundation también es un excelente ejemplo de cómo aprovechar RAG para lograr mejores resultados en IA. La misión de la fundación es preservar el legado de Mawson, que incluye la reivindicación territorial australiana del 42 % de la Antártida, y educar a los escolares y otras personas sobre la propia Antártida y la importancia de preservar su entorno prístino.

Con The Antarctic Explorer, una plataforma de aprendizaje con IA que funciona en IBM Cloud, Mawson brinda a los niños y otras personas acceso a la Antártida desde un navegador dondequiera que estén. Los usuarios pueden enviar preguntas a través de una interfaz basada en navegador y la plataforma de aprendizaje utiliza las capacidades de procesamiento del lenguaje natural potenciadas por IA proporcionadas por IBM watsonx Assistant para interpretar las preguntas y ofrecer respuestas adecuadas con medios asociados (vídeos, imágenes y documentos) que se almacenan y recuperan de IBM Cloud Object Storage.

Al aprovechar las ofertas de infraestructura como servicio junto con watsonx, tanto Mawson Huts Foundation como Blendow Group pueden obtener más conocimientos de sus modelos de IA al facilitar el proceso de gestión y almacenamiento de los datos que contienen.

Resultados de la IA generativa con la nube

La IA generativa y los LLM ya han demostrado tener un gran potencial para transformar organizaciones en todos los sectores. Ya se trate de educar a la población en general o de analizar documentos jurídicos, las soluciones PaaS en la nube son críticas para el éxito de RAG y la ejecución de modelos de IA.

En IBM, creemos que las cargas de trabajo de IA probablemente formarán la columna vertebral de las cargas de trabajo de misión crítica y, en última instancia, albergarán y gestionarán los datos más fiables, por lo que la infraestructura que las rodea debe ser fiable y resiliente por diseño. Con IBM Cloud, las empresas de todos los sectores que utilizan IA pueden aprovechar niveles más altos de resiliencia, rendimiento, seguridad, cumplimiento y coste total de propiedad. Obtenga más información sobre IBM Cloud Code Engine e IBM Cloud Object Storage a continuación.

Soluciones relacionadas
IBM Red Hat OpenShift

Red Hat OpenShift on IBM Cloud es una plataforma de contenedores OpenShift (OCP) totalmente gestionada.

Descubra Red Hat OpenShift
Soluciones de contenedores

Las soluciones de contenedores ejecutan y amplían cargas de trabajo en contenedores con seguridad, innovación de código abierto e implementación rápida.

Explore los contenedores
Servicios de consultoría en la nube 

Desbloquee nuevas capacidades e impulse la agilidad empresarial con los servicios de consultoría de nube de IBM. Descubra cómo cocrear soluciones, acelerar la transformación digital y optimizar el rendimiento mediante estrategias de nube híbrida y colaboraciones con expertos.

Servicio en la nube
Dé el siguiente paso

Modernice su infraestructura con las soluciones de contenedores de IBM. Ejecute, escale y gestione cargas de trabajo en contenedores en distintos entornos con flexibilidad, seguridad y eficiencia mediante la plataforma integral de contenedores de IBM.

  1. Explore las soluciones de contenedores
  2. Cree su cuenta gratuita de IBM Cloud