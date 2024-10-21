El 72 % de los CEO con mejor desempeño están de acuerdo en que tener las herramientas de IA generativa más avanzadas da a la organización una ventaja competitiva, según el IBM Institute for Business Value. Pero si esas herramientas de IA generativa no se basan en el contexto único de una empresa, es posible que las organizaciones no obtengan todos los beneficios de ellas.
Por muy potentes que sean los grandes modelos de IA generativa de propósito general como ChatGPT y Google Gemini, no están entrenados con conjuntos de datos específicos de la organización. Cuando están conectados a los procesos de una organización, pueden estar perdiendo información importante que puede confundirse y producir resultados subóptimos.
“Cada empresa tiene su propio lenguaje”, explica Michael Choie, consultor gerente sénior de IA y análisis, IBM Consulting. “Piense en la palabra ‘batería’” En una tienda de música, “batería” es un instrumento. En una tienda de electrónica, “batería” es la pila o acumulador de un dispositivo”.
IBM se asoció con The Harris Poll para publicar La IA en acción 2024, una encuesta a 2000 organizaciones de todo el mundo. La encuesta descubrió que el 15 % de estas organizaciones, llamadas líderes en IA, están logrando resultados cuantificables con la IA.
Algo que distingue a los líderes de la IA es la confianza en su capacidad para personalizar sus esfuerzos de IA para obtener un valor óptimo. Esto no significa que una organización deba crear sus propios modelos desde cero para destacar entre la multitud. En su lugar, puede adaptar los modelos de IA existentes aprovechando lo único que nadie más tiene: los datos empresariales propios.
"Cada proveedor de IA, como X o Google, tiene acceso a la información pública. También tienen acceso a los datos de sus propias plataformas", explica Shobhit Varshney, vicepresidente y socio sénior, líder de IA en América, IBM Consulting. “A lo que no tienen acceso es a los datos de su empresa. Falta esa pieza del rompecabezas”.
Como Varshney explica en La IA en acción 2024, “La próxima frontera es hacer que la IA cruce el abismo y entre en una empresa para que pueda absorber, aprender y convertirse en su ventaja competitiva”.
Boletín del sector
Obtenga conocimientos organizados sobre las noticias más importantes e intrigantes de la IA. Suscríbase a nuestro boletín semanal Think. Consulte la Declaración de privacidad de IBM.
Su suscripción se enviará en inglés. Encontrará un enlace para darse de baja en cada boletín. Puede gestionar sus suscripciones o darse de baja aquí. Consulte nuestra Declaración de privacidad de IBM para obtener más información.
Existen tres formas principales de alimentar un modelo de IA con datos propios: ingeniería de prompts, la generación aumentada por recuperación (RAG) y el fine-tuning.
En este contexto, ingeniería de prompts significa incluir datos propietarios en la instrucción que se pasa a la IA.
Supongamos que un usuario quiere un modelo de IA para resumir las conversaciones de un call center. El usuario puede escribir una instrucción (“Resume esta conversación”) y adjuntar la transcripción de la llamada como parte de la instrucción.
La ingeniería de prompts no requiere modificar el modelo en sí. Es más adecuada para tareas genéricas de bajo volumen donde es razonable incluir el contexto necesario en cada prompt.
Generación aumentada por recuperación (RAG) significa conectar modelos de IA a una base de datos propietaria. El modelo puede extraer información relevante de esta base de datos cuando responde a las solicitudes.
Por ejemplo, una organización puede dar a un chatbot de atención al cliente acceso a una base de datos de productos de la empresa. Cuando los usuarios hacen preguntas al chatbot sobre estos productos, puede consultar la documentación correspondiente y recuperar la respuesta correcta.
La RAG no requiere ningún cambio permanente en el modelo. Puede mejorar la precisión y reducir las alucinaciones, pero también puede aumentar los tiempos de respuesta.
Fine-tuning significa dar a un modelo de IA suficientes datos adicionales para cambiar algunos de sus parámetros. El fine-tuning cambia permanentemente el comportamiento de un modelo, adaptándolo a un caso de uso o contexto particular. Además, es más rápido y barato que entrenar un modelo nuevo.
"Si tiene una red neuronal que tiene 100 capas diferentes, entrenarla significaría modificar las 100 capas", explica Choie. "El fine-tuning significaría que realmente está cambiando las últimas capas. Sigue modificando el modelo, pero no tiene que cambiarlo por completo porque ya está funcionando bien".
El fine-tuning requiere un poco más de inversión inicial que la ingeniería de prompts y la RAG. Es útil para convertir a un modelo más pequeño en un experto en un campo especializado. Por ejemplo, una compañía de seguros puede afinar un modelo para dominar el arte de procesar nuevas reclamaciones.
Varshney compara un modelo puesto a punto con un nuevo empleado recién salido de la escuela que recibe una formación intensiva. Puede que no tengan el conocimiento que tiene un polímata genio (o un gran modelo de IA de propósito general), pero son mucho mejores procesando afirmaciones que el polímata.
"No puede hacer sus impuestos ni redactar un contrato legal", dice Varshney, "pero si le pido que procese una reclamación, sabría cómo hacerlo de inmediato".
El uso de datos propietarios de esta manera puede ofrecer una ventaja competitiva significativa al familiarizar los modelos de IA con los procesos, productos, clientes y otros matices únicos de una empresa.
"Si tiene una IA cuyos principales usuarios son de una empresa en particular, es importante que la IA utilice datos de esa misma empresa", dice Choie.
Cuando los modelos de IA tienen acceso a datos propietarios, se basan en un contexto empresarial específico, lo que significa que sus resultados también se basan en ese contexto.
"Puedo coger un modelo de IA abierto, ajustarlo con mis propios datos y esa copia es exclusivamente mía", afirma Varshney. “Soy el propietario de la propiedad intelectual detrás de esto. Lo ejecuto en mi propia infraestructura”.
Como resultado, estos modelos pueden producir resultados más precisos y efectivos que los modelos estándar no aumentados que extraen de un cuerpo general de datos públicos.
Las organizaciones pueden utilizar muchos tipos diferentes de modelos de IA para lograr resultados. Pero los modelos de código abierto, como los modelos IBM Granite, que están disponibles bajo una licencia Apache 2.0 para un uso comercial amplio y sin restricciones, ofrecen ciertos beneficios.
"Cuando se entrena un modelo de IA, hay muchos parámetros y técnicas diferentes que hay que ajustar para garantizar que el modelo aprenda de forma eficaz y eficiente. Necesita científicos de datos especializados y expertos en machine learning para configurarlo", explica Choie. “El beneficio de perfeccionar los modelos abiertos es que contamos con estos modelos que algunas personas brillantes ya han utilizado. Todo lo que necesitamos hacer es alimentar a los modelos con datos adicionales específicos de cada tarea y ajustar algunas capas, lo cual es una tarea mucho más sencilla que construir un modelo".
Además de permitir que las organizaciones se beneficien de la sabiduría del público, los modelos de código abierto pueden permitirles experimentar sin que el coste del fracaso sea demasiado alto. Esta experimentación, a su vez, ayuda a las organizaciones a seguir una estrategia multimodelo, utilizando muchos modelos diferentes y ajustados de manera diferente para tareas específicas del dominio.
Esta estrategia multimodelo se considera una buena práctica. La IA en acción 2024 descubrió que el 62 % de los líderes de IA utilizan varios modelos, en comparación con el 32 % de los estudiantes de IA.
"Es casi una obviedad utilizar modelos de código abierto", dice Choie. "Son rentables, tienen a algunas de las mejores personas de la industria trabajando en ellos, y cada vez que hay actualizaciones o problemas, la comunidad trabaja en ellos juntos".
La gestión de datos es una de las características clave que separa a los líderes de IA de otras organizaciones, según La IA en acción 2024. El 61 % de los líderes de IA creen en su capacidad para acceder y gestionar eficazmente los datos de la organización para apoyar las iniciativas de IA, frente al 11 % de los estudiantes de IA.
Pero alimentar con datos propios los modelos de IA no es tan sencillo como parece. Los silos de datos, el control de calidad y otros problemas pueden interponerse en el camino.
A grandes rasgos, la solución consiste en implantar un tejido de datos integrado que derribe silos, garantice la interoperabilidad y orqueste el movimiento fluido de datos entre plataformas.
¿Pero cómo se ve esto en la práctica? Estas son algunas consideraciones clave:
Los primeros obstáculos para muchos esfuerzos de IA son la recopilación y el almacenamiento de datos, procesos que no son tan simples como parecen.
La captura de datos en bases de datos tradicionales a menudo conduce a silos de datos, lo que puede impedir que una organización agregue todos los datos que necesita para crear una base de datos RAG eficaz o ajustar modelos. Según IBM Data Differentiator, el 82 % de las empresas experimentan silos de datos que obstaculizan sus flujos de trabajo clave.
Las organizaciones necesitan implementar canalizaciones para recuperar datos de fuentes dispares, prepararlos para su uso y depositarlos en un almacén accesible y centralizado.
La recuperación y preparación de datos puede implicar el uso de herramientas de procesamiento de flujo, como Apache Kafka, o herramientas de integración de datos preparadas para ETL y ELT , como IBM DataStage. Las organizaciones también deben elegir los repositorios adecuados para los datos, que pueden incluir:
Data lakes, que ofrecen entornos de almacenamiento de bajo coste diseñados para manejar cantidades masivas de datos estructurados y datos no estructurados sin procesar.
Almacenes de datos, que están diseñados para respaldar los esfuerzos de análisis de datos, inteligencia empresarial y ciencia de datos.
Lakehouses de datos, como watsonx.data, que combinan las capacidades de los almacenes y los lakes en una única solución de gestión de datos.
Una infraestructura de nube híbrida es también un componente importante de los esfuerzos de integración de datos. En la actualidad, muchas empresas tienen datos distribuidos entre almacenes de datos locales y múltiples servicios en la nube.
"Debe asegurarse de que puede agregar toda esta información, sin importar dónde se encuentre, e introducirla en sus modelos de IA", dice Choie. “Si no hace un modelo híbrido, se perderá algo”.
Las malas entradas conducen a malos outputs. Las organizaciones deben asegurarse de que los datos propios que introducen en los modelos de IA son fiables y precisos.
"Necesita descubrir el oro en sus datos, el diferenciador, para poder amplificarlo", dice Varshney. "Desea reducir el ruido en los datos y desea proporcionar datos de alta calidad para afinar".
Los datos deben limpiarse antes de pasarlos a una IA. De lo contrario, puede empeorar el rendimiento del modelo.
Varshney ofrece el ejemplo de un ticket de call center con una solución no tan obvia: "La gente puede probar cinco formas diferentes de solucionarlo antes de encontrar la que funciona. No puede enviar ese ticket directamente al modelo. Será muy ruidoso. Contendrá todas las cosas que la gente probó. El modelo puede confundirse sobre cuál es el resultado correcto. Quiere eliminar el ruido para que el modelo solo vea la solución real".
La limpieza, preparación y selección de conjuntos de datos implica cierto trabajo manual por parte de los científicos y analistas de datos, ya sean internos o externos. También implica herramientas como:
Las herramientas de gestión de datos habilitadas por la IA pueden validar automáticamente los datos, señalar los errores y convertirlos al formato adecuado.
Los generadores de datos sintéticos pueden ayudar a rellenar los valores que faltan y aumentar los activos preparados por humanos con corpus más grandes.
Herramientas de preprocesamiento e ingeniería de datos, como Apache Spark y la biblioteca Python pandas.
Las herramientas de observabilidad de los datos pueden rastrear el flujo de datos a lo largo del tiempo, supervisar el uso y el linaje de datos y detectar anomalías.
Sean cuales sean las ventajas competitivas que los datos patentados puedan aportar a la IA generativa, la ventaja estratégica duradera procede de implementar la combinación correcta de tecnología y procesos empresariales.
"El workflow en sí es donde está el dinero", explica Varshney. El modelo es un producto básico, y seguiremos obteniendo modelos cada vez mejores. Lo que realmente necesitamos averiguar es la combinación quirúrgica adecuada para unir la IA tradicional, la automatización y la IA generativa en un flujo de trabajo".
En otras palabras, las organizaciones no pueden incluir la IA generativa —ni siquiera un modelo ajustado a sus especificaciones— en sus procesos y esperar resultados. Más bien, deben evaluar sus procesos y adaptar sus flujos de trabajo a los modelos, del mismo modo que adaptan sus modelos a sus flujos de trabajo.
Pensemos en el humilde lavavajillas.
"Cuando desarrollamos lavavajillas, no esperábamos que se levantaran y lavaran como lo hacemos sobre un fregadero", dice Varshney. “Cambiamos el proceso para que el lavavajillas realmente pudiera sobresalir en el lavado. Planteamos el problema en el formato correcto. Tenemos que hacer lo mismo aquí. Tenemos que rediseñar los procesos y encontrar la combinación adecuada de IA tradicional e IA generativa. Luego, comienzas a desbloquear valor".
Descubra cómo pueden los CEO equilibrar el valor que la IA generativa es capaz de crear frente a la inversión que exige y los riesgos que introduce.
Aprenda los conceptos fundamentales y desarrolle sus habilidades con laboratorios prácticos, cursos, proyectos guiados, pruebas y mucho más.
Aprenda a incorporar con confianza la IA generativa y el machine learning a su negocio.
¿Quiere obtener un mayor rendimiento de sus inversiones en IA? Descubra cómo escalar la IA generativa en áreas clave impulsa el cambio ayudando a sus mentes más brillantes a crear y ofrecer nuevas soluciones innovadoras.
Hemos encuestado a 2000 organizaciones sobre sus iniciativas de IA para descubrir qué funciona, qué no y cómo puede adelantarse.
IBM Granite es nuestra familia de modelos de IA abiertos, eficaces y de confianza, adaptados a la empresa y optimizados para escalar sus aplicaciones de IA. Explore las opciones de lenguaje, código, series temporales y salvaguardias.
Aprenda a seleccionar el modelo fundacional de IA más adecuado para su caso de uso.
Entrene, valide, ajuste e implemente IA generativa, modelos fundacionales y capacidades de machine learning con IBM watsonx.ai, un estudio empresarial de nueva generación para desarrolladores de IA. Cree aplicaciones de IA en menos tiempo y con menos datos.
Ponga la IA a trabajar en su negocio con la experiencia líder en IA del sector de IBM y junto a su cartera de soluciones.
Reinvente las operaciones y flujos de trabajo críticos añadiendo IA para maximizar las experiencias, la toma de decisiones en tiempo real y el valor empresarial.
Obtenga acceso único a capacidades que abarcan el ciclo de vida de desarrollo de la IA. Produzca potentes soluciones de IA con interfaces intuitivas, flujos de trabajo y acceso a API y SDK estándar del sector.