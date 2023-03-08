Desde su lanzamiento en noviembre de 2022, ChatGPT de OpenAI ha capturado la imaginación tanto de los consumidores como de los líderes empresariales al demostrar el potencial que tiene la IA generativa para transformar drásticamente la forma en que vivimos y trabajamos. A medida que el alcance de su impacto en la sociedad continúa expandiéndose, las empresas y las organizaciones gubernamentales continúan reaccionando, creando políticas sobre el uso de la tecnología por parte de los empleados o incluso restringiendo el acceso a ChatGPT.
Las más prudentes de ellas han sido evaluar las formas en que pueden aplicar la IA a sus organizaciones y prepararse para un futuro que ya está aquí. Los más avanzados de entre ellos están pasando de pensar en la IA como algo accesorio a reimaginar los flujos de trabajo críticos con la IA en el centro.
El mercado mundial de la IA generativa se acerca a un punto de inflexión, con una valoración de 8 000 millones de dólares y una CAGR estimada del 34,6 % para 2030. Con más de 85 millones de puestos de trabajo que se espera que queden sin cubrir en ese momento, es necesario crear operaciones más inteligentes con IA y automatización para ofrecer la eficiencia, la eficacia y las experiencias que esperan los líderes empresariales y las partes interesadas.
La IA generativa presenta una oportunidad convincente para aumentar los esfuerzos de los empleados y hacer que la empresa sea más productiva. Pero a medida que los líderes del equipo directivo realizan una investigación sobre soluciones de IA generativa, van descubriendo más preguntas: ¿Qué casos de uso ofrecerán más valor para mi empresa? ¿Qué tecnología de IA se adapta mejor a mis necesidades? ¿Es seguro? ¿Es sostenible? ¿Cómo se gobierna? ¿Y cómo me aseguro de que mis proyectos de IA tengan éxito?
Tras trabajar con modelos fundacionales durante varios años, IBM Consulting, IBM Technology e IBM Research han desarrollado un punto de vista fundamentado sobre lo que se necesita para obtener valor de la implementación responsable de la IA en toda la empresa.
Como su nombre indica, la IA generativa genera imágenes, música, voz, código, vídeo o texto, al tiempo que interpreta y manipula datos preexistentes. La IA generativa no es un concepto nuevo: las técnicas de machine learning detrás de la IA generativa han evolucionado en la última década. El último enfoque se basa en una arquitectura de Neural Networks, denominada "transformadores". Combinando la arquitectura del transformador con aprendizaje no supervisado, surgieron grandes modelos fundacionales que superan las referencias existentes capaces de manejar múltiples modalidades de datos.
Estos grandes modelos se denominan modelos fundacionales, ya que sirven como punto de partida para el desarrollo de modelos más avanzados y complejos. Al construir sobre un modelo fundacional, podemos crear modelos más especializados y sofisticados adaptados a casos de uso o dominios específicos. Los primeros ejemplos de modelos, como GPT-3, BERT, T5 o DALL-E, han demostrado lo que es posible: entrada una breve instrucción y el sistema genera un ensayo completo, o una imagen compleja, en función de sus parámetros.
Grandes modelos lingüísticos (LLM) se entrenan específicamente con grandes cantidades de datos de texto para tareas de PLN y contienen un número significativo de parámetros, generalmente superiores a 100 millones. Facilitan el procesamiento y la generación de texto en lenguaje natural para diversas tareas. Cada modelo tiene sus fortalezas y debilidades, y la elección de uno u otro dependerá de la tarea específica de PLN y las características de los datos a analizar. Elegir el LLM correcto para un trabajo específico requiere experiencia en LLM.
BERT está diseñado para comprender las relaciones bidireccionales entre las palabras de una oración y se utiliza principalmente para la clasificación de tareas, la respuesta a preguntas y el reconocimiento de entidades nombradas. GPT, por otro lado, es un modelo unidireccional basado en transformadores que se utiliza principalmente para tareas de generación de texto, como traducción de idiomas, resumen y creación de contenido. T5 también es un modelo basado en transformadores, sin embargo, se diferencia de BERT y GPT en que se entrena utilizando un enfoque de texto a texto y se puede ajustar para diversas tareas de procesamiento del lenguaje natural, como la traducción de idiomas, el resumen y la respuesta. a las preguntas.
Al estar preentrenados con grandes cantidades de datos, estos modelos fundacionales ofrecen una gran aceleración en el ciclo de vida del desarrollo de la IA, permitiendo a las empresas centrarse en el ajuste fino para sus casos de uso específicos. En lugar de construir modelos de PLN personalizados para cada dominio, los modelos fundacionales permiten a las empresas reducir el tiempo de obtención de valor de meses a semanas. En los compromisos con los clientes, IBM Consulting está viendo una reducción de hasta el 70 % en el tiempo de obtención de valor para casos de uso de NLP, como el resumen de transcripciones del call center, el análisis de reseñas y más.
Dado el coste de entrenar y mantener los modelos fundacionales, las empresas tendrán que tomar decisiones sobre cómo incorporarlos e implementarlos para sus casos de uso. Hay consideraciones específicas para los casos de uso y los puntos de decisión en torno al coste, el esfuerzo, la protección de datos, la propiedad intelectual y la seguridad. Es posible utilizar una o varias opciones de implementación dentro de una empresa sopesando estos puntos de decisión.
Los modelos fundacionales acelerarán drásticamente la adopción de IA en las empresas al reducir los requisitos de etiquetado, lo que facilitará que las empresas experimenten con IA, creen aplicaciones y automatizaciones eficientes impulsadas por IA e implementen IA en una gama más amplia de situaciones de misión crítica. El objetivo de IBM Consulting es llevar el poder de los modelos fundacionales a todas las empresas en un entorno de nube híbrida sin fricciones.
Para obtener más información, consulte cómo puede utilizarse la IA generativa para maximizar las experiencias, la toma de decisiones y el valor empresarial, y cómo IBM Consulting aporta un enfoque valioso y responsable a la IA.
