Cuando la mayoría de las personas escuchan el término "mainframe ", es posible que no se den cuenta de su contribución vital a la innovación en los negocios empresariales. En medio del entusiasmo que rodea a la IA generativa, es fácil suponer que la infraestructura de TI heredada, como el mainframe, no ha sido invitada a la fiesta.
La verdad es que el mainframe está preparado para desempeñar un papel crucial en el impulso de la innovación mediante la integración de tecnologías de aceleración de IA de próxima generación con un ecosistema optimizado para mejorar las capacidades y tecnologías empresariales.
Cuando echamos la vista atrás, está claro que el mainframe lleva más de 60 años impulsando la innovación continua. Según un reciente reporte del IBM Institute for Business Value, 43 de los 50 principales bancos del mundo y 8 de las 10 principales compañías de pagos aprovechan el mainframe como su plataforma principal.
Para las industrias que manejan cantidades masivas de datos (finanzas, atención médica y gobierno), los mainframes han ido ganando más relevancia para las estrategias de inteligencia artificial (IA). De hecho, ese mismo informe de IBV mostró que el 79 % de los ejecutivos de TI creen que los mainframes son esenciales para permitir la innovación y la creación de valor impulsadas por IA.
Al mismo tiempo, estos líderes empresariales también buscan integrar la IA en las plataformas de mainframe existentes para aprovechar insights valiosos, automatizar tareas y mejorar la eficiencia mientras preservan su infraestructura estratégica. Este enfoque maximiza el valor de los sistemas heredados al tiempo que introduce nuevas capacidades a través de analytics y automatización impulsados por IA .
Muchos de los despliegues de IA actuales requieren que las organizaciones muevan sus datos a la nube. Sin embargo, para las industrias que dependen del procesamiento de datos de alta velocidad para manejar datos altamente confidenciales, mantener las capacidades de IA más cerca de donde residen los datos ofrece ventajas comerciales sustanciales.
"Se trata de llevar la IA donde suena la música, y esto está sucediendo en 2 áreas principales", dice Khadija Souissi, arquitecta principal de soluciones, IA en IBM Z y LinuxONE y especialista técnica distinguida de IBM.
"Estamos infundiendo IA en las cargas de trabajo transaccionales para obtener insights en tiempo real sobre las aplicaciones empresariales con el fin de agilizar la toma de decisiones y permitir a los clientes crear de forma sostenible aplicaciones inteligentes que adopten soluciones de IA generativa a la vez que salvaguardan los datos confidenciales. Además, estamos construyendo una infraestructura inteligente, empleando IA para los sistemas operativos y subsistemas del mainframe. Esto podría ayudar a predecir las próximas cargas de trabajo para preparar de forma proactiva los recursos necesarios y también detectar anomalías en las Operaciones del sistema que podrían ayudar a predecir interrupciones y extraer insights aplicables en la práctica relacionados con el rendimiento del sistema.
Los mainframes manejan casi el 70 % de las cargas de trabajo de TI de producción del mundo y se confía en ellos por su estabilidad, alta seguridad y escalabilidad. Hoy en día, los aceleradores de IA en chip pueden escalar y procesar millones de solicitudes de inferencia por segundo a tasas de baja latencia muy bajas. Esta capacidad permite a las organizaciones usar datos y gravedad transaccional al ubicar estratégicamente grandes conjuntos de datos, IA y aplicaciones críticas para el negocio. En el futuro, los aceleradores de próxima generación abrirán nuevas oportunidades para expandir las capacidades de IA y los casos de uso a medida que crecen las necesidades de una organización.
Los modelos tradicionales de IA y de IA generativa están ayudando a definir y dar forma a la empresa moderna. Los casos de uso transaccionales y de misión crítica requieren capacidades de machine learning, aprendizaje profundo e IA generativa, que a veces trabajan juntas en una arquitectura de conjunto para lograr mejores resultados comerciales.
En el mainframe, la arquitectura de modelos múltiples utiliza las fortalezas de cada uno de estos modelos diversos, lo que permite una toma de decisiones más sólida, precisa y flexible.
Mirando primero a la IA tradicional, estos modelos generalmente aplican reglas predefinidas para analizar datos y tomar decisiones basadas en patrones específicos. Los ejemplos incluyen forecasting para la gestión de inventario o las decisiones crediticias basadas en los datos históricos de un cliente.
La evolución de la IA ha sido marcada por nuevos conceptos como los grandes modelos de lenguaje (LLM), modelos avanzados de IA capacitados con grandes cantidades de datos que pueden comprender el lenguaje natural, generar texto similar al humano, traducir idiomas, responder preguntas, escribir código e incluso mantener conversaciones.
Los LLM que generan contenido suelen denominarse modelos decodificadores y se utilizan en la IA generativa. Esta capacidad se puede ver en los chatbots que brindan respuestas personalizadas de atención al cliente basadas en las consultas y el contexto de los usuarios.
Los modelos codificadores son otro tipo de LLM que se destaca en la comprensión del lenguaje natural y el procesamiento de texto no estructurado, centrándose en extraer información clave. Los modelos decodificadores comparten esta capacidad, pero también se destacan en la generación de nuevos contenidos.
La arquitectura de modelos múltiples es un concepto híbrido que integra diferentes tecnologías de IA, como la IA tradicional y los modelos de codificador LLM, para ofrecer resultados más rápidos y precisos que los que cualquier modelo puede lograr por sí solo, aprovechando la enorme potencia de procesamiento y las capacidades de almacenamiento de datos del mainframe.
En el procesamiento de reclamaciones de seguros, por ejemplo, la IA tradicional puede realizar un análisis inicial de datos estructurados, mientras que los LLM codificadores pueden manejar datos no estructurados más complejos para obtener más insights y abordar la reclamación según la dirección.
Tome en cuenta una reclamación por accidente de automóvil. La IA tradicional proporciona el procesamiento automatizado de datos estructurados (por ejemplo, informes policiales, licencias del conductor e información de registro). La IA generativa va un paso más allá para extraer insights de datos no estructurados (por ejemplo, texto e imágenes relacionados con lesiones y daños en vehículos) para ayudar a priorizar y atender la urgencia de esos siniestros.
Recientemente, IBM anunció el próximo procesador IBM Telum II e IBM Spyre Accelerator. Estas tecnologías están diseñadas para ayudar a las empresas a escalar la capacidad de procesamiento en los sistemas IBM Z y acelerar el uso de modelos de IA tradicionales, modelos de IA de lenguaje grande y arquitectura de modelos múltiples.
La tarjeta Spyre Accelerator permitirá a los sistemas IBM Z y LinuxOne realizar inferencias de IA para LLM e IA generativa a una escala aún mayor que la disponible anteriormente.
Aquí hay 4 ejemplos de casos de uso que demuestran cómo las organizaciones podrían usar estas tecnologías de IA para impulsar la innovación empresarial, mejorar las operaciones y acelerar las cargas de trabajo generativas de IA.
Las pérdidas financieras por transacciones fraudulentas con tarjetas de crédito causan daños financieros y de reputación. Según el Informe Nilson, se espera que las pérdidas de tarjetas de crédito en todo el mundo alcancen los 43 000 millones USD para 2026.1
Un estudio de caso interno de IBM mostró que un gran banco norteamericano desarrolló un modelo de calificación crediticia impulsado por IA y lo desplegó en una plataforma en la nube on-premises para ayudar a combatir el fraude. Sin embargo, solo el 20 % de las transacciones con tarjeta de crédito se pudieron puntuar en tiempo real. El banco decidió mover las complejas herramientas de detección de fraudes a su mainframe.
Luego de la implementación del mainframe, el banco comenzó a calificar el 100 % de las transacciones con tarjetas de crédito en tiempo real, con 15 000 transacciones por segundo, lo que proporcionó una detección de fraude significativa.
Además, cada transacción solía tardar 80 milisegundos en puntuarse. Con la latencia reducida proporcionada por el mainframe, los tiempos de respuesta ahora ocurren en 2 milisegundos o menos. Este mover al mainframe también le ha ahorrado al banco más de 20 millones de dólares en gastos anuales de prevención de fraude sin afectar los acuerdos de nivel de servicio.
El mainframe es vital en las transacciones con tarjeta de crédito, manejando el 90 % de las transacciones en todo el mundo.2 Ahora, las organizaciones financieras pueden continuar contando con el mainframe y simultáneamente integrar IA para detectar el fraude antes de que se cierre una transacción, confiando en las grandes cantidades de datos de transacciones ya almacenados allí en lugar de moverlo a un entorno de nube.
Según Forbes, el costo promedio del tiempo de inactividad de TI puede llegar a los 9000 USD por minuto para las grandes organizaciones y a más de 5 millones USD por hora para las empresas de mayor riesgo.3
Afortunadamente, las organizaciones ahora pueden usar IA para prevenir de manera proactiva o incluso predecir una interrupción causada por una falla del equipamiento. Al aplicar mecanismos de IA, las organizaciones pueden detectar anomalías a nivel de transacción, aplicación, subsistema y sistema. Por ejemplo, los sensores pueden analizar datos de los componentes del mainframe para predecir posibles fallas de hardware y permitir el mantenimiento preventivo.
La integración del mainframe con nuevas tecnologías, como la nube y los sistemas distribuidos, puede crear complejidad para la infraestructura de TI y los equipos de aplicaciones. Las organizaciones recurren cada vez más a la inteligencia artificial para operaciones de TI (AIOps),la aplicación de capacidades de IA para automatizar, agilizar y optimizar la infraestructura de TI y los flujos de trabajo operativos. AIOps permite a los equipos de operaciones de TI responder rápidamente a las ralentizaciones e interrupciones, proporcionando una mejor visibilidad y contexto.
Privacidad de datos es primordial para las organizaciones que manejan datos confidenciales. Esta es una de las principales razones por las que las industrias, como la atención médica, continúan confiando en las sólidas características de seguridad del mainframe, incluido el aislamiento de la carga de trabajo, el cifrado avanzado de datos y los protocolos de comunicación seguros.
El procesamiento de documentos en el mainframe ayuda a agilizar y ofrecer una extracción de datos precisa en un entorno altamente seguro. Las organizaciones pueden emplear la IA generativa para resumir documentos financieros e reportes empresariales, extraer puntos de datos clave (por ejemplo, métricas financieras e indicadores de rendimiento) e identificar información esencial para los procesos de cumplimiento (por ejemplo, auditorías financieras).
Como otro ejemplo, los gobiernos pueden utilizar la IA generativa para mejorar el control aduanero de carga sospechosa a través de sofisticadas técnicas de procesamiento de imágenes y análisis de descripciones textuales asociadas a cada envío.
Uno de los mayores desafíos en el mainframe ha sido migrar aplicaciones existentes escritas en COBOL a lenguajes de programación más modernos. ¿Por qué? Esto se debe principalmente al cambio generacional en la fuerza laboral tecnológica, donde los desarrolladores más nuevos han adquirido habilidades en lenguajes como Java y Python durante su educación, mientras que muchos de los profesionales experimentados todavía están bien versados en tecnologías más antiguas.
Sin embargo, COBOL no desaparecerá pronto: todavía impulsa muchos sistemas empresariales críticos en sectores como la banca y el gobierno. Según Reuters, el 43 % de los sistemas bancarios se basan en COBOL, y hoy en día se utilizan 220 000 millones de líneas de COBOL.4
Los asistentes virtuales en el mainframe están ayudando a salvar la brecha de conocimientos de los desarrolladores. Herramientas como IBM watsonx Code Assistant for Z emplean IA generativa para analizar, comprender y modernizar las aplicaciones COBOL existentes. Esta capacidad permite a los desarrolladores traducir código COBOL a lenguajes como Java. También acelera la modernización de las aplicaciones al tiempo que conserva la funcionalidad de los sistemas heredados/existentes COBOL.
Las características de watsonx Code Assistant for Z incluyen explicación de código, refactorización automatizada y consejos de optimización de código, lo que facilita a los desarrolladores el mantenimiento y la actualización de aplicaciones COBOL antiguas.
Durante décadas, el mainframe ha estado evolucionando y continúa evolucionando al unísono para aprovechar las oportunidades que presenta la IA de próxima generación. La introducción del procesador Telum II y la tarjeta Spyre Accelerator presenta una oportunidad para que las organizaciones desbloqueen el valor comercial y creen nuevas ventajas competitivas.
"Hoy en día, el mainframe no es solo una plataforma transaccional, sino una plataforma de IA en evolución que ofrecerá un valor significativo a medida que las empresas se embarquen en sus viajes de IA", dice Khadija Souissi.
Todos los enlaces se encuentran fuera de IBM.
1 Card Fraud Losses Worldwide—2021, Nilson Report, 2024
2 Why Is Mainframe Still Relevant and Thriving in 2022, Planet Mainframe, 20 de diciembre de 2022
3 The True Cost Of Downtime (And How To Avoid It), Forbes, 10 de abril de 2024
4 Cobol Blues, Reuters, 2017
IBM zSystems es una familia de hardware de z/Architecture moderno que ejecuta software de sistemas z/OS, Linux, z/VSE, z/TPF, z/VM y zSystems.
Diseñado para manejar la cargas de trabajo de misión crítica mientras mantiene la seguridad, confiabilidad y control de toda su infraestructura de TI.
Acelere la transformación digital modernizando sus aplicaciones mainframe con IBM.