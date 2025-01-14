Una supercomputadora que cabe debajo de un escritorio podría cambiar la forma en que las empresas manejan la inteligencia artificial.
En el CES 2025 la semana pasada, NVIDIA anunció el Proyecto DIGITS, un superordenador personal de IA con la característica del nuevo superchip GB10 Grace Blackwell de la compañía. El sistema, que tiene un precio inicial de 3000 USD y se lanza en mayo, puede ejecutar modelos de IA con hasta 200 000 millones de parámetros y ofrece un petaflop de rendimiento informático de IA.
"La IA será la corriente principal en todas las aplicaciones de todas las industrias", dijo Jensen Huang, fundador y director ejecutivo (CEO) de NVIDIA, en un comunicado de prensa. "Con Project DIGITS, el superchip Grace Blackwell llega a millones de desarrolladores", "Colocar una supercomputadora de IA en los escritorios de cada científico de datos, investigador de IA y estudiante les permite participar y dar forma a la era de la IA".
El dispositivo de escritorio incluye 128 GB de memoria unificada y hasta 4 TB de almacenamiento, dirigido a empresas que necesitan un procesamiento de datos instantáneo sin retrasos en la nube. Dos sistemas pueden vincularse para manejar modelos de hasta 405 mil millones de parámetros.
"Piense en aplicaciones industriales, donde usted desearía que en la planta de producción la computación esté justo al lado de donde se lleva a cabo la fabricación", dijo Shobhit Varshney de IBM, un vicepresidente de IBM Consulting, en un episodio reciente del pódcast Mixture of Experts. "Hay mucha latencia entre llamar a un servidor o a una API en la nube y obtener respuestas".
Las operaciones sensibles a la seguridad están impulsando la demanda de capacidades de procesamiento local. Varshney describió múltiples escenarios en los que esto es esencial. "Desea asegurarse de que los datos, especialmente si están relacionados con algo confidencial, no salgan de sus instalaciones", señaló. "Lo mismo ocurre con las aplicaciones de defensa, con las que hace algo más táctico en el campo. Quiere poder procesar todas las imágenes que llegan de todos los drones en un lugar concreto, porque puede que se encuentres en un territorio en el que ni siquiera tiene conexión a un servidor."
El sistema Project DIGITS funciona en el sistema operativo NVIDIA DGX basado en Linux, permitiendo a los usuarios desarrollar localmente y luego desplegarlos en infraestructura en la nube o en centros de datos. Las instalaciones de fabricación pueden implementar “monitoreo en tiempo real, mantenimiento predictivo y optimización de procesos impulsados por computación de borde”, dice Ashok Reddy, CEO de la compañía de software KX. Las firmas financieras obtienen herramientas para “operaciones en tiempo real, administración de riesgos e insights predictivos a una velocidad sin precedentes”. Mientras tanto, las organizaciones de atención médica podrían aprovechar la tecnología para "diagnósticos acelerados, imágenes y desarrollo de fármacos a través de análisis avanzados de IA", menciona Reddy. El sistema procesa “volúmenes masivos de datos estructurados y no estructurados al instante” para “toma de decisiones en tiempo real y análisis de baja latencia”.
El profesor de ingeniería de la Universidad de Pensilvania Benjamin Lee dijo que considera que la supercomputadora de NVIDIA forma parte de un cambio más amplio hacia la IA agéntica, en la que los sistemas gestionan trabajos completos en lugar de tareas individuales.
"Una IA inteligente elaborará estrategias y determinará el conjunto de tareas necesarias para completar ese trabajo", apunta Lee, y agrega que este enfoque "podría mejorar significativamente la productividad al permitir que los humanos soliciten trabajos grandes de un agente en lugar de solicitar tareas individuales de un modelo”.
Varshney señala que NVIDIA dio código abierto a la tecnología de su reciente adquisición de Run IA por 700 millones de dólares. “Están tratando de garantizar que toda la industria se mueva hacia esta era de IA agéntica y conducción autónoma”, dice Varshney. “Quieren ser la columna vertebral de cada uno de ellos”.
Los recortes de precios se extendieron por todas las líneas de productos. “El año pasado, la serie 40 de sus chips costaba 1600 USD”, dice Varshney. “Acaban de lanzar un cálculo equivalente por 550 USD”.
Las reducciones de precios sugieren avances técnicos. "El diseño de la GPU está definido en gran medida y no se optimiza agresivamente en cuanto a rendimiento, energía y costo", dice Lee. Sin embargo, es posible que NVIDIA haya llegado a ese punto "mucho antes que otros diseñadores de chips, lo que le permite competir tanto en rendimiento como en costo", comenta Lee.
"Los modelos podrían especializarse para tareas específicas, calculando la misma respuesta con muchos menos cálculos y mucha menos energía", afirma Lee. "Los agentes podrían aprender a seleccionar el modelo especializado adecuado para cada tarea, algo que un humano podría tener dificultades para hacer".
Este impulso hacia la computación especializada marca un cambio dramático con respecto a las limitaciones actuales. “Nos hemos visto limitados por algunos pequeños modelos cursi que se ejecutan en dispositivos móviles”, dice Varshney. "Quieren que la computación sea tan accesible y democratizada como conectarse a la electricidad, pero quieren ser la superpotencia eléctrica del mundo entero".
