La carrera de los chips en Silicon Valley estuvo en marcha desde mucho antes de que las aplicaciones de IA generativa aumentaran el apetito de las compañías tecnológicas por ellas. En 2015, el sistema de IA de Google AlphaGo, impulsado por un chip diseñado por Google conocido como unidad de procesamiento tensorial (TPU), venció a un jugador profesional humano en el antiguo juego chino Go. Desde entonces, Google ha presentado una serie de chips que diseñó internamente para impulsar los sistemas de IA en sus centros de datos. Más recientemente, en diciembre de 2024, Google anunció un nuevo chip de IA para computación cuántica llamado Willow. La compañía dice que Willow puede completar un cálculo de referencia estándar en menos de 5 minutos, uno que le tomaría a una de las supercomputadoras más rápidas de la actualidad 10 septillones, o 1025 años.

Casi al mismo tiempo que Google lanzaba AlphaGo, los investigadores de IBM también comenzaron a investigar la construcción de hardware de IA. En 2021, IBM abrió su Centro de Hardware de IA en Albany, Nueva York, para crear un ecosistema más amplio de hardware-software de IA, y para 2022, el nuevo microprocesador Telum de IBM llevó la inferencia de IA a IBM Z, el mainframe que gestiona aproximadamente el 70% de las transacciones mundiales por valor. A finales de 2024, IBM anunció un nuevo chip acelerador Spyre, que incorporó la IA generativa a los mainframes IBM Z para usuarios empresariales.

Mientras tanto, AWS ha estado trabajando en sus propios chips informáticos para proyectos de IA desde al menos 2018. Avance rápido hasta el evento anual de AWS de 2024, donde Amazon anunció su último chip de IA Trainium3 personalizado, que ofrece a sus clientes junto con los grandes modelos de lenguaje de su socio Anthropic. Muchas compañías adquirieron los chips de IA de AWS, incluida Apple, que llamó la atención en AWS 2024, ya que fue un momento poco común en el que Apple habló de uno de sus proveedores.

Para no quedar atrás, Microsoft, que lleva años fabricando chips para Power® sus funciones de juego, anunció sus propios chips personalizados de IA en 2023, aproximadamente al mismo tiempo que el gigante tecnológicoMeta anunció sus propios planes de chips de silicio. OpenAI es el último en unirse a la fiesta del silicio personalizado, aunque aún no ha hecho ningún anuncio oficial. Aunque no se compartieron detalles públicos, Reuters informó a principios de este mes que OpenAI estaba finalizando el diseño de sus chips, con planes de comenzar a fabricarlos a través de TSMC en 2025.

¿Por qué se ha intensificado recientemente la carrera por los chips? Varshney de IBM dice que cuando las empresas pueden personalizar chips a modelos de lenguaje específicos para los casos de uso que necesitan, pueden reducir costos, mejorar la latencia o acelerar el movimiento de datos de una red a otra. Señala un ejemplo: históricamente, cuando las empresas realizaban la detección de fraudes y examinaban las facturas entrantes, utilizaban técnicas informáticas clásicas porque el volumen era alto y necesitaban una latencia muy rápida. "También tenían que hacer esto un millón de veces al día, por lo que el costo aumentaría muy rápido", dice Varshney.

Ahora que las empresas pueden optimizar sus chips para modelos específicos, el costo de los casos de uso de gran volumen disminuye y se vuelve más rentable utilizar estas soluciones en la producción a escala. “Entonces, desde una perspectiva empresarial, los casos de uso no cambian”, dice Varshney. "Pero ahora comenzamos a buscar los de gran volumen donde antes no existía el ROI".