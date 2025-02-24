La carrera de los chips en Silicon Valley lleva en marcha desde mucho antes de que las aplicaciones de IA generativa aumentaran el apetito de las empresas tecnológicas por ellas. En 2015, el sistema de IA de Google, AlphaGo, impulsado por un chip diseñado por Google conocido como unidad de procesamiento tensorial (TPU), venció a un jugador profesional humano en el antiguo juego chino Go. Desde entonces, Google ha presentado una serie de chips que diseñó internamente para alimentar sistemas de IA en sus centros de datos. Más recientemente, en diciembre de 2024, Google anunció un nuevo chip de IA para computación cuántica llamado Willow. La compañía dice que Willow puede completar un cálculo de referencia estándar en menos de 5 minutos, uno de los superordenadores más rápidos de hoy en día tardaría 10 septillones, o 10 25 años.

Casi al mismo tiempo que Google lanzaba AlphaGo, los investigadores de IBM también comenzaron a investigar la construcción de hardware de IA. En 2021, IBM había abierto su centro de hardware de IA en Albany, Nueva York, para crear un ecosistema de hardware y software de IA más amplio, y en 2022, el nuevo chip microprocesador Telum de IBM había llevado la inferencia de IA a IBM Z, los mainframes que ejecutan aproximadamente el 70 % de las transacciones mundiales por valor. A finales de 2024, IBM anunció un nuevo chip acelerador Spyre, que llevó la IA generativa a los mainframes IBM Z para usuarios empresariales.

Mientras tanto, AWS lleva trabajando en sus propios chips informáticos para proyectos de IA desde al menos 2018. Hasta el evento anual de AWS 2024, donde Amazon anunció su último chip de IA personalizado Trainium3, que está llevando a los clientes junto con los grandes modelos de lenguaje de su socio Anthropic. Muchas empresas han adquirido los chips de IA de AWS, incluida Apple, que llamó la atención en AWS 2024, ya que fue un momento poco habitual en el que Apple habló de uno de sus proveedores.

Para no quedarse atrás, Microsoft, que ha fabricado chips para impulsar sus funciones de juego durante años, anunció sus propios chips de IA personalizados en 2023, alrededor del mismo momento en el que el gigante tecnológico Meta anunció sus propios planes de chips de silicio. OpenAI es la última en unirse a la fiesta del silicio personalizado, aunque aún no ha hecho ningún anuncio oficial. Aunque no se han compartido detalles públicos, Reuters informó a principios de este mes de que OpenAI estaba finalizando el diseño de sus chips, con planes de empezar a fabricarlos a través de TSMC en 2025.

¿Por qué se ha intensificado últimamente la carrera por los chips? Varshney, de IBM, afirma que cuando las empresas pueden personalizar los chips a modelos de lenguaje específicos para los casos de uso que necesitan, pueden reducir costes, mejorar la latencia o acelerar el movimiento de datos de una red a otra. Señala un ejemplo: históricamente, cuando las empresas realizaban la detección del fraude y examinaban las facturas entrantes, utilizaban técnicas informáticas clásicas porque el volumen era alto y necesitaban una latencia muy rápida. "También tenían que hacer esto un millón de veces al día, por lo que el coste aumentaría muy rápidamente", dice Varshney.

Ahora que las empresas pueden optimizar sus chips para modelos específicos, el coste de los casos de uso de gran volumen desciende y resulta más rentable utilizar estas soluciones en la producción a escala. "Así que, desde una perspectiva empresarial, los casos de uso no cambian", afirma Varshney. "Pero ahora empezamos a buscar los de gran volumen donde antes no existía el ROI".