Hoy en día, parece que casi todos los gigantes tecnológicos están desarrollando sus propios chips de silicio personalizados, o están buscando adquirir a fabricantes ya existentes. ¿Por qué? A medida que la cantidad de chips necesarios para impulsar una vertiginosa variedad de aplicaciones de IA se dispara, la producción interna de chips puede reducir los costos y mejorar el rendimiento de los sistemas de IA, dice Shobhit Varshney, un vicepresidente y socio sénior en IBM Consulting.
"Cuando optimizas la arquitectura del hardware para que funcione con la arquitectura del software, eso hace magia", dice en un episodio reciente del podcast Mixture of Experts de IBM. "Disminuye el costo total y la latencia al tiempo que aumenta el rendimiento".
Al producir chips internamente, las empresas también reducen su dependencia del fabricante de chips NVIDIA, que controla entre el 70 y el 95 %%del mercado de chips de IA. Sin embargo, esta no es toda la historia, dice Kaoutar El Maghraoui, científico principal investigador y gerente en IBM Research, en una entrevista con IBM Think. Reducir la dependencia de NVIDIA simplemente cambia "el centro de Power se mueve de un gigante a otro", dice.
Incluso a medida que las empresas toman un mayor control del proceso de diseño, que NVIDIA ha dominado en los últimos años, las empresas seguirán dependiendo en gran medida de Taiwan Semiconductor Manufacturing Company Limited (TSMC), dice Varshney. TSMC fabrica la mayoría de los chips de IA en todo el mundo para una amplia gama de aplicaciones, desde teléfonos inteligentes hasta equipamiento militar.
TSMC es el "gorila de 100 libras", dice Varshney. "Todo el mundo está diseñando los chips, pero TSMC es el corazón de toda la industria en este momento".
La carrera de los chips en Silicon Valley estuvo en marcha desde mucho antes de que las aplicaciones de IA generativa aumentaran el apetito de las compañías tecnológicas por ellas. En 2015, el sistema de IA de Google AlphaGo, impulsado por un chip diseñado por Google conocido como unidad de procesamiento tensorial (TPU), venció a un jugador profesional humano en el antiguo juego chino Go. Desde entonces, Google ha presentado una serie de chips que diseñó internamente para impulsar los sistemas de IA en sus centros de datos. Más recientemente, en diciembre de 2024, Google anunció un nuevo chip de IA para computación cuántica llamado Willow. La compañía dice que Willow puede completar un cálculo de referencia estándar en menos de 5 minutos, uno que le tomaría a una de las supercomputadoras más rápidas de la actualidad 10 septillones, o 1025 años.
Casi al mismo tiempo que Google lanzaba AlphaGo, los investigadores de IBM también comenzaron a investigar la construcción de hardware de IA. En 2021, IBM abrió su Centro de Hardware de IA en Albany, Nueva York, para crear un ecosistema más amplio de hardware-software de IA, y para 2022, el nuevo microprocesador Telum de IBM llevó la inferencia de IA a IBM Z, el mainframe que gestiona aproximadamente el 70% de las transacciones mundiales por valor. A finales de 2024, IBM anunció un nuevo chip acelerador Spyre, que incorporó la IA generativa a los mainframes IBM Z para usuarios empresariales.
Mientras tanto, AWS ha estado trabajando en sus propios chips informáticos para proyectos de IA desde al menos 2018. Avance rápido hasta el evento anual de AWS de 2024, donde Amazon anunció su último chip de IA Trainium3 personalizado, que ofrece a sus clientes junto con los grandes modelos de lenguaje de su socio Anthropic. Muchas compañías adquirieron los chips de IA de AWS, incluida Apple, que llamó la atención en AWS 2024, ya que fue un momento poco común en el que Apple habló de uno de sus proveedores.
Para no quedar atrás, Microsoft, que lleva años fabricando chips para Power® sus funciones de juego, anunció sus propios chips personalizados de IA en 2023, aproximadamente al mismo tiempo que el gigante tecnológicoMeta anunció sus propios planes de chips de silicio. OpenAI es el último en unirse a la fiesta del silicio personalizado, aunque aún no ha hecho ningún anuncio oficial. Aunque no se compartieron detalles públicos, Reuters informó a principios de este mes que OpenAI estaba finalizando el diseño de sus chips, con planes de comenzar a fabricarlos a través de TSMC en 2025.
¿Por qué se ha intensificado recientemente la carrera por los chips? Varshney de IBM dice que cuando las empresas pueden personalizar chips a modelos de lenguaje específicos para los casos de uso que necesitan, pueden reducir costos, mejorar la latencia o acelerar el movimiento de datos de una red a otra. Señala un ejemplo: históricamente, cuando las empresas realizaban la detección de fraudes y examinaban las facturas entrantes, utilizaban técnicas informáticas clásicas porque el volumen era alto y necesitaban una latencia muy rápida. "También tenían que hacer esto un millón de veces al día, por lo que el costo aumentaría muy rápido", dice Varshney.
Ahora que las empresas pueden optimizar sus chips para modelos específicos, el costo de los casos de uso de gran volumen disminuye y se vuelve más rentable utilizar estas soluciones en la producción a escala. “Entonces, desde una perspectiva empresarial, los casos de uso no cambian”, dice Varshney. "Pero ahora comenzamos a buscar los de gran volumen donde antes no existía el ROI".
Dado que cada vez más empresas tecnológicas diseñan chips internamente, ¿cómo mantiene TSMC su ventaja sobre la competencia? Por un lado, el enfoque de la empresa desde el principio ha sido diferente al de otras empresas tecnológicas. Son una fundición dedicada, lo que significa que no diseñan ningún chip, sino que solo fabrican chips para otras empresas, dice El Maghraoui de IBM. A lo largo de los años, un número cada vez mayor de empresas han subcontratado su fabricación de chips a TSMC debido al creciente costo de fabricar una gama cada vez más diversa de chips.
Al mismo tiempo, el costo de fabricar chips individuales se disparó, dijo Dylan Patel, fundador de SemiAnalysis, una compañía de investigación y análisis de semiconductores, en una reciente entrevistaen un podcast. TSMC se ha centrado en la fabricación de chips y lo ha facilitado mucho a sus clientes empresariales, dice Patel.
"La fabricación de semiconductores es muy anticuada y difícil", explica. "La barrera de entrada es mucho más alta [que la mayoría de las empresas tecnológicas], ya que los roles son súper especializados". Finalmente, los empleados de TSMC se enorgullecen de su trabajo, dice Patel. “Trabajarán 80 horas a la semana en una fábrica, y si algo sale mal, como un terremoto, aparecerán en medio de la noche” porque son los únicos que pueden hacer los arreglos de un equipamiento determinado, él dice.
Otra razón por la que es difícil replicar la fórmula TSMC es que han invertido miles de millones de dólares en la compra de docenas de máquinas avanzadas de fabricación de chips altamente especializadas creadas por otro gigante de los superconductores, la empresa holandesa ASML.
ASML fue pionera en la litografía ultravioleta extrema (EUV), que esencialmente genera longitudes de onda de luz increíblemente cortas en grandes cantidades para imprimir diseños pequeños y complejos en microchips. Las máquinas de fabricación de chips de ASML cuestan entre 183 y 380 millones de dólares cada una. Una de las primeras máquinas EUV del mundo se instaló en 2014 en el Albany Nanotech Complex, que es propiedad y está operado por NY CREATES y del cual la investigación de IBM es socio principal.
Desde entonces, IBM Research y sus socios han construido un ecosistema para desarrollar y optimizar la litografía EUV, lo que ha permitido a IBM y a otros reducir el tamaño de los transistores a unos pocos nanómetros, decenas de miles de veces más delgados que un cabello.
Mientras ASML y socios como IBM siguen trabajando en la impresión de chips cada vez más pequeños, TSMC permanecerá en la ecuación como fabricante de chips. Patel de SemiAnalysis no ve la participación de TSMC como un problema. “No creo que sea necesariamente romper la dependencia”, dice. "Creo que está logrando que TSMC se desarrolle en Estados Unidos". TSMC anunció en 2020 que iba a construir fábricas de chips en Estados Unidos y, desde entonces, el gigante de la fabricación ha invertido 65 000 millones de dólares para desarrollar tres fábricas de chips en Arizona. En el cuarto trimestre de 2024 la producción de chips comenzó en la primera fábrica de chips de TSMC en Estados Unidos.
Expertos como El Maghraoui ven promesa para las empresas en el uso de IA para encontrar nuevos materiales para chips que alimenten la IA. Con ese fin, nuevos modelos de IBM y Meta podrían ayudar a los investigadores a descubrir nuevos materiales para la fabricación de chips que puedan igualar las condiciones en el futuro.
"Cuando hacemos código abierto estos modelos, aceleramos la innovación, fomentamos la colaboración y promovemos el desarrollo de semiconductores completamente nuevos", dice El Maghraoui.
Por ejemplo, un equipo dentro del proyecto de modelos fundacionales para materiales (FM4M) de investigación de IBM está empleando IA para diseñar nuevos chips que pueden lograr el mismo o mejor rendimiento pero con una footprint menor, dice Jed Pitera, co-líder de Estrategia para materiales sostenibles de IBM. "Si tengo una fábrica y estoy fabricando diez tipos diferentes de chips, ¿cuál es la huella total de cada chip?" dice, refiriéndose a la energía y el agua utilizadas, y las emisiones creadas al fabricar un chip determinado.
"Cuando conocemos la footprint del chip A, podemos start a Think sobre cambiar la forma en que fabricamos los chips, para que sigan logrando el mismo rendimiento pero con un impacto ambiental minimizado", dice Pitera. "Cuando la huella ambiental disminuye, el costo se mueve en la misma dirección".
IBM Cloud Infrastructure Center es una plataforma de software compatible con OpenStack para gestionar la infraestructura de nubes privadas en IBM zSystems e IBM LinuxONE.
Descubra los servidores, el almacenamiento y el software diseñados para la nube híbrida y su estrategia de IA.
Encuentre una solución de infraestructura en la nube que sea adecuada para las necesidades de su negocio y escale los recursos bajo demanda.