Oggi sembra che quasi ogni colosso tecnologico stia sviluppando i propri chip di silicio personalizzati, o stia valutando l'acquisizione di produttori di chip esistenti. Perché? Con l'aumento vertiginoso del numero di chip necessari per sostenere una vertiginosa gamma di applicazioni AI, la produzione interna di chip può ridurre i costi e migliorare le prestazioni dei sistemi di AI, afferma Shobhit Varshney, vicepresidente e Senior Partner presso IBM Consulting.
"Quando ottimizzi l'architettura dell'hardware per funzionare con quella del software, si crea una magia", afferma in un recente episodio del podcast Mixture of Experts di IBM. “Riduce i costi totali e la latenza, aumentando al contempo la produttività.”
Producendo i chip internamente, le aziende riducono inoltre la dipendenza dal produttore NVIDIA, che controlla tra il 70 e il 95% del mercato dei chip AI. Tuttavia, questa non è tutta la storia, afferma Kaoutar El Maghraoui, Principal Research Scientist e Manager presso IBM Research, in un'intervista con IBM Think. Ridurre la dipendenza da NVIDIA sposta semplicemente "il centro del potere da un gigante all'altro", afferma.
Anche se assumono un controllo maggiore sul processo di progettazione, che NVIDIA ha dominato negli ultimi anni, le aziende continueranno a dipendere in larga misura dalla Taiwan Semiconductor Manufacturing Company Limited (TSMC), afferma Varshney. TSMC produce la maggior parte dei chip AI a livello globale per un'ampia gamma di applicazioni, dagli smartphone all'attrezzatura militare.
La TSMC è il "gorilla da 100 libbre", afferma Varshney. "Tutti progettano i chip, ma TSMC è il cuore dell'intero settore in questo momento."
La corsa ai chip nella Silicon Valley è iniziata ben prima che le applicazioni di AI generativa sostenessero l'interesse delle aziende tecnologiche. Nel 2015, il sistema AI di Google AlphaGo, basato su un chip progettato da Google noto come unità di elaborazione tensoriale (TPU), ha battuto un giocatore umano professionista nell'antico gioco cinese Go. Da allora, Google ha presentato una serie di chip progettati internamente per supportare i sistemi AI nei suoi data center. Più recentemente, nel dicembre 2024, Google ha annunciato un nuovo chip AI per il calcolo quantistico chiamato Willow. L'azienda afferma che Willow è in grado di completare un benchmark standard in meno di 5 minuti, che richiederebbe a uno dei supercomputer più veloci di oggi 10 septilioni, o 1025, anni.
All'incirca nello stesso periodo in cui Google stava lanciando AlphaGo, anche i ricercatori di IBM hanno iniziato a studiare la costruzione di hardware per l'AI. Nel 2021, IBM aveva aperto il suo AI Hardware Center ad Albany, New York, per creare un ecosistema hardware-software AI più ampio, ed entro il 2022 il nuovo chip microprocessore Telum di IBM aveva portato l'inferenza AI su IBM Z, i mainframe che gestiscono circa il 70% delle transazioni per valore. A fine 2024, IBM ha annunciato un nuovo chip Spyre Accelerator, che ha portato l'AI generativa al mainframe IBM Z per utenti aziendali.
Nel frattempo, AWS sta lavorando sui propri chip per computer per progetti di AI almeno dal 2018.. Arriviamo all'evento annuale di AWS del 2024, dove Amazon ha annunciato il suo ultimo chip AI personalizzato Trainium3, offerto ai clienti in coppia con i grandi modelli linguistici del partner Anthropic. Molte aziende hanno acquistato i chip AI di AWS, inclusa Apple, che ha attirato l'attenzione all'AWS 2024, in quanto è stato uno dei rari momenti in cui Apple ha parlato di uno dei suoi fornitori.
Per non essere da meno, Microsoft, che da anni produce chip per supportare le sue funzioni di gaming, ha annunciato nel 2023 i propri chip AI personalizzati nel 2023, più o meno nello stesso periodo in cui il colosso tecnologico Meta ha annunciato i propri piani per chip al silicio. OpenAI è l'ultima a unirsi alla festa del silicio personalizzato, anche se non ha ancora rilasciato annunci ufficiali. Sebbene non siano stati resi pubblici i dettagli, Reuters ha riportato all'inizio di questo mese che OpenAI stava finalizzando i suoi design di chip, con la previsione di iniziare a fabbricarli tramite TSMC nel 2025.
Perché la corsa ai chip si è intensificata di recente? Varshney di IBM afferma che quando le aziende possono personalizzare chip su modelli linguistici specifici per i casi d'uso di cui hanno bisogno, possono ridurre i costi, migliorare la latenza o velocizzare il trasferimento dei dati da una rete all'altra. Fa un esempio: storicamente, quando le aziende si occupavano di rilevamento delle frodi ed esaminavano le fatture in arrivo, utilizzavano tecniche di calcolo classiche perché il volume era elevato e avevano bisogno di una latenza molto rapida. "Dovevano farlo anche un milione di volte al giorno, quindi il costo si accumulava molto rapidamente," afferma Varshney.
Ora che le aziende possono ottimizzare i chip per modelli specifici, il costo dei casi d'uso ad alto volume diminuisce e diventa più conveniente utilizzare queste soluzioni in produzione su larga scala. "Quindi, dal punto di vista aziendale, i casi d'uso non cambiano," afferma Varshney. "Ma ora iniziamo a puntare su quelli ad alto volume, dove prima il ROI non esisteva."
Dato che sempre più aziende tecnologiche progettano i chip internamente, come fa TSMC a mantenere il suo vantaggio sui concorrenti? Anzitutto, l'approccio dell'azienda fin dall'inizio è stato diverso rispetto ad altre aziende tecnologiche. Si tratta di una fonderia dedicata, cioè non progettano chip ma li producono solo per altre aziende, afferma El Maghraoui di IBM. Nel corso degli anni, un numero crescente di aziende ha esternalizzato la produzione dei propri chip a TSMC a causa dei crescenti costi di produzione di una gamma sempre più diversificata di chip.
Allo stesso tempo, il costo di produzione dei singoli chip è salito alle stelle, ha affermato Dylan Patel, fondatore di SemiAnalysis, una società di ricerca e analisi dei semiconduttori, in una recente intervista in un podcast. Patel afferma che TSMC si è molto concentrata sulla fabbricazione di chip e ha reso il processo molto semplice per i propri clienti aziendali.
"La produzione di semiconduttori è molto antiquata e difficile", spiega. “La barriera all’ingresso è molto più alta [rispetto alla maggior parte delle aziende tecnologiche], poiché i ruoli sono estremamente specializzati”. Infine, i dipendenti TSMC sono molto orgogliosi del loro lavoro, afferma Patel. "Lavoreranno 80 ore a settimana in una fabbrica e, se qualcosa va storto, come un terremoto, si presenteranno nel cuore della notte", perché sono gli unici in grado di riparare un determinato pezzo di attrezzatura, dice.
Un altro motivo per cui è difficile replicare la formula TSMC è che hanno investito miliardi di dollari nell'acquisto di decine di macchine avanzate altamente specializzate per la produzione di chip create da un altro colosso dei superconduttori, l'azienda olandese ASML.
ASML è stata pioniera della litografia ultravioletta estrema (EUV), che essenzialmente genera lunghezze d'onda di luce incredibilmente brevi in grandi quantità per stampare disegni piccoli e complessi sui microchip. Le macchine per la produzione di chip di ASML costano tra 183 e 380 milioni di USD ciascuna. Una delle prime macchine EUV al mondo è stata installata nel 2014 presso l'Albany Nanotech Complex, di proprietà e gestito da NY CREATES e di cui IBM Research è partner principale.
Da allora, la ricerca di IBM e i suoi partner hanno costruito un ecosistema per sviluppare e ottimizzare la litografia EUV, che ha permesso a IBM e ad altre aziende di ridurre la dimensione dei transistor a pochi nanometri, decine di migliaia di volte più sottili di un ciuffo di capelli.
Mentre ASML e partner come IBM continuano a lavorare per stampare chip sempre più piccoli, TSMC continuerà a essere il produttore di chip. Patel di SemiAnalysis non vede il coinvolgimento di TSMC come un problema. "Non penso che ciò interrompa necessariamente la dipendenza", afferma. "Penso che stia convincendo TSMC a costruire negli Stati Uniti". Nel 2020 TSMC ha annunciato che avrebbe costruito fabbriche di chip negli Stati Uniti e, da allora, il gigante manifatturiero ha investito 65 miliardi di USD per sviluppare tre fabbriche di chip in Arizona. Nel quarto trimestre del 2024, la produzione di chip è iniziata nella prima fabbrica di chip TSMC negli Stati Uniti.
Esperti come El Maghraoui ritengono promettente per le aziende l'utilizzo dell'AI per trovare nuovi materiali per i chip che la supportano. A tal fine, i nuovi modelli di IBM e di Meta potrebbero aiutare i ricercatori a scoprire nuovi materiali per la fabbricazione dei chip che potrebbero livellare il campo di gioco in futuro.
"Quando rendiamo open source questi modelli, acceleriamo l'innovazione, favoriamo la collaborazione e promuoviamo lo sviluppo di semiconduttori completamente nuovi", afferma El Maghraoui.
Ad esempio, un team all'interno del progetto foundation model for materials (FM4M) di IBM Research sta utilizzando AI per progettare nuovi chip in grado di ottenere le stesse o migliori prestazioni ma con un'impronta ambientale più ridotta, afferma Jed Pitera, Strategy Co-Lead for Sustainable Materials di IBM. "Se ho una fab e produco dieci tipi diversi di chip, qual è l'impronta totale di ciascun chip?" dice, riferendosi all'energia e all'acqua usate, e alle emissioni generate nella produzione di un dato chip.
"Quando conosciamo l'impronta totale del chip A, potremo iniziare a Think a cambiare il modo in cui produciamo i chip, così che raggiungano comunque le stesse prestazioni ma con un impatto ambientale minimizzato", afferma Pitera. «Quando l'impronta ambientale scende, i costi si spostano nella stessa direzione».
IBM Cloud Infrastructure Center è una piattaforma software compatibile con OpenStack per gestire l'infrastruttura di cloud privati su IBM zSystems e IBM LinuxONE.
Scopri i server, lo storage e il software progettati per l'hybrid cloud e la strategia AI della tua azienda.
Trova la soluzione di infrastruttura cloud adatta alle esigenze della tua azienda e scala le risorse on-demand.