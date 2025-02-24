La corsa ai chip nella Silicon Valley è iniziata ben prima che le applicazioni di AI generativa sostenessero l'interesse delle aziende tecnologiche. Nel 2015, il sistema AI di Google AlphaGo, basato su un chip progettato da Google noto come unità di elaborazione tensoriale (TPU), ha battuto un giocatore umano professionista nell'antico gioco cinese Go. Da allora, Google ha presentato una serie di chip progettati internamente per supportare i sistemi AI nei suoi data center. Più recentemente, nel dicembre 2024, Google ha annunciato un nuovo chip AI per il calcolo quantistico chiamato Willow. L'azienda afferma che Willow è in grado di completare un benchmark standard in meno di 5 minuti, che richiederebbe a uno dei supercomputer più veloci di oggi 10 septilioni, o 1025, anni.

All'incirca nello stesso periodo in cui Google stava lanciando AlphaGo, anche i ricercatori di IBM hanno iniziato a studiare la costruzione di hardware per l'AI. Nel 2021, IBM aveva aperto il suo AI Hardware Center ad Albany, New York, per creare un ecosistema hardware-software AI più ampio, ed entro il 2022 il nuovo chip microprocessore Telum di IBM aveva portato l'inferenza AI su IBM Z, i mainframe che gestiscono circa il 70% delle transazioni per valore. A fine 2024, IBM ha annunciato un nuovo chip Spyre Accelerator, che ha portato l'AI generativa al mainframe IBM Z per utenti aziendali.

Nel frattempo, AWS sta lavorando sui propri chip per computer per progetti di AI almeno dal 2018.. Arriviamo all'evento annuale di AWS del 2024, dove Amazon ha annunciato il suo ultimo chip AI personalizzato Trainium3, offerto ai clienti in coppia con i grandi modelli linguistici del partner Anthropic. Molte aziende hanno acquistato i chip AI di AWS, inclusa Apple, che ha attirato l'attenzione all'AWS 2024, in quanto è stato uno dei rari momenti in cui Apple ha parlato di uno dei suoi fornitori.

Per non essere da meno, Microsoft, che da anni produce chip per supportare le sue funzioni di gaming, ha annunciato nel 2023 i propri chip AI personalizzati nel 2023, più o meno nello stesso periodo in cui il colosso tecnologico Meta ha annunciato i propri piani per chip al silicio. OpenAI è l'ultima a unirsi alla festa del silicio personalizzato, anche se non ha ancora rilasciato annunci ufficiali. Sebbene non siano stati resi pubblici i dettagli, Reuters ha riportato all'inizio di questo mese che OpenAI stava finalizzando i suoi design di chip, con la previsione di iniziare a fabbricarli tramite TSMC nel 2025.

Perché la corsa ai chip si è intensificata di recente? Varshney di IBM afferma che quando le aziende possono personalizzare chip su modelli linguistici specifici per i casi d'uso di cui hanno bisogno, possono ridurre i costi, migliorare la latenza o velocizzare il trasferimento dei dati da una rete all'altra. Fa un esempio: storicamente, quando le aziende si occupavano di rilevamento delle frodi ed esaminavano le fatture in arrivo, utilizzavano tecniche di calcolo classiche perché il volume era elevato e avevano bisogno di una latenza molto rapida. "Dovevano farlo anche un milione di volte al giorno, quindi il costo si accumulava molto rapidamente," afferma Varshney.

Ora che le aziende possono ottimizzare i chip per modelli specifici, il costo dei casi d'uso ad alto volume diminuisce e diventa più conveniente utilizzare queste soluzioni in produzione su larga scala. "Quindi, dal punto di vista aziendale, i casi d'uso non cambiano," afferma Varshney. "Ma ora iniziamo a puntare su quelli ad alto volume, dove prima il ROI non esisteva."