Che cos'è un'unità di elaborazione grafica (GPU)?

6 gennaio 2025

Autori

Mesh Flinders

Author, IBM Think

Ian Smalley

Senior Editorial Strategist

Che cos'è un'unità di elaborazione grafica (GPU)?

Un'unità di elaborazione grafica (GPU) è un circuito elettronico progettato per accelerare la grafica del computer e l'elaborazione delle immagini su vari dispositivi, tra cui schede video, schede madre, telefoni cellulari e personal computer (PC).

Eseguendo rapidamente calcoli matematici, una GPU riduce il tempo necessario affinché un computer esegua più programmi e questo lo rende un fattore di abilitazione essenziale delle tecnologie emergenti e future come machine learning (ML)intelligenza artificiale (AI)Blockchain.

Prima dell'invenzione delle GPU negli anni '90, i controller grafici nei PC e nei controller per videogiochi si basavano sull'unità di elaborazione centrale (CPU) di un computer per eseguire le attività. Fin dai primi anni '50, le CPU sono stati i processori più importanti in un computer, gestendo tutte le istruzioni necessarie per eseguire i programmi, come la logica, il controllo e l'input/output (I/O).

Tuttavia, con l'avvento dei giochi personali e della progettazione assistita da computer (CAD) negli anni '90, l'industria aveva bisogno di un modo più veloce ed efficiente per combinare rapidamente i pixel.

Nel 2007, Nvidia ha creato CUDA™ (Compute Unified Device Architecture), una piattaforma software e un'interfaccia di programmazione di applicazioni (API) che ha fornito agli sviluppatori l'accesso diretto alle capacità di calcolo parallelo delle GPU, consentendo loro di utilizzare la tecnologia GPU per una gamma più ampia di funzioni rispetto al passato.

Negli anni 2010, la tecnologia GPU ha acquisito ancora più funzionalità, forse in modo più significativo il ray-tracing (la generazione di immagini al computer tracciando la direzione della luce da una telecamera) e i tensor core (progettati per consentire il deep learning).

Grazie a questi progressi, le GPU hanno svolto un ruolo importante nell'accelerazione dell'AI e nei processori di deep learning, contribuendo ad accelerare lo sviluppo di applicazioni AI e di machine learning (ML). Oggi, oltre ad alimentare le console di gioco e i software di editing, le GPU alimentano funzioni di elaborazione all'avanguardia fondamentali per molte aziende.

Come funziona una GPU?

Una GPU dispone di una propria memoria ad accesso rapido (RAM), una memoria elettronica utilizzata per memorizzare codice e dati a cui il chip può accedere e modificare in base alle esigenze. Le GPU avanzate solitamente dispongono di RAM progettata per contenere i grandi volumi di dati necessari per attività ad alta intensità di calcolo, come l'editing grafico, i giochi o i casi d'uso AI/ML.

Esistono due tipi popolari di memoria per la GPU: la Graphics Double Data Rate 6 Synchronous Dynamic Random-Access Memory (GDDR6) e la GDDR6X, una generazione successiva. La GDDR6X utilizza il 15% in meno di energia per bit trasferito rispetto alla GDDR6, ma il suo consumo energetico complessivo è maggiore in quanto è più veloce. Le iGPU possono essere integrate nella CPU di un computer o inserite in uno slot accanto ad essa e collegate tramite una porta PCI express.

Qual è la differenza tra una GPU e una CPU?

Le CPU e le GPU condividono un design simile, incluso un numero simile di core e transistor per le attività di elaborazione, ma le CPU sono più generiche nelle loro funzioni rispetto alle GPU. Le GPU tendono a concentrarsi su un'attività di calcolo singola e specifica, come l'elaborazione grafica o il machine learning.

Le CPU sono il cuore e il cervello di un sistema informatico o di un dispositivo. Ricevono istruzioni o richieste generali relative a un'attività da un programma o da un'applicazione software. Una GPU, d'altra parte, ha un compito più specifico, normalmente l'elaborazione rapida di immagini e video ad alta risoluzione. Le GPU eseguono costantemente calcoli matematici complessi necessari per il rendering della grafica o altre funzioni ad alta intensità di calcolo per portare a termine il loro compito.

Una delle maggiori differenze è che le CPU tendono a utilizzare meno core e a svolgere i loro compiti in ordine lineare. Le GPU, tuttavia, hanno centinaia, persino migliaia, di core, consentendo l'elaborazione parallela alla base delle loro funzionalità di elaborazione fulminee.

Le prime GPU sono state progettate per accelerare il rendering della grafica 3D, rendendo le scene dei film e dei videogiochi più realistiche e avvincenti. Il primo chip GPU, il GeForce di Nvidia, è stato rilasciato nel 1999 ed è stato subito seguito da un rapido periodo di crescita che ha visto le funzionalità della GPU espandersi in altre aree grazie alle loro funzionalità di elaborazione parallela ad alta velocità.

L'elaborazione parallela, o calcolo parallelo, è un tipo di calcolo che si affida a due o più processori per realizzare sottoinsiemi diversi di un compito di calcolo complessivo.

Prima delle GPU, i computer di vecchia generazione potevano eseguire solo un programma alla volta, spesso impiegando ore per completare un’attività. La funzione di elaborazione parallela delle GPU esegue molti calcoli o attività simultaneamente, rendendole più veloci ed efficienti delle CPU nei computer più vecchi

Veduta aerea di uno snodo di autostrade

Rimani con la testa nel cloud 


Ricevi la newsletter settimanale Think per una guida esperta sull'ottimizzazione delle impostazioni multicloud nell'era dell'AI.

Quali sono i diversi tipi di GPU?

Esistono tre tipi di GPU:

  • GPU dedicate
  • GPU integrate
  • GPU virtuali

GPU dedicate

Le GPU dedicate, o dGPU, sono processori grafici separati dalla CPU di un dispositivo, in cui le informazioni vengono acquisite ed elaborate, consentendo al computer di funzionare. Le GPU dedicate sono solitamente utilizzate in applicazioni avanzate con requisiti speciali, come l'editing, la creazione di contenuti o i giochi ad alte prestazioni. Si tratta di chip distinti con connettori alle schede di circuiti separate e collegati alla CPU utilizzando uno slot express.

Una delle GPU dedicate più utilizzate è il marchio Intel Arc, progettato per l'industria dei giochi per PC.

GPU integrate

Una GPU integrata, o iGPU, è integrata nell'infrastruttura di un computer o di un dispositivo e in genere è inserita accanto alla CPU. Progettate negli anni 2010 da Intel, le GPU integrate hanno guadagnato popolarità quando produttori come MSI, ASUS e Nvidia hanno notato la potenza della combinazione di GPU e CPU, piuttosto che richiedere agli utenti di aggiungere GPU attraverso uno slot PCI express. Rimangono una scelta popolare per gli utenti di laptop, i gamer e altri che eseguono programmi ad alta intensità di calcolo sui propri PC.

GPU virtuali

Le GPU virtuali, o vGPU, hanno le stesse funzionalità delle GPU dedicate o integrate, ma senza l'hardware. Sono versioni basate su software di GPU create per istanze cloud e possono essere utilizzate per eseguire gli stessi workload. Inoltre, poiché non dispongono di hardware, sono più semplici ed economiche da mantenere rispetto alle loro controparti fisiche.

AI Academy

Prepararsi all'AI con l'hybrid cloud

Condotto dai migliori leader di pensiero di IBM, il programma di studi è stato progettato per aiutare i dirigenti aziendali ad acquisire le conoscenze necessarie per dare priorità agli investimenti in AI che possono favorire la crescita.

Che cos'è una GPU cloud?

Per GPU cloud si intende l'accesso a una GPU virtuale da parte di un provider di cloud service (CSP). Negli ultimi anni, il mercato dei servizi GPU basati su cloud è cresciuto, spinto dall'accelerazione del cloud computing e dalla maggiore adozione di applicazioni basate su AI/ML. In un rapporto di Fortune Business Insights, il mercato delle GPU as a service (GPUaaS), valutato 3,23 miliardi di dollari nel 2023, dovrebbe crescere da 4,31 miliardi di dollari nel 2024 a 49,84 miliardi di dollari entro il 2032. 1

Molti CSP, tra cui Google Cloud Platform, Amazon Web Services (AWS), Microsoft e IBM Cloud, offrono accesso su richiesta a servizi GPU scalabili per prestazioni ottimizzate dei workload. I CSP forniscono risorse GPU virtualizzate con pagamento a consumo nei loro data center. Spesso utilizzano hardware GPU dei principali produttori di GPU come Nvidia, AMD e Intel per alimentare la loro infrastruttura basata su cloud.

Le offerte di GPU basate su cloud di solito sono dotate di preconfigurazioni e possono essere distribuite facilmente. Queste funzionalità aiutano le organizzazioni a evitare i costi iniziali e la manutenzione associati alle GPU fisiche. Inoltre, poiché le aziende cercano di integrare workload di AI generativa per eseguire attività computazionali avanzate (ad esempio, creazione di contenuti, generazione di immagini), la scalabilità e l'economicità fornite dalle GPU cloud sono diventate cruciali per il business aziendale.

Cosa sono i benchmark delle GPU?

I benchmark delle GPU forniscono un processo per valutare le prestazioni della GPU in varie condizioni. Questi strumenti software specializzati consentono agli utenti (ad esempio, gamer, artisti 3D, sviluppatori di sistemi) di ottenere insight sulle proprie GPU e risolvere problemi di prestazioni come colli di bottiglia, latenza e compatibilità con altri software e hardware.

Esistono due tipi principali di benchmark delle GPU: benchmark sintetici e reali. I benchmark sintetici testano le prestazioni non elaborate di una GPU in un ambiente standardizzato. I benchmark reali testano le prestazioni di una GPU in applicazioni specifiche.

Gli strumenti di benchmarking della GPU esaminano metriche delle prestazioni come velocità, frame rate e larghezza di banda di memoria. Esaminano anche l'efficienza termica e il consumo di energia per aiutare gli utenti a ottenere prestazioni ottimali in base a esigenze specifiche. Alcune piattaforme di benchmark incorporano anche test che misurano l'efficacia dell'interazione di un solid-state drive (SSD) con una GPU.

Casi d'uso moderni della GPU

Nel tempo, le GPU si sono sviluppate, i miglioramenti tecnici le hanno rese più programmabili e sono state scoperte altre funzionalità. In particolare, la loro capacità di dividere le attività in più di un processore, noto come elaborazione parallela, li ha resi indispensabili per un'ampia gamma di applicazioni, come il gioco per PC, l'high performance computing (HPC), le workstation di rendering 3D, il data center computing e molti altri.

Vediamo nel dettaglio alcune delle più importanti e moderne applicazioni della tecnologia GPU, tra cui:

  • Intelligenza artificiale
  • Machine learning (ML) e deep learning (DL)
  • Blockchain
  • Gaming
  • Video editing
  • Creazione di contenuto
  • Calcolo ad alte prestazioni (HPC)
  • Visualizzazione e simulazione
Intelligenza artificiale

L'AI e le sue numerose applicazioni sarebbero probabilmente impossibili senza il computing GPU. La capacità delle GPU di risolvere problemi altamente tecnici in modo più rapido ed efficiente rispetto alle CPU tradizionali le rende indispensabili. Le GPU sono componenti cruciali per molti supercomputer, in particolare quelli AI.

Le GPU alimentano molte delle principali applicazioni di AI, come il supercomputer AI cloud-native di IBM, Velache richiede elevate velocità per poter formare set di dati sempre più grandi. I modelli di AI si addestrano e vengono eseguiti sulle GPU dei data center, in genere gestite dalle aziende che conducono ricerche scientifiche o altre attività ad alta intensità di calcolo.

Machine learning (ML) e deep learning (DL)

Il machine learning, o ML, si riferisce a una disciplina specifica dell'AI che riguarda l'uso di dati e algoritmi per imitare il modo in cui gli umani apprendono. Il deep learning, o DL, è un sottoinsieme del machine learning che utilizza reti neurali per simulare il processo-decisionale del cervello umano. La tecnologia GPU è fondamentale per entrambe le aree del progresso tecnologico.

Per quanto riguarda il machine learning (ML) e il deep learning (DL), le GPU alimentano la capacità dei modelli di ordinare enormi set di dati e di fare inferenze in modo simile agli esseri umani. Le GPU migliorano in modo specifico le aree di memoria e ottimizzazione perché possono eseguire molti calcoli simultanei contemporaneamente. Inoltre, le GPU utilizzate per ML e DL utilizzano meno risorse rispetto alle CPU, senza un calo di potenza o precisione.

Blockchain

Blockchain, il popolare registro utilizzato per registrare le transazioni e tenere traccia degli asset nelle reti aziendali, fa molto affidamento sulla tecnologia GPU, soprattutto quando si tratta di un passaggio noto come "prova di lavoro". In molte blockchain ampiamente utilizzate, come le criptovalute, la fase di proof of work è fondamentale per la convalida di una transazione, consentendone l'aggiunta alla blockchain.

Gaming

L'industria dei giochi ha sfruttato per la prima volta la potenza delle GPU negli anni 1990 per migliorare l'esperienza di gioco complessiva con maggiore velocità e precisione grafica. Oggi, i giochi personali richiedono un'elevata intensità di calcolo a causa di scenari iperrealistici, interazioni in tempo reale e mondi di gioco vasti e immersivi.

Le tendenze nel gaming, come la realtà virtuale (VR), i tassi di aggiornamento più elevati e gli schermi con risoluzioni più alte, dipendono dalle GPU per fornire grafica ad alta velocità in ambienti di elaborazione sempre più impegnativi. Le GPU per il gaming includono AMD Radeon, Intel Arc e Nvidia GeForce RTX.

Video editing

Tradizionalmente, i lunghi tempi di rendering sono stati un significativo ostacolo nelle applicazioni software di editing consumer e professionali. Da quando sono state inventate, le GPU hanno ridotto costantemente i tempi di elaborazione e le risorse di calcolo nei prodotti di montaggio video più diffusi, come Final Cut Pro e Adobe Premiere.

Oggi, le GPU dotate di elaborazione parallela e AI integrata accelerano notevolmente le capacità di editing per tutto, dalle suite di editing professionali alle app per smartphone.

Creazione di contenuto

I miglioramenti dell'elaborazione, nelle prestazioni e della qualità grafica hanno reso le GPU essenziali per la trasformazione del settore della creazione di contenuti. Oggi, i creatori di contenuti dotati di una scheda grafica ad alte prestazioni e di internet ad alta velocità possono generare contenuti realistici, aumentarli con l'AI e il machine learning, modificarli e trasmetterli a un pubblico dal vivo più velocemente che mai, tutto grazie principalmente ai progressi nella tecnologia GPU.

Calcolo ad alte prestazioni

Nei sistemi HPC, le GPU utilizzano funzionalità di elaborazione parallela per accelerare attività ad alta intensità di calcolo, come calcoli matematici complessi e analisi di grandi dati in campi come la scoperta di farmaci, la produzione di energia e l'astrofisica.

Visualizzazione e simulazione

Le GPU sono molto richieste in diversi settori per migliorare l'esperienza e le capacità di formazione delle applicazioni professionali complesse, tra cui procedure dettagliate di prodotto, disegni CAD e immagini mediche e sismiche o geofisiche. Le GPU sono fondamentali nelle visualizzazioni avanzate (ad esempio, formazione professionale di vigili del fuoco, astronauti, insegnanti) con animazione 3D, AI e ML, rendering avanzato e esperienze di realtà virtuale (VR) iperrealistiche e realtà aumentata (AR).

Anche gli ingegneri e i climatologi utilizzano applicazioni di simulazione basate su GPU per prevedere le condizioni meteorologiche, la fluidodinamica, l'astrofisica e il comportamento dei veicoli in determinate condizioni. La Nvidia RTX è una delle GPU più potenti disponibili per la visualizzazione scientifica e l'esplorazione energetica.

GPU vs. NPU vs. FPGA

Con la proliferazione di applicazioni AI e di gen AI, vale la pena esaminare altri due dispositivi di elaborazione specializzati e confrontarli con le GPU. Le aziende odierne utilizzano tutti e tre i tipi di processori (CPU, GPU e FPGA) a seconda delle loro esigenze specifiche.

Che cos'è un'unità di elaborazione neurale (NPU)?

Un'unità di elaborazione neurale (NPU) è un microprocessore informatico specializzato progettato per imitare la funzione di elaborazione del cervello umano. Conosciuto anche come acceleratore AI,  chip AI o processore di deep learning, un NPU è un acceleratore hardware creato per velocizzare le reti neurali AI, il deep learning e il machine learning.  

Le NPU e le GPU migliorano entrambe la CPU di sistema, ma presentano notevoli differenze. Le GPU contengono migliaia di core per ottenere le attività di calcolo rapide e precise necessarie per il rendering grafico e i giochi. Le NPU sono progettate per accelerare i workload di AI e di gen AI, dando priorità al flusso di dati e alla gerarchia della memoria in tempo reale, con bassi consumi e latenza.

Cos'è un field programmable gate array (FPGA)?

GPU ad alte prestazioni sono adatte per applicazioni di deep learning o AI perché possono gestire un grande volume di calcoli in più core con grandi quantità di memoria disponibile. I Field Programmable Gate Array (FPGA) sono tipi versatili di circuiti integrati che possono essere riprogrammati per diverse funzioni. Rispetto alle GPU, gli FPGA possono fornire flessibilità ed efficienza in termini di costi per offrire prestazioni migliori nelle applicazioni di deep learning che richiedono una bassa latenza, come l'imaging medico e l'edge computing.

Note a piè di pagina

Tutti i link sono esterni a IBM.

1 GPU as a Service Market Size, Share & Industry Analysis, Fortune Business Insights, Fortune Business Insights, 9 dicembre 2024

Soluzioni correlate
IBM Cloud Virtual Server for VPC

IBM Cloud Virtual Server for VPC è una famiglia di server virtuali Intel x86, IBM Z e IBM LinuxONE basati su IBM Cloud Virtual Private Cloud.

Esplora Cloud Virtual Server
Cloud Web Hosting 

I server dedicati IBM Cloud offrono una soluzione di web hosting scalabile con traffico di backhaul illimitato e gratuito e molte opzioni di personalizzazione.

Esplora le soluzioni di web hosting
Servizi di consulenza cloud 

Sblocca nuove funzionalità e promuovi l'agilità aziendale con i servizi di consulenza cloud di IBM. Scopri come creare insieme soluzioni, accelerare la trasformazione digitale e ottimizzare le prestazioni attraverso strategie di hybrid cloud e partnership di esperti.

Servizi cloud
Fai il passo successivo

Rafforza la tua presenza sul web con le soluzioni di web hosting affidabili e sicure di IBM Cloud. Dai siti web ad alto traffico alle applicazioni aziendali, gli IBM Cloud Bare Metal Servers offrono flessibilità, trasferimento dati illimitato e portata globale su misura per le tue esigenze di hosting.

Esplora il web hosting di IBM Cloud Crea un account IBM Cloud gratuito