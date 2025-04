Noto anche come trasformatore, un foundation model è un algoritmo di AI addestrato su grandi quantità di dati generali. Il termine “foundation model” è stato coniato dallo Stanford Institute for Human-Centered Artificial Intelligence nel 2021.

Un foundation model è basato su un modello di architettura di rete neurale per elaborare le informazioni proprio come fa il cervello umano. I foundation model possono essere addestrati per eseguire attività quali la classificazione dei dati, l'identificazione di oggetti all'interno di immagini (computer vision) e l'elaborazione del linguaggio naturale (PNL) (comprensione e generazione di testo) con un elevato grado di precisione. Possono anche svolgere un apprendimento auto-supervisionato per generalizzare e applicare le loro conoscenze a nuove attività.

Invece di dedicare tempo e impegno all'addestramento di un modello da zero, i data scientist possono utilizzare foundation model pre-addestrati quale punto di partenza per creare o personalizzare modelli AI per un caso d'uso specifico. Ad esempio, un foundation model potrebbe essere utilizzato come base per un modello di AI generativa che viene poi messo a punto con set di dati aggiuntivi per aiutare a scoprire modi più sicuri e veloci per produrre un tipo di prodotto.

Un tipo specifico di foundation model, noto come modello linguistico di grandi dimensioni (LLM), viene addestrato su grandi quantità di dati di testo per le attività di NLP. BERT (Bi-directional Encoder Representations from Transformers) è uno dei primi foundation model di LLM sviluppati. Google ha creato BERT, un modello open source, nel 2018. È stato pre-addestrato su un ampio corpus di dati in lingua inglese con auto-supervisione e può essere utilizzato per una serie di attività tra cui:

Analizzare il sentiment dei clienti o del pubblico

Rispondere alle domande del servizio clienti

Prevedere del testo dai dati di input

Generare testo in base ai prompt dell'utente

Riassumere documenti complessi e di grandi dimensioni

Foundation model e modelli tradizionali di machine learning a confronto

Un foundation model utilizzato per l'AI generativa è diverso da un modello di machine learning tradizionale perché può essere addestrato su grandi quantità di dati senza etichetta per supportare applicazioni che generano contenuti o eseguono attività.

Invece, un modello di machine learning tradizionale viene in genere addestrato per svolgere una singola attività utilizzando dati etichettati, ad esempio utilizzando immagini etichettate di auto per addestrare il modello a riconoscere poi le auto in immagini senza etichetta.

Foundation model orientati al valore aziendale

Lo studio watsonx.ai di IBM è una suite di foundation model di codice e linguaggio, ciascuno con un nome in codice a tema geologico, che può essere personalizzato per una vasta gamma di attività aziendali. Tutti i modelli watsonx.ai vengono addestrati sul data lake IBM, specifico e orientato al mondo enterprise.

Disponibile ora: Slate

Slate si riferisce a una famiglia di modelli basati solo su encoder che, sebbene non generativi, sono veloci ed efficaci per molte attività aziendali di PNL.

Prossimamente: Granite

I modelli Granite si basano su un'architettura di soli encoder, simile a GPT, per attività generative.

Prossimamente: Sandstone

I modelli Sandstone utilizzano un'architettura encoder-decoder e sono adatti per la messa a punto di attività specifiche.

Prossimamente: Obsidian

I modelli Obsidian utilizzano una nuova architettura modulare sviluppata da IBM Research, che fornisce un'elevata efficienza di inferenza e livelli di prestazioni in una varietà di attività.