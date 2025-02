L'ottimizzazione delle istruzioni è un sottoinsieme della più ampia categoria di messa a punto delle tecniche utilizzate per adattare i foundation model pre-addestrati per le attività downstream. I foundation model possono essere messi a punto per una serie di scopi, dalla personalizzazione dello stile all'integrazione delle conoscenze e del vocabolario di base del modello pre-addestrato, fino all'ottimizzazione delle prestazioni per un caso d'uso specifico. Sebbene l'ottimizzazione non sia esclusiva di alcun dominio specifico o architettura di modelli AI, è diventata parte integrante del ciclo di vita di un modello LLM. Ad esempio, la famiglia di modelli Llama 2 di Meta è offerta (in varie dimensioni) come modello base, come variante ottimizzata per il dialogo ( Llama-2-Chat) e come variante ottimizzata per la codifica (Code Llama).

L'ottimizzazione delle istruzioni non è incompatibile con altre tecniche di messa a punto. Ad esempio, i modelli di chat spesso subiscono sia l'ottimizzazione delle istruzioni, sia l'apprendimento per rinforzo dal feedback umano (RLHF), una tecnica di messa a punto che mira a migliorare qualità astratte come la disponibilità e l'onestà; i modelli messi a punto per la codifica spesso subiscono sia l'ottimizzazione delle istruzioni (per ottimizzare ampiamente le risposte per seguire le istruzioni), sia un'ulteriore messa a punto su dati specifici della programmazione (per aumentare la conoscenza del modello della sintassi e del vocabolario della codifica).

Sebbene la genesi degli LLM risalga all'articolo del 2017 "Attention is All You Need", che ha introdotto i modelli di trasformatori su larga scala nelle attività di elaborazione del linguaggio naturale (NLP), l'incorporazione del tuning delle istruzioni e dell'RLHF,guidata rispettivamente da influenti articoli di Google (nel 2021)1 e OpenAI (nel 2022),2 ha prodotto i moderni LLM che hanno dato il via all'attuale era dell'AI generativa con il lancio di ChatGPT.