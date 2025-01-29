I modelli linguistici di grandi dimensioni (LLM) come GPT-3, 4 e PalM sono comunemente chiamati modelli "black box" perché gli utenti non hanno accesso ai loro elementi interni, come parametri, metodi di ottimizzazione o processi decisionali.

Tale interazione avviene essenzialmente tramite prompt che utilizzano le chiamate application programming interface (API) come principali meccanismi di input e output. Sebbene questi modelli siano molto buoni, la loro capacità di produrre output precisi e specifici per un compito è spesso fortemente dipendente dalla qualità del prompt.2, 3

In questo caso, la prompt engineering per progettare prompt mirati a orientare il comportamento del modello è rilevante. Sia gli approcci manuali che quelli automatizzati alla prompt engineering hanno prodotto notevoli successi. Tuttavia, non sono privi di inconvenienti, soprattutto per i compiti che richiedono un forte controllo o un output molto specifico dell'istanza.

Ad esempio, attività come il riassunto o la generazione di dialoghi richiedono che il modello segua in modo sistematico i comportamenti target, come l'inclusione di dettagli chiave e l'adesione a un modello di ragionamento rigoroso o a linee guida stilistiche prescritte. Le tecniche convenzionali spesso non sono sufficienti per garantire una conformità costante a questi requisiti così dettagliati.

Il prompting di stimolo direzionale (DSP) colma questa lacuna. Il DSP è un piccolo modello di policy ausiliaria e genera prompt specifici per le istanze che guidano l'LLM verso le sue decisioni.

I prompt emessi rispondono a un contesto specifico per ogni istanza e sembrano convincere l'LLM a produrre output più allineati e desiderabili. Collegando il DSP al processo, gli utenti dispongono di un potente strumento per correggere il comportamento degli LLM black box per una maggiore coerenza, pertinenza e accuratezza in un lavoro che richiede precisione.1