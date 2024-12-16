Gli LLM generano testo prevedendo la parola successiva (o meglio, il token successivo) in base a una distribuzione di probabilità. A ogni token viene assegnato un logit (valore numerico) dall'LLM e il set totale di token viene normalizzato in una "distribuzione di probabilità softmax". A ogni token viene assegnata una "funzione softmax" compresa tra zero e uno e la somma di tutte le probabilità softmax dei token è una.

Il parametro di temperatura degli LLM modifica questa distribuzione. Una temperatura più bassa aumenta essenzialmente la probabilità che i token con la più alta probabilità vengano selezionati; una temperatura più alta aumenta la probabilità di un modello di selezionare token meno probabili. Ciò accade perché un valore di temperatura più alto introduce una maggiore variabilità nella selezione dei token dell'LLM. Le diverse impostazioni di temperatura introducono essenzialmente diversi livelli di casualità quando un modello di AI generativa genera testo.

La temperatura è una caratteristica cruciale per il controllo della casualità nelle prestazioni del modello. Consente agli utenti di regolare l'output dell'LLM per adattarlo meglio alle diverse applicazioni reali di generazione di testo. Più specificamente, questa impostazione degli LLM consente agli utenti di bilanciare coerenza e creatività nella generazione di output per un caso d'uso specifico. Ad esempio, una temperatura bassa potrebbe essere preferibile per attività che richiedono precisione e accuratezza dei fatti, come la documentazione tecnica o le risposte conversazionali con chatbot. Il valore di temperatura più basso aiuta l'LLM a produrre un testo più coeso e coerente ed evitare risposte irrilevanti. Al contrario, una temperatura elevata è preferibile per output creativi o attività creative come la scrittura creativa o il brainstorming concettuale. L'impostazione della temperatura consente efficacemente agli utenti di mettere a punto gli LLM e regolare l'output di un modello in base al risultato desiderato.

Spesso la temperatura viene confusa con la "creatività", ma non è sempre così. È più utile considerarlo come l'ampiezza con cui il modello usa il testo dai dati di addestramento. Max Peeperkorn et al1 hanno condotto un'analisi empirica della produzione degli LLM per diversi valori di temperatura e hanno scritto:

"Troviamo che la temperatura sia debolmente correlata con la novità e, ovviamente, moderatamente correlata con l'incoerenza, ma non c'è alcuna relazione né con la coesione né con la tipicità. Tuttavia, l'influenza della temperatura sulla creatività è molto più sfumata e debole di quanto suggerito dall'affermazione "del parametro di creatività"; i risultati complessivi suggeriscono che l'LLM genera output leggermente più nuovi all'aumentare delle temperature".

Un valore di temperatura elevato può far sembrare i risultati del modello più creativi, ma è più accurato considerarli come meno determinati dai dati di addestramento.