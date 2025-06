Negli approcci tradizionali di machine learning, i modelli stabiliscono i parametri attraverso un processo di addestramento in due fasi che consiste nella propagazione in avanti e nella retropropagazione.

La propagazione in avanti è lo spostamento dei dati attraverso il modello. I neuroni ricevono informazioni, calcolano i pesi per tali input e aggiungono bias. La funzione di attivazione determina quindi se quel valore è sufficiente per attivare il neurone. In tal caso, il neurone si attiva e trasmette gli output attraverso la rete. La catena continua fino a quando il modello non genera un output finale.

La seconda fase è la propagazione all'indietro, o retropropagazione. Questa fase calcola l'errore del modello: la discrepanza tra il suo output e i valori reali. Per fare ciò, un algoritmo di ottimizzazione di discesa del gradiente misura il gradiente della funzione di perdita. Il modello aggiorna i pesi e i bias in risposta al gradiente, con l'obiettivo di ridurre al minimo la funzione di perdita e generare previsioni migliori.

Il processo di propagazione in avanti/indietro continua fino a quando la funzione di perdita non è stata minimizzata con successo, che sta a indicare che il modello ha prestazioni ottimali. Le prestazioni del modello vengono giudicate in base a metriche di valutazione LLM come la coerenza del testo generato.