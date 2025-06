Osservata per la prima volta da Michael McCloskey e Neal J. Cohen nel 19891, l'oblio catastrofico si verifica a causa del modo in cui gli algoritmi di apprendimento automatico si adattano ai nuovi set di dati. Il processo di addestramento per i modelli di deep learning, come i modelli linguistici di grandi dimensioni (LLM), prevede l'esposizione del modello ai dati e la possibilità di aggiornarne i pesi di conseguenza. Un articolo di informatica del 2023 2 ha rilevato che riguarda i modelli di grandi dimensioni in modo più grave rispetto a quelli più piccoli.

I pesi di rete, noti anche come parametri di un modello, sono il set di regole interno che utilizza per acquisire modelli e relazioni nei set di dati di addestramento. Durante l'addestramento, un algoritmo di apprendimento automatico aggiorna i suoi pesi in modo iterativo in base a una funzione di perdita: un'equazione matematica che misura l'errore nelle previsioni del modello.

L'obiettivo dell'addestramento è ridurre al minimo la funzione di perdita attraverso metodi come la discesa del gradiente. Il tasso di apprendimento imposta il ritmo con cui un modello aggiorna i propri pesi durante l'addestramento.

La configurazione dei pesi di un modello è la sua rappresentazione della conoscenza: un riflesso matematico del modo in cui il modello conosce i propri dati di addestramento. Se un modello regola i propri pesi in modo sostanziale in modo che i nuovi valori non siano più rilevanti per le attività precedenti, allora perde la capacità di eseguire tali attività. Nel processo di apprendimento di nuove attività, il modello ha dimenticato "catastroficamente" o completamente come affrontare quelli vecchi.