Il tasso di apprendimento è importante perché guida i modelli AI nell'apprendimento efficace dai dati di addestramento.
Un tasso di apprendimento basso non consente al modello di "imparare" abbastanza in ogni fase. Il modello aggiorna i suoi parametri troppo lentamente e impiega troppo tempo per raggiungere la convergenza. Tuttavia, ciò non significa che un tasso di apprendimento elevato sia la risposta.
Con un tasso di apprendimento elevato, l'algoritmo può essere soggetto a overshooting, ovvero quando si spinge troppo in là nella correzione degli errori. In questo caso, l'algoritmo necessita di un tasso di apprendimento più basso, ma non troppo da rendere l'apprendimento inefficiente.
Come esempio, immagina un alieno che è venuto a conoscenza della vita sulla Terra. L'alieno vede gatti, cani, cavalli, maiali e mucche e pensa che tutti gli animali abbiano quattro zampe. Poi, l'alieno vede un pollo. Anche questa creatura è un animale? A seconda del suo tasso di apprendimento, l'alieno giungerà a una di queste tre conclusioni:
Con un tasso di apprendimento ottimale, l'alieno concluderà che anche i polli sono animali. Se è così, ciò significa che la quantità di gambe non è un fattore determinante per stabilire se una creatura è un animale o no.
Se l'alieno ha un basso tasso di apprendimento, non può trarre sufficienti insight da questo singolo pollo. L'alieno concluderà che i polli non sono animali perché non hanno quattro zampe. Il basso tasso di apprendimento dell'alieno non gli consentirà di aggiornare il suo pensiero finché non vedrà altri polli.
Con un tasso di apprendimento elevato, l'alieno correggerà eccessivamente. Concluderà che, poiché il pollo è un animale e poiché il pollo ha due zampe, tutti gli animali hanno due zampe. Un tasso di apprendimento elevato significa che il modello impara "troppo" in poco tempo.
Tassi di apprendimento diversi si traducono in risultati di apprendimento diversi. Il miglior tasso di apprendimento è quello che consente all'algoritmo di regolare i parametri del modello in modo tempestivo senza superare il punto di convergenza.