Una rete neurale può essere compresa attraverso un semplice esempio: il rilevamento. Una e-mail viene immessa nella rete e le caratteristiche come parole o frasi come “premio”, “denaro”, “caro” o “vincere” vengono utilizzate come input.
I primi neuroni della rete elaborano l’importanza di ogni segnale, mentre gli strati successivi combinano queste informazioni in segnali di livello superiore che catturano il contesto e il tono. L’ultimo livello calcola quindi la probabilità che la e-mail sia spam e, se tale probabilità è sufficientemente alta, questa e-mail viene contrassegnata. In sostanza, la rete impara a trasformare le caratteristiche grezze in modelli significativi e a utilizzarli per fare previsioni.
Questo processo è alimentato da due concetti fondamentali: pesi e distorsioni. I pesi agiscono come quadranti che controllano l’intensità con cui ogni caratteristica di input influenza la decisione: a una parola come “premio” potrebbe essere dato più peso di una parola comune come “ciao”.
I bias sono valori incorporati che spostano la soglia decisionale, consentendo a un neurone di attivarsi anche se gli input stessi sono deboli. Insieme, questi parametri del modello determinano in che modo ciascun neurone contribuisce al calcolo complessivo. Regolando questi valori durante la formazione, la rete impara gradualmente a fare previsioni accurate, in questo caso, indipendentemente dal fatto che un’e-mail sia spam o meno.
Matematicamente, una rete neurale apprende una funzione mappando un vettore di input per prevedere una risposta Ciò che distingue le reti neurali dagli altri algoritmi di machine learning tradizionali è la loro struttura a strati e la loro capacità di eseguire trasformazioni non lineari.