Ein neuronales Netz kann anhand eines einfachen Beispiels verstanden werden: Erkennung von Spam. Eine E-Mail wird in das Netzwerk eingespeist und Funktionen wie Wörter oder Ausdrücke wie „Preis“, „Geld“, „Sehr geehrte“ oder „gewinnen“ werden als Eingaben verwendet. Die frühen Neuronen im Netzwerk verarbeiten die Bedeutung jedes Signals, während spätere Schichten diese Informationen zu übergeordneten Hinweisen kombinieren, die Kontext und Ton erfassen. In der letzten Schicht wird dann eine Wahrscheinlichkeit dafür berechnet, ob es sich bei der E-Mail um Spam handelt, und wenn diese Wahrscheinlichkeit hoch genug ist, wird die E-Mail gekennzeichnet. Im Wesentlichen lernt das Netz, wie es Rohfunktionen in aussagekräftige Muster umwandelt und diese für Vorhersagen nutzt.
Dieser Prozess basiert auf zwei grundlegenden Konzepten: Gewichtungen und Verzerrungen. Gewichtungen wirken wie Drehknöpfe, die steuern, wie stark jede Eingabe-Funktion die Entscheidung beeinflusst – ein Wort wie „Preis“ kann mehr Gewicht erhalten als ein gewöhnliches Wort wie „Hallo“. Verzerrungen sind integrierte Werte, die Entscheidungsschwelle verschieben, sodass ein Neuron auch dann aktiviert werden kann, wenn die Eingaben selbst schwach sind. Zusammen bestimmen diese Modellparameter, wie jedes Neuron zur Gesamtberechnung beiträgt. Durch Anpassung dieser Werte während des Trainings lernt das Netzwerk nach und nach, genaue Vorhersagen zu treffen – in diesem Fall, ob es sich bei einer E-Mail um Spam handelt oder nicht.
Mathematisch lernt ein neuronales Netzwerk eine Funktion durch Zuordnung eines Eingabevektors um eine Reaktion vorherzusagen Was neuronale Netze von anderen traditionellen maschinellen Lernalgorithmen unterscheidet, ist ihre mehrschichtige Struktur und ihre Fähigkeit, nicht lineare Transformationen durchzuführen.