Uma rede neural pode ser compreendida por meio de um exemplo simples: detecção de spam. Um e-mail é alimentado na rede, e funcionalidades como palavras ou frases como "prêmio", "dinheiro", "prezado" ou "ganhar" são usados como entradas. Os neurônios iniciais na rede processam a importância de cada sinal, enquanto as camadas posteriores combinam essas informações em pistas de nível superior que capturam contexto e tom. A camada final, então, calcula uma probabilidade de o e-mail ser spam e, se essa probabilidade for alta o suficiente, o e-mail será sinalizado. Em essência, a rede aprende a transformar funcionalidades brutas em padrões significativos e usá-los para fazer previsões.
Esse processo é alimentado por dois conceitos fundamentais: pesos e vieses. Os pesos atuam como mostradores que controlam a força com que cada funcionalidade de entrada influencia a decisão; uma palavra como "prêmio" pode receber mais peso do que uma palavra comum como "olá". Vieses são valores embutidos que mudam o limite de decisão, permitindo que um neurônio seja ativado mesmo que as entradas em si sejam fracas. Juntos, esses parâmetros do modelo determinam como cada neurônio contribui para a computação geral. Ao ajustar esses valores durante o treinamento, a rede aprende gradualmente a fazer previsões precisas — neste caso, se um e-mail é spam ou não.
De maneira matemática, uma rede neural aprende uma função mapeando um vetor de entrada para prever uma resposta O que distingue as redes neurais de outros algoritmos tradicionais de aprendizado de máquina é sua estrutura em camadas e sua capacidade de realizar transformação não linear.