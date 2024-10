A função de perda de erro quadrático médio, também chamada perda L2 ou perda quadrática, é geralmente o padrão para a maioria dos algoritmos de regressão. Como o próprio nome sugere, o MSE é calculado como a média das diferenças quadráticas entre o valor previsto e o valor real em todos os exemplos de treinamento. A fórmula para calcular o MSE em n pontos de dados é escrita como 1 n ∑ i = 1 n ( y i - y i ^ ) 2 , em que y é o valor verdadeiro e ŷ é o valor previsto.

Quadrar o erro significa que o valor resultante é sempre positivo: dessa forma, o MSE avalia apenas a magnitude do erro, não sua direção. A quadratura do erro também causa um impacto desproporcionalmente pesado na perda geral, o que pune fortemente os valores discrepantes e incentiva o modelo a reduzi-los. O MSE é, portanto, adequado quando se presume que as saídas-alvo tenham uma distribuição normal (gaussiana).

O MSE é sempre diferenciável, o que o torna prático para otimizar modelos de regressão por meio de gradiente descendente.



Erro logarítmico quadrático médio (MSLE)

Para problemas de regressão em que os resultados-alvo têm uma gama muito ampla de valores potenciais, como aqueles que envolvem crescimento exponencial, a penalização pesada de grandes erros pode ser contraproducente. O erro logarítmico quadrático médio (MSLE) compensa esse problema ao calcular a média dos quadrados do logaritmo natural das diferenças entre os valores previstos e médios. No entanto, vale a pena observar que o MSLE atribui uma penalidade maior às previsões muito baixas do que às previsões muito altas.



A fórmula para o MSLE é escrita como 1 n ∑ i = 1 n ( log e ( 1 + y i ) - log e ( 1 + y i ^ ) ) 2

Raiz do erro quadrático médio (RMSE)

A raiz do erro quadrado médio é a raiz quadrada do MSE, o que a torna intimamente relacionada à fórmula para desvios padrões. Especificamente, o RMSE é calculado como ∑ i = 1 n ( y i - y i ^ ) 2 n .

O RMSE, portanto, reflete amplamente as qualidades do MSE em termos de sensibilidade a valores discrepantes, mas é mais fácil de interpretar porque expressa perda nas mesmas unidades que o próprio valor de produção. Esse benefício é um pouco moderado pelo fato de que o cálculo do RSME exige outra etapa em comparação com o cálculo do MSE, o que aumenta os custos de computação.