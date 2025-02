Regressão linear e regressão logística são modelos preditivos fundamentais no aprendizado de máquina. A regressão linear (ou mínimos quadrados ordinários) busca medir e prever o impacto de uma ou mais variáveis preditoras em uma variável de saída, encontrando a linha que melhor se ajusta aos pontos de dados fornecidos (isto é, dados de treinamento). A regressão logística, por outro lado, estima probabilidades de classe por meio de uma saída binária baseada em variáveis preditoras. Em outras palavras, a regressão linear faz previsões quantitativas contínuas, enquanto a regressão logística produz previsões categóricas discretas.5

É claro que, à medida que o número de preditores aumenta em qualquer modelo de regressão, a relação input-saída nem sempre é direta e requer manipulação da fórmula de regressão. Então, entra a regularização. Existem três formas principais de regularização para modelos de regressão. Observe que esta lista é apenas uma breve pesquisa. A aplicação dessas técnicas de regularização na regressão linear ou logística varia minimamente.

- Regressão Lasso (ou regularização L1) penaliza coeficientes de alto valor e correlacionados. Introduz um termo de regularização (também chamado de termo de penalização) na função de perda de soma dos erros quadrados (SSE) do modelo. Esse termo de penalização é o valor absoluto da soma dos coeficientes. Controlado pelo hiperparâmetro lambda (λ), ele reduz seletivamente pesos de funcionalidades a zero. Assim, a regressão Lasso elimina funcionalidades multicolineares do modelo.

- Regressão Ridge (ou regularização L2) é uma técnica de regularização que penaliza coeficientes de alto valor ao introduzir um termo de penalização na função de perda SSE. No entanto, ela difere da regressão Lasso em dois aspectos: primeiro, o termo de penalização na regressão Ridge é o quadrado da soma dos coeficientes, em vez do valor absoluto. Segundo, a regressão Ridge não realiza seleção de funcionalidades. Enquanto o termo de penalização da regressão Lasso pode remover funcionalidades do modelo ao reduzir os valores dos coeficientes para zero, a regressão Ridge apenas reduz os pesos das funcionalidades em direção a zero, mas nunca os elimina completamente.

- Regularização Elastic Net combina essencialmente as regressões Ridge e Lasso ao inserir os termos de penalização L1 e L2 na função de perda SSE. Os termos L2 e L1 derivam seus valores de penalização, respectivamente, ao elevar ao quadrado ou tomar o valor absoluto da soma dos pesos das funcionalidades. O Elastic Net insere ambos esses valores de penalização na equação da função de custo (SSE). Dessa forma, o Elastic Net lida com a multicolinearidade ao mesmo tempo em que possibilita a seleção de funcionalidades.6

Em estatística, esses métodos também são chamados de "redução de coeficientes", pois reduzem os valores dos coeficientes preditores no modelo. Em todas as três técnicas, a força do termo de penalização é controlada pelo parâmetro lambda, que pode ser ajustado por meio de diversas técnicas de validação cruzada.