Régularisation de régression catégorielle

méthode. Les méthodes de régularisation peuvent améliorer l'erreur prédictive du modèle en réduisant la variabilité des estimations du coefficient de régression en réduisant les estimations vers 0. Le Lasso et Elastic Net contracteront des estimations de coefficients à exactement 0, fournissant ainsi une forme de sélection variable. Lorsqu'une méthode de régularisation est demandée, le modèle régularisé et les coefficients de chaque valeur de coefficient de pénalité sont écrits dans un fichier de données ou un jeu de données IBM® SPSS® Statistics externe de la session en cours. Pour plus d'informations, voir la rubrique Sauvegarde de la régression catégorielle .

  • Régression pseudo-orthogonale. La régression de crête réduit les coefficients en introduisant un terme de pénalité égal à la somme des coefficients au carré multipliée par un coefficient de pénalité. Ce coefficient peut être compris entre 0 (aucune pénalité) et 1 ; cette procédure recherchera la "meilleure" valeur de pénalité si vous spécifiez une plage et un incrément.
  • Lasso: Le terme de pénalité de Lasso est basé sur la somme des coefficients absolus et la spécification d'un coefficient de pénalité est semblable à celle d'une régression pseudo-orthogonale. Néanmoins, le Lasso nécessite beaucoup plus de calculs.
  • Elastic net : Elastic Net regroupe simplement les pénalités de régression Lasso et de crête et effectuera une recherche dans la grille des valeurs spécifiées pour trouver les "meilleurs" coefficients de pénalité de régression Lasso et de crête. Pour une paire de pénalités de régression Lasso et de crête donnée, Elastic Net ne nécessite pas plus de calculs que le Lasso.

Afficher les tracés de régularisation : Il s'agit de tracés comparant les coefficients de régression et la pénalité de régularisation. Pendant que ce graphique recherche une plage de valeurs pour le "meilleur" coefficient de pénalité, il affiche les modifications des coefficients de régression dans cette plage.

Tracés Elastic Net : Pour la méthode Elastic Net, des tracés de régularisation séparés sont générés par les valeurs de la pénalité de régression de crête. La fonction Tous les tracés possibles utilise chaque valeur de la plage déterminée par les valeurs minimum et maximum de pénalité de régression de crête spécifiées. La fonction Pour certaines pénalités de crête permet de spécifier un sous-ensemble des valeurs dans la plage déterminée par le minimum et le maximum. Entrez simplement le chiffre d'une valeur de pénalité (ou spécifiez une plage de valeurs), puis cliquez sur Ajouter.

Pour spécifier la régularisation CATREG

Cette fonction nécessite l'option Catégories.

  1. A partir des menus, sélectionnez :

    Analyser > Régression > Mise à l'échelle optimale (CATREG) ...

  2. Dans la boîte de dialogue Régression catégorielle, cliquez sur Régularisation.
  3. Sélectionnez les options de régularisation souhaitées.
  4. Cliquez sur Continuer.