Régression logistique - Options pas à pas

Ces options vous permettent de contrôler les critères d'ajout et de suppression des champs avec les méthodes Par étapes, Ascendante, Descendante ou Par étapes descendante.

Nombre de termes du modèle (modèles multinomiaux uniquement). Vous pouvez indiquer le nombre minimal de caractéristiques pour les modèles Descendant et Par étapes descendant, ainsi que le nombre maximal de caractéristiques pour les modèles Ascendante et Par étapes. Si vous indiquez une valeur minimale supérieure à 0, le modèle contiendra le nombre de caractéristiques indiqué alors que certaines d'entre elles auraient été supprimées sur la base des critères statistiques. La valeur minimale est ignorée pour les modèles Ascendant, Par étapes et Entrée. Si vous indiquez une valeur maximale, certaines caractéristiques peuvent être supprimées du modèle, alors qu'elles auraient été sélectionnées sur la base des critères statistiques. Le paramètre Indiquer valeur maximale est ignoré pour les méthodes Descendante, Par étapes descendante et Entrée.

Critère d'entrée (modèles multinomiaux uniquement). Sélectionnez Score pour optimiser la vitesse du traitement. L'option Rapport de vraisemblance peut fournir des estimations un peu plus fiables, mais les calculs effectués sont plus longs. Par défaut, il convient d'utiliser les statistiques de score.

Critère de suppression. Sélectionnez Rapport de vraisemblance pour obtenir un modèle plus fiable. Pour réduire la durée de création de ce modèle, vous pouvez essayer de sélectionner Wald. Toutefois, si les données sont totalement ou quasiment séparées (ce que vous pouvez déterminer dans l'onglet Options avancées du nugget de modèle), les statistiques de Wald ne sont pas fiables et ne doivent pas être utilisées. Par défaut, il convient d'utiliser les statistiques de rapport de vraisemblance. Pour les modèles binomiaux, il existe l'option supplémentaire Conditionnel. Elle fournit un test de suppression basé sur la probabilité de la statistique du rapport de vraisemblance, en fonction des estimations des paramètres conditionnels.

Seuils de signification des critères. Cette option vous permet de spécifier des critères de sélection basés sur la probabilité statistique (la valeur p) associée à chaque champ. Les champs sont ajoutés au modèle uniquement si la valeur p associée est inférieure à la valeur spécifiée dans le champ Entrée ; ils sont supprimés uniquement si la valeur p est supérieure à la valeur spécifiée dans le champ Suppression. La valeur du champ Entrée doit être inférieure à la valeur du champ Suppression.

Conditions requises de saisie ou de suppression (modèles multinomiaux uniquement). Pour certaines applications, l'ajout de caractéristiques d'interaction au modèle n'a aucun sens mathématique, sauf si le modèle contient également les caractéristiques d'ordre inférieur pour les champs concernés par la caractéristique d'interaction. Par exemple, l'ajout de A * B au modèle peut n'avoir aucun sens, sauf si A et B font également partie du modèle. Les options suivantes vous permettent de déterminer le mode de traitement de ces dépendances au cours de la sélection des caractéristiques par étapes.

  • Hiérarchie des effets discrets. Les effets d'ordre supérieur (interactions impliquant plus de champs) seront ajoutés au modèle uniquement si tous les effets d'ordre inférieur (effets principaux ou interactions impliquant moins de champs) des champs correspondants se trouvent déjà dans le modèle. De plus, les effets d'ordre inférieur ne seront pas supprimés si les effets d'ordre supérieur impliquant les mêmes champs se trouvent dans le modèle. Cette option s'applique uniquement aux champs catégoriels.
  • Hiérarchie de tous les effets. Cette option fonctionne de la même façon que l'option précédente, sauf qu'elle s'applique à tous les champs d'entrée.
  • Imbrication de tous les effets. Les effets peuvent être inclus dans le modèle uniquement si tous les effets contenus dans un effet sont également inclus dans le modèle. Cette option est identique à l'option Hiérarchie de tous les effets, sauf que les champs continus sont traités de manière quelque peu différente. Pour un effet qui doit en contenir un autre, l'effet (d'ordre inférieur) contenu doit comprendre tous les champs continus de l'effet (d'ordre supérieur) contenant et tous les champs catégoriels de l'effet contenu doivent représenter un sous-ensemble de ceux qui se trouvent dans l'effet contenant. Par exemple, si A et B sont des champs catégoriels et que X est un champ continu, la caractéristique A * B * X contient les caractéristiques A * X et B * X.
  • Aucun. Aucune relation n'est appliquée : les caractéristiques sont ajoutées et supprimées séparément dans le modèle.