Paramètres spécifiques de la fonction d'exploration de régression

Cette section décrit les paramètres spécifiques de la régression linéaire, polynomiale et RBF.

Vous pouvez spécifier des paramètres pour les algorithmes de régression suivants:
  • Régression linéaire
  • Régression polynomiale
  • Régression RBF.

Les paramètres de l'algorithme de régression de transformation ne peuvent pas être modifiés.

Paramètres spécifiques à la régression linéaire et polynomiale

Vous pouvez spécifier les paramètres suivants qui sont spécifiques à l'algorithme de régression linéaire et à l'algorithme de régression polynomiale:
Traitement des valeurs extrêmes
Pour spécifier la façon dont les algorithmes de régression traitent les valeurs qui se trouvent en dehors de la portée de la plage de valeurs d'un champ, vous pouvez utiliser la méthode DM_setFldOutlTreat sur une valeur DM_RegSettings . Par exemple, vous pouvez utiliser la spécification suivante:
DM_setFldOutlTreat(fieldName, outlierTreatment)

La valeur par défaut est 0. Cela signifie que les valeurs extrêmes sont traitées telles qu'elles sont.

Il est recommandé de définir un traitement des valeurs extrêmes uniquement si vous définissez également des limites inférieure et supérieure pour les zones numériques dans la spécification de données logiques à l'aide de la méthode DM_setFldOutlLim. Si vous spécifiez un traitement des valeurs extrêmes sans spécifier de limites inférieure et supérieure pour les champs numériques, les algorithmes de régression calculent les limites automatiquement.

Degré maximal de régression polynomiale
Pour spécifier un degré maximal de polynôme pour l'algorithme de régression polynomiale, utilisez le paramètre d'algorithme MaxExp à l'aide de DM_setAlgorithm().
Le modèle résultant a un polynôme d'un degré inférieur ou égal à la valeur spécifiée.
  • Pour l'algorithme de régression linéaire, la seule valeur valide est la valeur par défaut 1.
  • Pour l'algorithme de régression polynomiale, vous pouvez utiliser des valeurs de 1 à 7. La valeur par défaut est 3.
    Par exemple, si vous souhaitez spécifier le degré 2 pour le polynôme, utilisez l'instruction suivante:
    DM_setAlgorithm('Polynomial','<MaxExp>2</MaxExp>')
Niveau de signification minimal
Si vous spécifiez un niveau de signification minimal, Stepwise Regression est utilisé pour déterminer un sous-ensemble de prédicteurs possibles. Seuls les champs indépendants dont la valeur de signification est supérieure à celle spécifiée contribuent au calcul du modèle de régression.
Pour définir le paramètre d'algorithme MinSigLevel sur une valeur comprise entre 0 et 1, vous pouvez utiliser la méthode DM_setAlgorithm. Par exemple, si vous souhaitez définir le niveau de signification minimal sur 0,5, utilisez l'instruction suivante:
DM_setAlgorithm('Polynomial",'<MinSigLevel>0.5</MinSigLevel>')

Si le niveau de signification minimal est défini sur 0, tous les champs qui sont fournis dans la spécification de données logiques et qui ne sont pas marqués comme Supplementary sont utilisés pour calculer le modèle.

Pour calculer un modèle de régression linéaire type, définissez le nom de l'algorithme sur Linear et le niveau de signification minimal sur 0 à l'aide de l'instruction suivante:
DM_setAlgorithm('Linear",'<MinSigLevel>0</MinSigLevel>')
Si vous ne spécifiez pas de niveau de signification minimal, l'algorithme tente automatiquement de sélectionner un sous-ensemble optimal de prédicteurs possibles.
Intercepter
Vous pouvez forcer la courbe de régression à passer par l'origine. Cela signifie que le modèle ne contiendra pas de constante.
Pour forcer la courbe de régression à passer par l'origine, vous pouvez utiliser le paramètre d'algorithme Intercept dans la méthode DM_SetAlgorithm à l'aide de l'instruction suivante:
DM_setAlgorithm('Linear",'<Intercept>True</Intercept>')

Le paramètre par défaut est false.

Sélection de fonction automatique
L'algorithme tente de déterminer un sous-ensemble optimal de prédicteurs possibles si vous ne spécifiez pas de niveau de signification minimal.
Les algorithmes prennent en charge les mesures suivantes:
  • Coefficient de corrélation de Pearson au carré normal
  • Coefficient de corrélation de Pearson ajusté au carré
Pour utiliser le coefficient de corrélation de Pearson au carré ajusté pour le paramètre d'algorithme RSquaredMode dans la méthode DM_setAlgorithm, vous pouvez utiliser l'instruction suivante:
DM_setAlgorithm('Polynomial",'<RSquaredMode>adjusted</RSquaredMode>')

La valeur par défaut est normal.

Paramètres spécifiques à la régression RBF

Vous pouvez spécifier les paramètres suivants qui sont spécifiques à l'algorithme de régression RBF:
TailleEchantillon
Cette valeur représente le nombre d'enregistrements consécutifs à sélectionner parmi les données d'entrée à utiliser lorsque l'apprentissage passe à la phase de vérification pour déterminer si les objectifs de précision et de limite d'erreur souhaités ont été atteints. Il est également utilisé pour détecter le surentraînement du modèle dans le temps. Lorsque ces objectifs sont atteints, le mode d'entraînement se termine. Au cours de l'entraînement, le nombre d'enregistrements spécifié est ignoré.

La valeur par défaut est 1.

Pour spécifier la valeur 2, utilisez l'instruction suivante:
DM_setAlgorithm('RBF','<OutSampleSize>2</OutSampleSize>')
TailleEchantillon
Cette valeur représente le nombre d'enregistrements consécutifs à sélectionner parmi les données d'entrée à utiliser pour l'entraînement. Au cours de la phase de vérification, le nombre d'enregistrements spécifié est ignoré.

La valeur par défaut est 2.

Pour spécifier la valeur 1, utilisez l'instruction suivante:
DM_setAlgorithm('RBF','<inSampleSize>1</InSampleSize>')
Nbre max. de centres
Cette valeur limite le nombre de centres créés par la fonction d'exploration à chaque passage des données d'entrée. Etant donné que le nombre de centres peut augmenter jusqu'à deux fois le nombre initial au cours d'un passage, le nombre réel de centres peut être supérieur au nombre que vous avez spécifié.

Si aucune valeur n'est indiquée, une valeur appropriée est calculée par le système.

Pour spécifier la valeur 20, utilisez l'instruction suivante:
DM_setAlgorithm('RBF','<MaxNumberCenters>20</MaxNumberCenters>')
TailleRégionmin
Cette valeur détermine le nombre minimal d'enregistrements affectés à une région. Si, à la fin d'une transmission, une région a une valeur inférieure à la valeur spécifiée, la région est supprimée.

La valeur par défaut est 15.

Pour spécifier la valeur 30, utilisez l'instruction suivante:
DM_setAlgorithm('RBF','<MinRegionSize>30</MinRegionSize>')
Nombre min. de passes
Cette valeur détermine le nombre minimal de passages dans les données d'entrée. Au cours de ces laissez-passer, le surentraînement ou la précision ne sont pas vérifiés. Cela permet de gagner du temps, cependant, spécifiez une valeur élevée pour le nombre minimal de passes uniquement si vous disposez de suffisamment de données d'apprentissage et si vous êtes certain qu'un bon modèle existe.

La valeur minimale à spécifier est 2.

Si aucune valeur n'est indiquée, une valeur appropriée est calculée par le système.

Pour spécifier la valeur 5, utilisez l'instruction suivante:
DM_setAlgorithm('RBF','<MinNumberPasses>5</MinNumberPasses>')
Nbre max. de passes
Cette valeur limite le nombre de fois où la fonction d'exploration passe par les données. Si la précision de prévision souhaitée est atteinte avant cette limite, l'apprentissage s'arrête.

S'il est spécifié, le nombre maximal de passes doit être supérieur ou égal au nombre minimal de passes.

Si aucune valeur n'est indiquée, une valeur appropriée est calculée par le système.

Pour spécifier la valeur 5, utilisez l'instruction suivante:
DM_setAlgorithm('RBF','<MaxNumberPasses>5</MaxNumberPasses>')