Paramètres spécifiques de la fonction d'exploration de régression
Cette section décrit les paramètres spécifiques de la régression linéaire, polynomiale et RBF.
- Régression linéaire
- Régression polynomiale
- Régression RBF.
Les paramètres de l'algorithme de régression de transformation ne peuvent pas être modifiés.
Paramètres spécifiques à la régression linéaire et polynomiale
- Traitement des valeurs extrêmes
- Pour spécifier la façon dont les algorithmes de régression traitent les valeurs qui se trouvent en dehors de la portée de la plage de valeurs d'un champ, vous pouvez utiliser la méthode
DM_setFldOutlTreatsur une valeurDM_RegSettings. Par exemple, vous pouvez utiliser la spécification suivante:DM_setFldOutlTreat(fieldName, outlierTreatment)La valeur par défaut est 0. Cela signifie que les valeurs extrêmes sont traitées telles qu'elles sont.
Il est recommandé de définir un traitement des valeurs extrêmes uniquement si vous définissez également des limites inférieure et supérieure pour les zones numériques dans la spécification de données logiques à l'aide de la méthode
DM_setFldOutlLim. Si vous spécifiez un traitement des valeurs extrêmes sans spécifier de limites inférieure et supérieure pour les champs numériques, les algorithmes de régression calculent les limites automatiquement. - Degré maximal de régression polynomiale
- Pour spécifier un degré maximal de polynôme pour l'algorithme de régression polynomiale, utilisez le paramètre d'algorithme
MaxExpà l'aide deDM_setAlgorithm().Le modèle résultant a un polynôme d'un degré inférieur ou égal à la valeur spécifiée.- Pour l'algorithme de régression linéaire, la seule valeur valide est la valeur par défaut 1.
- Pour l'algorithme de régression polynomiale, vous pouvez utiliser des valeurs de 1 à 7. La valeur par défaut est 3.Par exemple, si vous souhaitez spécifier le degré 2 pour le polynôme, utilisez l'instruction suivante:
DM_setAlgorithm('Polynomial','<MaxExp>2</MaxExp>')
- Niveau de signification minimal
- Si vous spécifiez un niveau de signification minimal,
Stepwise Regressionest utilisé pour déterminer un sous-ensemble de prédicteurs possibles. Seuls les champs indépendants dont la valeur de signification est supérieure à celle spécifiée contribuent au calcul du modèle de régression.Pour définir le paramètre d'algorithmeMinSigLevelsur une valeur comprise entre 0 et 1, vous pouvez utiliser la méthodeDM_setAlgorithm. Par exemple, si vous souhaitez définir le niveau de signification minimal sur 0,5, utilisez l'instruction suivante:DM_setAlgorithm('Polynomial",'<MinSigLevel>0.5</MinSigLevel>')Si le niveau de signification minimal est défini sur 0, tous les champs qui sont fournis dans la spécification de données logiques et qui ne sont pas marqués comme
Supplementarysont utilisés pour calculer le modèle.Pour calculer un modèle de régression linéaire type, définissez le nom de l'algorithme surLinearet le niveau de signification minimal sur 0 à l'aide de l'instruction suivante:
Si vous ne spécifiez pas de niveau de signification minimal, l'algorithme tente automatiquement de sélectionner un sous-ensemble optimal de prédicteurs possibles.DM_setAlgorithm('Linear",'<MinSigLevel>0</MinSigLevel>') - Intercepter
- Vous pouvez forcer la courbe de régression à passer par l'origine. Cela signifie que le modèle ne contiendra pas de constante.Pour forcer la courbe de régression à passer par l'origine, vous pouvez utiliser le paramètre d'algorithme
Interceptdans la méthodeDM_SetAlgorithmà l'aide de l'instruction suivante:DM_setAlgorithm('Linear",'<Intercept>True</Intercept>')Le paramètre par défaut est
false. - Sélection de fonction automatique
- L'algorithme tente de déterminer un sous-ensemble optimal de prédicteurs possibles si vous ne spécifiez pas de niveau de signification minimal.Les algorithmes prennent en charge les mesures suivantes:
- Coefficient de corrélation de Pearson au carré normal
- Coefficient de corrélation de Pearson ajusté au carré
Pour utiliser le coefficient de corrélation de Pearson au carré ajusté pour le paramètre d'algorithmeRSquaredModedans la méthodeDM_setAlgorithm, vous pouvez utiliser l'instruction suivante:DM_setAlgorithm('Polynomial",'<RSquaredMode>adjusted</RSquaredMode>')La valeur par défaut est
normal.
Paramètres spécifiques à la régression RBF
- TailleEchantillon
- Cette valeur représente le nombre d'enregistrements consécutifs à sélectionner parmi les données d'entrée à utiliser lorsque l'apprentissage passe à la phase de vérification pour déterminer si les objectifs de précision et de limite d'erreur souhaités ont été atteints. Il est également utilisé pour détecter le surentraînement du modèle dans le temps. Lorsque ces objectifs sont atteints, le mode d'entraînement se termine. Au cours de l'entraînement, le nombre d'enregistrements spécifié est ignoré.
La valeur par défaut est 1.
Pour spécifier la valeur 2, utilisez l'instruction suivante:DM_setAlgorithm('RBF','<OutSampleSize>2</OutSampleSize>') - TailleEchantillon
- Cette valeur représente le nombre d'enregistrements consécutifs à sélectionner parmi les données d'entrée à utiliser pour l'entraînement. Au cours de la phase de vérification, le nombre d'enregistrements spécifié est ignoré.
La valeur par défaut est 2.
Pour spécifier la valeur 1, utilisez l'instruction suivante:DM_setAlgorithm('RBF','<inSampleSize>1</InSampleSize>') - Nbre max. de centres
- Cette valeur limite le nombre de centres créés par la fonction d'exploration à chaque passage des données d'entrée. Etant donné que le nombre de centres peut augmenter jusqu'à deux fois le nombre initial au cours d'un passage, le nombre réel de centres peut être supérieur au nombre que vous avez spécifié.
Si aucune valeur n'est indiquée, une valeur appropriée est calculée par le système.
Pour spécifier la valeur 20, utilisez l'instruction suivante:DM_setAlgorithm('RBF','<MaxNumberCenters>20</MaxNumberCenters>') - TailleRégionmin
- Cette valeur détermine le nombre minimal d'enregistrements affectés à une région. Si, à la fin d'une transmission, une région a une valeur inférieure à la valeur spécifiée, la région est supprimée.
La valeur par défaut est 15.
Pour spécifier la valeur 30, utilisez l'instruction suivante:DM_setAlgorithm('RBF','<MinRegionSize>30</MinRegionSize>') - Nombre min. de passes
- Cette valeur détermine le nombre minimal de passages dans les données d'entrée. Au cours de ces laissez-passer, le surentraînement ou la précision ne sont pas vérifiés. Cela permet de gagner du temps, cependant, spécifiez une valeur élevée pour le nombre minimal de passes uniquement si vous disposez de suffisamment de données d'apprentissage et si vous êtes certain qu'un bon modèle existe.
La valeur minimale à spécifier est 2.
Si aucune valeur n'est indiquée, une valeur appropriée est calculée par le système.
Pour spécifier la valeur 5, utilisez l'instruction suivante:DM_setAlgorithm('RBF','<MinNumberPasses>5</MinNumberPasses>') - Nbre max. de passes
- Cette valeur limite le nombre de fois où la fonction d'exploration passe par les données. Si la précision de prévision souhaitée est atteinte avant cette limite, l'apprentissage s'arrête.
S'il est spécifié, le nombre maximal de passes doit être supérieur ou égal au nombre minimal de passes.
Si aucune valeur n'est indiquée, une valeur appropriée est calculée par le système.
Pour spécifier la valeur 5, utilisez l'instruction suivante:DM_setAlgorithm('RBF','<MaxNumberPasses>5</MaxNumberPasses>')