Présentation (commande RBF)
Les réseaux de neurones sont un outil d'exploration de données permettant de trouver des modèles inconnus dans les bases de données. Les réseaux de neurones peuvent être utilisés pour prendre des décisions métier en prévoyant la demande d'un produit en fonction du prix et d'autres variables ou en catégorisant les clients en fonction des habitudes d'achat et des caractéristiques démographiques. La procédure RBF s'adapte à un réseau de neurones à fonction de base radiale, qui est un réseau d'apprentissage supervisé avec une couche d'entrée, une couche masquée appelée couche de fonction de base radiale et une couche de sortie. La couche cachée transforme les vecteurs d'entrée en fonctions de base radiales. Comme la procédure MLP (perceptron multicouche), la procédure RBF effectue la prévision et la classification.
La procédure RBF entraîne le réseau en deux étapes:
- La procédure détermine les fonctions de base radiales à l'aide de méthodes de mise en cluster. Le centre et la largeur de chaque fonction de base radiale sont déterminés.
- La procédure estime les pondérations synaptiques en fonction des fonctions de base radiales. La fonction d'erreur de la somme des carrés avec la fonction d'activation d'identité pour la couche de sortie est utilisée pour la prévision et la classification. La régression des moindres carrés ordinaires est utilisée pour minimiser l'erreur de la somme des carrés.
En raison de cette approche d'entraînement en deux étapes, le réseau RBF est en général entraîné beaucoup plus rapidement que MLP.
Options
Prévision ou classification. Une ou plusieurs variables dépendantes peuvent être spécifiées, et elles peuvent être d'échelle, catégorielles ou une combinaison. Si une variable dépendante a un niveau de mesure d'échelle, le réseau de neurones prédit des valeurs continues qui se rapprochent de la valeur "vraie" d'une fonction continue des données d'entrée. Si une variable dépendante est catégorielle, le réseau de neurones est utilisé pour classer les observations dans la "meilleure catégorie" en fonction des prédicteurs d'entrée.
Redimensionnement: RBF rééchelonne éventuellement les covariables (prédicteurs avec niveau de mesure d'échelle) ou les variables d'échelle dépendantes avant d'entraîner le réseau de neurones. Il existe trois options de redimensionnement: la normalisation, la normalisation et la normalisation ajustée.
Données d'apprentissage, de test et de rétention. RBF divise éventuellement le jeu de données en données d'apprentissage, de test et de rétention. Le réseau de neurones est entraîné à l'aide des données d'apprentissage. Les données de test peuvent être utilisées pour déterminer le "meilleur nombre" d'unités masquées pour le réseau. Les données restantes sont complètement exclues du processus d'apprentissage et sont utilisées pour l'évaluation indépendante du réseau final.
Sélection de l'architecture. La procédure RBF crée un réseau de neurones avec une couche masquée et peut effectuer une sélection d'architecture automatique pour trouver le "meilleur nombre d'unités masquées". Par défaut, la procédure calcule automatiquement une plage raisonnable et trouve le "meilleur" nombre compris dans la plage. Toutefois, vous pouvez remplacer ces calculs en fournissant votre propre plage ou un nombre spécifique d'unités masquées.
Fonctions d'activation. Les unités de la couche masquée peuvent utiliser la fonction de base radiale normalisée ou la fonction de base radiale ordinaire.
Valeurs manquantes. La procédure RBF permet de traiter les valeurs manquantes de l'utilisateur des variables catégorielles comme étant valides. Les valeurs manquantes de l'utilisateur des variables d'échelle sont toujours traitées comme non valides.
Sortie. RBF affiche la sortie du tableau croisé dynamique, mais offre une option permettant de supprimer la plupart de ces sorties. La sortie graphique comprend un diagramme réseau (par défaut) et un certain nombre de graphiques facultatifs: prévus par les valeurs observées, résiduels par les valeurs prévues, courbes ROC (Receiver Operating Characteristic), gains cumulés, lift et importance des variables indépendantes. La procédure enregistre également, en option, les valeurs prédites dans le jeu de données actif. Les vecteurs de centre et de largeur d'unité masqués et les estimations de poids synaptique peuvent être enregistrés dans des fichiers XML.
Spécification de base
La spécification de base est la commande RBF suivie d'une ou de plusieurs variables dépendantes, du mot clé BY et d'un ou de plusieurs facteurs, ainsi que du mot clé WITH et d'une ou de plusieurs covariables.
Par défaut, la procédure RBF normalise les covariables et les variables d'échelle dépendantes et sélectionne un échantillon d'apprentissage avant d'entraîner le réseau de neurones. La sélection automatique de l'architecture est utilisée pour trouver la "meilleure architecture de réseau de neurones". Les valeurs manquantes de l'utilisateur sont exclues et la sortie du tableau croisé dynamique par défaut est affichée.
Règles de syntaxe
- Toutes les sous-commandes sont facultatives.
- Les sous-commandes peuvent être spécifiées dans n'importe quel ordre.
- Une seule instance de chaque sous-commande est autorisée.
- Une erreur se produit si un mot clé est spécifié plusieurs fois dans une sous-commande.
- Les parenthèses, les signes égal et les barres obliques affichés dans le graphique de syntaxe sont obligatoires.
- Le nom de la commande, les noms de sous-commande et les mots clés doivent être orthographiés en entier.
- Les sous-commandes vides ne sont pas autorisées.
- Toute variable de scission définie dans la commande
SPLIT FILEne peut pas être utilisée en tant que variable dépendante, facteur, covariable ou variable de partition.
Limites
Les pondérations de fréquence spécifiées dans la commande WEIGHT sont ignorées avec un avertissement par la procédure RBF .
Variables catégorielles
La procédure RBF recode temporairement les prédicteurs indépendants et les variables dépendantes à l'aide d'un codagec pour la durée de la procédure. S'il existe c catégories d'une variable, la variable est stockée en tant que vecteurs c, avec la première catégorie notée (1,0, ..., 0), la catégorie suivante, (0,1,0, ..., 0), ..., et la catégorie finale, (0,0, ..., 0, 1).
En raison du codage un-de-c , le nombre total d'unités d'entrée correspond au nombre de prédicteurs d'échelle plus le nombre de catégories dans tous les prédicteurs indépendants. Cependant, contrairement au perceptron multicouche (MLP), ce schéma de codage n'augmente pas le nombre de pondérations syntaptiques pour les prédicteurs catégoriels et ne devrait donc pas augmenter de manière significative le temps d'apprentissage.
Tous les codages one-of-c sont basés sur les données d'apprentissage, même si un échantillon de test ou restant est défini (voir Sous-commande PARTITION (commande RBF) ). Ainsi, si les échantillons de test ou restants contiennent des observations avec des catégories de prédicteur qui ne sont pas présentes dans les données d'apprentissage, ces observations ne sont pas utilisées par la procédure ou dans l'évaluation. Si les échantillons de test ou restants contiennent des observations avec des catégories de variables dépendantes ne figurant pas dans les données d'apprentissage, ces observations ne sont pas utilisées par la procédure mais peuvent être notées.
duplication des résultats
La procédure RBF utilise la génération de nombres aléatoires lors de l'affectation aléatoire de partitions. Pour reproduire ultérieurement les mêmes résultats aléatoires, utilisez la commande SET afin de définir la valeur d'initialisation du générateur de nombres aléatoires avant chaque exécution de la procédure RBF .
RBF Les résultats dépendent également de l'ordre des données, car l'algorithme de classification en deux étapes intervient dans la détermination des fonctions à base radiale. Pour minimiser les effets de l'ordre des données, ordonnez les observations de manière aléatoire avant d'exécuter la procédure RBF . Pour vérifier la stabilité d'une solution donnée, vous pouvez obtenir différentes solutions dans lesquelles les observations sont triées de différentes manières aléatoires. Si les fichiers sont très volumineux, vous pouvez effectuer plusieurs fois l'opération sur un échantillon des observations triées de différentes manières aléatoires.
En résumé, si vous souhaitez répliquer exactement les résultats de RBF dans le futur, utilisez la même valeur d'initialisation pour le générateur de nombres aléatoires et le même ordre de données, en plus d'utiliser les mêmes paramètres de procédure RBF .