Options de génération des noeuds KDE

Utilisez l'onglet Options de génération afin de spécifier les options de génération pour les noeuds KDE, y compris les options de base pour les paramètres de densité du noyau et les libellés de cluster, ainsi que les options avancées telles que la tolérance, la taille des feuilles et l'utilisation d'une méthode de parcours en largeur. Pour des informations supplémentaires sur ces options, voir les ressources en ligne suivantes :

Basique

Bande passante. Indiquez la bande passante du noyau.

Noyau. Sélectionnez le noyau à utiliser. Les noyaux disponibles pour le noeud Modélisation KDE sont Gaussian, Tophat, Epanechnikov, Eponential, Linear ou Cosine. Les noyaux disponibles pour le noeud KDE Simulation sont Gaussian ou Tophat. Pour plus d'informations sur les noyaux disponibles, voirKernel Density Estimation - Guide d'utilisation.2

Algorithme. Sélectionnez Auto, Ball Tree ou KD Tree comme algorithme d'arborescence à utiliser. Pour plus d'informations, voir Ball Tree3 et KD Tree.4

Mesure. Sélectionnez une mesure de distance. Les mesures disponibles sont Euclidean, Braycurtis, Chebyshev, Canberra, Cityblock, Dice, Hamming, Infinity, Jaccard, L1, L2, Matching, Manhattan, P, Rogerstanimoto, Russellrao, Sokalmichener, Sokalsneath, Kulsinski ou Minkowski. Si vous sélectionnez Minkowski, définissez la Valeur P comme il convient.

Les mesures disponibles dans cette liste déroulante varient en fonction de l'algorithme que vous choisissez. Notez également que la normalisation de la sortie de densité est correcte uniquement pour la mesure de distance Euclidienne.

Options avancées

Tolérance absolue. Indiquez la cohérence absolue souhaitée du résultat. Une plus grande tolérance se traduira généralement par un temps d'exécution plus rapide. La valeur par défaut est 0.0.

Tolérance relative. Indiquez la cohérence relative souhaitée du résultat. Une plus grande tolérance se traduira généralement par un temps d'exécution plus rapide. La valeur par défaut est 1E-8.

Taille de feuille. Indiquez la taille de feuille de l'arbre sous-jacent. La valeur par défaut est 40. La modification de la taille des feuilles peut avoir un impact significatif sur les performances et la mémoire requise. Pour plus d'informations sur les algorithmes Arbre sphérique et Arbre KD, voir Ball Tree3 et KD Tree.4

Largeur d'abord. Sélectionnez True si vous souhaitez utiliser une approche basée sur la largeur ou False pour utiliser une approche basée sur la profondeur.

Le tableau suivant présente la relation entre les paramètres de la boîte de dialogue du noeud KDE de SPSS Modeler et les paramètres de la bibliothèque Python KDE.
Tableau 1. Relation entre les propriétés du noeud et les paramètres de la bibliothèque Python
Paramètre SPSS Modeler Nom du script (nom de la propriété) Paramètre KDE
Entrées entrées
Bande passante bandwidth bandwidth
Noyau kernel kernel
Algorithme algorithm algorithm
Métrique metric metric
Valeur P pValue pValue
Tolérance absolue atol atol
Tolérance relative rtol Rtol
Taille de feuille leafSize leafSize
Largeur en premier breadthFirst breadthFirst

1 "API Reference." sklearn.neighbors.KernelDensity. Web. © 2007-2018, scikit-learn developers.

2 "User Guide." Kernel Density Estimation. Web. © 2007-2018, scikit-learn developers.

3 "Ball Tree." Five balltree construction algorithms. © 1989, Omohundro, S.M., International Computer Science Institute Technical Report.

4 "K-D Tree." Multidimensional binary search trees used for associative searching. © 1975, Bentley, J.L., Communications of the ACM.