Options de génération des noeuds KDE
Utilisez l'onglet Options de génération afin de spécifier les options de génération pour les noeuds KDE, y compris les options de base pour les paramètres de densité du noyau et les libellés de cluster, ainsi que les options avancées telles que la tolérance, la taille des feuilles et l'utilisation d'une méthode de parcours en largeur. Pour des informations supplémentaires sur ces options, voir les ressources en ligne suivantes :
- Kernel Density Estimation - Description des paramètres de l'API Python1
- Kernel Density Estimation User Guide2
Basique
Bande passante. Indiquez la bande passante du noyau.
Noyau. Sélectionnez le noyau à utiliser. Les noyaux disponibles pour le noeud Modélisation KDE sont Gaussian, Tophat, Epanechnikov, Eponential, Linear ou Cosine. Les noyaux disponibles pour le noeud KDE Simulation sont Gaussian ou Tophat. Pour plus d'informations sur les noyaux disponibles, voirKernel Density Estimation - Guide d'utilisation.2
Algorithme. Sélectionnez Auto, Ball Tree ou KD Tree comme algorithme d'arborescence à utiliser. Pour plus d'informations, voir Ball Tree3 et KD Tree.4
Mesure. Sélectionnez une mesure de distance. Les mesures disponibles sont Euclidean, Braycurtis, Chebyshev, Canberra, Cityblock, Dice, Hamming, Infinity, Jaccard, L1, L2, Matching, Manhattan, P, Rogerstanimoto, Russellrao, Sokalmichener, Sokalsneath, Kulsinski ou Minkowski. Si vous sélectionnez Minkowski, définissez la Valeur P comme il convient.
Les mesures disponibles dans cette liste déroulante varient en fonction de l'algorithme que vous choisissez. Notez également que la normalisation de la sortie de densité est correcte uniquement pour la mesure de distance Euclidienne.
Options avancées
Tolérance absolue. Indiquez la cohérence absolue souhaitée du résultat. Une plus grande tolérance se traduira généralement par un temps d'exécution plus rapide. La valeur par défaut est 0.0.
Tolérance relative. Indiquez la cohérence relative souhaitée du résultat. Une plus grande tolérance se traduira généralement par un temps d'exécution plus rapide. La valeur par défaut est 1E-8.
Taille de feuille. Indiquez la taille de feuille de l'arbre sous-jacent. La valeur par défaut est 40. La modification de la taille des feuilles peut avoir un impact significatif sur les performances et la mémoire requise. Pour plus d'informations sur les algorithmes Arbre sphérique et Arbre KD, voir Ball Tree3 et KD Tree.4
Largeur d'abord. Sélectionnez True si vous souhaitez utiliser une approche basée sur la largeur ou False pour utiliser une approche basée sur la profondeur.
| Paramètre SPSS Modeler | Nom du script (nom de la propriété) | Paramètre KDE |
|---|---|---|
| Entrées | entrées |
|
| Bande passante | bandwidth |
bandwidth |
| Noyau | kernel |
kernel |
| Algorithme | algorithm |
algorithm |
| Métrique | metric |
metric |
| Valeur P | pValue |
pValue |
| Tolérance absolue | atol |
atol |
| Tolérance relative | rtol |
Rtol |
| Taille de feuille | leafSize |
leafSize |
| Largeur en premier | breadthFirst |
breadthFirst |
1 "API Reference." sklearn.neighbors.KernelDensity. Web. © 2007-2018, scikit-learn developers.
2 "User Guide." Kernel Density Estimation. Web. © 2007-2018, scikit-learn developers.
3 "Ball Tree." Five balltree construction algorithms. © 1989, Omohundro, S.M., International Computer Science Institute Technical Report.
4 "K-D Tree." Multidimensional binary search trees used for associative searching. © 1975, Bentley, J.L., Communications of the ACM.