Discrétisation des variables

Si une variable comporte plus de catégories que ce qui est pratiquement interprétable, vous devez modifier les catégories à l'aide de la boîte de dialogue Discrétisation pour réduire la plage de catégories à un nombre plus gérable.

La variable Jour de l'année a une valeur minimale de 3 et une valeur maximale de 365. L'utilisation de cette variable dans une régression catégorielle correspond à l'utilisation d'une variable avec 365 catégories. De même, la valeur de Visibilité (miles) est comprise entre 0 et 350. Pour simplifier l'interprétation des analyses, discrétiser ces variables en intervalles égaux de longueur 10.

La variable Inversion base height est comprise entre 111 et 5000. Une variable avec ce nombre de catégories entraîne des relations très complexes. Cependant, la discrétisation de cette variable en intervalles égaux de longueur 100 donne environ 50 catégories. L'utilisation d'une variable de catégorie 50 plutôt que d'une variable de catégorie 5000 simplifie les interprétations de manière significative.

Gradient de pression (mm Hg) varie de -69 à 107. La procédure omet toutes les catégories codées avec des nombres négatifs de l'analyse, mais en discrétisant cette variable en intervalles égaux de longueur 10, on obtient environ 19 catégories.

La température (degrés F) est comprise entre 25 et 93 sur l'échelle Fahrenheit. Pour analyser les données comme si elles se trouvaient sur l'échelle Celsius, discrétisez cette variable en intervalles égaux de longueur 1.8.

Différentes discrétisation des variables peuvent être souhaitées. Les choix utilisés ici sont purement subjectifs. Si vous souhaitez moins de catégories, choisissez des intervalles plus grands. Par exemple, Jour de l'année peut avoir été divisé en mois de l'année ou en saisons.

Suivant