Modèles de causalité temporelle

La modélisation de causalité temporelle tente de découvrir des relations de causalité clés dans les données de séries temporelles. Dans la modélisation de causalité temporelle, vous spécifiez un ensemble de séries cibles et un ensemble d'entrées candidates sur ces cibles. La procédure construit alors un modèle de série temporelle autorégressive pour chaque cible et n'inclut que les entrées avec une relation de causalité avec la cible. Cette approche diffère de la modélisation traditionnelle de série temporelle où vous devez spécifier explicitement les prédicteurs pour une série cible. Vu que la modélisation de causalité temporelle implique généralement la construction de modèles pour plusieurs séries temporelles associées, le résultat est dénommé système modèle.

Dans le contexte de modélisation de causalité temporelle, le terme causal se réfère à la causalité au sens de Granger. Un série temporelle X est dite "causer au sens de Granger" une autre série temporelle Y si la régression de Y en prenant en compte les valeurs passées de X et de Y produit un meilleur modèle pour Y que la seule régression des valeurs passées de Y.

Remarque : Le noeud modélisation de causalité temporelle ne prend pas en charge les étapes Evaluation de modèle ou Champion challenger dans IBM® SPSS Collaboration and Deployment Services.

Exemples

Les décideurs métier peuvent utiliser la modélisation de causalité temporelle pour identifier des relations de causalité dans un vaste ensemble de métriques basées temps qui décrivent l'activité. L'analyse peut révéler un petit nombre d'entrées contrôlables qui ont l'impact le plus déterminant sur les indicateurs de performances clés.

Les responsables de systèmes informatiques à grande échelle peuvent utiliser la modélisation de causalité temporelle pour détecter des anomalies dans un large éventail de métriques opérationnelles interdépendantes. Le modèle causal peut alors ne pas se contenter de détecter des anomalies, mais découvrir aussi leurs causes premières les plus probables.

Exigences concernant les champs

Au moins une cible doit avoir été définie. Par défaut, les champs avec le rôle prédéfini Aucun ne sont pas utilisés.

Structure des données

La modélisation de causalité temporelle prend en charge deux types de structures de données.

Données basées colonne
Pour les données basées colonne, chaque zone de série temporelle contient les données d'une seule série temporelle. Il s'agit de la structure traditionnelle des données de série temporelle, telle qu'utilisée par Time Series Modeler.
Données multidimensionnelles
Pour les données multidimensionnelles, chaque champ de série temporelle contient les données de plusieurs séries temporelles. Les séries temporelles distinctes au sein d'un champ donné sont alors identifiées par un ensemble de valeurs de champs catégoriels, dénommés champs de dimension. Par exemple, les données de ventes de deux circuits de vente différents (détail et Web) pourraient être stockées dans une zone ventes unique. Une zone de dimension nommée canal, avec pour valeurs 'détail' et 'Web', identifie les enregistrements associés à chacun des deux circuits de vente.
Remarque : Pour construire un modèle de causalité temporelle, vous avez besoin d'un nombre suffisant de points de données. Le produit utilise la contrainte suivante :
m>(L + KL + 1)
m correspond au nombre de points de données, L au nombre de décalages et K au nombre de prédicteurs. Prenez soin que votre jeu de données soit suffisamment volumineux afin que le nombre de points de données (m) respecte cette condition.