Examen du modèle
- Double-cliquez sur le nugget de modèle Séries temporelles et sélectionnez l'onglet Sortie afin d'afficher les données relatives aux modèles créés pour chacun des marchés.
Figure 1. Modèles de séries temporelles générés pour les marchés 
Dans la colonne Sortie de gauche, sélectionnez les Informations sur le modèle pour l'un des marchés. La ligne Nombre de prédicteurs indique le nombre de champs utilisés comme prédicteurs pour chaque cible, soit zéro en l'occurrence.
Les lignes restantes des tables Informations sur le modèle montrent différentes mesures de qualité d'ajustement pour chaque modèle. La valeur R carré stationnaire estime dans quelle proportion le modèle explique la variation totale de la série. Plus la valeur est élevée (avec un maximum de 1,0), meilleur est l'ajustement du modèle.
Les lignes Statistiques Q(#), df et Signification sont associées à la statistique Ljung-Box qui est un test de l'aspect aléatoire des erreurs résiduelles du modèle ; plus les erreurs sont aléatoires, meilleur peut être le modèle. Q(#) est la statistique Ljung-Box elle-même alors que df (degrés de liberté) indique le nombre de paramètres de modèles qui sont libres de varier lors de l'estimation d'une cible spécifique.
La ligne Signification affiche la valeur de signification de la statistique Ljung-Box, qui indique si le modèle est correctement spécifié. Une valeur de signification inférieure à 0,05 indique que les erreurs résiduelles ne sont pas aléatoires ce qui implique l'existence, dans la série observée, d'une structure inexpliquée par le modèle.
Si l'on prend en compte les valeurs R carré stationnaire et Signification, les modèles choisi par Expert Modeler pour Market_3 et Market_4 sont acceptables. Les valeurs Signification pour Market_1, Market_2 et Market_5 sont toutes inférieures à 0,05, ce qui signifie qu'une expérimentation avec des modèles mieux adaptés pour ces marchés pourrait s'avérer nécessaire.
Une série de mesures de qualité d'ajustement supplémentaires apparaît. La valeur R carré donne une estimation de la variation totale de la série temporelle qui peut être expliquée par le modèle. Avec une valeur maximum de 1.0 pour cette statistique, nos modèles sont acceptables à cet égard.
RMSE est l'erreur moyenne quadratique, une mesure de la différence entre les valeurs réelles d'une série et les valeurs prédites par le modèle et est exprimée dans la même unité que celle utilisée pour la série elle-même. En tant que mesure d'une erreur, cette valeur doit être aussi basse que possible. A première vue, il semble que les modèles de Market_2 et Market_3, tout en étant acceptables selon les statistiques produites jusque là, sont moins réussis que ceux des trois autres marchés.
Ces mesures de qualité d'ajustement supplémentaires comprennent l'erreur absolue moyenne en pourcentage (MAPE) et sa valeur maximale (MAXAPE). L'erreur absolue en pourcentage mesure la proportion de la variation d'une série cible par rapport à son niveau prévu par le modèle et elle est exprimée en valeur de pourcentage. En examinant la moyenne et le maximum sur l'ensemble des modèles, vous pouvez obtenir une indication quant à l'incertitude inhérente à vos prévisions.
La valeur MAPE indique que tous les modèles affichent une incertitude moyenne d'environ 1 %, ce qui est très bas. La valeur MAXAPE affiche l'erreur maximale absolue en pourcentage et permet d'imaginer le pire des scénarios pour vos prévisions. Elle indique que l'erreur maximale en pourcentage pour la plupart des modèles se situe approximativement entre 1,8 et 3,7 % qui, de nouveau, sont des valeurs très basses ; seul Market_4 est supérieur, avec une valeur plus près de 7 %.
La valeur MAE (erreur absolue moyenne) indique la moyenne des valeurs absolues des erreurs de prévision. Comme la valeur RMSE, elle est exprimée dans les mêmes unités que celles utilisées pour la série même. MAXAE indique l'erreur maximale de prévision dans les mêmes unités et le pire scénario de prévisions possible.
Bien que ces valeurs absolues soient intéressantes, il est préférable d'observer les valeurs des erreurs en pourcentage (MAPE et MAXAPE) car les séries cibles représentent les quantités d'abonnés appartenant à des marchés de taille variable.
Les valeurs MAPE et MAXAPE représentent-elles un niveau d'incertitude acceptable pour les modèles ? Elles sont certainement très basses. Dans ce genre de situation, les facteurs relatifs au développement de l'entreprise entrent en jeu car le niveau de risque acceptable change d'un problème à l'autre. Nous supposons que les qualités d'ajustement des statistiques se trouvent dans des limites acceptables et examinons à présent les erreurs résiduelles.
L'examen des valeurs de la fonction des autocorrélations (ACF) et de la fonction des autocorrélations partielles (PACF) pour les résidus des modèles donne un aperçu plus quantitatif sur les modèles que la simple consultation des statistiques de qualité d'ajustement.
Un modèle de série temporelle bien défini capturera toutes les variations non-aléatoires, y compris l'effet des saisons, la tendance, la nature cyclique et les autres facteurs importants. Le cas échéant, aucune erreur ne devra être corrélée avec elle-même (autocorrélation). Toute structure significative dans l'une de ces fonctions d'autocorrélation impliquerait que le modèle sous-jacent soit incomplet.
- Pour le quatrième marché, dans la colonne de gauche, cliquez sur
Corrélogramme pour afficher les valeurs de la fonction
d'autocorrélation (ACF) et de la fonction d'autocorrélation partielle (PACF) pour les
erreurs résiduelles du modèle.
Figure 2. Valeurs des fonctions d'autocorrélation (ACF) et d'autocorrélation partielle (PACF) pour le quatrième marché 
Dans ces graphiques, les valeurs d'origine de la variable d'erreur ont été découpées en 24 périodes et comparées avec la valeur d'origine afin de savoir s'il existera des corrélations. Pour que le modèle soit acceptable, aucune des barres dans le graphique supérieur (ACF) ne doit dépasser la zone grisée, que ce soit dans les plus (vers le haut) ou dans les moins (vers le bas).
Si cela se produisait, il vous faudrait vérifier le graphique inférieur (PACF) pour savoir si la structure y est confirmée. Le graphique PACF examine les corrélations après avoir contrôlé les valeurs des séries aux points temporels intermédiaires.
Les valeurs de Market_4 étant toutes à l'intérieur de la zone grisée, nous pouvons continuer et vérifier les valeurs des autres marchés.
- Cliquez sur le Corrélogramme pour chacun des autres marchés et les totaux.
Les valeurs des autres marchés montrent toutes des valeurs en dehors de la zone ombrée, ce qui confirme ce que nous suspections auparavant à partir de leurs valeurs Signification. Il nous faudra utiliser d'autres modèles pour ces marchés afin de savoir s'il en existe un plus adapté, mais pour le reste de cet exemple, nous nous concentrerons sur ce que nous pouvons encore apprendre du modèle Market_4.
- Dans la palette Graphiques, reliez un noeud Tracé horaire au nugget de modèle Séries temporelles.
- Dans l'onglet Tracé, désélectionnez la case à cocher Afficher les séries dans des panneaux distincts.
- Dans la liste Série, cliquez sur le bouton de sélection de champ, sélectionnez les champs Market_4 et $TS-Market_4, puis cliquez sur OK pour les ajouter à la liste.
- Cliquez sur Exécuter pour afficher un graphique linéaire des données réelles et prévisionnelles du premier marché local.
Figure 3. Sélection des champs à tracer 
Comme vous pouvez le constater, la ligne prévisionnelle ($TS-Market_4) s'étend au-delà de la fin des données réelles. Vous disposez désormais d'une prévision de la demande pour les trois prochains mois dans ce marché.
Dans le graphique, les lignes des données réelles et prévisionnelles sont très proches l'une de l'autre sur la totalité de la série temporelle, ce qui indique que ce modèle est fiable pour cette série.
Figure 4. Tracé horaire des données réelles et prévisionnelles pour Market_4 
Enregistrez le modèle dans un fichier pour l'utiliser ultérieurement dans un autre exemple :
- Cliquez sur OK pour fermer le graphique actuel.
- Ouvrez le nugget de modèle Séries temporelles.
- Choisissez l'option Fichier > Enregistrer le noeud et spécifiez l'emplacement du fichier.
- Cliquez sur Enregistrer.
Vous disposez d'un modèle fiable pour ce marché en particulier, mais quelle est la marge d'erreur de la prévision ? Vous pouvez obtenir une indication en examinant l'intervalle de confiance.
- Cliquez deux fois sur le dernier noeud Tracé horaire dans le flux (celui nommé Market_4 $TS-Market_4) pour rouvrir sa boîte de dialogue.
- Cliquez sur le bouton de sélection de champ et ajoutez les champs $TSLCI-Market_4 et $TSUCI-Market_4 à la liste Série.
- Cliquez sur Exécuter.

Vous obtenez le même graphique qu'auparavant avec, en plus, les limites supérieure ($TSUCI) et inférieure ($TSLCI) de l'intervalle de confiance.
Comme vous pouvez le constater, les limites de l'intervalle de confiance divergent sur l'ensemble de la période de prévision, ce qui traduit une incertitude croissante dès lors que la prévision porte sur une période plus longue.
Toutefois, au terme de chaque période, vous disposez, en l'occurrence, d'un mois supplémentaire de données d'utilisation réelles sur lesquelles vous pouvez baser vos prévisions. Vous pouvez lire les nouvelles données du flux et réappliquer le modèle, puisque vous savez que celui-ci est fiable. Pour plus d'informations, voir la rubrique Réapplication d'un modèle de séries temporelles.
