観測 (時間的因果モデリング)

「フィールド」タブの「観測」設定を使用して、観測を定義するフィールドを指定します。

注: アクティブなデータ セットに日付指定がある場合、観測は日付指定によって定義され、時間的因果モデリングのプロシージャで変更できません。日付の指定は、「日付の定義」ダイアログまたは DATE コマンドで作成されます。
日付と時刻で定義された観測

日付、時刻、または日時形式のフィールドまたは日時を表す文字列フィールドによって観測を定義することを指定できます。文字列フィールドでは、YYYY-MM-DD 形式で日付を表すか、HH:MM:SS 形式で時刻を表すか、YYYY-MM-DD HH:MM:SS 形式で日時を表すことができます。文字列表現では、先行ゼロを省略できます。例えば、文字列 2014-9-01 は 2014-09-01 と同等です。

観測を定義するフィールドに加え、観測を記述する適切な時間間隔を選択します。指定した時間間隔に応じて、観測の間隔 (増分) や 1 週間の日数などの他の設定も指定できます。時間間隔には、以下の考慮事項が適用されます。
  • 販売注文の処理時刻など、観測値の時間間隔が不規則な場合、値「不規則」を使用します。「不規則」を選択した場合、「データ仕様 (Data Specifications)」タブの「時間間隔」設定から、分析に使用する時間間隔を指定する必要があります。
  • 観測値が日時を表し、時間間隔が時間、分、または秒の場合、「1 日当たりの時間数 (Hours per day)」「1 日当たりの分数 (Minutes per day)」、または「1 日当たりの秒数 (Seconds per day)」を使用します。観測値が、日付を参照せずに時間 (期間) を表していて、時間間隔が時間、分、または秒の場合、「時間 (非周期) (Hours (non-periodic))」「分 (非周期) (Minutes (non-periodic))」、または「秒 (非周期) (Seconds (non-periodic))」を使用します。
  • 選択した時間間隔に基づいて、プロシージャで、欠損している観測値を検出できます。プロシージャでは、すべての観測値が等間隔の時間に存在し、観測値が欠損していないことが想定されるため、欠損している観測値を検出する必要があります。例えば、時間間隔が日で、日付 2014-10-27 の後に 2014-10-29 が続いている場合、2014-10-28 の観測値が欠損しています。欠損している観測値には値が代入されます。欠損値を処理するための設定は、「データ仕様 (Data Specifications)」タブで指定できます。
  • 指定した時間間隔により、プロシージャは、集計する必要がある、同じ時間間隔内の複数の観測値を検出したり、月初めなどの間隔の境界で観測値を調整したりして、観測値が等間隔になるようにすることができます。例えば、時間間隔が月の場合、同じ月の複数の日付は集計されます。このタイプの集計は、グループ化 と呼びます。デフォルトでは、グループ化された観測値は合計されます。「データ仕様 (Data Specifications)」タブの「集計と分配 (Aggregation and Distribution)」設定から、観測値の平均など、別のグループ化方法を指定できます。
  • 一部の時間間隔では、追加設定により、通常の等間隔内にブレークを定義できます。例えば、時間間隔が日であるが、平日のみが有効な場合、1 週間に 5 日あり、週が月曜日から始まるということを指定できます。
期間または周期的な期間で定義された観測

期間または繰り返し期間サイクル (任意の数のサイクル レベル) を表す 1 つ以上の整数フィールドで観測を定義できます。この構造を使用して、標準時間間隔のいずれにも適合しない観測の系列を記述できます。例えば、年を表すサイクル フィールドと、月を表す期間フィールドを使用し、1 サイクルの長さを 10 にすることで、10 カ月しかない年度を記述できます。

周期的な期間を指定するフィールドでは、周期的レベルの階層を定義します。この階層では、最も低いレベルは、「期間」フィールドによって定義します。次に高いレベルは、レベルが 1 のサイクル フィールドによって定義し、その次に高いレベルは、レベルが 2 のサイクル フィールドによって定義します。これ以降も同様です。最高レベルを除き、各レベルのフィールド値は、次に高いレベルを基準として周期的でなければなりません。最高レベルの値を周期的にすることはできません。例えば、10 カ月から成る年度の場合、年内の月は周期ですが、年は周期的ではありません。

  • 特定のレベルにおけるサイクルの長さは、次に低いレベルの周期になります。年度の例の場合、次に低いレベルは月を表し、指定年度に 10 カ月あるため、サイクル レベルは 1 つだけであり、サイクルの長さは 10 です。
  • 1 から開始しない周期的フィールドの開始値を指定します。欠損値を検出するために、この設定が必要になります。例えば、周期的フィールドが 2 で開始するが、開始値が 1 と指定されている場合、プロシージャは、当該フィールドの各サイクルの最初の期間に欠損値があるものと想定します。
レコード順序で定義された観測
列ベースのデータの場合、レコード順序で観測を定義し、最初のレコードが最初の観測値を表し、2 番目のレコードが 2 番目の観測値を表すといったようにすることを指定できます。その場合、レコードは、等間隔の時間で発生した観測値を表すものと想定されます。