時系列演算子の定義

時間順に並べられたデータ・セットの予測を行うことができます。
  • キャンバス上に時系列演算子を配置します。
  • その入力ポートを、分析するデータ・セグメントを含む表に接続します。

時系列演算子を定義するには、以下のようにします。

  1. キャンバス内で、「時系列」演算子をクリックして選択します。 その演算子のプロパティー・ページが、キャンバスの下の「プロパティー」ビューに表示されます。
  2. 演算子が使用する列を指定します。
    1. プロパティー」ビューで、「」プロパティー・タブをクリックします。
    2. 値列の値を順序付けるために使用する、時刻列または順序列を指定します。 時刻列は 1 つだけ指定する必要があります。左方の「使用可能な列」リストで列を選択し、矢印ボタン (矢印ボタン) でこれを「時刻列」フィールドに移動します。時刻列は任意の SQL 日付、時刻、または数値タイプとすることができます。列に重複値があってはなりません。
    3. 予測する値列を最低 1 つ指定します。 左方の「使用可能な列」リストで列を選択し、矢印ボタン ボタンでこれらを右方の「値列」リストに移動します。
  3. モデル名を指定します。
    1. プロパティー」ビューで、「モデル名」タブをクリックします。
    2. モデル名を入力します。 モデル名は、表内のモデルを検索するためのキーとして使用され、IM Visualization でモデルをブラウズするときにも表示されます。 同じ名前の時系列モデルが Db2® データベースにすでに存在する場合、既存のモデルは置き換えられます。
  4. 予測設定を指定します。
    1. プロパティー」ビューで、「予測設定」タブをクリックします。
    2. データ・セットの予測に使用する「予測アルゴリズム」を指定します。 選択するアルゴリズムはすべて時系列モデルで使用可能になり、時系列ビジュアライザーで比較可能になります。
    3. 予測期間を指定します。
      自動予測期間
      デフォルト設定では、どのアルゴリズムも、内部誤差予測がしきい値を上回るまで、値の予測を行います。この場合、アルゴリズムの誤差の計算はそれぞれ異なるため、各アルゴリズムの予測の長さは同じになりません。
      手動の予測の終点
      アルゴリズムが時系列の予測に使用する固定期間を指定できます。アルゴリズムは、指定された時点まで時系列の予測を行います。遠い将来を終点にすると、予測は無効となり、信頼範囲が膨大になります。

以下の例で使用する表を作成するには、Intelligent Miner® サンプル Db2 スクリプトを実行します。 サンプル・スクリプトは、Intelligent Miner インストールの一部として data warehousing in Db2 データベース・サーバー上にインストールされます。 ディレクトリー SQLLIB¥samples¥dwe¥ModelingDB2 を参照してください。

この例では、航空旅客数の過去の推移が AIRLINE 表に記載されており、その将来の予測を行います。

この例は、サンプル・データベース DWESAMP の TIMESERIES.AIRLINE のデータに基づいています。

時系列演算子を使用して航空旅客数の予測を行うには、次のようにします。

  1. AIRLINE 表の、表のソース演算子をキャンバス上に配置します。
  2. キャンバス上に時系列演算子を配置します。
  3. 表 AIRLINE の出力ポートを時系列演算子の入力ポートに接続します。
  4. ビジュアライザー演算子をキャンバス上に配置します。
  5. 時系列演算子の出力ポートをビジュアライザー演算子の入力ポートに接続します。
  6. 図 1. 例における時系列演算子の接続
    時系列演算子
  7. 時系列演算子のプロパティーを指定します。
    1. 時系列演算子を選択し、演算子の「プロパティー」ビューを開きます。
    2. 「モデル名」ページで、モデル名として AIRLINEMODEL と入力します。
    3. 「列プロパティー」ページで、時刻列として TIME 列を選択し、値列として PASSENGERS 列を選択します。
  8. 時刻列と値列を指定します。時系列演算子を選択します。時系列演算子の「プロパティー」ビューで、「列プロパティー」タブをクリックします。「時刻列」として TIME 列を、「値列」として PASSENGERS 列を選択します。
  9. マイニング・フローを実行します。


フィードバック | 情報ロードマップ