時間順に並べられたデータ・セットの予測を行うことができます。
- キャンバス上に時系列演算子を配置します。
- その入力ポートを、分析するデータ・セグメントを含む表に接続します。
- キャンバス内で、「時系列」演算子をクリックして選択します。 その演算子のプロパティー・ページが、キャンバスの下の「プロパティー」ビューに表示されます。
- 演算子が使用する列を指定します。
- 「プロパティー」ビューで、「列」プロパティー・タブをクリックします。
- 値列の値を順序付けるために使用する、時刻列または順序列を指定します。 時刻列は 1 つだけ指定する必要があります。左方の「使用可能な列」リストで列を選択し、矢印ボタン (
) でこれを「時刻列」フィールドに移動します。時刻列は任意の SQL 日付、時刻、または数値タイプとすることができます。列に重複値があってはなりません。
- 予測する値列を最低 1 つ指定します。 左方の「使用可能な列」リストで列を選択し、
ボタンでこれらを右方の「値列」リストに移動します。
- モデル名を指定します。
- 「プロパティー」ビューで、「モデル名」タブをクリックします。
- モデル名を入力します。 モデル名は、表内のモデルを検索するためのキーとして使用され、IM Visualization でモデルをブラウズするときにも表示されます。
同じ名前の時系列モデルが Db2® データベースにすでに存在する場合、既存のモデルは置き換えられます。
- 予測設定を指定します。
- 「プロパティー」ビューで、「予測設定」タブをクリックします。
- データ・セットの予測に使用する「予測アルゴリズム」を指定します。 選択するアルゴリズムはすべて時系列モデルで使用可能になり、時系列ビジュアライザーで比較可能になります。
- 予測期間を指定します。
- 自動予測期間
- デフォルト設定では、どのアルゴリズムも、内部誤差予測がしきい値を上回るまで、値の予測を行います。この場合、アルゴリズムの誤差の計算はそれぞれ異なるため、各アルゴリズムの予測の長さは同じになりません。
- 手動の予測の終点
- アルゴリズムが時系列の予測に使用する固定期間を指定できます。アルゴリズムは、指定された時点まで時系列の予測を行います。遠い将来を終点にすると、予測は無効となり、信頼範囲が膨大になります。
以下の例で使用する表を作成するには、Intelligent Miner® サンプル Db2 スクリプトを実行します。
サンプル・スクリプトは、Intelligent Miner インストールの一部として data warehousing in Db2 データベース・サーバー上にインストールされます。
ディレクトリー SQLLIB¥samples¥dwe¥ModelingDB2 を参照してください。
この例では、航空旅客数の過去の推移が AIRLINE 表に記載されており、その将来の予測を行います。
この例は、サンプル・データベース DWESAMP の TIMESERIES.AIRLINE のデータに基づいています。
時系列演算子を使用して航空旅客数の予測を行うには、次のようにします。
- AIRLINE 表の、表のソース演算子をキャンバス上に配置します。
- キャンバス上に時系列演算子を配置します。
- 表 AIRLINE の出力ポートを時系列演算子の入力ポートに接続します。
- ビジュアライザー演算子をキャンバス上に配置します。
- 時系列演算子の出力ポートをビジュアライザー演算子の入力ポートに接続します。
図 1. 例における時系列演算子の接続
- 時系列演算子のプロパティーを指定します。
- 時系列演算子を選択し、演算子の「プロパティー」ビューを開きます。
- 「モデル名」ページで、モデル名として AIRLINEMODEL と入力します。
- 「列プロパティー」ページで、時刻列として TIME 列を選択し、値列として PASSENGERS 列を選択します。
- 時刻列と値列を指定します。時系列演算子を選択します。時系列演算子の「プロパティー」ビューで、「列プロパティー」タブをクリックします。「時刻列」として TIME 列を、「値列」として PASSENGERS 列を選択します。
- マイニング・フローを実行します。