ノードのキャッシュ・オプション

ストリームの実行を最適化するために、ターミナル・ノード以外の任意のノードにキャッシュを設定することができます。ノードにキャッシュを設定すると、次のデータ・ストリームの実行時にそのノードを通過するデータがキャッシュされます。データがキャッシュされたら、以降のデータはデータ・ソースの代わりに、キャッシュ (ディスクの一時ディレクトリーに格納) から読み込まれます。

キャッシュは、ソート、結合、集計など、時間のかかる操作に最も有用です。例えば、データベースから販売データを読み込む入力ノードと、販売地域ごとに集計するレコード集計ノードがあるとします。この場合、データ・セット全体ではなく集計済みデータをキャッシュしたいので、入力ノードではなくレコード集計ノードにキャッシュを設定します。

注: 入力ノードでキャッシュする場合、IBM® SPSS® Modeler に読み込まれるように元のデータのコピーを保存するため、多くの環境でパフォーマンスは改善されません。

キャッシュを有効にしたノードの右上には、小さい文書アイコンが表示されます。データがキャッシュされると、この文書アイコンが緑に変わります。

キャッシュを有効にするには

  1. ストリーム領域でノードを右クリックし、メニューの 「キャッシュ」 をクリックします。
  2. キャッシュ設定用のサブメニューから、「使用する」 を選択します。
  3. キャッシュを解除するには、ノードを右クリックして、キャッシュ設定用のサブメニューから 「使用しない」 を選択します。

データベース内でのノードのキャッシュ

データベース内で実行されるストリームの場合、ファイル・システムでなくデータベース内の一時テーブルへ、データを中流でキャッシュできます。この機能を SQL 最適化と組み合わせると、パフォーマンスが著しく向上する可能性があります。例えば、データ・マイニング・ビューを作成するために複数のテーブルを併合するストリームからの出力をキャッシュし、必要に応じて再使用できます。すべての下流ノードで自動的に SQL を生成するようにすると、パフォーマンスがさらに向上する可能性があります。

データベースのキャッシングを利用するには、SQL 最適化とデータベース・キャッシングの両方を有効にする必要があります。Client の設定は、Server の最適化設定によって無効になるので注意してください。詳しくは、トピックストリームの最適化オプションの設定を参照してください。

データベースのキャッシングが有効にされると、任意の非ターミナル・ノードを右クリックするだけでその場所のデータがキャッシュされ、次にストリームが実行されるときに自動的に、データベース内にキャッシュが直接作成されます。データベース・キャッシングまたは SQL 最適化が有効にされていないと、キャッシュは、代わりにファイル・システムへ書き出されます。

注: 次のデータベースは、キャッシュのために一時テーブルをサポートします。Db2、Oracle、SQL Server、および Teradata。Netezza などのその他のデータベースでは、データベース・キャッシングに通常のテーブルが使用されます。SQL コードを特定のデータベース向けにカスタマイズできます。サービスに連絡してください。

キャッシュを取り消すには

ノードに表示されている文書アイコンが白い場合、キャッシュが空であることを表しています。キャッシュがいっぱいになると、文書アイコンは濃い緑色になります。キャッシュの内容を置き換える場合は、最初にキャッシュを取り消してからデータ・ストリームを再実行して、キャッシュにデータを格納しなおす必要があります。

  1. ストリーム領域でノードを右クリックし、メニューの 「キャッシュ」 をクリックします。
  2. キャッシュ設定用のサブメニューから、「取り消し」 を選択します。

キャッシュを保存するには

キャッシュの内容は、IBM SPSS Statistics データ・ファイル (*.sav) として保存できます。その後、ファイルをキャッシュとして再ロードしたり、キャッシュ・ファイルをデータ・ソースとして使用するノードを設定することができます。さらに、別のプロジェクトで保存したキャッシュをロードすることもできます。

  1. ストリーム領域でノードを右クリックし、メニューの 「キャッシュ」 をクリックします。
  2. キャッシュ設定用のサブメニューから、「キャッシュの保存」 を選択します。
  3. 「キャッシュの保存」ダイアログ・ボックスで、キャッシュ・ファイルを保存する場所を指定します。
  4. 「ファイル名」テキスト・ボックスに名前を入力します。
  5. 「ファイルの種類」リストで 「*.sav」 が選択されていることを確認し、「保存」 をクリックします。

キャッシュをロードするには

キャッシュ・ファイルをノードから削除する前に保存した場合、それを再ロードすることができます。

  1. ストリーム領域でノードを右クリックし、メニューの 「キャッシュ」 をクリックします。
  2. キャッシュ設定用のサブメニューから、「キャッシュのロード」 を選択します。
  3. 「キャッシュのロード」ダイアログ・ボックスで、目的のキャッシュ・ファイルを選択し、「ロード」 をクリックします。