ノードのキャッシュ・オプション
ストリームの実行を最適化するために、ターミナル・ノード以外の任意のノードにキャッシュを設定することができます。ノードにキャッシュを設定すると、次のデータ・ストリームの実行時にそのノードを通過するデータがキャッシュされます。データがキャッシュされたら、以降のデータはデータ・ソースの代わりに、キャッシュ (ディスクの一時ディレクトリーに格納) から読み込まれます。
キャッシュは、ソート、結合、集計など、時間のかかる操作に最も有用です。例えば、データベースから販売データを読み込む入力ノードと、販売地域ごとに集計するレコード集計ノードがあるとします。この場合、データ・セット全体ではなく集計済みデータをキャッシュしたいので、入力ノードではなくレコード集計ノードにキャッシュを設定します。
キャッシュを有効にしたノードの右上には、小さい文書アイコンが表示されます。データがキャッシュされると、この文書アイコンが緑に変わります。
キャッシュを有効にするには
- ストリーム領域でノードを右クリックし、メニューの 「キャッシュ」 をクリックします。
- キャッシュ設定用のサブメニューから、「使用する」 を選択します。
- キャッシュを解除するには、ノードを右クリックして、キャッシュ設定用のサブメニューから 「使用しない」 を選択します。
データベース内でのノードのキャッシュ
データベース内で実行されるストリームの場合、ファイル・システムでなくデータベース内の一時テーブルへ、データを中流でキャッシュできます。この機能を SQL 最適化と組み合わせると、パフォーマンスが著しく向上する可能性があります。例えば、データ・マイニング・ビューを作成するために複数のテーブルを併合するストリームからの出力をキャッシュし、必要に応じて再使用できます。すべての下流ノードで自動的に SQL を生成するようにすると、パフォーマンスがさらに向上する可能性があります。
データベースのキャッシングを利用するには、SQL 最適化とデータベース・キャッシングの両方を有効にする必要があります。Client の設定は、Server の最適化設定によって無効になるので注意してください。詳しくは、トピックストリームの最適化オプションの設定を参照してください。
データベースのキャッシングが有効にされると、任意の非ターミナル・ノードを右クリックするだけでその場所のデータがキャッシュされ、次にストリームが実行されるときに自動的に、データベース内にキャッシュが直接作成されます。データベース・キャッシングまたは SQL 最適化が有効にされていないと、キャッシュは、代わりにファイル・システムへ書き出されます。
キャッシュを取り消すには
ノードに表示されている文書アイコンが白い場合、キャッシュが空であることを表しています。キャッシュがいっぱいになると、文書アイコンは濃い緑色になります。キャッシュの内容を置き換える場合は、最初にキャッシュを取り消してからデータ・ストリームを再実行して、キャッシュにデータを格納しなおす必要があります。
- ストリーム領域でノードを右クリックし、メニューの 「キャッシュ」 をクリックします。
- キャッシュ設定用のサブメニューから、「取り消し」 を選択します。
キャッシュを保存するには
キャッシュの内容は、IBM SPSS Statistics データ・ファイル (*.sav) として保存できます。その後、ファイルをキャッシュとして再ロードしたり、キャッシュ・ファイルをデータ・ソースとして使用するノードを設定することができます。さらに、別のプロジェクトで保存したキャッシュをロードすることもできます。
- ストリーム領域でノードを右クリックし、メニューの 「キャッシュ」 をクリックします。
- キャッシュ設定用のサブメニューから、「キャッシュの保存」 を選択します。
- 「キャッシュの保存」ダイアログ・ボックスで、キャッシュ・ファイルを保存する場所を指定します。
- 「ファイル名」テキスト・ボックスに名前を入力します。
- 「ファイルの種類」リストで 「*.sav」 が選択されていることを確認し、「保存」 をクリックします。
キャッシュをロードするには
キャッシュ・ファイルをノードから削除する前に保存した場合、それを再ロードすることができます。
- ストリーム領域でノードを右クリックし、メニューの 「キャッシュ」 をクリックします。
- キャッシュ設定用のサブメニューから、「キャッシュのロード」 を選択します。
- 「キャッシュのロード」ダイアログ・ボックスで、目的のキャッシュ・ファイルを選択し、「ロード」 をクリックします。