行列入替ノードのオプションの設定

「行列入替方法」ドロップダウンで、行列入替ノードで実行する方法を「フィールドとレコードの両方」「レコードからフィールドへ」「フィールドからレコードへ」の中から選択します。3 つの方法それぞれの設定は、以下のセクションで説明しています。
制約事項: 「レコードからフィールドへ」方式および「フィールドからレコードへ」方式は、Windows 64 ビット、Linux 64 ビット、および Mac でのみサポートされています。

フィールドとレコードの両方

新規フィールド名は、指定された接頭辞に基づいて自動的に生成することも、データ内の既存のフィールドから読み込むこともできます。

接頭辞を使用: このオプションは、新しいフィールド名を指定した接頭辞 (Field1Field2、など) に基づいて自動的に生成します。必要に応じて接頭辞をカスタマイズできます。このオプションを使用する場合は、元のデータの行数に無関係に、生成するフィールド数を指定する必要があります。例えば、「新規フィールド数」 が 100 に設定されると、最初の 100 行を超えるすべてのデータは破棄されます。元のデータが 100 行に満たない場合は、一部のフィールドはヌルとなります。(必要に応じてフィールド数を増やすことができますが、この設定の目的は、100 万のレコードを 100 万のフィールドに行列入替することを防ぐことにあり、もしそのような入れ替えを行うと管理不能となります。)

例えば、行内に系列データがあり、各月の独立したフィールド (列) があると想定します。各系列が個別のフィールドに、各月が行になるように、行列の入れ替えを実行できます。

フィールドから読み込み: 既存のフィールドからフィールド名を読み込みます。このオプションを使用すると、新規フィールド数が指定された最大数を上限として、データによって決定します。選択されたフィールドの各値は、出力データの新しいフィールドとなります。選択されたフィールドには (整数、文字列、日付など) 任意のストレージ・タイプがありますが、フィールド名の重複を避けるために、選択されたフィールドの各値は一意である必要があります (つまり、値の数は行数と一致する必要があります)。フィールド名が重複している場合、警告が表示されます。
  • 値の読み込み: 選択されたフィールドがインスタンス化されていない場合、このオプションを選択して新しいフィールド名のリストを編成します。フィールドがすでにインスタンス化されている場合、この手順は必要ではありません。
  • 読み込む値の最大数: データからフィールド名を読み込む場合、上限値を指定してあまりに多いフィールドが作成されることを回避します。(前述のとおり、100 万のレコードを 100 万のフィールドに入れ替えると、管理できない結果が生じます。)

例えば、データの最初の列が各シリーズの名前を指定している場合、これらの値を入れ替えられたデータのフィールド名として使用することができます。

入れ替え:デフォルトでは、連続型 (数値範囲) フィールドのみが入れ替わります (整数または実数)。オプションで、数値型フィールドのサブセットを選択するか、代わりに文字列フィールドを入れ替えることができます。ただし、入れ替えるフィールドはすべて同じストレージ・タイプでなければなりません (数値または文字列のいずれか一方。両方ではありません)。これは、入力フィールドを混在させると、各出力列内に混在した値が生成され、フィールドの値がすべて同じストレージでなければならないという規則に反するためです。その他のストレージ・タイプ (日付、時間、タイムスタンプ) を入れ替えることはできません。

  • すべての数値型: すべての数値型フィールド (整数または実数ストレージ) を入れ替えます。出力の行数は、元のデータの数値型フィールド数に一致します。
  • すべての文字列: すべての文字列フィールドを入れ替えます。
  • カスタム: 数値型フィールドのサブセットを選択することができます。出力の行数は、選択したフィールド数に一致します。このオプションは数値型フィールドに対してのみ使用できます。

行 ID 名: ノードで作成された行 ID フィールドの名前を指定します。このフィールドの値は、元のデータのフィールド名によって決まります。

ヒント: 行から列へ時系列データを入れ替える際、元のデータに各測定値の期間にラベルを付ける日付、月、または年などの行が含まれる場合、データの最初の行のラベルを含めるのではなく、これらのラベルを IBM® SPSS® Modeler にフィールド名として読み込みます (前述の例で説明したとおり、下のデータの月または日付をフィールド名として表示します)。これにより、各列のラベルと値の混在を回避します (ストレージ・タイプが列内で混在しないため、数値を文字列として読み込むことを強制します)。

レコードからフィールドへ

フィールド: 「フィールド」リストには、行列入替ノードに入るすべてのフィールドが含まれます。

インデックス: 「インデックス」セクションを使用して、インデックス・フィールドとして使用するフィールドを選択します。

フィールド: 「フィールド」セクションを使用して、フィールドとして使用するフィールドを選択します。

値。 「値」セクションを使用して、値フィールドとして使用するフィールドを選択します。

集約関数: インデックスに対して複数のレコードがある場合、レコードを 1 件に集約する必要があります。「集約関数」ドロップダウンを使用して、以下の関数のいずれかを利用するレコードの集約方法を指定します。集約はすべてのフィールドに影響を及ぼすことに注意してください。
  • 平均: キー・フィールドの各組み合わせの平均値を返します。平均値は、中心傾向の尺度であり、算術平均です (ケース数で割った合計)。
  • 合計:キー・フィールドの各組み合わせの合計値を返します。合計は、欠損値のないすべてのケースに対する変数の値の合計です。
  • 最小: キー・フィールドの各組み合わせの最小値を返します。
  • 最大: キー・フィールドの各組み合わせの最大値を返します。
  • 中央値: キー・フィールドの各組み合わせの中央値を返します。中央値は、外れ値に対して敏感でない、中心化傾向の測定値です。それに対して平均値は、いくつかの極端に大きい、または小さい値に影響されます。50 番目のパーセンタイルまたは 2 番目の四分位でもあります。
  • カウント: キー・フィールドの各組み合わせの非ヌル値のカウントを返します。

フィールドからレコードへ

フィールド: 「フィールド」リストには、行列入替ノードに入るすべてのフィールドが含まれます。

インデックス: 「インデックス」セクションを使用して、インデックス・フィールドとして使用するフィールドを選択します。

値。 「値」セクションを使用して、値フィールドとして使用するフィールドを選択します。値フィールドを選択しない場合、割り当てられていないすべての数値フィールドが値として使用されます。ただし、数値ではないフィールドが使用できる場合、割り当てられていないすべての文字列フィールドが使用されます。