行列入替ノードのオプションの設定
フィールドとレコードの両方
新規フィールド名は、指定された接頭辞に基づいて自動的に生成することも、データ内の既存のフィールドから読み込むこともできます。
接頭辞を使用: このオプションは、新しいフィールド名を指定した接頭辞 (Field1、Field2、など) に基づいて自動的に生成します。必要に応じて接頭辞をカスタマイズできます。このオプションを使用する場合は、元のデータの行数に無関係に、生成するフィールド数を指定する必要があります。例えば、「新規フィールド数」 が 100 に設定されると、最初の 100 行を超えるすべてのデータは破棄されます。元のデータが 100 行に満たない場合は、一部のフィールドはヌルとなります。(必要に応じてフィールド数を増やすことができますが、この設定の目的は、100 万のレコードを 100 万のフィールドに行列入替することを防ぐことにあり、もしそのような入れ替えを行うと管理不能となります。)例えば、行内に系列データがあり、各月の独立したフィールド (列) があると想定します。各系列が個別のフィールドに、各月が行になるように、行列の入れ替えを実行できます。
フィールドから読み込み: 既存のフィールドからフィールド名を読み込みます。このオプションを使用すると、新規フィールド数が指定された最大数を上限として、データによって決定します。選択されたフィールドの各値は、出力データの新しいフィールドとなります。選択されたフィールドには (整数、文字列、日付など) 任意のストレージ・タイプがありますが、フィールド名の重複を避けるために、選択されたフィールドの各値は一意である必要があります (つまり、値の数は行数と一致する必要があります)。フィールド名が重複している場合、警告が表示されます。- 値の読み込み: 選択されたフィールドがインスタンス化されていない場合、このオプションを選択して新しいフィールド名のリストを編成します。フィールドがすでにインスタンス化されている場合、この手順は必要ではありません。
- 読み込む値の最大数: データからフィールド名を読み込む場合、上限値を指定してあまりに多いフィールドが作成されることを回避します。(前述のとおり、100 万のレコードを 100 万のフィールドに入れ替えると、管理できない結果が生じます。)
例えば、データの最初の列が各シリーズの名前を指定している場合、これらの値を入れ替えられたデータのフィールド名として使用することができます。
入れ替え:デフォルトでは、連続型 (数値範囲) フィールドのみが入れ替わります (整数または実数)。オプションで、数値型フィールドのサブセットを選択するか、代わりに文字列フィールドを入れ替えることができます。ただし、入れ替えるフィールドはすべて同じストレージ・タイプでなければなりません (数値または文字列のいずれか一方。両方ではありません)。これは、入力フィールドを混在させると、各出力列内に混在した値が生成され、フィールドの値がすべて同じストレージでなければならないという規則に反するためです。その他のストレージ・タイプ (日付、時間、タイムスタンプ) を入れ替えることはできません。
- すべての数値型: すべての数値型フィールド (整数または実数ストレージ) を入れ替えます。出力の行数は、元のデータの数値型フィールド数に一致します。
- すべての文字列: すべての文字列フィールドを入れ替えます。
- カスタム: 数値型フィールドのサブセットを選択することができます。出力の行数は、選択したフィールド数に一致します。このオプションは数値型フィールドに対してのみ使用できます。
行 ID 名: ノードで作成された行 ID フィールドの名前を指定します。このフィールドの値は、元のデータのフィールド名によって決まります。
レコードからフィールドへ
フィールド: 「フィールド」リストには、行列入替ノードに入るすべてのフィールドが含まれます。
インデックス: 「インデックス」セクションを使用して、インデックス・フィールドとして使用するフィールドを選択します。
フィールド: 「フィールド」セクションを使用して、フィールドとして使用するフィールドを選択します。
値。 「値」セクションを使用して、値フィールドとして使用するフィールドを選択します。
- 平均: キー・フィールドの各組み合わせの平均値を返します。平均値は、中心傾向の尺度であり、算術平均です (ケース数で割った合計)。
- 合計:キー・フィールドの各組み合わせの合計値を返します。合計は、欠損値のないすべてのケースに対する変数の値の合計です。
- 最小: キー・フィールドの各組み合わせの最小値を返します。
- 最大: キー・フィールドの各組み合わせの最大値を返します。
- 中央値: キー・フィールドの各組み合わせの中央値を返します。中央値は、外れ値に対して敏感でない、中心化傾向の測定値です。それに対して平均値は、いくつかの極端に大きい、または小さい値に影響されます。50 番目のパーセンタイルまたは 2 番目の四分位でもあります。
- カウント: キー・フィールドの各組み合わせの非ヌル値のカウントを返します。
フィールドからレコードへ
フィールド: 「フィールド」リストには、行列入替ノードに入るすべてのフィールドが含まれます。
インデックス: 「インデックス」セクションを使用して、インデックス・フィールドとして使用するフィールドを選択します。
値。 「値」セクションを使用して、値フィールドとして使用するフィールドを選択します。値フィールドを選択しない場合、割り当てられていないすべての数値フィールドが値として使用されます。ただし、数値ではないフィールドが使用できる場合、割り当てられていないすべての文字列フィールドが使用されます。