複数のソースからのデータを結合する

目的

2つ以上のテーブルのデータを、キーとなる列の値が一致する行ごとに結合し、主テーブルに補足情報を追加します。

どのような場合にこれを使うか

次の場合に「Join」を使用します:

  • 参照テーブルから列を追加する(例:人事データからのコストセンターの詳細)
  • コストデータに資産情報や組織階層を追加する
  • 関連するデータセットを統合し、包括的なレポートを作成する
  • モデルユニットのドライバーに必要なすべてのデータを含む単一のテーブルを作成する
注: JOINはデータを同じ行に結合します。 行を追加したい場合は、Append を使用してください(C 参照:複数のデータソースの追加)。

前提条件

  • 主テーブルをチェックアウトしました
  • 一致するキー列を持つ関連テーブルが存在します
  • 結合キー(値が一致する列)の理解

見積もり時間

15~20分

ステップ

  1. プロジェクトエクスプローラーでプライマリテーブルを開きます。
  2. 変換パイプラインに 「結合 」ステップを追加します(「テーブル」ステップの後に表示されます)。
  3. 結合図では、主テーブルが左側に表示されます。 関連する表が、一致率とともに右側に表示されます。
  4. 「リンクを追加」 をクリックして、リンクを作成してください。
  5. [リンクの追加] ダイアログで:
    • テーブル 」から:結合する関連テーブルを選択してください
    • 「列」から :関連テーブルのキー列を選択してください
    • 」:主テーブル内の一致するキー列を選択してください
  6. 「OK」 をクリックしてリンクを作成してください。
  7. 結合図を確認してください:
    • 表の 「+ 」マークをクリックすると、列ごとの一致率を確認できます
    • リンクをクリックして、一致した項目、一致しなかった項目、および参照先の詳細を表示してください
  8. 必要に応じて、手順4~6を繰り返して、さらに結合を追加してください。
  9. 「保存」 をクリックして、結合ステップを適用します。
  10. 結合された列が、主テーブルの下の「 プロジェクトエクスプローラー 」に表示されていることを確認してください( TableName.ColumnName のような表記で表示されます)。

期待される結果

結合されたテーブルの列が、メインのテーブルで使用可能になりました。 これらの列は、数式、レポート、およびモデル設定で使用できます。 「 テーブル 」ステップのプレビューには結合された列は表示されませんが、下流のステップやプロジェクトエクスプローラー では利用可能です。

よくある落とし穴

  • 一致率が低い場合: 一致率が低い場合は、結合キーとなる列の値とデータ型が同じであることを確認してください。 先頭や末尾のスペース、あるいは大文字と小文字の違いによって、一致しない場合があります。
  • 「テーブル」ステップで結合された列が表示されない: これは想定された動作です。 結合された列は、プロジェクトエクスプローラーや下流のパイプラインステップには表示されますが、テーブルステップのプレビューには表示されません。
  • 数式での結合データの使用: 主列と結合列の両方に基づく条件分岐が必要な場合は、「結合」機能だけに頼るのではなく、「数式」ステップでLookup() 関数を使用してください。

関連タスク