複数のソースからのデータを結合する
目的
2つ以上のテーブルのデータを、キーとなる列の値が一致する行ごとに結合し、主テーブルに補足情報を追加します。
どのような場合にこれを使うか
次の場合に「Join」を使用します:
- 参照テーブルから列を追加する(例:人事データからのコストセンターの詳細)
- コストデータに資産情報や組織階層を追加する
- 関連するデータセットを統合し、包括的なレポートを作成する
- モデルユニットのドライバーに必要なすべてのデータを含む単一のテーブルを作成する
注: JOINはデータを同じ行に結合します。 行を追加したい場合は、Append を使用してください(C 参照:複数のデータソースの追加)。
前提条件
- 主テーブルをチェックアウトしました
- 一致するキー列を持つ関連テーブルが存在します
- 結合キー(値が一致する列)の理解
見積もり時間
15~20分
ステップ
- プロジェクトエクスプローラーでプライマリテーブルを開きます。
- 変換パイプラインに 「結合 」ステップを追加します(「テーブル」ステップの後に表示されます)。
- 結合図では、主テーブルが左側に表示されます。 関連する表が、一致率とともに右側に表示されます。
- 「リンクを追加」 をクリックして、リンクを作成してください。
- [リンクの追加] ダイアログで:
- 「テーブル 」から:結合する関連テーブルを選択してください
- 「列」から :関連テーブルのキー列を選択してください
- 「列 」:主テーブル内の一致するキー列を選択してください
- 「OK」 をクリックしてリンクを作成してください。
- 結合図を確認してください:
- 表の 「+ 」マークをクリックすると、列ごとの一致率を確認できます
- リンクをクリックして、一致した項目、一致しなかった項目、および参照先の詳細を表示してください
- 必要に応じて、手順4~6を繰り返して、さらに結合を追加してください。
- 「保存」 をクリックして、結合ステップを適用します。
- 結合された列が、主テーブルの下の「 プロジェクトエクスプローラー 」に表示されていることを確認してください( TableName.ColumnName のような表記で表示されます)。
期待される結果
結合されたテーブルの列が、メインのテーブルで使用可能になりました。 これらの列は、数式、レポート、およびモデル設定で使用できます。 「 テーブル 」ステップのプレビューには結合された列は表示されませんが、下流のステップやプロジェクトエクスプローラー では利用可能です。
よくある落とし穴
- 一致率が低い場合: 一致率が低い場合は、結合キーとなる列の値とデータ型が同じであることを確認してください。 先頭や末尾のスペース、あるいは大文字と小文字の違いによって、一致しない場合があります。
- 「テーブル」ステップで結合された列が表示されない: これは想定された動作です。 結合された列は、プロジェクトエクスプローラーや下流のパイプラインステップには表示されますが、テーブルステップのプレビューには表示されません。
- 数式での結合データの使用: 主列と結合列の両方に基づく条件分岐が必要な場合は、「結合」機能だけに頼るのではなく、「数式」ステップでLookup() 関数を使用してください。
関連タスク