データ・ソース

データ・ソースには、エンティティー解決のために処理してエンティティー・データベースにロードする必要のある、アイデンティティーが含まれています。データ・ソースには、識別データ (アイデンティティーのユニークな個人 ID) と、非識別データ (アイデンティティーのその他の属性やデータ・ポイント) が含まれています。このデータ・ソース内のアイデンティティー・レコードをシステムで処理したり、エンティティー・データベースにロードしたりするためには、事前にそれらのレコードを Universal Message Format (UMF) としてエクスポートする必要があります。データ・ソースの例には、従業員リスト、監視リスト、顧客リスト、ベンダー・リストがあります (これらに限定されるわけではありません)。

データ・ソースには、元のソースに関する情報 (元のデータは UMF に変換済みであるため) や、データ・ソースの外部参照など、重要な情報が含まれています。これらの詳細によって、各データ・ソースがシステム内でユニークとなります。

エンティティー解決時に、2 つのエンティティーが未解決となった場合、システムはデータ・ソース情報を使用して、どの情報がどのエンティティーと結び付いているのかを判別します。

データ・ソースの場所とソース・システム

ソースの場所とソース・システムを作成し、それらをデータ・ソースに関連付けることで、入力データ・ソースを整理できます。ソースの場所とソース・システムを使用すると、同じようなタイプのデータ・ソースを区別することができます。

例えば、複数の場所からの予約データと人材データを処理する場合、次のようにデータ・ソースの場所を使用することで、どの場所から提供されたデータであるかを判別できます。

プロパティー X 予約データ
プロパティー X 人材データ
プロパティー Y 予約データ
プロパティー Y 人材データ

データ・ソース別の構成

エンティティー解決および関係検出の結果を最大化するには、以下の設定を使用して各データ・ソースを構成します。

ロール: データ・ソースは同じタイプのデータをグループ化したものであるため、同じ入力データ・ソース内のすべてのアイデンティティー・レコードに自動的に同じロールを割り当てることができます。例えば、人材のデータ・ソースに「従業員 (Employee)」ロールを関連付けることで、従業員リストからのすべての入力レコードに自動的に「従業員 (Employee)」ロールが割り当てられます。
ロード・レベル: 入力データ・ソース内のすべてのデータをロードするのか、1 つ以上のエンティティーに解決されるデータまたは 1 つ以上のエンティティーに関連するデータだけをロードするのかを決定できます。
関係解決の設定: 関係検出レベルをデータ・ソース別に構成することができます。例えば、あるデータ・ソースについて関係解決をオフにしたり、その特定のデータ・ソース内での関係検出用の隔たり度合いを選択したりできます。