Aktivieren des Features 'IBM Global Name Recognition Name Hasher'

Durch Aktivieren der Datenqualitätsverarbeitung des Features 'IBM Global Name Recognition Name Hasher' für das UMF-Segment <NAME> können Sie das Namensparsing, die Klassifizierung von Kulturen und die Hashwertgenerierung für Namen verbessern.

Vorbereitende Schritte

Wenn Sie Name Hasher für eine vorhandene Installation erstmalig aktivieren, wenden Sie sich an den IBM Kundendienst oder den IBM Support. Es müssen alle vorhandenen Daten aus allen Datenquellen erneut geladen werden, um zu verhindern, dass die Entitätsauflösung der neuen Daten im Hinblick auf die in der Entitätendatenbank vorhandenen Daten fehlschlägt.

Informationen zu diesem Vorgang

Diese Anweisungen stellen Zusammenfassungen der Tasks dar, die ausgeführt werden müssen, um Name Hasher zu aktivieren. Alle Schritte werden mithilfe der Konfigurationskonsole ausgeführt. Klicken Sie die Verknüpfung an, um schrittweise Anleitungen für jede Task aufzurufen.

Vorgehensweise

  1. Aktivieren Sie die DQM-Funktion 282, um Namenshashes zu erstellen. Diese Funktion aktiviert die Name Hasher-Funktion in den Pipelines. Wenn Sie von Name Hasher eine frühere Produktversion als Version 8.0 Fixpack 2 verwendet haben, lesen Sie die Anweisungen in Migrieren auf das aktualisierte Feature 'IBM Global Name Recognition Name Hasher'. Sie wollen möglicherweise mehrere von DQM 282 verwendete Parameter wiederverwenden.
  2. Aktivieren Sie die DQM-Funktion 610, damit Name Hasher Hashattribute für zusammengesetzte Namen erstellen kann.
  3. Konfigurieren Sie die Kandidatenerstellungsregel 'Default w/ Name only' für erweitertes Namenshashing.
  4. Konfigurieren Sie alle Datenquellen für erweitertes Namenshashing.
  5. Inaktivieren Sie das Parsing für vollständige Namen in DQM-Funktion 252. Name Hasher erstellt für alle Namensteile Namenshashvarianten, nicht nur für den vollständigen Namen.
  6. Konfigurieren Sie DQM-Regel 255 für erweitertes Namenshashing. Durch Ausführen dieses Schritts wird die Namensstandardisierungsfunktion von DQM 255 beibehalten. Sie inaktivieren jedoch das Standardnamenshashing für die Verwendung des erweiterten Namenshashings von Name Hasher. Sie stellen außerdem sicher, dass die Pipeline-Gültigkeitsprüfung, bei der geprüft wird, ob DQM 255 aktiviert ist, nicht fehlschlägt und die Pipelines abschaltet.
  7. Aktivieren Sie die DQM-Funktion 260 für das UMF-Segment <NAME>. Diese DQM-Funktion ordnet eingehenden Namensdaten Namenskulturen zu. Für Name Hasher ist eine Namenskultur erforderlich, die kulturübergreifendes Fachwissen auf das erweiterte Namenshashing anwendet. Stellen Sie sicher, dass Name Manager aktiviert ist. (Name Manager ist in der Regel aktiviert.) Wenn Sie die DQM-Regel 260 aktivieren und Name Manager nicht aktiviert ist, schlägt die DQM-Regel 260 fehl und die Pipelines werden abgeschaltet.
  8. Legen Sie die Systemparameter für Name Hasher fest. Durch Ausführen dieses Schritts konfigurieren Sie die erforderlichen Systemparameter für die Pipelines, die während des erweiterten Namenshashings verwendet werden.