文字鏈結分析節點
「文字鏈結分析 (TLA)」節點將一個型樣相符技術新增至文字採礦的概念擷取中,以根據已知型樣識別文字資料中概念之間的關係。 這些關係可以說明客戶關於產品的使用感受、哪些公司有商業合作,甚至可以說明基因機構或醫藥機構之間的關係。
例如,您可能對擷取競爭者的產品名稱並不是很感興趣。 但是您還可以使用此節點來瞭解人們對此產品的使用感受(如果資料中存在此類觀點的話)。 這些關係和關聯是透過將已知型樣與您的文字資料進行比對來識別及擷取的。
您可以使用 IBM® SPSS® Modeler Text Analytics 隨附的某些資源範本內的 TLA 型樣規則,也可以建立/編輯您專屬的型樣規則。型樣規則由巨集、單字清單及字隙組成以構成與輸入文字進行比較的布林查詢或規則。 使用 TLA 型樣規則來比對文字時,可以將此文字作為 TLA 結果並重組為輸出資料。如需相關資訊,請參閱主題 關於文字鏈結規則。
「文字鏈結分析」節點提供了一個更直接的方法來識別及擷取文字中的 TLA 型樣結果,然後將結果新增至串流中的資料集。 但「文字鏈結分析」節點並不是您可以執行文字鏈結分析的唯一方法。 您還可以在「文字採礦」建模節點中使用互動式工作台階段作業。
在互動式工作台中,您可以探索 TLA 型樣結果並將其用作種類描述子,以及/或使用往下探查圖形來進一步瞭解結果。如需相關資訊,請參閱主題 探索文字鏈結分析。實際上,使用「文字採礦」節點來擷取 TLA 結果非常適合用於探索及精細調整範本資料以供稍後直接用於 TLA 節點中。
輸出最多可以由 6 個屬性或組件來代表。如需相關資訊,請參閱主題 TLA 節點輸出。
您可以在 IBM SPSS Modeler 視窗底端的節點選用區的 IBM SPSS Modeler Text Analytics 標籤中找到此節點。如需相關資訊,請參閱主題 IBM SPSS Modeler Text Analytics 節點。
需求。「文字鏈結分析」節點可以接受使用任何標準來源節點(「資料庫」節點、「純文字檔」節點等)讀取到欄位中的文字資料, 或者讀取到列出外部文件(由「檔案清單」節點或「Web 資訊來源」節點產生)之欄位中的文字資料。
強度。 「文字鏈結分析」節點除了基本概念擷取之外,還會提供概念之間關係的相關資訊,以及資料中可能揭露的相關觀點或限定元資訊。