從範本及 TAP 複製資源
挖掘文字時,擷取程序不僅是基於「專家」標籤中的設定,還基於語言資源。 這些資源在擷取期間用作如何處理文字的基礎,從而取得概念、類型,並有時取得型樣。您可以從資源範本將資源複製到此節點,並且如果您在「文字採礦」節點中,還可以選取文字分析套件 (TAP) 或 SPSS® Text Analytics for Surveys 專案 (.tas)。
依預設,將節點新增至畫布時,會將資源從產品授權語言的基本範本中複製到節點。如果您已授權多種語言,則選取的第一個語言用來判定自動載入的範本。
當您載入時,會將所選取資源的副本儲存在節點中。如果範本、TAP 或 SPSS Text Analytics for Surveys 本身未鏈結至節點,則只會複製範本、TAP 或 SPSS Text Analytics for Surveys 專案資源的內容。這表示如果稍後更新資源,則這些更新不會在節點中自動可用。簡言之,一律使用載入節點的資源,除非您重新載入新的資源副本,或者除非您更新「文字採礦」節點並選取使用階段作業工作選項。如需使用階段作業工作的相關資訊,請進一步參閱本節。
當您選取資源時,選擇與您的文字資料使用相同語言的資源。您只能使用獲授權之語言的資源。如果您想要執行文字鏈結分析,惡必須選取包含 TLA 型樣的範本。如果範本包含 TLA 型樣,則將在「載入資源範本」對話框的 TLA直欄中顯示一個圖示。
資源範本
資源範本是已針對特定網域或用途進行精細調整的檔案庫及進階語言和非語言資源的預先定義集。 在文字挖掘建模節點中,當您將節點新增至串流時,已在節點中載入基本範本的資源副本,但是您可以透過選取資源範本或文字分析套件,然後按一下載入,變更範本或載入文字分析套件。對於範本,然後您可以在「載入資源範本」對話框中選取範本。
文字分析套件 (TAP) 和用於意見調查的文字分析專案 (TAS)
文字分析套件 (TAP) 是一組預先定義的檔案庫集及進階語言與非語言資源,並組合一組或多組預先定義的種類。IBM® SPSS Modeler Text Analytics 提供數個針對特定網域進行細部調整的預先建置 TAP。您可以編輯這些 TAP 並將其儲存至其他目錄以供用來立即開始建置種類模型。您還可以在互動式階段作業中建立您自己的 TAP。如需相關資訊,請參閱 載入文字分析套件。
如果您選擇匯入 SPSS Text Analytics for Surveys 專案 (.tas),則它將轉換為 TAP。
使用「使用階段作業工作」選項(模型標籤)
由於資源複製到「模型」標籤中的節點,您還可以稍後在互動式階段作業中對資源進行變更,以及想要利用這些最新的變更來更新文字挖掘建模節點。在此情況下,您可選取文字挖掘建模節點中「模型」標籤內的使用階段作業工作選項。
如果您選取使用階段作業工作,並且在節點中停用載入按鈕以指出將使用來自互動式工作台的那些資源,而不是先前在這裡載入的資源。
若要在您選取使用階段作業工作選項後對資源進行變更,您可以直接在互動式工作台階段作業內部,透過資源編輯器視圖直接編輯或切換資源。如需相關資訊,請參閱 載入之後更新節點資源。