文字挖掘節點:模型標籤

使用「模型」標籤來為節點輸出指定建置方法和一般模型設定。

您可以設定下列參數:

模型名稱。您可以根據目標或 ID 欄位(或者模型類型,如果未指定此類欄位)自動產生模型名稱,或者指定自訂名稱。

使用分割的資料。 如果定義了分割區欄位,那麼此選項可確保僅使用訓練分割區的資料來建置模型。

建置模式。指定執行具有此「文字採礦」節點的串流時,將如何產生模型塊。或者,您可以採用以互動方式建置模式使用更具實踐性的上機方式,您不僅可以擷取概念、建立種類及精簡語言資源,還可以執行文字鏈結分析及探索叢集。

  • 以互動方式建置。當執行串流時,此選項會啟動互動式介面,您可以從中擷取概念及型樣、探索及細部調整所擷取結果、建置及精簡種類、細部調整語言資源(範本、同義字、類型、檔案庫等),以及建置種類模型塊。如需相關資訊,請參閱 以互動方式建置
  • 直接產生。此選項指出執行串流時,應該會自動建立模型並新增至「模型」選用區。與互動式工作台不同,執行時,除了節點中定義的設定之外,不需要您提供任何其他操作。如果您選取此選項,則會顯示模型特定的選項,您可以利用這些選項定義要產生之模型的類型。如需相關資訊,請參閱 直接產生

將大型模型儲存在 AS 中。如果您具有 IBM® SPSS® Analytic Server 的連線,請選取此選項,以從遠端在伺服器上儲存您的模型。

註: 任何在伺服器上建置及儲存的模型只能在該伺服器上進行評分。若要回復包含此類模型的互動式工作台,您需要用來建立階段作業之原始伺服器的連線。

複製資源來源。 挖掘文字時,擷取程序不僅是基於「專家」標籤中的設定,還基於語言資源。 這些資源在擷取期間用作如何處理文字的基礎,從而取得概念、類型,並有時取得型樣。您可以將資源從資源範本、文字分析套件 (.tap) 或 SPSS Text Analytics for Surveys 專案檔 (.tas) 複製到此節點。進行選擇然後按一下載入以定義將從中複製資源的範本、套件或專案。當您載入時,會將資源的副本儲存在節點中。因此,如果您要使用更新的資源,則必須在這裡或在互動式工作台階段作業中重新載入它。為了便於使用,資源的複製及載入日期和時間顯示在節點中。如需相關資訊,請參閱 從範本及 TAP 複製資源

文字語言。 識別所要發掘之文字的語言。在節點中所複製的資源控制存在的語言選項。請選取已調整其資源的語言。