在串流中使用文字挖掘節點

「文字挖掘」建模節點用來在串流中存取資料及擷取概念。您可以使用任何來源節點存取資料,例如「資料庫」節點、「變數檔案」節點、「Web 資訊來源」節點或「修正檔案」節點。對於位於外部文件中的文字, 可以使用「檔案清單」節點。

範例 1:用來直接建置概念模型塊的「檔案清單」節點及「文字挖掘」節點

下列範例顯示如何使用「檔案清單」節點以及「文字挖掘」建模節點來產生概念模型塊。如需使用「檔案清單」節點的相關資訊,請參閱檔案清單節點

  1. 檔案清單節點(設定標籤)。首先,我們將此節點新增至串流,以指定將儲存文字文件的位置。我們選取包含您要執行文字挖掘之所有文件的目錄。
  2. 文字挖掘節點(欄位標籤)。接下來,我們新增「文字挖掘」節點,並連接至「檔案清單」節點。在此節點中,我們定義輸入格式、資源範本及輸出格式。我們選取從「檔案清單」節點產生的欄位名稱,並選取文字欄位,以及其他設定。如需相關資訊,請參閱主題 在串流中使用文字挖掘節點
  3. 文字挖掘節點(模型標籤)。接下來,在「模型」標籤上,我們選取建置模式以直接從此節點產生概念模型塊。您可以選取不同的資源範本,或者保持基本資源。

範例 2:用來以互動方式建置種類模型的 Excel 檔案及文字挖掘節點

此範例顯示「文字挖掘」節點如何還可以啟動互動式工作台階段作業。如需互動式工作台的相關資訊,請參閱互動式工作台模式

  1. Excel 來源節點(資料標籤)。先將此節點新增至串流以指定文字的儲存位置。
  2. 文字挖掘節點(欄位標籤)。接下來,我們新增「文字挖掘」節點,並進行連接。在這個第一個標籤上,我們定義輸入格式。我們從來源節點中選取欄位名稱。
  3. 文字挖掘節點(模型標籤)。接下來,在「模型」標籤上,我們選取以互動方式建置種類模型塊,以及使用擷取結果自動建置種類。在此範例中,我們從文字分析套件載入資源副本及一組種類。
  4. 互動式工作台階段作業。接下來,我們執行串流,即會開啟互動式工作台介面。執行擷取之後,我們開始探索資料,並改良我們的種類。