使用文字分析套件
文字分析套件(也稱為 TAP)可用作文字回應種類的範本。 使用 TAP 是一種簡單的方法,可讓您在最少人為介入的情況下對文字資料進行分類,因為它包含 預先建置的種類集 以及快速自動編寫大量記錄所需的語言資源。 使用語言資源,系統會分析及發掘文字資料以擷取主要概念。 根據在文字中找到的主要概念及型樣,可以將記錄分類到您在 TAP 中選取的種類集。 您可以建立自己的 TAP 或更新一個。
TAP 由下列元素組成:
- 種類集。 種類集主要由預先定義的種類、種類代碼、每一個種類的描述子以及整個種類集的名稱組成。 描述子是語言元素(概念、類型、型樣及規則),例如術語 cheap 或型樣 good price。 描述子用來定義種類,以便在文字符合任何種類描述子時,文件或記錄會放置到種類中。
- 語言資源。 語言資源是一組檔案庫及進階資源,已調整以擷取主要概念及型樣。 而這些擷取概念及型樣用作描述子,容許將記錄放置到種類集的種類中。
文字分析套件可進行下列作業。
- 建立文字分析套件。 如需相關資訊,請參閱 製作文字分析套件 。
- 載入文字分析套件。 或者您可以載入 SPSS® Text Analytics for Surveys 專案 (.tas) ,該專案將轉換為文字分析套件。 如需相關資訊,請參閱 載入文字分析套件 。
- 更新文字分析套件。 如需相關資訊,請參閱 更新文字分析套件 。
選取 TAP 並選擇種類集之後, SPSS Modeler Text Analytics 可以擷取並分類您的記錄。
附註: TAP 可以在 SPSS Text Analytics for Surveys 與 SPSS Modeler Text Analytics 之間建立及交換使用。 不過,請注意,根據您是直接從 SPSS Modeler Text Analytics 載入文字分析套件 (TAP) ,還是從 IBM® SPSS Text Analytics for Surveys 載入 TAP ,在 SPSS Modeler Text Analytics 中對規則進行評分可能有所不同。 建議您使用在 SPSS Modeler Text Analytics 內建立的 TAP; 這是因為在 IBM SPSS Text Analytics for Surveys 中建立的 TAP 可能使用不同版本的語言資源來建立。