使用文字分析套件
文字分析套件(也稱為 TAP)可用作文字回應種類的範本。使用 TAP 是透過最小人為介入分類文字資料的簡單方法,原因是它包含快速及自動為大量記錄編製代碼所需要的預先建置的種類集及文字資源。使用語言資源,系統會分析及發掘文字資料以擷取主要概念。根據在文字中找到的主要概念及型樣,可以將記錄分類到您在 TAP 中選取的種類集。您可以建立自己的 TAP 或更新一個。
TAP 由下列元素組成:
- 種類集。種類集主要由預先定義的種類、種類代碼、每一個種類的描述子以及整個種類集的名稱組成。描述子是語言元素(概念、類型、型樣及規則),例如術語 cheap 或型樣 good price。描述子用來定義種類,以便在文字符合任何種類描述子時,文件或記錄會放置到種類中。
- 語言資源。語言資源是一組檔案庫及進階資源,已調整以擷取主要概念及型樣。而這些擷取概念及型樣用作描述子,容許將記錄放置到種類集的種類中。
文字分析套件可進行下列作業。
- 建立文字分析套件。如需相關資訊,請參閱 建立文字分析套件。
- 載入文字分析套件。或者,您可以載入 SPSS® Text Analytics for Surveys 專案 (.tas),它將轉換為文字分析套件。如需相關資訊,請參閱 載入文字分析套件。
- 更新文字分析套件。如需相關資訊,請參閱 更新文字分析套件。
選取 TAP 並選擇的種類集之後, SPSS Modeler Text Analytics 可以擷取並分類您的記錄。
註: 可以透過可交換的方式在 SPSS Text Analytics for Surveys 與 SPSS Modeler Text Analytics 之間建立及使用 TAP。然而,請注意,根據您是否直接從 SPSS Modeler Text Analytics 載入文字分析套件 (TAP),或者您是否從 IBM® SPSS Text Analytics for Surveys 載入 TAP,在 SPSS Modeler Text Analytics 中評分規則可能有所不同。我們建議您使用在 SPSS Modeler Text Analytics 內建立的 TAP;這是因為在 IBM SPSS Text Analytics for Surveys 中建立的 TAP 可能係利用不同版本的語言資源進行建立。