分析叢集
您可以在「叢集」視圖中建置及探索概念叢集()。叢集是叢集演算法根據相關概念在文件/記錄集中出現的頻率,以及它們在同一份文件中一起出現的頻率(又稱為出現次數),所產生的相關概念分組。叢集中的每一個概念都與叢集中的至少一個其他概念一起出現。叢集的目標是要群組一起出現的概念,而種類的目標則是要根據文件或記錄包含的文字如何符合每一個種類的描述子(概念、規則、型樣)來群組它們。
好的叢集是指其概念穩固鏈結且經常出現,並具有幾個與其他叢集中的概念之鏈結的叢集。處理較大型的資料集時,此技術可能會導致遠遠較長的處理時間。
叢集作業是一開始先分析一組概念,並尋找在文件中經常出現的概念的一項程序。在文件中出現的兩個概念會被視為概念對組。接下來,叢集作業程序會評量每一個概念對組的相似性值, 其作法為將對組在其中一起出現的文件數與每一個概念在其中出現的文件數相比較。如需相關資訊,請參閱主題 計算相似性鏈結值。
最後,叢集作業程序會藉由聚集將類似的概念群組成叢集,並將它們的鏈結值和「建置叢集」對話框中定義的設定納入考量。對於聚集,意指新增概念或是將較小的叢集合併成較大的叢集,直到叢集飽和為止。當要再合併概念或較小的叢集將會導致叢集超出「建置叢集」對話框中的設定(概念、內部鏈結或外部鏈結數)時,就表示叢集已飽和。叢集會取用叢集內具有與叢集內的其他概念的最高整體鏈結數之概念的名稱。
在結尾時,並不是所有的概念對組最終都會在同一個叢集中在一起,因為另一個叢集中可能有更穩固的鏈結,或是飽和度可能會防止合併它們在其中出現的叢集。基於此原因,所以有內部和外部鏈結兩者。
- 內部鏈結是指叢集內的概念對組之間的鏈結。並非所有的概念都會在叢集中彼此鏈結。不過,每一個概念至少都會鏈結到叢集內的一個其他概念。
- 外部鏈結是指各別叢集(一個概念在一個叢集內,而一個概念在另一個叢集外)中的概念對組之間的鏈結。

「叢集」視圖編排成三個窗格,從「視圖」功能表中選取其名稱就可以隱藏或顯示其中的每一個窗格: