多重對應分析
多重對應分析會試著產生一種解,在圖形中,相同類別內的個體距離會比較近,而不同類別內的個體距離會比較遠。 每一個物件會盡量接近包含該物件的類別的類別點。 如此一來,即由類別將個體區分為同質性的子群組。 將相同類別中的個體歸類到同一子群組的變數即為同質性變數。
在一維的解中,多重對應分析將最適尺度值 (類別量化) 指定給每個變數的每一類別,因此在整體上平均而言,類別具有最大的分佈。 若是二維的解,多重對應分析會找出每個變數的第二組類別量化,而此量化與第一組量化無關,再試著將分佈最大化,並持續進行。 由於變數的類別所收到的分數個數和維度個數相同,因此假設分析中的變數為最適尺度層級中的多重名義量數 。
多重對應分析亦指定分數給分析中的個體,因此類別量化亦即該類別中個體的個體分數平均數,或稱為重心。
和其他類別程序的關係。 亦稱為同質性分析或是雙尺度。 當變數只有兩個時,同質性分析會提供可比較但不相同的結果給對應分析。 而由對應分析產生一個獨特的輸出,用以概述解的適合度和品質,包括穩定性資訊。 因此,對應分析通常適用於雙變數情況下的多重對應分析。 這兩個程序的另一差異在於,輸入到多重對應分析中的是資料矩陣,此時的列為個體而行為變數;但輸入到對應分析中的則可為相同的資料矩陣、一般的相似性矩陣、或是聯合的列聯表,此為聚集矩陣,其中的列和行皆代表變數的類別。 多重對應分析亦可視為多重名義層級下,尺度化資料的主成份分析。
和標準技術的關係。 多重對應分析可視為多因素列聯表的分析。 多因素列聯表也可以使用「交叉列表」程序來分析,但交叉列表所提供的是每個控制變數中,每一類別的個別摘要統計量。 利用多重對應分析,即可藉由一張二維圖形來建立所有變數之間的關係摘要。 多重對應分析的進階使用,是要以第一個維度中的最適尺度值來置換原始類別值,再進行次要的多變量分析。 由於多重對應分析使用數值尺度值來置換類別標記,因此可在多重對應分析之後套用許多需要數值資料的不同程序。 例如,「因素分析」程序所產生的第一個主成份相當於多重對應分析的第一個維度。 第一個維度中的成份分數等於個體分數,且成份平方負荷量等於識別測量。 但第二個多重對應分析維度卻不等於因素分析的第二個維度。