概觀 (AGGREGATE 指令)
AGGREGATE 會將作用中資料集中的觀察值群組聚集到單一觀察值,並建立新的聚集檔案,或在包含聚集資料的作用中資料集中建立新的變數。 作用中資料集中一個以上變數的值會定義觀察值群組。 這些變數稱為 分段變數。 每個分段變數具有相同值的一組觀察值稱為 分段群組。 若未指定分段變數,則整個資料集為單一分段群組。 聚集函數會套用至作用中資料集的 來源變數 ,以建立每個分段群組具有一個值的新聚集變數。
選項
資料。 您可以在包含聚集資料的作用中資料集中建立新變數,以聚集結果取代作用中資料集,或建立包含聚集結果的新資料檔。
文件文字。 您可以使用 DOCUMENT 次指令,將文件文字從原始檔案複製到聚集檔案。 依預設,會捨棄文件文字。
聚集變數。 您可以使用 19 個聚集函數中的任何一個來建立聚集變數。 函數 SUM、 MEAN和 SD 只能聚集數值變數。 所有其他函數都可以同時使用數值和字串變數。
標籤和格式。 您可以指定聚集變數的變數標籤。 使用函數 MAX、 MIN、 FIRST和 LAST 建立的變數會採用其來源變數的格式和值標籤。 所有其他變數都採用 聚集函數下說明的預設格式。
基本規格
基本規格至少是一個聚集函數及來源變數。 聚集函數會在作用中資料集中建立新的聚集變數。
次指令順序
- 如果已指定,則必須先指定
OUTFILE。 - 如果指定的話,
DOCUMENT和PRESORTED必須在BREAK之前。 在這兩個次指令之間無法指定其他次指令。 MISSING(如果指定的話) 必須緊接在OUTFILE之後。- 聚集函數必須最後指定。
作業
- 取代作用中資料集或建立新資料檔時,聚集檔案包含分段變數加上聚集函數所建立的變數。
AGGREGATE會從所有聚集計算中排除具有遺漏值的觀察值,但涉及函數N、NU、NMISS及NUMISS的那些觀察值除外。- 除非另有指定,否則
AGGREGATE會以分組變數值的遞增順序來排序聚集檔案中的觀察值。 PRESORTED使用更快速、更不耗用大量記憶體的演算法,假設資料已排序到所需的群組中。AGGREGATE會忽略分割檔案處理。 若要達到相同的效果,請將用來分割檔案的一或多個變數命名為任何其他分段變數之前的分段變數。AGGREGATE會產生一個檔案,但聚集觀察值的順序會與分割檔案的順序相同。