概觀 (DATASET NAME 指令)

DATASET 指令 (DATASET NAMEDATASET ACTIVATEDATASET DECLAREDATASET COPYDATASET CLOSE) 提供同時開啟多個資料來源的能力,並控制階段作業中任何點的作用中開啟資料來源。 使用已定義的資料集名稱,您可以:

  • 合併來自多個不同來源類型 (例如,文字資料、資料庫、試算表) 的資料 (例如, MATCH FILESADD FILESUPDATE) ,而不先將每一個資料儲存為外部 IBM® SPSS® Statistics 資料檔。
  • 建立新的資料集,這些資料集是開放式資料來源的子集 (例如,一個子集中的男性、另一個子集中的女性、另一個子集中的特定年齡以下的人員,或一個集合中的原始資料,以及另一個子集中的轉換/計算值)。
  • 在「資料編輯器」中的兩個以上開啟的資料來源之間複製並貼上變數、觀察值及/或變數內容。

DATASET NAME 指令:

  • 將唯一名稱指派給作用中資料集,可在後續檔案存取指令及後續 DATASET 指令中使用。
  • 即使在開啟/啟動其他資料來源之後,仍可使用現行資料檔。

適用下列一般規則:

  • 如果作用中資料集已有已定義的資料集名稱,則現有關聯會中斷,且新名稱會與作用中檔案相關聯。
  • 如果名稱已與另一個資料集相關聯,則該關聯會中斷,並建立新的關聯。 先前與該名稱相關聯的資料集已關閉且不再可用。

基本規格

DATASET NAME 的基本規格是指令名稱後接符合變數命名規則的名稱。 如需相關資訊,請參閱主題 變數名稱

WINDOW 關鍵字

WINDOW 關鍵字控制與資料集相關聯之「資料編輯器」視窗的狀態。

ASIS. 包含資料集的「資料編輯器」視窗不受影響。 這是預設值。

正面. 包含資料集的「資料編輯器」視窗會顯示在前面,資料集會變成對話框的作用中資料集。

作業

  • 指令在作用中資料集上操作。 作用中 資料集是最近開啟的資料來源 (例如,透過 GET DATAGET SASGET STATAGET TRANSLATE等指令) 或最近啟動的 DATASET ACTIVATE 指令。

    附註: 也可以透過按一下開啟資料來源之「資料編輯器」視窗中的任何位置,或從語法視窗工具列中可用的資料集清單中選取資料集,來變更作用中資料集。

  • 當另一個資料集是作用中資料集時,無法使用來自一個資料集的變數。
  • 在定義資料集名稱之前或之後,作用中資料集的轉換會在階段作業期間與具名資料集一起保留,而且只要不同的資料來源變成作用中資料集,就會自動執行作用中資料集的任何擱置轉換。
  • 資料集名稱可以在大部分指令中使用,這些指令可以包含 IBM SPSS Statistics 資料檔的參照。
  • 對於可以建立新資料集或改寫現有資料集的指令,您無法使用作用中資料集的資料集名稱來改寫作用中資料集。 例如,如果作用中資料集是 mydata,則具有次指令 /OUTFILE=mydata 的指令會導致錯誤。 若要改寫具名作用中資料集,請使用星號而非資料集名稱,例如: /OUTFILE=*
  • 只要可以使用資料集名稱、檔案控點 (由 FILE HANDLE 指令定義) 或檔名來參照 IBM SPSS Statistics 資料檔,定義的資料集名稱優先於檔案控點,後者優先於檔名。 例如,如果 file1 同時作為資料集名稱和檔案控點存在,則 MATCH FILES 指令中的 FILE=file1 會解譯為參照名為 file1的資料集,而不是檔案控點。

範例

GET FILE='/examples/data/mydata.sav'.
SORT CASES BY ID.
DATASET NAME mydata.
GET DATA /TYPE=XLS 
  /FILE='/examples/data/excelfile.xls'.
SORT CASES BY ID.
DATASET NAME excelfile.
GET DATA /TYPE=ODBC /CONNECT=
 'DSN=MS Access Database;DBQ=/examples/data/dm_demo.mdb;'+
 'DriverId=25;FIL=MS Access;MaxBufferSize=2048;PageTimeout=5;'
 /SQL='SELECT * FROM main'.
SORT CASES BY ID.
MATCH FILES
 /FILE='mydata'
 /FILE='excelfile'
 /FILE=*
 /BY ID.
  • IBM SPSS Statistics 格式的資料檔,並指派資料集名稱 mydata。 由於已指派資料集名稱,因此即使在開啟其他資料來源之後,它仍可供後續使用。
  • 然後讀取 Excel 檔案並指派資料集名稱 excelfile。 如同 IBM SPSS Statistics 資料檔,由於已指派資料集名稱,因此在開啟其他資料來源之後仍然可用。
  • 然後讀取資料庫中的表格。 因為它是最近開啟或啟動的資料集,所以它是作用中資料集。
  • 然後,這三個資料集與 MATCH FILES 指令合併在一起,使用 FILE 次指令上的資料集名稱而非檔名。
  • 星號 (*) 用來指定作用中資料集,在此範例中是資料庫表格。
  • 這些檔案會根據 BY 次指令上指定的索引鍵變數 ID值合併在一起。
  • 由於所有要合併的檔案都需要以索引鍵變數的相同順序排序,因此會在每個資料集上執行 SORT CASES