線性迴歸:儲存新變數

您可以儲存預測值、殘差、和其他統計量以便診斷。 每個選項都會新增一或多個新變數到您的作用中資料檔。

預測值。 迴歸模型會預測每個觀察值之未來數值。

  • 未標準化模型所預測的應變數值。
  • 標準化將每一個預測值轉換成其標準化形式。 也就是說,平均數預測值會從預測值中減去,而差分會除以預測值的標準差。 標準化預測值的平均數為 0,標準差為 1。
  • 已調整從迴歸係數計算中排除觀察值時,該觀察值的預測值。
  • 平均數預測值的標準誤預測值的標準誤。 估計應變數平均值的標準差,它是為與自變數有相同值的觀察值而進行的估計。

距離。 識別有異常自變數組合值之觀察值、或對迴歸模型有重大影響之觀察值時,所使用的量數。

  • Mahalanobis測量自變數之觀察值的值與整體觀察值平均數的變異程度。 較大 Mahalanobis 距離會將觀察值識別為在一個以上自變數中具有極端值。
  • Cook's在從迴歸係數計算中排除特定觀察值時,所有觀察值殘差變更程度的量數。 若 Cook D 較大,則表示從迴歸統計量計算中排除某個觀察值會造成係數發生重大變更。
  • 槓桿值測量迴歸適合度中的點影響。 置中槓桿值的範圍介於 0(適合度中無影響)至 (N-1)/N 之間。

預測區間。 平均數、個別預測區間的上界和下界。

  • 平均數預測回應平均數之預測區間的上界與下界(兩個變數)。
  • 個別單一觀察值之應變數預測區間的下限及上限(兩個變數)。
  • 信賴區間輸入介於 1 和 99.99 之間的值,以指定兩個「預測區間」的信賴等級。 輸入此數值之前,必須選取「平均數」或「個別值」。 一般的信賴區間值為 90、95 及 99。

殘差。 該值算法為應變數的實際數值,再減去迴歸方琵式所預測之數值。

  • 未標準化觀察值與模型所預測的值之間的差異。
  • 標準化殘差除以其標準差的估計值。 標準化殘差(也稱為皮爾遜殘差)的平均數為 0,標準差為 1。
  • Studentized殘差會根據自變數的平均數到自變數中每一個觀察值的值之距離,除以隨其觀察值類型變化之標準差的估計值。 有時稱為內部 studentized 殘差。
  • 已刪除從迴歸係數計算中排除觀察值時,該觀察值的殘差。 它是應變數值與已調整預測值之間的差異。
  • Studentized 已刪除觀察值除以其標準誤的已刪除殘差。 學生化已刪除殘差與其相關聯學生化殘差之間的差異,指出刪除觀察值對其本身的預測所產生的差異。 有時稱為外部 studentized 殘差。

影響統計量。 因為排除特定觀察值之故,造成迴歸係數 (DfBeta) 和預測值 (Df 適合度) 的改變。 標準化 DfBeta 和 DfFit 值也可以跟共變異數比值一起使用。

  • DfBetas. beta 值的差異即為因排除特定觀察值而導致的迴歸係數變更。 值是針對模型中的每一個項目計算(包含常數)。
  • Standardized DfBeta以 beta 值標準化的差分。 因為排除特定觀察值之故,造成迴歸係數的改變。 您可能要檢驗絕對值除以 N 的平方根大於 2 之觀察值,其中 N 為觀察值個數。 值是針對模型中的每一個項目計算(包含常數)。
  • DfFit. 適合度值的差異即為因排除特定觀察值而導致的預測值變更。
  • 標準化 DfFit以適合度值標準化的差分。 因為排除特定觀察值之故,造成預測值的改變。 您可能要檢查絕對值超過 p/N 平方根兩倍的標準化值,其中 p 為模型中參數的數目,N 為觀察值的數目。
  • 共變異比例具有從迴歸係數計算中排除之特定觀察值的共變異數矩陣行列式,與包含所有觀察值之共變異數矩陣行列式的比例。 如果此比例接近於 1,則觀察值不會明顯變更共變異數矩陣。

係數統計量。 將迴歸係數儲存到資料集或資料檔中。 資料集可供同一階段作業中之後續的作業使用,但是不會儲存為檔案,除非特別在階段作業結束之前儲存。 資料集名稱必需符合變數命名規則。 如需相關資訊,請參閱主題 變數名稱

匯出模型資訊至 XML 檔。 將參數估計與(選擇性)其共變異數以 XML (PMML) 格式匯出到指定檔案中。 您可以使用這個模型檔案,將模式資訊套用到其他資料檔中以進行評分工作。 如需相關資訊,請參閱主題 評分精靈

將新變數儲存在線性迴歸中

本功能需要 Statistics Base 選項。

  1. 從功能表中選擇:

    分析 > 迴歸 > 線性 ...

  2. 在「線性迴歸」對話框中,按一下「儲存」。
  3. 選取您想要的數值或統計量。