統計模型

統計模型使用數學方程式對擷取自資料的資訊進行編碼。在某些情況下,統計建模技術可以非常快速地給出合適的模型。甚至對於那些只有更加靈活的機器學習技術(例如神經網路)才能最終給出更好結果的問題,仍然可以將某些統計模型用作基準線預測模型以判斷更先進技術的效能。

提供了下列統計建模節點。

線性迴歸模型基於目標和一個或多個預測值之間的線性關係預測連續目標。
邏輯迴歸是一種統計技術,它可根據輸入欄位的值對記錄進行分類。它類似於線性迴歸方法,但採用的是種類目標欄位而非數值範圍。
PCA/因素節點提供強大的資料減少技術來減少資料的複雜性。主成份分析(PCA)可找出輸入欄位的線性組合,該組合最好地擷取了整個欄位集合中的變異,且組合中的各個成分相互正交(相互垂直)。因數分析則試圖識別底層因素,這些因素說明觀測的欄位集合內的相關性型樣。對於這兩種方法,其共同的目標是找到可對原始欄位集合中的資訊進行有效總結的少量衍生欄位。
判別分析所做的假設比邏輯迴歸方法的假設更嚴格,但在符合這些假設時,判別分析可以作為邏輯迴歸方法分析的有用替代項或補充。
「廣義線性」模型對廣義線性模型進行了擴展,這樣應變數通過指定的鏈結函數與因子和共變數線性相關。此外,此模式允許」變數具有非常態分配。它包括統計模型大部分的功能,其中包括線性迴歸、邏輯迴歸方法、用於計數資料的對數線性模型以及區間刪失生存分析模型。
概化線性混合模型 (GLMM) 延伸了線性模型,使得目標可以有非常態分佈,通過指定的連接函數與因子和共變數線性相關,並且觀察可能相關。廣義線性混合模型涵蓋多種模式,從非常態縱向資料的簡單線性迴歸,到複雜的多層級模式。
使用 Cox 迴歸節點,您可以在已有審查記錄的情況下建置時間事件資料的生存模型。該模型會生成一個生存分析函數,該函數可預測在給定時間 (t) 內對於所給定的輸入變數值相關事件的發生機率。