在 Data Refinery 中視覺化資料

以圖形方式視覺化資訊,可讓您深入瞭解資料。 您可以在視覺化資料並查看變更時,將步驟新增至 Data Refinery 流程。 透過使用視覺化從不同視景探索資料,您可以識別該資料內的型樣、連線及關係,以及快速地瞭解大量資訊。

您也可以在 SPSS Modeler 流程中使用這些相同的圖表來視覺化您的資料。 使用節點選用區中「圖形」區段下的「圖表」節點。 按兩下「圖表」節點以開啟內容窗格。 然後,按一下啟動圖表建置器,以開啟圖表建置器,並建立一或多個圖表定義以與節點相關聯。

圖表範例

若要視覺化您的資料,請採取下列動作:

  1. 從 Data Refinery 中,按一下視覺化標籤。
  2. 從圖表開始或選取直欄:
  • 按一下任何可用的圖表。 然後在頁面左側開啟的詳細資料窗格中新增直欄。
  • 選取要使用的直欄。 建議的圖表會在圖表名稱旁邊將以點指示。 按一下圖表以視覺化您的資料。
重要事項: 可用的圖表類型會根據選取的直欄,從最相關到最不相關進行排序。 如果資料集中不存在資料類型受到支援的直欄,則該圖表將不可用。 如果圖表不支援直欄的資料類型,則該直欄無法用於該圖表的選取。 圖表名稱旁邊的點會為您的資料提供最佳圖表。

圖表

包括下列圖表:

  • 3D 圖表在 3-D 座標系統中顯示資料,方法是將每一欄繪製成一個長方體以建立 3D 效果。

  • 長條圖方便用來並列顯示及比較資料的種類。 長條的順序無關緊要。 您也可以按照從高到低或從低到高的順序來排列長條。

  • 方框線條圖會比較許多群組或資料集之間的分佈。 它們顯示資料群組變異:資料的散佈和偏斜以及離群值。

  • 泡泡圖將群組中的每一個種類顯示為一個泡泡。

  • K 線圖是一種財務圖表類型,其中顯示安全、衍生工具或貨幣的價格變動。

  • 圓堆積圖將階層式資料顯示為一組巢狀區域。

  • 自訂圖表可讓您根據 JSON 輸入來呈現圖表。

  • 雙重 Y 軸圖表使用兩個 Y 軸變數來顯示資料之間的關係。

  • 誤差線指出值中的錯誤或不確定性。 它們可讓您瞭解值的精確性或不精確性,值與真實值之間的可能差距。

  • 評估圖表是測量二進位分類器品質的組合圖表。 您需要三個直欄用於輸入:實際(目標)值、預測值及信賴度(0 或 1)。 移動「截止」圖表中的滑塊以動態更新其他圖表。 ROC 及其他圖表是分類器的標準測量。

  • 「熱圖」圖表會將資料顯示為顏色,以傳送活動層次或密度。 一般而言,低值會顯示為較冷的顏色,且高值會顯示為較暖的顏色。

  • 直方圖顯示資料的頻率分佈。

  • 折線圖會針對一個直欄的每一個值計算一個另一個直欄的摘要統計資料,然後繪製連接值的線條,以顯示一段時間內的資料趨勢。

  • 地圖圖表顯示地理位置點資料,以便您可以比較值並顯示各地理區域的種類。

  • 「數學曲線」圖表會根據您輸入的方程式顯示一組曲線。 您不會將資料集與此圖表搭配使用。 相反,您會使用它將結果與另一個圖表(如散佈平面圖)中的資料集進行比較。

  • 多圖表最多顯示長條圖、折線圖、圓餅圖及散佈平面圖的四個組合。 您可以多次顯示具有不同資料的相同圖表類型。 例如,具有來自不同直欄之資料的兩個圓餅圖。

  • 多系列圖表將多個資料集或多個直欄中的資料顯示成一系列由直線或條欄連接的點。

  • 平行座標圖表顯示並比較數列資料(稱為設定檔)以尋找相似性。 每一列是一條線,且該列中每個直欄的值會以該線條上的點表示。

  • 圓餅圖顯示比例。 系列中的每個值都會顯示為圓餅圖的比例式截塊。 圓餅圖代表值的總和。

  • 母體金字塔圖顯示變數在各類別中的頻率分佈。 它們通常用來顯示人口統計資料的變更。

  • 分位數 (Q-Q) 線條圖會繪製其分位數以將預期的分佈值與觀察到的值進行比較。

  • 雷達圖將在軸(半徑)上代表的三個或多個定量變數整合為單一星形圖。 資料在每個軸上繪製並以連接的線條結合至相鄰軸。 雷達圖對於顯示相關性及比較分類資料非常有用。

  • 關係圖利用各種類型的線條來顯示資料直欄相互之間的關係,以及該關係的強度。

  • 「散佈矩陣」圖表會彼此對映直欄,並顯示其散佈平面圖及相關性。 用於比較多個直欄及其相互之間的相關性強度。

  • 散佈平面圖透過顯示並比較兩個直欄中的值來顯示相關性(一個變數受另一個變數的影響程度)。

  • 「放射環狀圖」類似於分層式圓餅圖,在其中,不同種類的不同比例會立即顯示在多個層次中。

  • 佈景主題河流圖使用特殊化的流程圖,顯示一段時間的變更。

  • 時間圖以連續的時間間隔說明資料點。

  • t-SNE 圖表協助您視覺化高維度資料集。 它們有助於將高維度資料內嵌在包含二維或三維的空間,然後可在散佈平面圖以視覺方式呈現。

  • 「樹狀結構圖」會顯示階層式資料,這些資料會按種類分割成不同的分支。 用於在不同種類下排序不同的資料集。 「樹狀結構圖」是由根節點、稱為分支(代表成員之間的關係及連線)的線條連線以及沒有子節點的葉節點組成。

  • 矩形式樹狀結構圖將階層式資料顯示為一組巢狀區域。 用來比較群組與群組中巢狀之單一元素之間的大小。

  • 文字雲圖透過將每個單字的大小設為與其頻率成比例,顯示單字在文字中出現的頻率。

動作

您可以採取下列任一動作:

  • 重新開始:清除視覺化及詳細資料窗格,並將您帶回至視覺化的起始頁

  • 指定是否顯示欄位值或欄位標籤。 在定義標籤時,此選項僅適用於 SPSS Modeler。 例如,如果您有「性別」欄位,且已將標籤定義為值為 0 的女性,則值為 1 的標籤為男性。 如果未定義標籤,則會顯示值。

  • 下載視覺化:

    • 下載圖表影像:下載包含現行圖表影像的 PNG 檔。

    • 下載圖表詳細資料:下載包含現行圖表詳細資料的 JSON 檔。

  • 設定適用於所有圖表的廣域喜好設定

圖表動作

可用的圖表動作取決於圖表。 圖表動作包括:

  • 縮放

  • 還原:以正常比例檢視圖表

  • 選取資料:在資料標籤中強調顯示您在圖表中選取的資料

  • 清除選項:從「資料」標籤中移除對資料的強調顯示

進一步瞭解

資料視覺化 - 如何挑選正確的圖表類型?

上層主題: 精簡資料