1. 程式人生 > >七周成為數據分析師05_數據可視化

七周成為數據分析師05_數據可視化

放置 info 箱線圖 完成 衡量 重點 Dimension 空間 詞雲

數據可視化之美

數據可視化的目的是為了讓數據更高效,讓讀者可以更高效閱讀,而不單是自己使用。

數據可視化首先需要突出數據背後的規律和重要因素,其次才是美觀。

數字可視化應該基於實際業務背景,比如地鐵線路圖並沒有按照真實的地理距離來劃分,但它卻準確直觀的傳遞給用戶最關註的重點:應該如何乘車才能到達某地。

圖表繪制部分主要為實操,這裏就不做分享。原課程可以參考如下鏈接:

如何七周成為數據分析師:Excel技巧之甘特圖繪制(項目管理)

圖表的基本概念

1. 維度和度量

首先需要對維度和度量的概念進行區分。維度表示分析數據的角度/屬性,度量則是衡量這個屬性的數值大小。

  • 維度 Dimension
    :描述分析的角度和屬性,屬於分類數據
    • 如:時間、地理位置、產品類型
  • 度量 measure:具體的參考數值,屬於數值數據
    • 如:元、銷量、銷售額

2. 維度主要分為三大類的數據結構:文本(類別)、時間、數值

如:地區分類為文本維度,年份為時間維度,銷售額為數值維度

維度之間可以互相轉換,如一個人的年齡,本來是時間維度,但可以將其轉換為“青年、中年、老年”,轉換為文本維度

常見的可視化圖表

1. 散點圖

散點圖的優勢在於揭示數據間的關系,發覺變量與變量間的關聯。

散點圖需要至少需要兩個維度數據,一列放置於 X 軸,一列放置於 Y 軸

技術分享圖片

對散點圖進行擴展,可以繪制氣泡圖

區別之處在於氣泡圖引入了第三個度量,作為氣泡的大小

技術分享圖片

2. 折線圖

折線圖常用於觀察數據隨時間變動的趨勢。

此時 X 軸為時間維度,Y 軸為數值維度。

技術分享圖片

對折線圖進行拓展,可以繪制面積圖

區別之處在於面積圖更易於對比各類別間的數據隨時間變化的趨勢,各類邊數據此時是累加顯示的。

技術分享圖片

3. 折線圖

折線圖常用於多個維度的比較和變化。

文本維度/時間維度通常作為X軸。數值型維度作為Y軸。柱形圖至少需要一個數值型維度。

技術分享圖片

柱形圖還有許多豐富的應用。例如堆積柱形圖,瀑布圖,橫向條形圖,橫軸正負圖等。

技術分享圖片

4. 餅圖

餅圖優點在於美觀,但難以觀察各類別間的差距。

技術分享圖片

5. 漏鬥圖

漏鬥圖主要反映一個轉化流程,便於展示

技術分享圖片

6. 雷達圖

也叫蛛網圖,它在商務、財務領域應用較大,適合用在固定的框架內表達某種已知的結果。常見於經營狀況,財務健康程度。

適用於個體的數據和屬性可視化。

技術分享圖片

常見的高級圖表

1. 樹形圖

樹形圖直觀的以面積表示數值,以顏色表示類目。尤其適用於數據量較大類別較多的情況。

技術分享圖片

2. 桑基圖

桑基圖常用於表達信息的變動和流動狀態,是揭示數據復雜變動趨勢的圖表。

桑基圖可以一對多或多對一。如:用戶在網頁上的活動軌跡。

技術分享圖片

3. 熱力圖

熱力圖常用於表現數據在空間上的變化規律。

技術分享圖片

熱力圖也不一定表示純粹空間,也可能是屬性和維度的規律組合。

如在數據分析中常用熱力圖表示各特征間的線性關系。

技術分享圖片

4. 關系圖

關系圖常用於展示不同類別之間的數據關系,展現失誤相關性和關聯性。

如社交關系鏈、品牌傳播

技術分享圖片

5. 箱線圖

箱線圖和直方圖類似,主要用於統計中,用於觀察數據分布情況和對比數據分布

技術分享圖片

6. 標靶圖

也稱子彈圖,常用於衡量 KPI 完成情況

技術分享圖片

7. 詞雲圖

詞雲圖多用於展示,繪制簡單

技術分享圖片

8. 地理圖

地理圖主要體現數據和空間之間的關系

技術分享圖片

七周成為數據分析師05_數據可視化