七周成為數據分析師05_數據可視化
數據可視化之美
數據可視化的目的是為了讓數據更高效,讓讀者可以更高效閱讀,而不單是自己使用。
數據可視化首先需要突出數據背後的規律和重要因素,其次才是美觀。
數字可視化應該基於實際業務背景,比如地鐵線路圖並沒有按照真實的地理距離來劃分,但它卻準確直觀的傳遞給用戶最關註的重點:應該如何乘車才能到達某地。
圖表繪制部分主要為實操,這裏就不做分享。原課程可以參考如下鏈接:
如何七周成為數據分析師:Excel技巧之甘特圖繪制(項目管理)
圖表的基本概念
1. 維度和度量
首先需要對維度和度量的概念進行區分。維度表示分析數據的角度/屬性,度量則是衡量這個屬性的數值大小。
- 維度 Dimension
- 如:時間、地理位置、產品類型
- 度量 measure:具體的參考數值,屬於數值數據。
- 如:元、銷量、銷售額
2. 維度主要分為三大類的數據結構:文本(類別)、時間、數值
如:地區分類為文本維度,年份為時間維度,銷售額為數值維度
維度之間可以互相轉換,如一個人的年齡,本來是時間維度,但可以將其轉換為“青年、中年、老年”,轉換為文本維度
常見的可視化圖表
1. 散點圖
散點圖的優勢在於揭示數據間的關系,發覺變量與變量間的關聯。
散點圖需要至少需要兩個維度數據,一列放置於 X 軸,一列放置於 Y 軸
對散點圖進行擴展,可以繪制氣泡圖。
區別之處在於氣泡圖引入了第三個度量,作為氣泡的大小
2. 折線圖
折線圖常用於觀察數據隨時間變動的趨勢。
此時 X 軸為時間維度,Y 軸為數值維度。
對折線圖進行拓展,可以繪制面積圖。
區別之處在於面積圖更易於對比各類別間的數據隨時間變化的趨勢,各類邊數據此時是累加顯示的。
3. 折線圖
折線圖常用於多個維度的比較和變化。
文本維度/時間維度通常作為X軸。數值型維度作為Y軸。柱形圖至少需要一個數值型維度。
柱形圖還有許多豐富的應用。例如堆積柱形圖,瀑布圖,橫向條形圖,橫軸正負圖等。
4. 餅圖
餅圖優點在於美觀,但難以觀察各類別間的差距。
5. 漏鬥圖
漏鬥圖主要反映一個轉化流程,便於展示
6. 雷達圖
也叫蛛網圖,它在商務、財務領域應用較大,適合用在固定的框架內表達某種已知的結果。常見於經營狀況,財務健康程度。
適用於個體的數據和屬性可視化。
常見的高級圖表
1. 樹形圖
樹形圖直觀的以面積表示數值,以顏色表示類目。尤其適用於數據量較大類別較多的情況。
2. 桑基圖
桑基圖常用於表達信息的變動和流動狀態,是揭示數據復雜變動趨勢的圖表。
桑基圖可以一對多或多對一。如:用戶在網頁上的活動軌跡。
3. 熱力圖
熱力圖常用於表現數據在空間上的變化規律。
熱力圖也不一定表示純粹空間,也可能是屬性和維度的規律組合。
如在數據分析中常用熱力圖表示各特征間的線性關系。
4. 關系圖
關系圖常用於展示不同類別之間的數據關系,展現失誤相關性和關聯性。
如社交關系鏈、品牌傳播
5. 箱線圖
箱線圖和直方圖類似,主要用於統計中,用於觀察數據分布情況和對比數據分布
6. 標靶圖
也稱子彈圖,常用於衡量 KPI 完成情況
7. 詞雲圖
詞雲圖多用於展示,繪制簡單
8. 地理圖
地理圖主要體現數據和空間之間的關系
七周成為數據分析師05_數據可視化