1. 程式人生 > 其它 >視覺化圖表入門教程

視覺化圖表入門教程

資料視覺化,即通過圖表形式展現資料,幫助我們快速、準確理解資訊。好的視覺化會“講故事”,能向我們揭示資料背後的規律。

本文主要介紹常見圖表的資訊表達特徵和適用場景,幫助大家瞭解如何在不同的場景下選擇合適的圖表,從而幫助我們更清晰的傳遞資訊。(注:正文中所有圖表的製作所使用的工具為Yonghong Z-Suite)

圖1:圖表型別

圖表基礎元素

一張圖表至少包含:標題、橫縱座標軸、資料系列、資料標籤、圖例等部分,每一部分都在圖表中扮演特定的角色、表達特定的資訊。

圖2:圖表的基本元素

視覺化圖表的兩個概念

1. 維度(Dimension)

如地區、性別、職業等,常常是觀察資料的角度,往往是橫座標。特徵為類別型欄位、一般是離散的、不可進行四則運算。

2. 度量/指標(Measure)

如UV、PV、客單價、活躍使用者數,資料的統計值衡量,往往是縱座標。特徵為數值型欄位、一般是連續的、可進行四則運算

視覺化圖表型別詳解

1. 折線圖“家族”

折線圖作為資訊最明瞭的圖表,是各種圖表中最容易解讀的圖表,以下是它的幾種變種:

  • 基礎折線圖

例如圖3所表示的是:某公司4.01-5.20日期間新增使用者數的變化趨勢,其中標記了兩個運營的重要事件,分別是“應用市場投放開始”和“應用市場投放停止”。從折線圖中我們可以發現,新增使用者在應用市場投放後增長明顯提升,並且帶動了停止投放後的自然新增。

圖3:基礎折線圖

  • 堆積面積圖

面積大小對應該類別數值大小,反映不同類別佔比關係及其時間趨勢變化。

以圖4為例,顏色代表不同渠道,面積的大小來表示新增使用者,以時間來展示趨勢變化。從圖4中可看出AppStore和360手機助手為該產品下載量Top1、2的渠道。然而它的缺點是:由色塊面積來表示數值大小不夠直觀。

圖4:堆積面積圖

2. 柱形圖“家族”

  • 累加柱形圖

累加柱形圖的核心思想是“對比”,適合少量類別的對比,且對比資訊特別清晰。

例如圖5表示的是某公司在調整運營策略前後的成本對比,經過對比後發現,喚回成本有所提高,拉新成本有所降低。假設該公司的運營策略為側重喚回,減少拉新,通過這張圖就可以發現執行是到位的。

圖5:累加柱形圖

與堆積面積圖相比,堆積面積圖比累加柱形圖多一時間維度,它可表達時間維度上的趨勢變化。

  • 多指標柱形圖

主要運用於多個指標進行對比分析的場景,但類別物件不宜過多,當超過5個,不適合使用此圖表。

圖6是某醫院的科室患者和醫生人數對比圖。從圖中可以發現在所有科室中,內科醫生為醫生數最多的一個科室,而兒科中的患者數是最多的,說明每個醫生需要服務到更多的患者。

圖6:多指標柱形圖

  • 單一指標柱形圖

單一指標柱形圖,必須按照數值大小降序排列,從而提升條形圖的閱讀體驗。當對比物件類別>5時,將多指標柱形圖更改為單指標的條形圖,能有效提高資料對比清晰度。

圖7:單一指標柱形圖

  • 瀑布圖

瀑布圖的核心是按維度/指標下鑽分解,如公司收入各用途分解、公司年利潤按分公司分解、業績按銷售團隊分解等。

例如圖8為某公司去年收入成本的分解,從圖中可以看到花費最多的為倉儲費用,以此來判斷是否有需要降低的費用,從而來提升淨利潤

圖8:瀑布圖

  • 背離式條形圖

背離式條形圖比單一指標條形圖的優勢在於:多增加了一個對比維度以及雙尾關注(正數第一、倒數第一)。當資料指標有正負對比、前後對比、左右對比概念時候,可以選擇背離式柱形圖。如:進出口貿易值對比、某業務的前後變化對比、人為構建的均值差異等。

圖9:背離式條形圖

  • 柱形圖結合折線圖

柱形圖結合折線圖,通過對比多個指標,使得一個圖表可以表現兩個層次的資訊。

圖10:柱形圖結合折線圖

3. 散點圖“家族”

散點圖適合用於發現變數間的關係與規律。

  • 基礎散點圖

用於觀察兩個指標的關係。

圖11:基礎散點圖

  • 氣泡圖

在基礎散點圖上新增一個指標:用氣泡大小來表示。

例如圖12中,氣泡大小表示在職時間。從圖中可以看出,當人均接待數>7的時候,在職時間長的員工2分鐘內的回覆率較高。

圖12:氣泡圖

  • 基於散點圖的分類矩陣

在基礎散點圖上新增一個維度:用顏色來區分。

例如圖13中的科室是我們要觀察的維度,如果公司要重點運營某些科室,可能會選擇右上角區域內的科室。

圖13:基於散點圖的分類矩陣

根據散點圖的分類矩陣,可以實現分類運營。分類運營是精準運營的開始,比如常見的活躍/不活躍/平民客戶/高階QQ賬號出售平臺地圖客戶等使用者分類指標。

4. 餅圖“家族”

  • 基礎餅圖

例如圖14中,面積代表佔比大小。餅圖需要標註具體數值,如果沒有具體數值的標註,是很難看出分公司D和分公司E佔比大小差異的。

圖14:基礎餅圖

技巧:將需要突出顯示的部分,置於左上角、順時針方向。

  • 環狀圖

環狀圖是由兩個及兩個以上大小不一的餅圖疊在一起,挖去中間的部分所構成的圖形,與餅圖本質上沒有任何差別。

圖15:環狀圖

餅圖小結:

1)一般來說,數值最大的部分排在最前面,也就是12點鐘方向順時針;

2)餅圖的細分項不宜過多,一般不超過8項;

3)不要製作三維的餅圖,不直觀;

4)切忌將餅圖拉得過開,若要突出某一塊,可單獨將其拉開。

5. 其他圖表

  • 雷達圖

雷達圖可以直觀地呈現幾個觀察物件在多個指標上對比情況,但需要保證雷達圖的指標代表正負傾向一致。需要注意的是:雷達圖的線條不超過5條,衡量指標不要超過8個。

例如圖16中可以看出,最優秀的為客服A,客服B的主要問題在於質檢得分低,客服C的比較平庸,客服D的評估、比例的值很好,但是絕對值不高,他可能為一個很值得培養的新員工。

圖16:雷達圖

  • 漏斗圖

漏斗圖適用於關鍵業務環節資料比較,將各環節串聯起來構成漏斗,量化流程內環節,追蹤各環節轉化率。

圖17:漏斗圖

  • 地理圖

地理圖是將資料資訊在地理區域上的分解,是空間分佈的一個良好展示。

例如圖18為某公司平臺使用者在全國省份的分佈情況,顏色越深代表該省份使用者越多。

圖18:地理圖

  • 箱線圖

箱線圖又稱盒須圖,是一種顯示資料分佈情況的統計圖,從中可以觀察到資料的分佈是否密集、是否具有偏向性、是否存在異常值。

圖19:箱線圖

  • 詞雲圖

詞雲圖是為了描述事物的主要特徵,要求能夠讓人一眼看出一個事物的主要特徵,越明顯的特徵越要突出顯示。

例如圖20中,Word直接展示物件,Word字型大小表示某種度度量。字型越大,表示出現次數越多。

圖20:詞雲圖

  • 樹形圖

樹形圖主要用於視覺化層次和整體與部分的關係。以區塊表示部分與層級,不同區塊用顏色區分,用矩形面積表示大小關係。

圖21為某家公司使用者訪問APP中廣告位訪問的使用者訪問量的對比,從中我們可以發現,做了UTD活動的訪問量是最大的。

圖21:樹形圖