《tableau資料視覺化實戰》第二章建立單變數圖表 Ashutosh Nandeshwar著學習總結
第二章 建立單變數圖表
主要包括:表格、條形圖、餅圖、直方圖、線圖、堆積條形圖、箱線圖
1、表格可以為使用者提供詳細的資料資訊。其中儀表盤可以將表格和圖表融為一體。
2、條形圖:水平方向稱為“條形圖”,垂直方向稱為“柱狀圖”。條形圖長度代表一個特定度量的量,適用於分類資訊。
3、餅圖:很具有爭議。注意從12點鐘方向向右畫最大的分塊,然後在左邊畫第二大的分塊,最小分塊應接近於底部。這樣幫助使用者看到更大的塊,也更容易比較。不要使用三維餅圖,只會變得更糟糕。
4、直方圖:顯示的是度量的計數或密度,對度量進行離散化(分組)可以使計數變得更有意義。這種圖可以更好的觀察度量的分佈。
5、線圖:對於時間趨勢十分有效。但如果縮放比例、座標單元或者高寬比不合適,趨勢就會被誤解。圖表設計時橫軸時間單位很重要,一個小時為單位可能看起來波動很頻繁,但是以天、月為單位就不會。
6、堆積條形圖:相同欄位的不同分類畫在了彼此的最頂端。最大的問題在於除了堆積條形圖最低端的條形,其他條形的長度很難度量。若必須使用,數量限制在2-3個,以避免堆積失調。
7、箱線圖:即盒須圖。展示的是度量的分佈,這個分佈包括度量值的25%、50%、75%分位點以及最大值最小值。在盒子裡顯示25%、50%、75%四分位點的值,觸鬚上顯示最大值和最小值。
這組資料顯示出:
-
最小值(minimum)=5
-
下四分位數(Q1)=7
-
中位數(Med--也就是Q2)=8.5
-
上四分位數(Q3)=9
-
最大值(maximum)=10
-
平均值=8
-
四分位間距(interquartile range)={\displaystyle Q3-Q1}=2 (即ΔQ)
在區間 Q3+1.5ΔQ, Q1-1.5ΔQ 之外的值被視為應忽略(farout)。
-
farout: 在圖上不予顯示,僅標註一個符號∇。
-
最大值區間: Q3+1.5ΔQ
-
最小值區間: Q1-1.5ΔQ
最大值與最小值產生於這個區間。區間外的值被視為outlier顯示在圖上.
-
mild outlier = 3.5
-
extreme outlier = 0.5
、用“〇”標出溫和的異常值,用“*”標出極端的異常值。相同值的資料點並列標出在同一資料線位置上,不同值的資料點標在不同資料線位置上。至此一批資料的箱形圖便繪出了。