Python-資料分析與展示學習筆記(二)
阿新 • • 發佈:2019-01-01
前言
此次學習的主題是圍繞機器學習所需的python庫展開。
在學完了python的基礎語法後,瞭解到機器學習還需要掌握一些python進階知識:利用python爬取資料、資料分析與展示。
於是在網上找了許多教程,發現北理工嵩天老師的python進階MOOC系列非常好,這幾篇python學習筆記也是源於嵩天老師的《Python網路爬蟲與資訊提取》和《Python資料分析與展示》。
此係列筆記方便自己日後複習python相關知識,也供正在學習python的朋友作參考。
Matplotlib庫
自上一篇Numpy庫後,這一篇主要記錄Matplotlib庫的一些使用方法。
Matplotlib是一個專門用來畫圖的庫。
最基礎的就是:
import matplotlib.pyplot as plt
ply.plot()
plt.savefig('',dpi = 600)
plt.show()
但是裡面有一大堆對這個圖進行修飾,豐富的函式:
plt.plot基本使用——座標圖
plt.plot(x,y,format_string,……)
顏色字元、風格字元、標記字元
format_string顏色字元
format_string風格字元
format_string標記字元
常用:
'.'
','
'o'
'x'
中文顯示
rcParams
import matplotlib
matplotlib.rcParams[''] = '' #raParams的改變是全域性改變,不建議使用
fontproperties(更好)
文字顯示
對於文字的具體修飾可以用:
fontproperties
fontsize
color
plt.text(x,y,'')
plt.grid(True) #網格線
plt.axis([x0,x1,y0,y1])
子區域
subplot2grid
colspan是從所選的向右
rowspan是從所選的向下
GridSpec(更常用)
總結plot
- 繪製基本影象:線+線的格式、顏色、標記點
- 繪製x軸、y軸、標題、內部的註解、網格線、xy軸範圍等外框內容
- 製作子區域
plt.pie基本使用——餅圖
import matplotlib.pyplot as plt
#餅圖
labels = [a,b,c,d]
sizes = [15,30,40,15] #比例
explode = (0,0,0.1,0) #突出大小
plt.pie(sizes,explode = explode,labels = labels,autopct = '%1.1f%%',shadow = False, startangle = 90#第一個a開始的位置)
plt.axis('equal') #正方形
plt.show()
plt.hist基本使用——直方圖
import numpy as np
import matplotlib.pyplot as plt
#直方圖
plt.hist(a,40,normed = 1,……)
#a是陣列,40是bin值,代表陣列中最大值與最小值之間分成bin份,此處即40份#normed = 1指Y軸以區域內出現的比例為單位,= 0指出現的次數為單位
plt.title('')
常用的圖表
總結Matplotlib
Matplotlib中有n多個圖表的繪製方式,這裡僅僅列出了16個最常用的圖表。
使用Matplotlib最關鍵的不是學會所有的圖表繪製方式,而是:
- 有了資料之後,知道應該用什麼圖表去清晰的視覺化資料
- 去Matplotlib文件裡具體看這個圖表的繪製方式