1. 程式人生 > >Python-資料分析與展示學習筆記(二)

Python-資料分析與展示學習筆記(二)

前言

此次學習的主題是圍繞機器學習所需的python庫展開。
在學完了python的基礎語法後,瞭解到機器學習還需要掌握一些python進階知識:利用python爬取資料、資料分析與展示
於是在網上找了許多教程,發現北理工嵩天老師的python進階MOOC系列非常好,這幾篇python學習筆記也是源於嵩天老師的《Python網路爬蟲與資訊提取》和《Python資料分析與展示》。
此係列筆記方便自己日後複習python相關知識,也供正在學習python的朋友作參考。

Matplotlib庫

自上一篇Numpy庫後,這一篇主要記錄Matplotlib庫的一些使用方法。
Matplotlib是一個專門用來畫圖的庫。

最基礎的就是:
import matplotlib.pyplot as plt
ply.plot()
plt.savefig('',dpi = 600)
plt.show()

但是裡面有一大堆對這個圖進行修飾,豐富的函式:

plt.plot基本使用——座標圖

plt.plot(x,y,format_string,……)
顏色字元、風格字元、標記字元

format_string顏色字元

format_string風格字元

format_string標記字元

常用:
'.'
','
'o'
'x'

中文顯示

rcParams

import matplotlib
matplotlib.rcParams[''] = ''    #raParams的改變是全域性改變,不建議使用

fontproperties(更好)

文字顯示

對於文字的具體修飾可以用:
fontproperties
fontsize
color

plt.text(x,y,'')
plt.grid(True)      #網格線
plt.axis([x0,x1,y0,y1])

子區域

subplot2grid

colspan是從所選的向右

rowspan是從所選的向下

GridSpec(更常用)

總結plot

  1. 繪製基本影象:線+線的格式、顏色、標記點
  2. 繪製x軸、y軸、標題、內部的註解、網格線、xy軸範圍等外框內容
  3. 製作子區域

plt.pie基本使用——餅圖

import matplotlib.pyplot as plt
#餅圖
labels = [a,b,c,d]
sizes = [15,30,40,15]   #比例
explode = (0,0,0.1,0)   #突出大小

plt.pie(sizes,explode = explode,labels = labels,autopct = '%1.1f%%',shadow = False, startangle = 90#第一個a開始的位置)
plt.axis('equal')       #正方形
plt.show()

plt.hist基本使用——直方圖

import numpy as np
import matplotlib.pyplot as plt
#直方圖
plt.hist(a,40,normed = 1,……) 
#a是陣列,40是bin值,代表陣列中最大值與最小值之間分成bin份,此處即40份#normed = 1指Y軸以區域內出現的比例為單位,= 0指出現的次數為單位
plt.title('')

常用的圖表

總結Matplotlib

Matplotlib中有n多個圖表的繪製方式,這裡僅僅列出了16個最常用的圖表。

使用Matplotlib最關鍵的不是學會所有的圖表繪製方式,而是:

  1. 有了資料之後,知道應該用什麼圖表去清晰的視覺化資料
  2. 去Matplotlib文件裡具體看這個圖表的繪製方式