python繪圖與視覺化--matplotlib

阿新 • • 發佈：2019-01-31

主要用來記錄《利用python進行資料分析》一書第8章繪圖與視覺化

matplotlib繪圖

1. 載入模組：

%matplotlib inline
import numpy as np 
import matplotlib.pyplot as plt

在jupyter notebook中，若不使用魔法函式“%matplotlib inline”，需要適用plt.show()使繪圖顯示出來。

2. 繪製子圖

# plt.subplots(nrows,ncols,sharex=False,sharey=False)
# 圖表可分為幾行幾列的圖形，是否共享X軸/Y軸（便於同比例尺下對比）

fig, axes = plt.subplots(2,2,sharex=True, sharey=True)
for i in range(2):
    for j in range(2):
        axes[i,j].hist(np.random.randn(500),bins=50,color="k",alpha=0.5)

# subplots_adjust(left=None, bottom=None, right=None, top=None, wspace=None, hspace=None)
# 子圖的在大圖中的位置，前四個為子圖到大圖邊界的距離，wspace/hspace表示子圖間列間距和行間距
plt.subplots_adjust(wspace=0,hspace=0)

3. 顏色、標記、線型

根據x, y繪製綠色虛線'g--'

ax.plot(x, y, 'g--')

ax.plot(x, y, color='g', linestyle='--')

# 'ko--'繪製黑色帶實心圓mark的虛線圖
plt.plot(np.random.randn(30).cumsum(),'ko--')
# 等效的：
plt.plot(np.random.randn(30).cumsum(),color='k',linestyle='dashed',marker='o')

4. 刻度、標籤、圖例

set_xticks 設定x軸刻度標籤位置

set_xticklabels 設定x軸刻度標籤

set_title 設定標題

set_xlabel 設定x軸名稱

fig = plt.figure()
ax = fig.add_subplot(1,1,1)
ax.plot(np.random.randn(1000).cumsum())

# 要修改X軸的刻度，使用set_xticks設定刻度標籤位置和set_xticklabels設定刻度標籤
ticks = ax.set_xticks([0,250,500,750,1000])
labels = ax.set_xticklabels(['one','two','three','four','five'],rotation=30, fontsize='small')

# set_title設定標題，set_xlabel設定X軸名稱
ax.set_title('My first matplotlib plot')
ax.set_xlabel('stages')

新增圖例legend：

繪圖時新增label, 再在plt.legend() 建立圖例

fig = plt.figure()
ax = fig.add_subplot(1,1,1)

# 繪圖時，新增label
ax.plot(np.random.randn(1000).cumsum(),'k',label='one')
ax.plot(np.random.randn(1000).cumsum(),'k--',label='two')
ax.plot(np.random.randn(1000).cumsum(),'k.',label='three')

# 通過ax.legend() 或 plt.legend() 自動建立圖例
ax.legend(loc='best')

5. 儲存圖表

儲存圖表 plt.savefig('foo.png') 檔案型別可以由副檔名定義，可選項：dpi 解析度（每英寸點數），bbox_inches 可以減除當前圖表的空白部分（tight表示留有最小白邊)

plt.savefig('figname.png', dpi=400, bbox_inches='tight')

Pandas繪圖

在matplotlib中繪製一張圖需要組裝各種基礎元件（圖表、圖例、標題、刻度標籤以及其他註解），在pandas中只需要一兩行程式碼就能完成。

1. 線型圖

在pd.Series()和pd.DataFrame()中設定index（索引）,columns（列名）等

data.plot中設定label（圖例的標籤），kind（可以是'line','bar','barh','kde','box'等圖表形式）等等P246中的關鍵字引數會被傳給相應的matplotlib繪圖函式。

# 調整圖片大小
matplotlib.rcParams['figure.figsize']=(9,6)

import pandas as pd

# Series.plot
s = pd.Series(np.random.randn(10).cumsum(),index=np.arange(1,100,10))
s.plot()

# DataFrame.plot
df = pd.DataFrame(np.random.randn(10,4).cumsum(0),
                  columns=['A','B','C','D'],
                  index=np.arange(0,100,10))
df.plot()

2. 柱狀圖

kind = 'bar'（垂直柱狀圖）, kind = 'barh'（水平柱狀圖）

fig, axes = plt.subplots(2,1)
data=pd.Series(np.random.rand(16),index=list('abcdefghijklmnop'))
data.plot(kind='bar',ax=axes[0],color='k',alpha=0.7)
data.plot(kind='barh',ax=axes[1],color='k',alpha=0.7)

df = pd.DataFrame(np.random.rand(6,4),index=['one','two','three','four','five','six'],
                  columns=pd.Index(['A','B','C','D'],name='Genus'))
df.plot(kind='bar')

DataFrame中列名的名字“Genus”可作為圖例的名稱顯示出來

若在df.plot(kind='bar', stacked=True) 新增stacked=True，可繪製堆積柱狀圖

堆疊圖：各行規格化和為1後，再比較堆疊項

tips = pd.read_csv('tips.csv')
# 作聚會時間（day）和聚會規模（size）的交叉表，pd.crosstab(index, columns)，表的內容為計數
party_counts = pd.crosstab(tips['day'],tips['size'])
# 由於規模為1和6的次數都較少，故切片去掉
party_counts = party_counts.loc[:,2:5]

# 規格化，使各行的和為1
party_pcts = party_counts.div(party_counts.sum(1).astype(float),axis=0)

party_pcts.plot(kind='bar',stacked=True)

在同一比例下對比不同時間聚會規模的佔比，可以明顯看得出在週末大規模聚會增多。

3. 直方圖histogram和密度圖

# 沿用上表-tips.csv

# 由df的某兩列運算得到新一列，小費百分比=小費/賬單
tips['tip_pct']=tips['tip']/tips['total_bill']

# 繪製直方圖
tips['tip_pct'].hist(bins=50)

# 繪製密度圖 plot(kind='kde')
tips['tip_pct'].plot(kind='kde')

直方圖和密度圖常常被畫在一起:

a. 用pandas API

tips['tip_pct'].hist(bins=50)
tips['tip_pct'].plot(kind='kde')

b. 可以用seaborn中的sns.distplot()

import seaborn as sns
sns.distplot(tips['tip_pct'])

4. 散佈圖 scatter plot（觀察兩個一維資料之間的關係）

使用matplotlib和pandas API 作散佈圖

# 使用matplotlib.pyplot 可直接繪製兩列散點圖
plt.scatter(trans_data['m1'],trans_data['unemp'])
plt.title('Changes in log %s vs log %s' % ('m1','unemp'))

# 使用pandas API 可根據DataFrame建立散佈圖矩陣，還支援在對角線上放置各變數的直方圖或密度圖
pd.scatter_matrix(trans_data, diagonal='kde',color='k',alpha=0.3)

python繪圖與視覺化--matplotlib

主要用來記錄《利用python進行資料分析》一書第8章繪圖與視覺化 matplotlib繪圖 1. 載入模組： %matplotlib inline import numpy as np import matplotlib.pyplot as plt 在jupy

python 繪圖及視覺化

除標準的圖表物件之外，你可能還希望繪製一些自定義的註釋（比如文字、箭頭或其他圖形等）。註釋可以通過text、arrow和annotate等函式進行新增。text可以將文字繪製在圖表的指定座標（x, y），還可以加上一些自定義格式： In [41]: ax.text(

基於Python的資料視覺化 matplotlib seaborn pandas

原文采用了kaggle上iris花的資料，資料來源從上面的網址上找噢如果沒有seaborn庫安裝方法如下 http://www.ithao123.cn/content-10393533.html 正式開始了~~~ # 首先載

python資料分析07--matplotlib繪圖和視覺化

python資料分析07–matplotlib繪圖和視覺化一、簡介資訊視覺化（也叫繪圖）是資料分析中最重要的工作之一。它可能是探索過程的一部分，例如，幫助我們找出異常值、必要的資料轉換、得出有關模型的idea等。另外，做一個可互動的資料視覺化也許是工作的最終目標。 m

python 爬蟲與資料視覺化--matplotlib模組應用

一、資料分析的目的（利用大資料量資料分析，幫助人們做出戰略決策）二、什麼是matplotlib? 　　matplotlib: 最流行的Python底層繪相簿，主要做資料視覺化圖表,名字取材於MATLAB，模仿MATLAB構建,能將資料進行視覺化、更直觀的呈現、使資料更加客觀、更具說服

python之matplotlib實現繪圖和視覺化

繪圖是資料分析工作中最重要的任務之一，是探索過程的一部分。python為我們提供了許多視覺化工具，最常用的的是matplotlib。matplotlib是一種用於創建出版質量圖示的桌面繪圖包（主要是2D方面），它為python構建了一個MATLAB式的繪圖介面。它不僅支援各種

python資料視覺化(matplotlib,pandas繪圖，直方圖，散點圖，柱狀圖，折線圖，箱線圖)

pclass survived name sex \ 0 1 1 Allen, Miss. Elisabeth Walton fema

Python+pandas+matplotlib資料分析與視覺化案例（附原始碼）

問題描述：執行下面的程式，在當前資料夾中生成飯店營業額模擬資料檔案data.csv然後完成下面的

Python繪圖與可視化

編輯其他 range map web應用 bmp nco 簽名背景 Python有很多可視化工具，本篇只介紹Matplotlib。 Matplotlib是一種2D的繪圖庫，它可以支持硬拷貝和跨系統的交互，它可以在Python腳本、IPython的交互環境下、Web應用程

python基礎之資料視覺化matplotlib

資料視覺化圖示的繪製需要安裝matplotlib庫，安裝方法：cmd下pip install matplotlib，以及numpy庫，安裝法法：cmd下pip install numpy。使用numpy生產影象繪製需要的資料，如果已經有了資料可以讀取資料到陣

python資料分析新手入門課程學習——（二）探索分析與視覺化（來源：慕課網）

一，單因子與對比分析視覺化資料 import pandas as pd df = pd.read_csv('./HR.csv') #檢視前十條資料 df.head(10) 以下為顯示的結果我們可以看出：第一個屬性satisf

利用Python進行資料分析——繪圖和視覺化(八)(2)

1、註釋以及在Subplot上繪圖除標準的圖表物件之外，你可能還希望繪製一些自定義的註釋（比如文字、箭頭或其他圖形等）。註釋可以通過text、arrow和annotate等函式進行新增。text可以將文字繪製在圖表的指定座標（x, y），還可以加上一些自定義格式： In [41]: ax.t

【利用python進行資料分析】繪圖和視覺化

通常的引入約定是： import matplotlib.pyplot as plt fig,axes=plt.subplots(2,3) 這種用法，可以一下子產生2x3個子視窗，並且以numpy陣列的方式儲存在axes中，而fig仍然是整個影象物件，這樣我們可以通過對a

Python視覺化庫 python視覺化--matplotlib

轉自小小蒲公英原文用Python視覺化庫現如今大資料已人盡皆知，但在這個資訊大爆炸的時代裡，空有海量資料是無實際使用價值，更不要說幫助管理者進行業務決策。那麼資料有什麼價值呢？用什麼樣的手段才能把資料的價值直觀而清晰的表達出來？答案是要提供像人眼一樣的直覺的、互動的和反應靈敏的視覺化環境。資料

Python之PyQt5視覺化程式設計02——matplotlib動態顯示畫面

matplotlib動態顯示畫面分為直接在figure圖形物件動態顯示畫面和在UI介面動態顯示畫面，但是兩者本質都是使用到了matplotlib中的animation模組，並呼叫其中的FuncAnimation(figure, update, interval..

Python資料視覺化matplotlib（二）—— 子圖功能

Python資料視覺化matplotlib（二）—— 子圖功能在matplotlib中，整個影象為一個Figure物件,在Figure物件中可以包含一個或者多個Axes物件,每個Axes(ax)物件都是一個擁有自己座標系統的繪圖區域 import pandas as

Python資料視覺化matplotlib（一）—— 圖表的基本元素

Python資料視覺化matplotlib（一）—— 圖表的基本元素圖表建立 plt.show() # 圖表視窗1 → plt.show() plt.plot(np.random.rand(10)) plt.show() # 直接生成圖表魔法函式 % matp

Python資料視覺化--matplotlib.pyplot用法示例

繪製簡單的折線圖 import matplotlib.pyplot as plt input_values = [1, 2, 3, 4, 5] squares = [1, 4, 9, 16, 25] plt.plot(input_values, squares) plt.s

Python資料視覺化-Matplotlib學習筆記（1）--折線圖為例畫圖入門

在使用Python做資料處理的時，大量的資料我們看起來並不是很直觀，有時候把它圖形化顯示反而更能容易的觀察資料的變化特徵等等。 Matplotlib是一個Python的2D繪相簿，它以各種硬拷貝格式和跨平臺的互動式環境生成出版質量級別的圖形。它提供了一整套

Pandas+Matplotlib之csv檔案的建立、讀取與視覺化

Pandas+Matplotlib之csv檔案的建立、讀取與視覺化 #在當前資料夾中生成飯店營業額模擬資料檔案data.csv import csv import random import datetime fn='E:/Spyder/data.csv' with open(fn,'w

python繪圖與視覺化--matplotlib

matplotlib繪圖

Pandas繪圖

相關推薦