Python中MPI訊息傳遞介面

阿新 • • 發佈：2019-01-30

MPI(Message-Passing-Interface)訊息傳遞介面

1.MPI安裝

python mpi安裝mpi4py的python庫

pip install mpi4py

安裝後得到Bin資料夾：

這裡寫圖片描述

將MicrosoftMPI/Bin資料夾路徑新增到環境變數：

這裡寫圖片描述

命令列輸入mpiexec執行，出現幫助表示安裝成功

這裡寫圖片描述
2.試驗程式碼

from mpi4py import MPI

comm = MPI.COMM_WORLD
comm_rank = comm.Get_rank()
comm_size = comm.Get_size()

print 
 'I'm the %d process of %d processes" % (comm_rank, comm_size)

這裡寫圖片描述

2.點對點傳輸

點對點通訊.其實就是最簡單的程序A向程序B傳送資訊,而程序B向程序A接收資訊.這是關於兩個程序之間的通訊.

示例程式碼：

#mpip2p.py
from mpi4py import MPI

comm = MPI.COMM_WORLD
comm_rank = comm.Get_rank()
comm_size = comm.Get_size()

data = [comm_rank]*5
comm.send(data,dest=(comm_rank+1 
)%comm_size)
data_recv =comm.recv(source=(comm_rank-1)%comm_size)
print "my rank is %d, and Ireceived:" %comm_rank
print data_recv

在命令列中輸入命令

mpiexec -n 5 python mpip2p.py

執行結果：

my rank is 4, and Ireceived:
[3, 3, 3, 3, 3]
my rank is 3, and Ireceived:
[2, 2, 2, 2, 2]
my rank is 2, and Ireceived:
[1 
, 1, 1, 1, 1]
my rank is 0, and Ireceived:
[4, 4, 4, 4, 4]
my rank is 1, and Ireceived:
[0, 0, 0, 0, 0]

指定啟動5個mpi程序來執行後面的程式。相當於對指令碼拷貝了5份，每個程序執行一份，互不干擾。在執行的時候程式碼裡面唯一的不同，就是各自的rank也就是ID不一樣。

Get_rank()函式：獲取當前程序rank值

Get_size()函式：獲取總共的程序數

send()函式：將資料送給rank為dest的值的程序

recv()函式：接收rank為source的值的資料

訊息傳遞的同步非同步性：

recv是阻塞函式,也就是說程序要收到傳送方的資料,這個函式才返回.

而send是不確定的,也就是說它有時候是阻塞,有時候是非阻塞.當傳送的資料不多的時候,mpi會將資料存到一個系統緩衝區,然後馬上進行send方法的返回.而當資料量很大超過緩衝區的大小的時候,mpi需要等待接收方接收,然後把資料拷貝給接收方,再進行send方法的返回.

簡單來說,資料量少->非阻塞（同步）,資料量大->阻塞（非同步）.

除了send和recv方法,還有Send和Recv方法.,這樣區分是由於要傳遞的資料的性質差異.當我們要傳遞int,float,list,dict等python內建型別的資料的時候,我們使用小寫的方法.而當使用buffer型別的資料的時候,我們要使用大寫的方法.

send的多個版本:

事實上,除了大寫小寫的版本,send還有不同的版本,這個不同是基於不同的傳送策略的,而這些版本都有大小寫之分.

bsend:緩衝模式,資料寫入緩衝區,馬上返回,使用者必須確保緩衝區大小足夠

ssend:同步模式,等接收方接收才返回

rsend:就緒模式,傳送時必須確保接收方處於等待接收的狀態,否則產生錯誤

send:標準模式(bsend+ssend)，send實際上就是bsend和ssend的結合體.

3.多點傳輸：

#mpimp.py
from mpi4py import MPI

comm = MPI.COMM_WORLD
comm_rank = comm.rank()
comm_size = comm.size()

if comm_rank == 0:
    data = [1,2,3]
    for i in range(comm_size - 1):
        comm.send(data,dest=i+1)
else:
    data = comm.recv(source = 0)
    print "Process %d receive"%comm_rank,data

執行結果：

mpiexec -n 6 python mpimp.py

Process 1 receive [1,2,3]
Process 2 receive [1,2,3]
Process 3 receive [1,2,3]
Process 4 receive [1,2,3]
Process 5 receive [1,2,3]

此做法漏洞：

在單機上跑這n個程序好像沒所謂,CPU始終在工作,時間複雜度也是O(n)級別.

但假如是n臺機器分別跑這n個程序,第0臺機器始終在傳送資料,而其他機器的大部分時間都在排隊,等第0臺機器往自己傳送資料.這樣的話,這堆機器要執行完這堆程序,需要O(n)時間.等於一臺機器的工作效率，不是滿意的結果。

廣播（改進）：

想到了,我們可以像p2p那樣做,有資料的機器都幫忙向沒有資料的機器傳送資料,這樣的話時間複雜度是可以降低到O(logn)的!

mpi有實現這樣操作的介面,bcast函式

改進程式碼：

#mpimp.py
from mpi4py import MPI

comm = MPI.COMM_WORLD
comm_rank = comm.rank()
comm_size = comm.size()

if comm_rank == 0:
    data = [1,2,3]
    comm.bcast(data, root=0)
else:
    data = comm.bcast(None, root=0)
    print "Process %d receive"%comm_rank,data

bcast()函式：無論是廣播者,還是被廣播者,都是呼叫bcast函式,而不像點對點那樣一個send另一個recv.bcast()函式一個根程序把資料發給其他程序。

散播：

這裡寫圖片描述

散播的函式和廣播的引數是一樣的,只是返回值不一樣.

注意!散播的傳送方也會接收到資料(和概念圖有出入),

散播裡列表裡元素的分發不是按程序0就分得第0個元素,程序1就第1個元素這樣的.而是一種類似隨機的打亂的分發策略.

散播發送的資料，data（列表）裡元素的個數必須等於程序的個數.否則會出錯。

示例程式碼：

#mpisca.py
from mpi4py import MPI

comm = MPI.COMM_WORLD
comm_rank = comm.Get_rank()
comm_size = comm.Get_size()

if comm_rank == 0:
    data = [1,2,3,4,5,6]
else:
    data = None

data = comm.scatter(data, root=0)
    print "Process %d receive"%comm_rank,data

執行結果：

mpiexec -n 6 python mpisca.py
Process 1 receive 2
Process 4 receive 5
Process 2 receive 3
Process 0 receive 1
Process 3 receive 4
Process 5 receive 6

收集：

散播的逆操作：

#mpigather.py
from mpi4py import MPI

comm = MPI.COMM_WORLD
comm_rank = comm.Get_rank()
comm_size = comm.Get_size()

if comm_rank == 0:
    data = comm.gather(comm_rank, root=0)
    print data
else:
    comm.gather(comm_rank,root=0)

mpiexec -n 8 python mpigather.py
[0, 1, 2, 3, 4, 5, 6, 7]

reduce()規約函式：

它相當於在收集的過程中不斷地進行兩元運算,最終在接收方那裡只有一個值,而不是一個列表.

也就是說規約函式

示例程式碼：通過 $1 - \frac{1}{3} + \frac{1}{5} - \frac{1}{7} + . . . = \frac{π}{4}$ 計算圓周率

#mpireduce.py
from mpi4py import MPI

comm = MPI.COMM_WORLD
comm_rank = comm.Get_rank()
comm_size = comm.Get_size()

k = (1.0 if comm_rank%2 == 0 else -1.0)/(2*comm_rank +1)
data = comm.reduce(k, root=0,op=MPI.SUM)

if comm_rank == 0:
    pi = data*4
    print "PI = %.6f"%pi

執行結果：

C:\Python27\Scripts\ML\MPI>mpiexec -n 12 python mpireduce.py
PI = 3.058403

注意事項：

1.平行計算的reduce,scatter,gather在執行資訊互動函式是並行，資訊互動完之後，每個程序統一從函式中出來，執行接下來的程式碼

2.上述函式root秩代表根節點：scatter傳播，gather接收，reduce最終彙總結果的程序，

3每臺機器reduce複雜度，只有O（logn），reduce函式MPI_SUMj操作：

假設九個程序

1, 2, 3, 4, 5, 6, 7, 8, 9
  1+2, 3+4, 5+6, 7+8, 9
   1+2+3+4, 5+6+7+8, 9
    1+2+3+4+5+6+7+8, 9
    1+2+3+4+5+6+7+8+9

4.單機的話不要開幾百個程序，不是開玩笑的

5.注意的是，散播和reduce中傳送接收到的返回值，不是接收方最終得到的返回值，而是一個none.

alltogether:收集後再廣播一次，allreduce：reduce+bcast

barrier是一種全域性同步,就是說全部程序進行同步.

當一個程序呼叫barrier的時候,它會被阻塞.

當所有程序都呼叫了barrier之後,barrier會同時解除所有程序的阻塞.

但執行起來發現並不是這回事.所有程序沒有像期待那樣先全部輸出begin,再全部輸出end,barrier這個函式彷彿形同虛設.

其實這裡問題不是在barrier,而是在print.

我們OS的IO是有緩衝的,一個數據要出現在螢幕上,簡單來說是經過記憶體->標準IO檔案->控制檯螢幕.

而程序間不共享IO檔案(後面會學到如何在MPI的程序裡共享檔案),共享控制檯螢幕.

因此螢幕上語句的順序依賴OS什麼時候將IO檔案裡的內容推到螢幕上.

我們強制讓記憶體->標準IO檔案和標準IO檔案->控制檯螢幕這兩步一起進行,也就是加上flush語句.

form mpi4py import MPI
import sys

comm = MPI.COMM_WORLD
comm_rank = comm.Get_rank()
comm_size = comm.Get_size()

print comm_rank,'begin'
sys.stdout.flush()
comm.barrier()
print comm_rank,'end'

sendrecv()函式

傳送send+接收recv

data = sendrecv(data,dest=1)

關於程序

from mpi4py import MPI

comm = MPI.COMM_WORLD
comm_rank = comm.Get_rank()
comm_size = comm.Get_size()

data_send = [comm_rank]*5
comm.send(data_send,dest=(comm_rank+1)%comm_size)
data_recv = comm.recv(source=(comm_rank-1)%comm_size)
print (my rank is %d, and Ireceived: %comm_rank)
print data_recv

這裡面有個需要注意的問題，如果我們要傳送的資料比較小的話，mpi會快取我們的資料，然後繼續執行後面的指令，而不會等待對方程序執行recv指令接收這個資料。

但是，如果要傳送資料量很大，[rank]*500程式就會很卡，因為所有程序都會卡在傳送這條指令，等待下一個指令發起接收指令，但是程序是執行完傳送的指令才能接收的指令，這就和死鎖差不多。

一般修改如下：

from mpi4py import MPI

comm = MPI.COMM_WORLD
comm_rank = comm.Get_rank()
comm_size = comm.Get_size()

data_send = [comm_rank]*500
if comm_rank == 0:
    comm.send(data_send, dest=(comm_rank+1)%comm_size)
if comm_rank > 0:
    data_recv = comm.recv(source=(comm_rank-1)%comm_size)
    comm_send(data_send,dest=(comm_rank-1)%comm_size)
if comm_rank == 0:
    data_recv = comm.recv(source=(comm_rank-1)%comm_size)

這也就是為什麼接收放在前面的原因了

Python中MPI訊息傳遞介面

MPI(Message-Passing-Interface)訊息傳遞介面 1.MPI安裝 python mpi安裝mpi4py的python庫 pip install mpi4py 安裝後得到Bin資料夾：將Micro

使用MPI訊息傳遞實現hello world的順序輸出

MPI：hello world順序輸出在跑MPI並行程式時，我們不知道哪個核心前進得快，故而在沒有其他控制的條件下，誰先執行同一條程式碼，是不可知的。比如說，對於一個輸出“hello world”的程式，如果採用多個節點來跑，列印順序是不定的。下面是一個hellow程式： /

LINUX中的訊息傳遞函式分析

python中的引數傳遞 * **

python中函式引數的傳遞是通過賦值來傳遞的。函式引數的使用又有倆個方面值得注意：1.函式引數是如何定義的 2.在呼叫函式的過程中引數是如何被解析先看第一個問題，在python中函式引數的定義主要有四種方式：1.F(arg1,arg2,...)這是最常見的定義方式，一個函式可以定義任意個引數，每個引數

python中參數傳遞的方法

是什麽使用 type 相同 args 位置參數關系 return 參數 Python中函數傳遞參數的形式主要有以下五種，分別為位置傳遞，關鍵字傳遞，默認值傳遞，不定參數傳遞（包裹傳遞）和解包裹傳遞。 1.位置傳遞實例： def fun(a,b,c) 　　return

python中Matplotlib庫顯示介面中進行滑鼠互動繪製操作

近期在用Python做醫學影象處理系統製作，逐步跟大家分享我遇到的問題以及解決方案。今天來跟大家說一下在matplotlib庫顯示介面中進行滑鼠互動繪製等操作。先上圖，下圖為用matplotlib進行顯示的脊柱影象（.dicom格式），後期跟大家介紹.dicom檔

Python中函式引數傳遞

前幾天寫一個方法的時候，內部呼叫了第三方庫的可變引數方法，由於實際的需求，導致引數越寫越長，很不方便。這時是不是我們自己也應該寫一個可變引數的方法，然後根據需要動態傳遞引數？在解決這個問題之前，我們先來了解Python中四種傳遞引數的形式： fun1(a, b, c)

php中Redis的應用--訊息傳遞

訊息傳遞這一應用廣泛存在於各個網站中，這個功能也是一個網站必不可少的。本文主要介紹了php中Redis的應用--訊息傳遞。閱讀目錄 1、摘要 2、實現方法 3、一對一訊息傳遞 4、多對多訊息傳遞 1、摘要訊息傳遞這一應用廣泛存在於各個網站中，這個功能也是一個網站必不可

python中的flask框架寫簡單的登入介面

flask框架和css的應用實現的環境： windows環境 eclipse下的pydev pip3 install flask jinja2 步驟一：首先建立一個web.py # -*- coding:utf-8 -*- ''' Created

從函式的引數傳遞來理解python中“一切都是物件”

From Python 初學者： a = 2 其中2為物件，a可理解為貼在物件上的標籤。物件由不可變物件和可變物件，不可變物件有數字、字串、元祖，可變物件有列表，字典，集合。 def f(x): x *= 2 a = 1 f(a) print(a) #1 b =

python中的賦值值傳遞？

幾行很簡單的程式碼 def func(m): m[0] = 10 m = [100,200,300] return m m = [1,2,3] func(m) print(m) 猜測這個輸出是什麼呢？ A.【1，2，3】 B.【10，2，3】

在python中使用itchat傳送微信訊息

介紹 itchat是一個開源的微信個人號介面，使用python呼叫微信從未如此簡單。使用不到三十行的程式碼，你就可以完成一個能夠處理所有資訊的微信機器人安裝 pip install itchat 示例程式碼 #-*-codi

SpringMVC框架Java Web專案中訊息傳遞的流程

這是一個servlet專案，功能是使用者填寫表單，然後後臺渲染頁面後把表單內容返回給使用者。通過這個簡單的例子理解下springmvc框架的工作原理。 springmvc概念架構 springmvc可

Python GUI程式設計之訊息傳遞機制&使用者登入

PythonGUI程式設計之-訊息傳遞機制及簡單的使用者登入訊息機制 1.訊息的傳遞機制自動發出事件/訊息訊息由系統負責傳送到佇列有相關元件進行繫結/設定後端自動選擇感興趣的事件並作出相應的

python中的提示和傳遞

這是學習python的第11課，主要學習了python中提示與傳遞，也就是通過input（），進行一些簡單的人機對話。 from sys import argv script,user_name = argv prompt = '> ' print(f"Hi

laravel 中自定義 api 介面的錯誤訊息

當在laravel 中編寫 api 介面時，throw new Exception() 返回的錯誤訊息格式不是我們想要的格式解決辦法：在 App\Exceptions目錄下新建一個 ApiException類繼承 Exception namespace App\Ex

Python中值傳遞和引用傳遞區別

python中對一個函式可以傳遞引數，但是如何分辨是值傳遞還是引用傳遞，不是程式設計師手動控制的，而是python根據你傳入的資料物件，自動識別的。如果你傳入的引數物件是可變物件：列表，字典，這個時候就是引用傳遞，如果引數在函式體內被修改，那麼源物件也會被修改。如果你傳

Python中呼叫OpenCV介面儲存攝像頭或視訊中的影象幀到視訊檔案

Python中呼叫OpenCV介面儲存攝像頭或視訊中的影象幀到視訊檔案 import cv2 cap = cv2.VideoCapture(0) # 開啟攝像頭 size = (int(cap.get(cv2.CAP_PROP_FRAME_WIDTH)), int(cap.get(cv2

Python中呼叫OpenCV介面中的高斯混合模型，實現對運動目標的檢測，並保存錄制視訊

Python中呼叫OpenCV介面中的高斯混合模型(GMM)，實現對運動目標的檢測 import numpy as np import cv2 # TODO: 本程式碼使用OpenCV介面中的高斯混合模型，實現對運動目標的檢測 cap = cv2.VideoCapture(

Handler訊息傳遞機制（子執行緒中傳遞new Handler和主執行緒中new Handle傳遞訊息）

> 子執行緒中更新UI new Thread(new Runnable() { @Override public void run() { Looper.prepare();

Python中MPI訊息傳遞介面

MPI(Message-Passing-Interface)訊息傳遞介面

1.MPI安裝

python mpi安裝mpi4py的python庫

安裝後得到Bin資料夾：

將MicrosoftMPI/Bin資料夾路徑新增到環境變數：

命令列輸入mpiexec執行，出現幫助表示安裝成功

2.點對點傳輸

點對點通訊.其實就是最簡單的程序A向程序B傳送資訊,而程序B向程序A接收資訊.這是關於兩個程序之間的通訊.

示例程式碼：

在命令列中輸入命令

執行結果：

指定啟動5個mpi程序來執行後面的程式。相當於對指令碼拷貝了5份，每個程序執行一份，互不干擾。在執行的時候程式碼裡面唯一的不同，就是各自的rank也就是ID不一樣。

Get_rank()函式：獲取當前程序rank值

Get_size()函式：獲取總共的程序數

send()函式：將資料送給rank為dest的值的程序

recv()函式：接收rank為source的值的資料

訊息傳遞的同步非同步性：

recv是阻塞函式,也就是說程序要收到傳送方的資料,這個函式才返回.

簡單來說,資料量少->非阻塞（同步）,資料量大->阻塞（非同步）.

除了send和recv方法,還有Send和Recv方法.,這樣區分是由於要傳遞的資料的性質差異.當我們要傳遞int,float,list,dict等python內建型別的資料的時候,我們使用小寫的方法.而當使用buffer型別的資料的時候,我們要使用大寫的方法.

send的多個版本:

事實上,除了大寫小寫的版本,send還有不同的版本,這個不同是基於不同的傳送策略的,而這些版本都有大小寫之分.

bsend:緩衝模式,資料寫入緩衝區,馬上返回,使用者必須確保緩衝區大小足夠

ssend:同步模式,等接收方接收才返回

rsend:就緒模式,傳送時必須確保接收方處於等待接收的狀態,否則產生錯誤

send:標準模式(bsend+ssend)，send實際上就是bsend和ssend的結合體.

3.多點傳輸：

執行結果：

此做法漏洞：

在單機上跑這n個程序好像沒所謂,CPU始終在工作,時間複雜度也是O(n)級別.

但假如是n臺機器分別跑這n個程序,第0臺機器始終在傳送資料,而其他機器的大部分時間都在排隊,等第0臺機器往自己傳送資料.這樣的話,這堆機器要執行完這堆程序,需要O(n)時間.等於一臺機器的工作效率，不是滿意的結果。

廣播（改進）：

想到了,我們可以像p2p那樣做,有資料的機器都幫忙向沒有資料的機器傳送資料,這樣的話時間複雜度是可以降低到O(logn)的!

mpi有實現這樣操作的介面,bcast函式

改進程式碼：

bcast()函式：無論是廣播者,還是被廣播者,都是呼叫bcast函式,而不像點對點那樣一個send另一個recv.bcast()函式一個根程序把資料發給其他程序。

散播：

散播的函式和廣播的引數是一樣的,只是返回值不一樣.

注意!散播的傳送方也會接收到資料(和概念圖有出入),

散播裡列表裡元素的分發不是按程序0就分得第0個元素,程序1就第1個元素這樣的.而是一種類似隨機的打亂的分發策略.

散播發送的資料，data（列表）裡元素的個數必須等於程序的個數.否則會出錯。

示例程式碼：

執行結果：

收集：

散播的逆操作：

reduce()規約函式：

它相當於在收集的過程中不斷地進行兩元運算,最終在接收方那裡只有一個值,而不是一個列表.

也就是說規約函式

示例程式碼：通過1−13+15−17+...=π41−13+15−17+...=π4計算圓周率

執行結果：

注意事項：

1.平行計算的reduce,scatter,gather在執行資訊互動函式是並行，資訊互動完之後，每個程序統一從函式中出來，執行接下來的程式碼

2.上述函式root秩代表根節點：scatter傳播，gather接收，reduce最終彙總結果的程序，

3每臺機器reduce複雜度，只有O（logn），reduce函式MPI_SUMj操作：

假設九個程序

4.單機的話不要開幾百個程序，不是開玩笑的

5.注意的是，散播和reduce中傳送接收到的返回值，不是接收方最終得到的返回值，而是一個none.

alltogether:收集後再廣播一次，allreduce：reduce+bcast

barrier是一種全域性同步,就是說全部程序進行同步.

當一個程序呼叫barrier的時候,它會被阻塞.

當所有程序都呼叫了barrier之後,barrier會同時解除所有程序的阻塞.

但執行起來發現並不是這回事.所有程序沒有像期待那樣先全部輸出begin,再全部輸出end,barrier這個函式彷彿形同虛設.

其實這裡問題不是在barrier,而是在print.

我們OS的IO是有緩衝的,一個數據要出現在螢幕上,簡單來說是經過記憶體->標準IO檔案->控制檯螢幕.

而程序間不共享IO檔案(後面會學到如何在MPI的程序裡共享檔案),共享控制檯螢幕.

因此螢幕上語句的順序依賴OS什麼時候將IO檔案裡的內容推到螢幕上.

我們強制讓記憶體->標準IO檔案和標準IO檔案->控制檯螢幕這兩步一起進行,也就是加上flush語句.

sendrecv()函式

傳送send+接收recv

關於程序

這裡面有個需要注意的問題，如果我們要傳送的資料比較小的話，mpi會快取我們的資料，然後繼續執行後面的指令，而不會等待對方程序執行recv指令接收這個資料。

但是，如果要傳送資料量很大，[rank]*500程式就會很卡，因為所有程序都會卡在傳送這條指令，等待下一個指令發起接收指令，但是程序是執行完傳送的指令才能接收的指令，這就和死鎖差不多。

一般修改如下：

這也就是為什麼接收放在前面的原因了

相關推薦

示例程式碼：通過 $1 - \frac{1}{3} + \frac{1}{5} - \frac{1}{7} + . . . = \frac{π}{4}$ 計算圓周率