Matlab並行程式設計方法及理解（1）

阿新 • • 發佈：2019-01-21

轉載（有微弱改動）至：美女Rachel-Zhang的部落格：http://blog.csdn.net/abcjennifer/article/details/17610705；http://blog.csdn.net/abcjennifer/article/details/17843787。

本文講一下matlab中的並行方法與技巧，這裡我們不涉及GPU加速，主要考慮for迴圈並行和資料並行。分為以下幾個板塊：

1. 怎麼並行？

2. parfor vs. SPMD

3. 注意事項及經驗總結

-----------------------------------------------------------

1. 如何並行？

1. Request a number of workers;（指定核心數）
2. Issue the normal command to run the program. The client program will call on the workers as needed;
3. Release the workers;（釋放核心）

具體到程式碼：

matlabpool local 2;
%parallel program
matlabpool close

其中2是core數目，注意2是core數。你的電腦如果是雙核四執行緒的，那麼只能申兩個（而非4個）matlab local pool。

具體實現parallel program呢，主要是通過parfor（parallel for）和SPMD（single program, multiple data）完成的。

-----------------------------------------------------------

2. parfor vs. SPMD

2.1 什麼時候用parfor

parfor只用於matlab並行迴圈。當你需要簡單計算的多次迴圈迭代時，例如蒙特卡洛(Monte Carlo)模擬，parfor迴圈就很有用。parfor將迴圈迭代分組，那麼每個worker執行迭代的一部分。當迭代耗時很長的時候parfor迴圈也是有用的，因為workers可以同時執行迭代。

注意當迴圈中有迭代依賴其他迭代的結果時不應該使用parfor迴圈。每個迭代都必須不依賴其他迭代，若依賴其他迭代，則顯示警告“發現迴圈對話interactive session”。由於parfor迴圈內有通訊消耗，當只有小數量的簡單計算時使用parfor可能得不到什麼好處。

c = 1:10;
a = ones(10,1);
tic
parfor i = 1:length(c)
a(i)= a(i)+ c(i);
Zi=Zi+1； %像這種就是迭代，要顯示“Found an interactive session. You cannot have % multiple interactive sessions open simultaneously.”
end
toc
fprintf('%d\n',a);

2.2 什麼時候用SPMD（Single Program/Multiple Data）單程式多工進行任務並行

Spmd中的“Single program”方面指的是同一段程式碼執行在不同的多個lab上。你在一個Matlab客戶端上執行一個程式，被標誌為spmd模組的其他部分執行在其他lab上。當這些塊執行完畢後，你的程式繼續在客戶端執行。 “Multiple data”方面指的是雖然spmd語句在所有的lab上執行相同的程式碼，但每一個lab可以有不同的，獨有的資料。所以多資料集可以在多個lab上同時被容納。一下是我總結的SPMD使用的兩個場景：

The "single program" aspect of spmd means that the identical code runs on multiple labs. 就是說同一段程式應用於不同的樣本（資料），所以一般針對隨機抽樣的並行，如

%% SPMD
%example 1
spmd
A = rand(3,2); %generate a matrix A for each lab(worker)
end
for i = 1:length(A)
figure; imagesc(A{i});
end
%example 2
a = 3;
b = 4;
spmd
c = labindex();
d = c+a;
end
c{2} = 5;
spmd
f = c*b;
end
for i = 1:length(f)
fprintf('%d\t',f{i});%access the value of each lab
end

另外，SPMD也可以用於可替代parfor的塊並行，在不同lab（worker）上對相同或不同的資料執行不同的並行操作，說起來有些拗口，具體看一下例子就明白了，下面我寫的example3,4分別針對在不同lab上對相同資料和不同資料執行不同操作。它們都可以用parfor代替，對吧，這裡我就不寫了，相信大家的能力。。

%example3 - deal with same Data by different parameters
%add different values to same array Data
Data = 1:100;
spmd
switch labindex
case 1
Data = Data+1;
case 2
Data = Data+2;
end
end
% print Data{1} & Data{2} for checking
%example4
%add different values for different parts of array Data
% [1:50]+1
% [51:100]+2
spmd
if labindex == 1
Data(1:50) = Data(1:50)+1;
else
Data(51:100) = Data(51:100)+2;
end
end

以上是我對spmd和parfor的理解，歡迎補充指正，其他關於spmd vs. parfor的可以參考這個帖子。

2.3 Composite型別

spmd中每個lab返回值以composite儲存，如上面[code]example 1中的f就是以composite的形式展現。f{i}為第i個lab的返回值。最開始我們也可以建立Composite物件並進行初始化賦值。

>> f = Composite(2);

-----------------------------------------------------------

4. 注意事項及經驗總結

注意事項：

1. parfor中慎用（最好勿用）eval幅值。

一個程式並行時要共享記憶體，而eval語句可能使程式進入錯誤的workspace，因此不要用eval，改用不同index賦值。

matlabpool local 2;
c = 1:5;
parfor i = 1:length(c)
a(i) = c(i);
end

2. parfor迴圈不能很好利用所有處理器怎麼辦？

是這樣，

parfor i = 1:4
........
end

就只能用4個處理器，而如果不加這個parfor可能matlab自身的負載均衡能夠更好地利用CPU。這裡我是開起來3個matlab，比如伺服器上有12個核。我就給每個matlab分配4個core（>>matlabpool local 4），每個程式裡有一個parfor i = 1:4. 這樣就可以用起來12個核。我知道這樣好暴力……囧，有人知道正解的話指條明路吧。。

3. parfor，spmd不可以相互或者自身巢狀。

4. parfor使用有很多約束，比如for迴圈內的表示式需要顯式表達(透明性)，不依賴前項。如

parfor i = 3:10

f(i) = f(i-1)+f(i-2);

end

是不行滴。。

歡迎留言其他並行技巧和方法，謝謝！

Reference：

2. 詳細講解並行用法（貌似阿拉伯人寫的……o(╯□╰)o）

3. 詳細並行程式碼

5. Parallel Computing Toolbox User's Guide

Matlab並行程式設計方法及理解（1）

1. 如何並行？

2. parfor vs. SPMD

2.1 什麼時候用parfor

2.2 什麼時候用SPMD（Single Program/Multiple Data）單程式多工進行任務並行

2.3 Composite型別

4. 注意事項及經驗總結

Matlab並行程式設計方法及理解（1）

MATLAB編程與應用系列-第2章數組及矩陣的創建及操作（1）

GloVe模型的理解及實踐（1）

【統計學習方法讀書筆記】感知機的個人理解（1）

相機標定 matlab opencv ROS三種方法標定步驟（1）

（6）javascript的程序控制結構及語句-----（1）條件判斷

Faster rcnn代碼理解（1）

智能指針原理及實現（1）- shared_ptr

python socket 的理解（1）

assimp編譯及使用（1）

Spring MVC 配置及應用（1）

空域分析及變換（1）：濾波卷積

程式設計藝術學習筆記（1）

wifi驅動的理解（1）——驅動架構

c語言程式設計常見問題總結（1）

python實現人臉檢測及識別（1）---- 採集人臉資料

淺談對Js面向物件的理解（1）

[C#]非同步程式設計: async和await（1）

（二）網路程式設計：聊天室（1）

初學者對指標的理解（1）

Matlab並行程式設計方法及理解（1）

1. 如何並行？

2. parfor vs. SPMD

2.1 什麼時候用parfor

2.2 什麼時候用SPMD（Single Program/Multiple Data）單程式多工進行任務並行

2.3 Composite型別

4. 注意事項及經驗總結

相關推薦