OpenMP入門教程（三）

阿新 • • 發佈：2018-12-14

承接前面兩篇，這裡直接逐一介紹和使用有關OpenMP的指令和函式

Directives

1、for

作用：for指令指定緊隨其後的程式的迴圈的迭代必須由團隊並行執行，只是假設已經建立了並行區域，否則它在單個處理器上序列執行。

格式：

 1 #pragma omp for [clause ...] newline 
 2                 schedule （type [，chunk]） 
 3                 ordered 
 4                 private （list） 
 5                 firstprivate （list） 
 
 6                 lastprivate （list） 
 7                 shared （list） 
 8                 reduction （operator：list） 
 9                 collapse （n） 
10                 nowait for_loop

可以使用如下子句：

還可以通過Schedule子句(clause)設定for迴圈的並行化方法：（有關一種排程如何比其他排程更優化的討論，請參閱http://openmp.org/forum/viewtopic.php?f=3&t=83

）

static：迴圈迭代被分成size chunk，然後靜態的分配給各個執行緒，如果chunk沒有被指定，則均勻地劃分（如果可能）給各個執行緒
dynamic：迴圈迭代被分成size chunk，然後動態地分配給各個執行緒，當一個chunk完成時，被分配另外一個chunk。預設地chunk size為1
guided：當執行緒請求迴圈迭代時，迭代會動態地分配給塊中地執行緒，直到沒有剩餘的塊要被分配。與dynamic類似，不同的地方在於每次為執行緒分配chunk時都會變小，所以最初組中的迴圈體執行數目較大。初始大小與以下成正比，number_of_iterations / number_of_thread，後續塊與之成比例，number_of_iterations_remaining / number_of_threads。
runtime：迴圈的並行化方式不在編譯時靜態確定，而是推遲到程式執行時動態地根據環境變數OMP_SCHEDULE 來決定要使用的方法。此時在子句中指定chunk_size是非法的
auto：排程決策取決於編譯器/執行時系統

nowait子句：如果指定，則執行緒在迴圈結束時不同步

ordered子句：指定必須像在序列程式中一樣執行迴圈的迭代，可以對for的部分使用

collapse子句：指定巢狀迴圈中應將多少迴圈摺疊到一個大的迭代空間中，並根據schedule子句進行劃分。摺疊迭代空間中的迭代順序被確定為順序執行它們。可以改善表現。

其它的子句後面會做介紹

限制：

迴圈迭代變數必須是整數，並且所有執行緒的迴圈控制引數必須相同
程式正確性不能取決於哪個執行緒執行特定迭代，需要確保程式的正確性
從for指令關聯的迴圈中分支是非法的
必須將塊大小指定為迴圈不變整數表示式，因為在不同執行緒的評估期間沒有同步

示例

 1  #include <omp.h>
 2  #define N 1000
 3  #define CHUNKSIZE 100
 4 
 5  main(int argc, char *argv[]) {
 6 
 7  int i, chunk;
 8  float a[N], b[N], c[N];
 9 
10  /* Some initializations */
11  for (i=0; i < N; i++)
12    a[i] = b[i] = i * 1.0;
13  chunk = CHUNKSIZE;
14 
15  #pragma omp parallel shared(a,b,c,chunk) private(i)
16    {
17 
18    #pragma omp for schedule(dynamic,chunk) nowait
19    for (i=0; i < N; i++)
20      c[i] = a[i] + b[i];
21 
22    }   /* end of parallel region */
23 
24  }

2、section

作用：section是一種非迭代的工作共享結構，程式碼被劃分成多個區域

格式：

 1 #pragma omp sections [clause ...]  newline 
 2                      private (list) 
 3                      firstprivate (list) 
 4                      lastprivate (list) 
 5                      reduction (operator: list) 
 6                      nowait
 7   {
 8 
 9   #pragma omp section   newline 
10 
11      structured_block
12 
13   #pragma omp section   newline 
14 
15      structured_block
16 
17   }

注意：

除非使用nowait子句，否則sections指令結尾都有一個隱含的障礙
分割槽塊裡不能含有分支

示例

 1  #include <omp.h>
 2  #define N 1000
 3 
 4  main(int argc, char *argv[]) {
 5 
 6  int i;
 7  float a[N], b[N], c[N], d[N];
 8 
 9  /* Some initializations */
10  for (i=0; i < N; i++) {
11    a[i] = i * 1.5;
12    b[i] = i + 22.35;
13    }
14 
15  #pragma omp parallel shared(a,b,c,d) private(i)
16    {
17 
18    #pragma omp sections nowait
19      {
20 
21      #pragma omp section
22      for (i=0; i < N; i++)
23        c[i] = a[i] + b[i];
24 
25      #pragma omp section
26      for (i=0; i < N; i++)
27        d[i] = a[i] * b[i];
28 
29      }  /* end of sections */
30 
31    }  /* end of parallel region */
32 
33  }

3、其它的不一一介紹了，請參閱：OpenMP

Clause

前面已經介紹了幾個子句，這裡主要介紹資料作用域子句。

1、private

作用：private子句將其列表中的變數宣告為每個執行緒的私有變數

格式：

private (list)

要點：

在組中的每個執行緒宣告一個相同資料型別的變數
所有對原始變數的引用全部替換為對新變數的引用
被宣告為private的變數應被認為未初始化

2、shared

作用：shared子句宣告其列表中的變數，以便在團隊中的所有執行緒之間共享

格式：

shared (list)

要點：

共享變數僅存在於一個記憶體位置，並且所有執行緒都可以讀取或寫入該地址
程式設計師有責任確保多個執行緒正確訪問SHARED變數（例如通過CRITICAL部分）

3、reduction

作用：reduction子句對列表中的每個變數執行簡化操作。為每個執行緒建立並初始化每個列表變數的私有副本。在縮減結束時，reduce變數應用於共享變數的所有私有副本，最終結果將寫入全域性共享變數。

格式：

1 reduction (operator: list)

示例：

並行迴圈的迭代將以相同大小的塊分配給團隊中的每個執行緒（SCHEDULE STATIC）；

在並行迴圈結構的末尾，所有執行緒將新增其“result”值以更新主執行緒的全域性副本；

 1 #include <omp.h>
 2 
 3  main(int argc, char *argv[])  {
 4 
 5  int   i, n, chunk;
 6  float a[100], b[100], result;
 7 
 8  /* Some initializations */
 9  n = 100;
10  chunk = 10;
11  result = 0.0;
12  for (i=0; i < n; i++) {
13    a[i] = i * 1.0;
14    b[i] = i * 2.0;
15    }
16 
17  #pragma omp parallel for      \  
18    default(shared) private(i)  \  
19    schedule(static,chunk)      \  
20    reduction(+:result)  
21 
22    for (i=0; i < n; i++)
23      result = result + (a[i] * b[i]);
24 
25  printf("Final result= %f\n",result);
26 
27  }

4、其它還有很多，省略

Run-time Library Routines

OpenMP API包含越來越多的執行時庫例程
對於C / C ++，所有執行時庫例程都是實際的子例程。對於Fortran，有些實際上是函式，有些是子例程。
對於C / C ++，通常需要包含 <omp.h>標頭檔案

例如：

1 #include <omp.h> 
2 int omp_get_num_threads（void）

詳細的函式介紹可見OpenMP入門教程（二）

Environment Variables

OpenMP提供一些環境變數來控制並行程式的執行
所有的環境變數名都是大寫字母，但是分配給它們的值不區分大小寫

1、OMP_NUM_THREADS：設定在執行期間最大的執行緒數

setenv OMP_NUM_THREADS 8

2、OMP_DYNAMIC：啟用或禁用動態調整可用於執行並行區域的執行緒數。有效值為TRUE或FALSE

setenv OMP_DYNAMIC TRUE

3、OMP_PROC_BIND：啟用或禁用繫結到處理器的執行緒。有效值為TRUE或FALSE。

setenv OMP_PROC_BIND TRUE

4、OMP_STACKSIZE：控制建立（非主）執行緒的堆疊大小

setenv OMP_STACKSIZE 2000500B 
setenv OMP_STACKSIZE“3000 k” 
setenv OMP_STACKSIZE 10M 
setenv OMP_STACKSIZE“10 M” 
setenv OMP_STACKSIZE“20 m” 
setenv OMP_STACKSIZE“1G” 
setenv OMP_STACKSIZE 20000

4、還有很多其它的，省略

注：前面的執行API也能做與環境變數一樣的工作，同時使用環境變數和執行時 API 會出現什麼情況？執行時 API 將獲得更高的優先權。

注：這是一個簡單的OpenMP的練習網站：https://computing.llnl.gov/tutorials/openMP/exercise.html

參考連結：https://computing.llnl.gov/tutorials/openMP/#Abstract

OpenMP入門教程（三）

承接前面兩篇，這裡直接逐一介紹和使用有關OpenMP的指令和函式 Directives 1、for 作用：for指令指定緊隨其後的程式的迴圈的迭代必須由團隊並行執行，只是假設已經建立了並行區域，否則它在單個處理器上序列執行。格式： 1 #pragma omp f

CodeArt入門教程（三）

pan center account 根據領域對象保存顏色單一職責原則用例 5.領域模型設計　　下面我們創建賬戶子系統（AccountSubsystem），賬戶子系統雖然被門戶服務使用，但是子系統本身是獨立於任何服務存在的。所以我們為賬戶子系統創建獨立的項目解決

Dapper入門教程（三）——Dapper Query查詢

int32 method ppi ransac try spa can () raw 介紹查詢方法（Query）是IDbConnection的擴展方法，它可以用來執行查詢（select）並映射結果到C#實體（Model、Entity）類查詢結果可以映射成如下類型： A

Python入門教程（三）

循環三個參數 normal 編程 list bili lan 函數返回容易　　按理說，這篇是收尾了。可能有一點術語，但大都是顧名思義的。重要概念【類】在第二個標題下說明。函數式編程（縮寫：FP）　　如果對此有興趣，可以看scheme視頻教程（SICP公開課）（sche

Golang入門教程（三）beego 快速開發 HTTP 框架

應用 inf ado .com home clas lan mime iyu 　　beego 是一個快速開發 Go 應用的 HTTP 框架，他可以用來快速開發 API、Web 及後端服務等各種應用，是一個 RESTful 的框架，主要設計靈感來源於 tornado、sina

JavaScript基礎入門教程（三）

直接復制一般來說得到方式註意元素 nbsp 通過說明　　前面的兩篇博客介紹了js中的基本知識中的變量類型、標識符等。這篇博客主要談表達式以及運算符。原始表達式　　原始表達式就是表達式中最小的，不能在分割的表達式，一般指變量、常數直接量、關鍵字（tru

Redux 入門教程（三）：React-Redux 的用法

建立 www counter reducer creates 所有 port 操作 lin 作者：阮一峰前兩篇教程介紹了 Redux 的基本用法和異步操作，今天是最後一部分，介紹如何在 React 項目中使用 Redux。為了方便使用，Redux 的作者封裝

Linux小小白入門教程（三）：Linux資料夾

學習一個作業系統的使用，最先應該搞清楚的是他的C盤、D盤、E盤。一、Linux的資料夾 Linux和Windows最大的區別是，Windows有C盤、D盤的概念，但是在Linux上沒有碟符的概念。Linux只有一個碟符，那就是“/”。你沒有看錯，就是一個斜杆。這個

Docker入門教程（三）Dockerfile

【編者的話】DockerOne組織翻譯了Flux7的Docker入門教程，本文是系列入門教程的第三篇，介紹了Dockerfile的語法，DockerOne目前在程式碼高亮部分還有些Bug，我們會盡快修復，目前在程式碼部分有會些字元會被轉義。在Docker系列教程的上一篇文章中，我們介紹了15個

機器學習極簡入門教程（三）

這是機器學習入門教程系列的第三部分，點選這裡跳轉到第一部分，點選這裡跳轉到第二部分。 part6 通過前面的學習，我們掌握了用已有資料對目標進行預測的方法。在使用模型的時候，有些人或許會好奇，模型究竟是怎樣的？這裡我們通過一個獨特的視角——部分依賴圖（Partial De

譜聚類演算法入門教程（三）—— 求f^TLf的最小值

在上一篇部落格中，我們知道目標函式變為 argmin⁡f∈R6fTLfarg \min \limits_{f \in \R^6} f^TLfargf∈R6minfTLf，即找到一個fff，使得 fTLff^TLffTLf 取得最小值這篇部落格將通過求導的方

OpenMP入門教程（一）

什麼是OpenMP Open Multi-Processing的縮寫，是一個應用程式介面（API），可用於顯式指導多執行緒、共享記憶體的並行性。在專案程式已經完成好的情況下不需要大幅度的修改原始碼，只需要加上專用的pragma來指明自己的意圖，由此編譯器可以自動將程式進行並行化，並在必要之處加入同步互斥

OpenMP入門教程（二）

OpenMP API概述 OpenMP由三部分組成：編譯指令（19）執行時庫程式（32）環境變數（9）後來的API包含同樣的三個元件，只是三者的數量都有所增加。編譯器指令 OpenMP編譯器指令用於各種目的：產生平行區域線上程之間劃分程式碼

Python-matplotlib-入門教程（三）-線形管理

0.摘要本文主要介紹使用matplotlib繪圖過程中的線形管理。 1.標準線形線形符號實線 - 短線 -- 點線 -.

MiniUI快速入門教程（三）CRUD

CRUD包括：查詢、編輯、新增、刪除等資料操作。效果圖如下：一：建立DataGrid 首先，我們建立一個數據表格： <div id="datagrid1" class="mini-datagrid" style="width:800px;height:280px;" url="../da

mui初級入門教程（三）— html5+ XMLHttpRequest 與mui ajax用法詳解

文章來源：小青年原創釋出時間：2016-05-29 關鍵詞：mui,html5+,XMLHttpRequest,ajax，懶載入寫在前面這是這個系列的的第三篇文章，前面的文章在多個地方（本人github部落格、dcloud ask社群

WebMagic爬蟲入門教程（三）爬取汽車之家的例項-品牌車系車型結構等

本文使用WebMagic爬取汽車之家的品牌車系車型結構價格能源產地國別等；java程式碼備註，只是根據url變化爬取的，沒有使用爬取script頁面具體的資料，也有反爬機制，知識簡單爬取html標籤爬取的網頁：需要配置pom.xml <!-

cocos creator主程入門教程（三）—— 資源管理

五邑隱俠，本名關健昌，10年遊戲生涯，現隱居五邑。本系列文章以TypeScript為介紹語言。在初識篇，我介紹過怎樣載入prefab。cocos提供了一系列的載入介面，包括cc.loader.load，cc.loader.loadRes，cc.loader.loadArray，cc.loa

Laravel 系列入門教程（三）【最適合中國人的 Laravel 教程】

在本篇文章中，我們將嘗試構建一個帶後臺的簡單部落格系統。我們將會使用到路由、MVC、Eloquent ORM 和 blade 檢視系統。簡單部落格系統規劃我們在教程一中已經新建了一個繼承自 Eloquent Model 類的 Article 類，使用 migration 建立了資料表並使用 seed

OHSCE入門教程（三）-PHP串列埠通訊、構建高可靠性的匯流排應用。

（寫於OHSCE_V0.1.25）終於等到這篇文章了吧，其實之所以先寫了TCP/UDP的是因為在現在的環境下它倆是相輔相成的，其實在控制領域我們所說的TCP/UDP和串列埠匯流排應用非常接近，和普通的網際網路網路應用還是有著很大區別的，畢竟絕大部分網路控制產品都是從匯流排控制產品升級而來或沿襲了可靠

OpenMP入門教程（三）

Directives

Clause

Run-time Library Routines

Environment Variables

相關推薦