xilinx 繫結執行緒到cpu核
Linux系統提供API函式sched_setaffinity和sched_getaffinity用於設定或獲取執行緒的可以使用的CPU核。
int sched_setaffinity(pid_t pid, unsigned int cpusetsize, cpu_set_t *mask);
這個函式中pid表示需要設定或獲取繫結資訊的執行緒id(或程序id),如果為0,表示對當前呼叫的執行緒進行設定;第2個引數cpusetsize一般設定為sizeof(cpu_set_t),用以表示第3個引數指向的記憶體結構物件的大小;第3個引數mask指向型別為cpu_set_t物件的指標,用以設定或獲取指定執行緒可以使用的CPU核列表。Linux提供函式CPU_ZERO、CPU_SET和CPU_ISSET對cpu_set_t型別的物件進行操作,其中CPU_ZERO用於清空cpu_set_t型別物件的內容,CPU_SET用於設定cpu_set_t型別物件,CPU_ISSET用於判斷cpu_set_t型別物件與核對應的位是否被設定。下面通過簡單的程式碼示例來說明這兩個函式的具體用法。
設定執行緒繫結程式碼:
cpu_set_t mask;
int blist[8]={2, 5, 13, 9, 3, 6, 7, 4}; //設定需要繫結的核列表
#pragma omp parallel private(mask)
{
CPU_ZERO(&mask);
CPU_SET(blist[omp_get_thread_num()], &mask); //對每個執行緒設定繫結方案
sched_setaffinity(0,sizeof(cpu_set_t), &mask);
}
該段程式碼將paralle region裡面的8個執行緒依次繫結到核2,5,13,9,3,6,7,4。同樣可以使用sched_getaffinity函式獲取執行緒的能夠使用的核的列表,示例程式碼如下:
int num_processors = sysconf(_SC_NPROCESSORS_CONF); //獲取當前節點核的數目
cpu_set_t get;
int i = 0;
CPU_ZERO(&get);
sched_getaffinity(0, sizeof(cpu_set_t), &get); //獲取當前呼叫執行緒的可以使用的核
for(i = 0; i < num_processors; i++)
{
if(CPU_ISSET(i, &get))
{
printf(“The current thread %d bound to core %d\n“, omp_get_thread_num(), i);
}
}
下面是一個完整的例子
檔案bind.c
#include<stdlib.h>
#include<stdio.h>
#include<sys/types.h>
#include<sys/sysinfo.h>
#include<unistd.h>
#define __USE_GNU
#include<sched.h>
#include<ctype.h>
#include<string.h>
#include<pthread.h>
#define THREAD_MAX_NUM 100 //1個CPU內的最多程序數
int num=0; //cpu中核數
void* threadFun(void* arg) //arg 傳遞執行緒標號(自己定義)
{
cpu_set_t mask; //CPU核的集合
cpu_set_t get; //獲取在集合中的CPU
int *a = (int *)arg;
printf("the a is:%d\n",*a); //顯示是第幾個執行緒
CPU_ZERO(&mask); //置空
CPU_SET(*a,&mask); //設定親和力值
if (sched_setaffinity(0, sizeof(mask), &mask) == -1)//設定執行緒CPU親和力
{
printf("warning: could not set CPU affinity, continuing...\n");
}
while (1)
{
CPU_ZERO(&get);
if (sched_getaffinity(0, sizeof(get), &get) == -1)//獲取執行緒CPU親和力
{
printf("warning: cound not get thread affinity, continuing...\n");
}
int i;
for (i = 0; i < num; i++)
{
if (CPU_ISSET(i, &get))//判斷執行緒與哪個CPU有親和力
{
printf("this thread %d is running processor : %d\n", i,i);
}
}
}
return NULL;
}
int main(int argc, char* argv[])
{
num = sysconf(_SC_NPROCESSORS_CONF); //獲取核數
pthread_t thread[THREAD_MAX_NUM];
printf("system has %i processor(s). \n", num);
int tid[THREAD_MAX_NUM];
int i;
for(i=0;i<num;i++)
{
tid[i] = i; //每個執行緒必須有個tid[i]
pthread_create(&thread[0],NULL,threadFun,(void*)&tid[i]);
}
for(i=0; i< num; i++)
{
pthread_join(thread[i],NULL);//等待所有的執行緒結束,執行緒為死迴圈所以CTRL+C結束
}
return 0;
}
編譯命令:gcc bind.c -o bind -lpthread
執行:./bind
輸出結果:略
特別注意:
#define __USE_GNU不要寫成#define _USE_GNU
#include<pthread.h>必須寫在#define __USE_GNU之後,否則編譯會報錯
檢視你的執行緒情況可以在執行時在另一個視窗使用top -H來檢視執行緒的情況,檢視各個核上的情況請使用top命令然後按數字“1”來檢視。
備註:
我使用的時xilinx環境
我是用的是#define _GNU_SOURCE 也可以
RM7 不繫結時執行緒會繫結到兩個核中 , 繫結後只在繫結的核中,
如果只繫結一個核, 效率更低??
編譯之後執行程式,輸入命令top -p 程序id,輸入f,輸入j,輸入回車,可以看到程序在cpu之間不停切換。