1. 程式人生 > >xilinx 繫結執行緒到cpu核

xilinx 繫結執行緒到cpu核

Linux系統提供API函式sched_setaffinity和sched_getaffinity用於設定或獲取執行緒的可以使用的CPU核。

int sched_setaffinity(pid_t pid, unsigned int cpusetsize, cpu_set_t *mask);

這個函式中pid表示需要設定或獲取繫結資訊的執行緒id(或程序id),如果為0,表示對當前呼叫的執行緒進行設定;第2個引數cpusetsize一般設定為sizeof(cpu_set_t),用以表示第3個引數指向的記憶體結構物件的大小;第3個引數mask指向型別為cpu_set_t物件的指標,用以設定或獲取指定執行緒可以使用的CPU核列表。Linux提供函式CPU_ZERO、CPU_SET和CPU_ISSET對cpu_set_t型別的物件進行操作,其中CPU_ZERO用於清空cpu_set_t型別物件的內容,CPU_SET用於設定cpu_set_t型別物件,CPU_ISSET用於判斷cpu_set_t型別物件與核對應的位是否被設定。下面通過簡單的程式碼示例來說明這兩個函式的具體用法。

設定執行緒繫結程式碼:

cpu_set_t mask;

int blist[8]={2, 5, 13, 9, 3, 6, 7, 4}; //設定需要繫結的核列表

#pragma omp parallel private(mask)

{

         CPU_ZERO(&mask);

         CPU_SET(blist[omp_get_thread_num()], &mask); //對每個執行緒設定繫結方案

         sched_setaffinity(0,sizeof(cpu_set_t), &mask);

}

該段程式碼將paralle region裡面的8個執行緒依次繫結到核2,5,13,9,3,6,7,4。同樣可以使用sched_getaffinity函式獲取執行緒的能夠使用的核的列表,示例程式碼如下:

int num_processors = sysconf(_SC_NPROCESSORS_CONF); //獲取當前節點核的數目

cpu_set_t get;

int i = 0;

CPU_ZERO(&get);

sched_getaffinity(0, sizeof(cpu_set_t), &get); //獲取當前呼叫執行緒的可以使用的核

for(i = 0; i < num_processors; i++)

{

         if(CPU_ISSET(i, &get))

         {

                   printf(“The current thread %d bound to core %d\n“, omp_get_thread_num(), i);

         }

}

下面是一個完整的例子

檔案bind.c

#include<stdlib.h>

#include<stdio.h>

#include<sys/types.h>

#include<sys/sysinfo.h>

#include<unistd.h>

#define __USE_GNU

#include<sched.h>

#include<ctype.h>

#include<string.h>

#include<pthread.h>

#define THREAD_MAX_NUM 100  //1個CPU內的最多程序數

int num=0;  //cpu中核數

void* threadFun(void* arg)  //arg  傳遞執行緒標號(自己定義)

{

         cpu_set_t mask;  //CPU核的集合

         cpu_set_t get;   //獲取在集合中的CPU

         int *a = (int *)arg; 

         printf("the a is:%d\n",*a);  //顯示是第幾個執行緒

         CPU_ZERO(&mask);    //置空

         CPU_SET(*a,&mask);   //設定親和力值

         if (sched_setaffinity(0, sizeof(mask), &mask) == -1)//設定執行緒CPU親和力

         {

                   printf("warning: could not set CPU affinity, continuing...\n");

         }

         while (1)

         {

                   CPU_ZERO(&get);

                   if (sched_getaffinity(0, sizeof(get), &get) == -1)//獲取執行緒CPU親和力

                   {

                            printf("warning: cound not get thread affinity, continuing...\n");

                   }

                   int i;

                   for (i = 0; i < num; i++)

                   {

                            if (CPU_ISSET(i, &get))//判斷執行緒與哪個CPU有親和力

                            {

                                     printf("this thread %d is running processor : %d\n", i,i);

                            }

                   }

         }

         return NULL;

}

int main(int argc, char* argv[])

{

         num = sysconf(_SC_NPROCESSORS_CONF);  //獲取核數

         pthread_t thread[THREAD_MAX_NUM];

         printf("system has %i processor(s). \n", num);

         int tid[THREAD_MAX_NUM];

         int i;

         for(i=0;i<num;i++)

         {

                   tid[i] = i;  //每個執行緒必須有個tid[i]

                   pthread_create(&thread[0],NULL,threadFun,(void*)&tid[i]);

         }

         for(i=0; i< num; i++)

         {

                   pthread_join(thread[i],NULL);//等待所有的執行緒結束,執行緒為死迴圈所以CTRL+C結束

         }

         return 0;

}

編譯命令:gcc bind.c -o bind -lpthread

執行:./bind

輸出結果:略

特別注意:

#define __USE_GNU不要寫成#define _USE_GNU 

#include<pthread.h>必須寫在#define __USE_GNU之後,否則編譯會報錯

檢視你的執行緒情況可以在執行時在另一個視窗使用top -H來檢視執行緒的情況,檢視各個核上的情況請使用top命令然後按數字“1”來檢視。

備註:

我使用的時xilinx環境

我是用的是#define _GNU_SOURCE 也可以

RM7 不繫結時執行緒會繫結到兩個核中 , 繫結後只在繫結的核中, 

如果只繫結一個核, 效率更低??

編譯之後執行程式,輸入命令top -p 程序id,輸入f,輸入j,輸入回車,可以看到程序在cpu之間不停切換。