1. 程式人生 > >OpenCL “速成”衝刺【第一天】

OpenCL “速成”衝刺【第一天】

話說軟體開發從來沒有速成一說,一門語言你學的越快,說明你在別的語言上下個功夫越多,所以這次加了引號,只不過幾周之後可能會有一個公司內部OpenCL的考核,雖然本人不需要考核,不過也正好藉機整理下之前OpenCL的經驗,一方面幫著下別的同事,一方面也給自己留點幹活。這個教程針對有一點C/C++開發經驗的童鞋,如果沒有太多經驗,我建議還是先去學學C語言。

這個是wiki上OpenCL的定義,我感覺想學OpenCL的人應該都已經知道了。

OpenCL (Open Computing Language,開放計算語言) 是一個為異構平臺編寫程式的框架,此異構平臺可由CPUGPU或其他型別的處理器組成。OpenCL由一門用於編寫kernels (在OpenCL裝置上執行的函式)的語言(基於

C99)和一組用於定義並控制平臺的API組成。OpenCL提供了基於任務分割和資料分割的平行計算機制。

第一天,環境,專案,HelloWorld

硬體環境

你需要一臺支援OpenCL的裝置,AMD,Nvidia的顯示卡,Intel的CPU(最好帶核顯),型號不能太老了,3年內的基本沒問題。

本次教程將以Intel的CPU配合AMD的顯示卡為例。

軟體環境

作業系統是windows的,下載安裝AMDAPPSDK for windows,VS2012(老版本也行,我推薦用新的)。

作業系統是linux的,下載安裝AMDAPPSDK for linux,Code::blocks(喜歡VIM的也行,或者說更好)。

下載自己常用的版本控制軟體,和C/C++輔助開發軟體。

PS:OpenCL也就是庫和標頭檔案,各個廠商的SDK也就是OpenCL+Tools+Samples,別的廠商也有相應的SDK,百度“廠商 OpenCL SDK"的關鍵字組合都能找到。

檢測開發環境

安裝好AMDAPPSDK之後,在命令列下執行clinfo命令,將顯示出你支援OpenCL的硬體資訊。

PS:不是AMD的裝置,可以用CPUz,GPUz等軟體查詢是否支援OpenCL。

配置專案

個人認為,既然你已經知道了OpenCL就是庫那麼應該知道怎麼配置專案,否則可能就是不滿足有一點C/C++開發經驗這個前提了。不過為了方便,還是貼出來。

自己去安裝軟體的目錄下找到OpenCL庫檔案的位置(一般是C:\Program Files (x86)\AMD APP),linux直接find -name ”opencl“ 命令就行(一般在/opt/AMDAPP下)。

Visual Studio系列(別用VC6,不解釋)

專案屬性->C++->常規->附加包含目錄,把SDK下邊的include目錄加進去。

專案屬性->連結器->常規->附加庫目錄,把SDK下邊的lib/x86_64(x64)目錄加進去。

專案屬性->連結器->輸入->附加依賴項,輸入opencl.lib

PS: 安裝完SDK,一般會在系統中加入環境變數的,用環境變數配置上邊的路徑更方便,比如$(AMDAPPSDKROOT)include就解決了,這樣換了電腦的話,只要是相同廠商就能通用。

Code::blocks

右鍵專案->Properties...->Project's build options,輸入下邊內容

-I/opt/AMDAPP/include  -L/opt/AMDAPP/lib/x86_64  -lOpenCL 

PS: 其實OpenCL就是配置好標頭檔案和庫檔案,直接貼上到專案中也行,但是不推薦,換個電腦可能就不好使了。

HelloWorld

本人偷懶就用fixstar的程式碼了,建立專案,新建c或者cpp檔案,貼上下列程式碼進去:

#include <stdio.h>
#include <stdlib.h>
#include <CL/cl.h>

#define MEM_SIZE (128)
#define MAX_SOURCE_SIZE (0x100000)

int main()
{
	cl_device_id device_id = NULL;
	cl_context context = NULL;
	cl_command_queue command_queue = NULL;
	cl_mem memobj = NULL;
	cl_program program = NULL;
	cl_kernel kernel = NULL;
	cl_platform_id platform_id = NULL;
	cl_uint ret_num_devices;
	cl_uint ret_num_platforms;
	cl_int ret;

	char string[MEM_SIZE];

	FILE *fp;
	char fileName[] = "./main.cl";
	char *source_str;
	size_t source_size;

	/* Load the source code containing the kernel*/
	fp = fopen(fileName, "r");
	if (!fp) {
		fprintf(stderr, "Failed to load kernel.\n");
		exit(1);
	}
	source_str = (char*)malloc(MAX_SOURCE_SIZE);
	source_size = fread(source_str, 1, MAX_SOURCE_SIZE, fp);
	fclose(fp);

	/* Get Platform and Device Info */
	ret = clGetPlatformIDs(1, &platform_id, &ret_num_platforms);
	ret = clGetDeviceIDs(platform_id, CL_DEVICE_TYPE_DEFAULT, 1, &device_id, &ret_num_devices);

	/* Create OpenCL context */
	context = clCreateContext(NULL, 1, &device_id, NULL, NULL, &ret);

	/* Create Command Queue */
	command_queue = clCreateCommandQueue(context, device_id, 0, &ret);

	/* Create Memory Buffer */
	memobj = clCreateBuffer(context, CL_MEM_READ_WRITE,MEM_SIZE * sizeof(char), NULL, &ret);
	/* Create Kernel Program from the source */
	program = clCreateProgramWithSource(context, 1, (const char **)&source_str,(const size_t *)&source_size, &ret);

	/* Build Kernel Program */
	ret = clBuildProgram(program, 1, &device_id, NULL, NULL, NULL);

	/* Create OpenCL Kernel */
	kernel = clCreateKernel(program, "hello", &ret);

	/* Set OpenCL Kernel Parameters */
	ret = clSetKernelArg(kernel, 0, sizeof(cl_mem), (void *)&memobj);

	/* Execute OpenCL Kernel */
	ret = clEnqueueTask(command_queue, kernel, 0, NULL,NULL);

	/* Copy results from the memory buffer */
	ret = clEnqueueReadBuffer(command_queue, memobj, CL_TRUE, 0,
		MEM_SIZE * sizeof(char),string, 0, NULL, NULL);

	/* Display Result */
	puts(string);

	/* Finalization */
	ret = clFlush(command_queue);
	ret = clFinish(command_queue);
	ret = clReleaseKernel(kernel);
	ret = clReleaseProgram(program);
	ret = clReleaseMemObject(memobj);
	ret = clReleaseCommandQueue(command_queue);
	ret = clReleaseContext(context);

	free(source_str);

	getchar();
	return 0;

}

新建檔案,字尾改成.cl,貼上下列程式碼進去:
__kernel void hello(__global char* string)
{
    string[0] = 'H';
    string[1] = 'e';
    string[2] = 'l';
    string[3] = 'l';
    string[4] = 'o';
    string[5] = ',';
    string[6] = ' ';
    string[7] = 'W';
    string[8] = 'o';
    string[9] = 'r';
    string[10] = 'l';
    string[11] = 'd';
    string[12] = '!';
    string[13] = '\0';
}

編譯執行檔案。

第一天的內容就是這些,明天將講解上邊的程式碼和OpenCL的組織結構。

作業:閱讀上邊的程式碼,解釋各個API的含義,寫上中文註釋(最好別直接翻譯),將程式碼上傳到自己的版本管理工具上。