Win10+CUDA10+VS2017 安裝配置教程

阿新 • • 發佈：2019-01-05

本機配置

win10 64bit（版本1809）

i5-7200 U

GTX 940MX

下載並配置

測試Cuda是否安裝成功

①命令列測試

開啟命令提示符，輸入：nvcc -V

出現如下類似資訊即為成功

②編譯測試檔案

C:\ProgramData\NVIDIA Corporation\CUDA Samples\v10.0下找到Samples_vs2017.sln並開啟

編譯：選擇Release x64，右鍵1_Utilities，點選“生成”

③驗證deviceQuery和bandwidthTest

開啟命令提示符：定位到 c:\ProgramData\NVIDIA Corporation\CUDA Samples\v10.0\bin\win64\Release

分別輸入deviceQuery，bandwidthTest並執行，出現如下類似資訊便說明CUDA安裝成功

配置環境變數

①確認系統變數中：CUDA_PATH和CUDA_PATH_V10.0已經存在

②我們還需要在環境變數中新增如下幾個變數：
CUDA_SDK_PATH = C:\ProgramData\NVIDIA Corporation\CUDA Samples\v9.0 
CUDA_LIB_PATH = %CUDA_PATH%\lib\x64 
CUDA_BIN_PATH = %CUDA_PATH%\bin 
CUDA_SDK_BIN_PATH = %CUDA_SDK_PATH%\bin\win64 
CUDA_SDK_LIB_PATH = %CUDA_SDK_PATH%\common\lib\x64 
③可在cmd中檢視配置情況（命令：set cuda）

配置VS2017

①新建Visual C++空專案（CUDA_TEST）

②CUDA_TEST右鍵->新增->新建項->選擇CUDA C/C++File，取名CUDA_MAIN

③CUDA_TEST右鍵–>專案依賴項–>自定義生成，選擇CUDA10.0

④CUDA_MAIN.cu右鍵->屬性,在配置屬性–>常規–>項型別–>選擇“CUDA C/C++”

⑤專案配置

1.x64

1.1 包含目錄配置
1.右鍵點選專案屬性–>屬性–>配置屬性–>VC++目錄–>包含目錄
2.新增包含目錄：
$(CUDA_PATH)\include

1.2 庫目錄配置
1.VC++目錄–>庫目錄
2.新增庫目錄：
$(CUDA_PATH)\lib\x64

1.3 依賴項
配置屬性–>連結器–>輸入–>附加依賴項
新增庫檔案：

    cublas.lib
    cuda.lib
    cudadevrt.lib
    cudart.lib
    cudart_static.lib
    nvcuvid.lib
    OpenCL.lib
    cublas.lib

注意：新增nvcuvid.lib庫檔案，編譯時，報找不到該檔案的錯誤。去掉後，程式也能執行

2.x86(win32)

2.1 包含目錄配置

右鍵點選專案屬性–>屬性–>配置屬性–>VC++目錄–>包含目錄
新增包含目錄：
$(CUDA_PATH)\include

2.2 庫目錄配置
1.VC++目錄–>庫目錄
2.新增庫目錄：
$(CUDA_PATH)\lib\Win32

2.3 依賴項
配置屬性–>聯結器–>輸入–>附加依賴項
新增庫檔案：

    cuda.lib 
    cudadevrt.lib 
    cudart.lib 
    cudart_static.lib 
    nvcuvid.lib 
    OpenCL.lib

⑥測試程式，在CUDA_MAIN.cu中貼上以下程式碼：

#include "cuda_runtime.h"  
#include "cublas_v2.h"  

#include <time.h>  
#include <iostream>  

using namespace std;

// 定義測試矩陣的維度  
int const M = 5;
int const N = 10;

int main()
{
	// 定義狀態變數  
	cublasStatus_t status;

	// 在 記憶體 中為將要計算的矩陣開闢空間  
	float *h_A = (float*)malloc(N*M * sizeof(float));
	float *h_B = (float*)malloc(N*M * sizeof(float));

	// 在 記憶體 中為將要存放運算結果的矩陣開闢空間  
	float *h_C = (float*)malloc(M*M * sizeof(float));

	// 為待運算矩陣的元素賦予 0-10 範圍內的隨機數  
	for (int i = 0; i < N*M; i++) {
		h_A[i] = (float)(rand() % 10 + 1);
		h_B[i] = (float)(rand() % 10 + 1);

	}

	// 列印待測試的矩陣  
	cout << "矩陣 A :" << endl;
	for (int i = 0; i < N*M; i++) {
		cout << h_A[i] << " ";
		if ((i + 1) % N == 0) cout << endl;
	}
	cout << endl;
	cout << "矩陣 B :" << endl;
	for (int i = 0; i < N*M; i++) {
		cout << h_B[i] << " ";
		if ((i + 1) % M == 0) cout << endl;
	}
	cout << endl;

	/*
	** GPU 計算矩陣相乘
	*/

	// 建立並初始化 CUBLAS 庫物件  
	cublasHandle_t handle;
	status = cublasCreate(&handle);

	if (status != CUBLAS_STATUS_SUCCESS)
	{
		if (status == CUBLAS_STATUS_NOT_INITIALIZED) {
			cout << "CUBLAS 物件例項化出錯" << endl;
		}
		getchar();
		return EXIT_FAILURE;
	}

	float *d_A, *d_B, *d_C;
	// 在 視訊記憶體 中為將要計算的矩陣開闢空間  
	cudaMalloc(
		(void**)&d_A,    // 指向開闢的空間的指標  
		N*M * sizeof(float)    //　需要開闢空間的位元組數  
	);
	cudaMalloc(
		(void**)&d_B,
		N*M * sizeof(float)
	);

	// 在 視訊記憶體 中為將要存放運算結果的矩陣開闢空間  
	cudaMalloc(
		(void**)&d_C,
		M*M * sizeof(float)
	);

	// 將矩陣資料傳遞進 視訊記憶體 中已經開闢好了的空間  
	cublasSetVector(
		N*M,    // 要存入視訊記憶體的元素個數  
		sizeof(float),    // 每個元素大小  
		h_A,    // 主機端起始地址  
		1,    // 連續元素之間的儲存間隔  
		d_A,    // GPU 端起始地址  
		1    // 連續元素之間的儲存間隔  
	);
	cublasSetVector(
		N*M,
		sizeof(float),
		h_B,
		1,
		d_B,
		1
	);

	// 同步函式  
	cudaThreadSynchronize();

	// 傳遞進矩陣相乘函式中的引數，具體含義請參考函式手冊。  
	float a = 1; float b = 0;
	// 矩陣相乘。該函式必然將陣列解析成列優先陣列  
	cublasSgemm(
		handle,    // blas 庫物件   
		CUBLAS_OP_T,    // 矩陣 A 屬性引數  
		CUBLAS_OP_T,    // 矩陣 B 屬性引數  
		M,    // A, C 的行數   
		M,    // B, C 的列數  
		N,    // A 的列數和 B 的行數  
		&a,    // 運算式的 α 值  
		d_A,    // A 在視訊記憶體中的地址  
		N,    // lda  
		d_B,    // B 在視訊記憶體中的地址  
		M,    // ldb  
		&b,    // 運算式的 β 值  
		d_C,    // C 在視訊記憶體中的地址(結果矩陣)  
		M    // ldc  
	);

	// 同步函式  
	cudaThreadSynchronize();

	// 從 視訊記憶體 中取出運算結果至 記憶體中去  
	cublasGetVector(
		M*M,    //  要取出元素的個數  
		sizeof(float),    // 每個元素大小  
		d_C,    // GPU 端起始地址  
		1,    // 連續元素之間的儲存間隔  
		h_C,    // 主機端起始地址  
		1    // 連續元素之間的儲存間隔  
	);

	// 列印運算結果  
	cout << "計算結果的轉置 ( (A*B)的轉置 )：" << endl;

	for (int i = 0; i < M*M; i++) {
		cout << h_C[i] << " ";
		if ((i + 1) % M == 0) cout << endl;
	}

	// 清理掉使用過的記憶體  
	free(h_A);
	free(h_B);
	free(h_C);
	cudaFree(d_A);
	cudaFree(d_B);
	cudaFree(d_C);

	// 釋放 CUBLAS 庫物件  
	cublasDestroy(handle);

	getchar();

	return 0;
}

⑦編譯執行

遇到的問題

①最新的VS2017在編譯過程中可能產生類似於“找不到Windows SDK”字樣的錯誤

解決方法：只需要按照它的提示更改為可用版本的SDK即可。

②驗證deviceQuery報錯："CUDA: cudaDeviceSynchronize return error code 30"

解決方法：重灌NVIDIA顯示卡驅動

參考資料

Win10+CUDA10+VS2017 安裝配置教程

目錄本機配置下載並配置遇到的問題參考資料本機配置 win10 64bit（版本1809） i5-7200 U GTX 940MX 下載並配置測試Cuda是否安裝成功 ①命令列測試開啟命令提示符，輸入：nvcc

【AI】CUDA win10 安裝配置教程

《CUDA win10 安裝配置教程》下載地址：https://developer.nvidia.com/cuda-toolkit-archive，打不開的話重試幾次。

【AI】CUDA+win10-1803安裝配置教程

CUDA安裝配置教程下載CUDA 下載地址：https://developer.nvidia.com/cuda-toolkit-archive 打不開的話重試幾次。官網給出電腦驅動程式和CUDA的

win10+VisualStudio2017+opencv3.4.3安裝配置教程

OpenCV3.4.3下載 vs2017的配置環境變數的設定測試程式碼 1、opencv3.4.3的下載先下載OpenCV3.4.3的win pack 下載連結：https://opencv.org/releases.html 下載完成之後是一個ex

Ubuntu 14.04 64bit下Caffe + Cuda6.5/Cuda7.0 安裝配置教程

-a att html mode .net share surface art cores http://www.embeddedlinux.org.cn/emb-linux/entry-level/201612/21-6005.html 隨著深度學習快速發展的浪潮，許多有

mysql5.7.19 winx64解壓縮版安裝配置教程

port dos 開始 tin pda pat pri ini bold 1、把 mysql-5.7.19-winx64.zip 壓縮文件解壓到 C:\MySQL\ 目錄下；2、在 C:\MySQL\ 目錄下新建 my.ini 配置文件；3、用文本編輯器或其他編輯器打開 m

jmeter安裝配置教程

com 輸入沒有文件 ava 屬性 follow href 設置代理 jmeter安裝配置教程 1、下載Jmeter　　下載地址：http://jmeter.apache.org/download_jmeter.cgi　　目前最新版為3.1，其余文件如源代碼等也

XDebug安裝配置教程

remote AC www blank 進行 settings strong zend helper 筆者的開發環境如下：Windows8.1+Apache+PhpStorm+XDebug+Firefox（XDebug helper 1.4.3插件）。轉載http:/

Linux基礎環境_安裝配置教程（CentOS7.2 64、JDK1.8、Tomcat8）

vmw 統一什麽找不到 root用戶 tro .html 內容 bash Linux基礎環境_安裝配置教程 (CentOS7.2 64、JDK1.8、Tomcat8) 安裝包版本 1) VMawre-workstation版本包地址： https://my

MySQL基礎環境_安裝配置教程（Windows7 64或Centos7.2 64、MySQL5.7）

secure https http cti -s entos 重啟 init data MySQL基礎環境_安裝配置教程(Windows7 64或Centos7.2 64、MySQL5.7) 安裝包版本 1) VMawre-workstation版本包地址：

Windows基礎環境_安裝配置教程（Windows7 64、JDK1.8、Android SDK23.0、TortoiseSVN 1.9.5）

tools 直接 x86_64 ase php JD network not using Windows基礎環境_安裝配置教程（Windows7 64、JDK1.8、Android SDK23.0、TortoiseSVN 1.9.5）安裝包版本 1) JDK版

DKhadoop安裝配置教程與常見問題解決方法

fff failover img src 分享圖片技術分享服務 .com 建議上周分別就DKHadoop的安裝準備工作以及服務器操作系統配置寫了兩篇分享的文章，這是個人第一次嘗試寫一個系統性的分享文章，必然會有很多疏漏的地方，還望見諒吧。今天分享的是DKHadoop安

Oracal數據庫安裝配置教程

ads bit padding 操作系統 hit cells windows code 安裝配置官網註冊賬號登錄 https://www.oracle.com/technetwork/database/enterprise-edition/downloads/oracle

MYSQL免安裝配置教程

fontsize install nts class fcm 設置mysql csdn tle service 第一步：下載下載地址：http://dev.mysql.com/downloads/mysql/ 滾動到下方就能看到了，根據自己的需求下載；我的電腦為6

64位windows10系統下memcache的安裝配置教程

1.安裝Memcached服務，詳細的安裝教程可以參考:菜鳥教程注意：為了安裝順利，所以需要以管理員身份啟動cmd.exe,不然多會報錯：“failed to install service or service already installed”，進入D:\memcached目錄下，執

Centos6.8 Mysql5.6 安裝配置教程(轉)

mysql5 b2c root密碼 yum client centos sta rpm -ivh con 準備Mysql文件：方式一：wget url（mysql下載地址）; 方式二：從官網下載mysql，上傳至centos（小編使用的Nodepad++的NppFT

linux redis最新官方叢集安裝配置教程

Redis叢集介紹 Redis 叢集是一個提供在多個Redis間節點間共享資料的程式集。 Redis叢集並不支援處理多個keys的命令,因為這需要在不同的節點間移動資料,從而達不到像Redis那樣的效能,在高負載的情況下可能會導致不可預料的錯誤. Redis 叢集通過分割槽來提

win10下，安裝配置nodejs環境

第一步：下載nodejs安裝包 https://nodejs.org/en/ 第二步：測試安裝nodejs是否成功開啟命令列工具，輸入以下命令： C:\Users\Administrator>node -v v8.12.0 第三步：環境配置說明：這裡的環境配置主要配置

Spring安裝配置教程

1.Spring簡介 Spring是一個開放原始碼的設計層面框架，他解決的是業務邏輯層和其他各層的鬆耦合問題，因此它將面向介面的程式設計思想貫穿整個系統應用。Spring是於2003 年興起的一個輕量級的Java 開發框架，由Rod Johnson建立。簡單來說，Spring是一個分層的Ja

Vue.js 安裝配置教程

一、首先進入cmd查詢通過命令查詢： http://www.runoob.com/vue2/vue-install.html # 檢視版本 $ npm -v 2.3.0 #升級 npm cnpm install npm -g # 升級或安裝 cnpm npm inst

Win10+CUDA10+VS2017 安裝配置教程

目錄

本機配置

下載並配置

測試Cuda是否安裝成功

配置環境變數

配置VS2017

遇到的問題

參考資料

相關推薦