xmake新增對Cuda程式碼編譯支援

阿新 • • 發佈：2018-12-30

最近研究了下NVIDIA Cuda Toolkit的編譯環境，並且在xmake 2.1.10開發版中，新增了對cuda編譯環境的支援，可以直接編譯*.cu程式碼。

下載安裝好Cuda SDK後，在macosx上回預設安裝到/Developer/NVIDIA/CUDA-x.x目錄下，Windows上可以通過CUDA_PATH的環境變數找到對應的SDK目錄，而
Linux下預設會安裝到/usr/local/cuda目錄下。

xmake在執行$ xmake 命令編譯*.cu程式碼的時候，會嘗試探測這些預設的安裝目錄，然後嘗試呼叫nvcc編譯器直接編譯cuda程式，大部分情況下只需要執行：

$ xmake

建立和編譯Cuda工程

我之前編譯之前，我們可以通過xmake建立一個空的cuda工程，例如：

$ xmake create -l cuda test
$ cd test
$ xmake

通過-l引數指定建立一個cuda程式碼工程，工程名為test，執行輸出如下：

[00%]: ccache compiling.release src/main.cu
[100%]: linking.release test

我們也可以嘗試直接執行這個cuda程式：

$ xmake run

接著我們來看下，這個cuda工程的xmake.lua檔案：

-- define target 

target("test")

    -- set kind
    set_kind("binary")

    -- add include directories
    add_includedirs("inc")

    -- add files
    add_files("src/*.cu")

    -- generate SASS code for each SM architecture
    for _, sm in ipairs({"30", "35", "37", "50", "52", "60", "61", "70"}) do
        add_cuflags("-gencode arch=compute_" 
 .. sm .. ",code=sm_" .. sm)
        add_ldflags("-gencode arch=compute_" .. sm .. ",code=sm_" .. sm)
    end

    -- generate PTX code from the highest SM architecture to guarantee forward-compatibility
    sm = "70"
    add_cuflags("-gencode arch=compute_" .. sm .. ",code=compute_" .. sm)
    add_ldflags("-gencode arch=compute_" .. sm .. ",code=compute_" .. sm)

裡面大部分跟C/C++的工程描述類似，唯一的區別就是通過add_cuflags設定了一些cuda程式碼特有的編譯選項，這部分配置根據使用者的需求，可自己調整。

關於add_cuflags的更多說明，可閱讀xmake的官方文件。

Cuda編譯環境的配置

預設情況下，xmake都能成功檢測到系統中安裝的Cuda SDK環境，使用者不需要做額外的配置操作，當然如果遇到檢測不到的情況，使用者也可以手動指定Cuda SDK的路徑：

$ xmake f --cuda_dir=/usr/local/cuda
$ xmake

來告訴xmake，你當前的Cuda SDK的安裝目錄在哪裡。

如果想要測試xmake對當前cuda環境的探測支援，可以直接執行：

$ xmake l detect.sdks.find_cuda_toolchains

{
    linkdirs =
    {
        /Developer/NVIDIA/CUDA-9.1/lib
    }

,   bindir = /Developer/NVIDIA/CUDA-9.1/bin
,   includedirs =
    {
        /Developer/NVIDIA/CUDA-9.1/include
    }

,   cudadir = /Developer/NVIDIA/CUDA-9.1
}

來測試檢測情況，甚至可以幫忙貢獻相關檢測程式碼find_cuda_toolchains.lua來改進xmake的檢測過程。

其他說明

注：目前對cuda的支援剛剛完成，還沒正式發版，更多關於xmake對cuda的支援情況和進展，見：issues #158。

xmake新增對Cuda程式碼編譯支援

最近研究了下NVIDIA Cuda Toolkit的編譯環境，並且在xmake 2.1.10開發版中，新增了對cuda編譯環境的支援，可以直接編譯*.cu程式碼。下載安裝好Cuda SDK後，在macosx上回預設安裝到/Developer/NVIDIA

xmake新增對WDK驅動編譯環境支持

說明 down 插件 level x86 可讀性 ocs 不能根據 xmake v2.2.1新版本現已支持WDK驅動編譯環境，我們可以直接在系統原生cmd終端下，執行xmake進行驅動編譯，甚至配合vscode, sublime text, IDEA等編輯器+xmake插

xmake新增對Qt編譯環境支援

在最新的xmake v2.2.1版本中，新增了對Qt SDK環境的支援，我們完全可以脫離Qt Creater進行Qt應用程式的開發，甚至配合vscode/idea等編輯器+xmake外掛(xmake-vscode, xmake-idea …)，使用者完全可以

MiniDLNA 1.2.1編譯新增對rmvb格式的支援

因為電視為安卓系統，螢幕大，所以看電影時喜歡在TV上看，之前都是PC端通過samba(網路上的芳鄰)來分享視訊，但在TV上觀看時，在多人同時用上網時偶爾會卡頓，體驗不怎麼好。所以就想換個方式來共享視訊，所以就選定DLNA了。 Windows： Windows Med

微軟正在為 Windows 10 新增對 AVIF 影象的支援

據外媒報道，Windows 10 1903 版本是微軟 Windows 10 作業系統的下一個功能更新版本，將支援 AVIF 影象格式。AVIF 或 AV1 影象檔案格式是基於 AV1 的新影象格式，它使用 HEIF 作為容器和 AV1 幀。微軟在 Windows 10

IIS新增對ashx檔案的支援

http://www.cnblogs.com/szytwo/archive/2012/09/04/2670493.html 第一步：每個網站都有個“處理程式對映”，用於新增對各種檔案的處理程式第二步：進入“處理程式對映"，可以看到對各種檔案的處理程式列表，其中就

線上程式設計網站對中文程式碼的支援

參考哪些比較好的線上程式設計網站？, 測試各個網站對中文命名的程式碼的支援, 包括除錯資訊等(見向LeetCode報告編譯資訊中Unicode顯示問題). 有趣的是, 在範圍有限的評測中, 國產的線上程式設計網站似乎對中文命名的程式碼普遍支援更好. 不知開發者是否對這個功能有特別的關注,

MiniDLNA 1.1.4 新增對rmvb格式的支援

因為電視為安卓系統，螢幕大，所以看電影時喜歡在TV上看，之前都是PC端通過samba(網路上的芳鄰)來分享視訊，但在TV上觀看時，在多人同時用上網時偶爾會卡頓，體驗不怎麼好。所以就想換個方式來共享視訊，所以就選定DLNA了。 Windows： Windows Media

【更新】Stimulsoft Reports v2019.3.1釋出，新增對OData v4的支援功能

下載Stimulsoft Report.Ultimate v2019.3.1試用版集所有報表解決方案於一體的綜合性平臺 &

Spring Boot新增對jsp的支援

1、在pom.xml新增如下內容： <dependency> <groupId>org.apache.tomcat.embed</groupId> <artifactId>tomcat-

SpringBoot新增對Log4j2的支援

1、在新增對Log4j2的支援前，需要先把SpringBoot預設使用的Logback日誌框架排除，修改pom.xml檔案： <dependency> <groupId>org.springframework.boot</grou

在QT專案中新增對研華數採模組的支援

一、正確安裝研華數採模組管理程式Advantech Device Manager，並安裝相應模組驅動。二、將C:\Program Files\Advantech\Adsapi路徑（預設安裝位置）下的Include、Lib資料夾複製到QT專案資料夾下。三、在程式碼中新

給Tengine新增模組編譯支援http2協議

1、首先升級openssl包，支援ALPN協議，我使用的是1.0.2o這個版本 https://www.openssl.org/source/ 官網可以下載。 2、安裝openssl，下載tag.gz壓縮包，解壓縮 make & test 測試 make

【無私分享：ASP.NET CORE 專案實戰（第十二章）】新增對SqlServer、MySql、Oracle的支援

目錄索引簡介　　增加對多資料庫的支援，並不是意味著同時對多種資料庫操作，當然，後面，我們會嘗試同時對多種資料庫操作，這可能需要多個上下文，暫且不論。分散式資料庫，我們採用的是阿里雲的Mycat，這個後面會更新出來。我們今天的場景是：我們的專案可能是在windows上開發的使用的

Spring新增對快取的支援

快取可以可以儲存經常使用到的資訊，如果這些資訊儲存在資料庫中，經常對資料庫的讀取會嚴重影響應用的效能，所以將這些資訊儲存在快取中，取出來就可以立即使用。 1、啟用spring對快取的支援 Spring對快取的支援有兩種方式： 1）註解驅動快取 2

使用VS2015新增對ffmpeg新增h265 支援。

最近有人問我hls 是否支援h265，經過一番查詢資料應該是不支援的。但是有人卻不依不饒的問是否vlc 支援hls 支援h265，於是我想測試一番，翻出原來的推流程式碼，把 pCodecOut = avcodec_find_encoder(AV_CODEC_ID_H264

核心新增對jffs2 的支援

海思最新出了一款超低記憶體的晶片HI3518EV201（記憶體只有32M）在開發過程中對核心的裁剪考驗相當大，當然海思也提供了參考的裁剪方案《hi3518ev20x_mini_config.txt》。但是不能完全按照海思提供的裁剪方案來玩，因為該核心不支

Qt官方對OpenSSL的編譯方法的描述

lin openssl hack ons version building nss ssl 編譯 https://wiki.qt.io/MSYS2http://wiki.qt.io/Compiling_OpenSSL_with_MinGWhttps://wiki.qt.io

Linux共享對象之編譯參數fPIC(轉)

性能 recompile 般的全局變量文件 usr 命令說明令行最近在看Linux編程的基礎知識，打算對一些比較有趣的知識做一些匯總備忘，本文圍繞fPIC展開，學習參考見文末。　　在Linux系統中，動態鏈接文件稱為動態共享對象（DSO，Dynamic Shar

es6中新增對象的特性和方法

script 就是 xxx logs 情況 cti 變量應用 div 1. 對象簡寫 //曾經假如是這樣的 var name = ‘xxx‘ var obj = { name : name, say : fun

xmake新增對Cuda程式碼編譯支援

建立和編譯Cuda工程

Cuda編譯環境的配置

其他說明

相關推薦