適用於CUDA GPU的Numba 隨機數生成

阿新 • • 發佈：2020-12-26

隨機數生成

Numba提供了可以在GPU上執行的隨機數生成演算法。由於NVIDIA如何實現cuRAND的技術問題，Numba的GPU隨機數生成器並非基於cuRAND。相反，Numba的GPU RNG是xoroshiro128 +演算法的實現。xoroshiro128 +演算法的週期為2**128-1，比cuRAND中預設使用的XORWOW演算法的週期短，但是xoroshiro128 +演算法仍然通過了隨機數發生器質量的BigCrush測試。

在GPU上使用任何RNG時，重要的是要確保每個執行緒都有其自己的RNG狀態，並且它們已初始化為產生不重疊的序列。numba.cuda.random模組提供了執行此操作的主機功能，以及提供統一或正態分佈的隨機數的CUDA裝置功能。

注意

Numba (like cuRAND) uses the Box-Muller transform <https://en.wikipedia.org/wiki/Box%E2%80%93Muller_transform>從統一生成器生成正態分佈的隨機數。但是，Box-Muller生成隨機數對，當前實現只返回其中之一。結果，生成正態分佈的值是均勻分佈的值的速度的一半。

numba.cuda.random.create_xoroshiro128p_states(n, seed, subsequence_start=0, stream=0)

返回為n個隨機數生成器初始化的新裝置陣列。

這將初始化RNG狀態，以便陣列中的每個狀態與主序列中彼此分開2 ** 64步的子序列相對應。因此，只要沒有CUDA執行緒請求超過2 ** 64個隨機數，就可以保證此函式產生的所有RNG狀態都是獨立的。

subsequence_start引數可用於將第一個RNG狀態提前2 ** 64步的倍數。

引數：

n（int）–要建立的RNG狀態數
seed（uint64）–生成器列表的起始種子
subsequence_start（uint64）–
Stream（CUDA流）–在其上執行初始化核心的流

numba.cuda.random.init_xoroshiro128p_states(states, seed, subsequence_start=0, stream=0)

在GPU上為並行生成器初始化RNG狀態。

subsequence_start引數可用於將第一個RNG狀態提前2 ** 64步的倍數。

引數：

states (1D DeviceNDArray, dtype=xoroshiro128p_dtype)– RNG狀態陣列
seed（uint64）–生成器列表的起始種子

numba.cuda.random.xoroshiro128p_uniform_float32

返回範圍為[0.0，1.0）的float32並前進states[index]。

引數：	states (1D DeviceNDArray, dtype=xoroshiro128p_dtype)– RNG狀態陣列 index（int64）–要更新的狀態的偏移量
返回型別：	float32

numba.cuda.random.xoroshiro128p_uniform_float64

返回範圍為[0.0，1.0）的float64並前進states[index]。

引數：	狀態states (1D array, dtype=xoroshiro128p_dtype)– RNG狀態陣列 index（int64）–要更新的狀態的偏移量
返回型別：	float64

numba.cuda.random.xoroshiro128p_normal_float32

返回正態分佈的float32並前進states[index]。

使用Box-Muller變換從平均值= 0和sigma = 1的高斯中得出返回值。這使RNG序列前進了兩個步驟。

引數：	states (1D array, dtype=xoroshiro128p_dtype)– RNG狀態陣列 index（int64）–要更新的狀態的偏移量
返回型別：	float32

numba.cuda.random.xoroshiro128p_normal_float64

返回正態分佈的float32並前進states[index]。

使用Box-Muller變換從平均值= 0和sigma = 1的高斯中得出返回值。這使RNG序列前進了兩個步驟。

引數：	狀態states (1D array, dtype=xoroshiro128p_dtype)– RNG狀態陣列 index（int64）–要更新的狀態的偏移量
返回型別：	float64

例

這是使用隨機數生成器的示例程式：

from __future__ import print_function, absolute_import

from numba import cuda

from numba.cuda.random import create_xoroshiro128p_states, xoroshiro128p_uniform_float32

import numpy as np

@cuda.jit

def compute_pi(rng_states, iterations, out):

"""Find the maximum value in values and store in result[0]"""

thread_id = cuda.grid(1)

# Compute pi by drawing random (x, y) points and finding what

# fraction lie inside a unit circle

inside = 0

for i in range(iterations):

x = xoroshiro128p_uniform_float32(rng_states, thread_id)

y = xoroshiro128p_uniform_float32(rng_states, thread_id)

if x**2 + y**2 <= 1.0:

inside += 1

out[thread_id] = 4.0 * inside / iterations

threads_per_block = 64

blocks = 24

rng_states = create_xoroshiro128p_states(threads_per_block * blocks, seed=1)

out = np.zeros(threads_per_block * blocks, dtype=np.float32)

compute_pi[blocks, threads_per_block](rng_states, 10000, out)

print('pi:', out.mean())

適用於CUDA GPU的Numba 隨機數生成

適用於CUDA GPU的Numba 隨機數生成

4位或6位隨機數生成（用於簡訊驗證碼）

Android 模組打包生成aar 適用於4.2.2以上的AS版本

3種適用於Python的瘋狂祕密武器及原因解析

php生成隨機數/生成隨機字串的方法小結【5種方法】

如何判斷win10系統是否適用於Hyper-V虛擬機器

基於animate.css動畫庫的全屏滾動小外掛，適用於vue.js(移動端、pc)專案

適用於 Linux 的 Windows 子系統安裝指南 (Windows 10) （微軟官方文件）

基於 Quill、適用於 Vue 的富文字編輯器，支援服務端渲染和單頁應用

[Dnc.Api.Throttle] 適用於. Net Core WebApi 介面限流框架

隨機數生成程式碼演示

C++ 真隨機數生成方法

Java兩種常用的隨機數生成方式(小白總結)

Scribus是適用於Linux的Art Desktop Publishing工具

適用於ios5的應用_Google推出了適用於Android和iOS的專用任務應用

matlab stem_評論：適用於STEM孩子的littleBits小工具和Gizmos電子產品套件

現在可以下載適用於Windows 7和Windows Server 2008 R2的Internet Explorer 11穩定版

chromebook刷機_適用於Chromebook和PC的傳統桌上型電腦應用程式的30多種基於Web的替代品...

適用於Linux的最佳終端模擬器

蘋果 watchOS 7.0.3 正式版釋出：修復意外重啟 Bug，僅適用於 Apple Watch Series 3

適用於CUDA GPU的Numba 隨機數生成

相關推薦