ArrayFire---向量化陣列(2)

阿新 • • 發佈：2020-07-12

　　在程式設計中我們經常會合並某個矩陣，通常我們會使用迴圈來實現，然而迴圈有時候會降低程式執行的效率，

所以利用ArrayFire中的向量的平坦模式，我們可以利用空間來換取時間。主要的思路是：

　　1.我們將m*n的矩陣展開成一個1*(m*n)或者(m*n)*1的向量；

　　2.同理我們將p*q的矩陣展開成一個1*(p*q)或者(p*q)*1的向量；

　　3.我們再次定義一個向量x=((p*q):(m*n))或x=((m*n):(p*q))將上述兩個向量合併到一起；

　　4.現在我得到了一個一維的目標向量，現在我們要將這個目標向量拆開成a*b的目標矩陣，具體的做法是

再次定義一個f(a*b)的目標矩陣，將x向量的賦值給目標矩陣就可以實現了。

　　這樣我們就不用使用迴圈來實現了，利用向量化的思路實現了空間換取時間。

程式碼如下：

#include "cuda_runtime.h"
#include "device_launch_parameters.h"

#include <stdio.h>
#include<arrayfire.h>
#include<iostream>


using namespace af;

int main(void) {

    float h_a[] = { 0,1,2,3,4,5 };
    float h_b[] = { 1,4,5,7 };
     
float h_c[] = { 6,7,8,9,10,11 };
    float h_d[] = { 2,4,6,8,10,12,14,16,18 };
    float dt = 1.0f;

    array d_b(3, 2, h_a); //'
    array d_d(2, 2, h_b);
    array d_c(2, 3, h_c); //'
    array d_a(3, 3, h_d);
    array d_R;

    



    //merge array_1
    array d_f = af::join(0, af::flat((d_a)), af::flat((d_b)));
     
float *yptr = d_f.device<float>();

    array d1_order(3, 5, yptr);
    //d_order = transpose(d_order);

    //merge array_2
    array d_g = af::join(0, af::flat((d_c)), af::flat((d_d)));
    float *gptr = d_g.device<float>();

    array d2_order(2, 5, gptr);

    //merge array_3
    array d_k = af::join(0, af::flat(transpose(d1_order)), af::flat(transpose(d2_order)));
    float *kptr = d_k.device<float>();

    array d_order(5, 5, kptr);
    d_order = transpose(d_order);

    af_print(d1_order);
    af_print(d2_order);
    af_print((d_order));

    
    

    return 0;
}

merge

在vs2017上執行如下：

ArrayFire---向量化陣列(2)

　　在程式設計中我們經常會合並某個矩陣，通常我們會使用迴圈來實現，然而迴圈有時候會降低程式執行的效率，

Eigen 向量化加速，對其導致崩潰問題 2. 原因分析

部落格轉自：從Eigen向量化談記憶體對齊 Eigen是一個非常常用的矩陣運算庫，至少對於SLAM的研究者來說不可或缺。然而，有時候會由於Eigen向量化的記憶體對齊問題使程式執行異常。

Luogu P3368 【模板】樹狀陣列 2

思路樹狀陣列2這道相當於是用樹狀陣列來實現線段樹的一部分功能（所以也可以用線段樹來寫），具體實現方法就是在樹狀陣列上套一個差分。這看起來很簡單，但是我們應該怎麼做，而且又為什麼要這麼做呢？

文字挖掘預處理之分詞 / 向量化 / TF-IDF / Hash trick 附程式碼 Demo

分詞(tokenizing) 對於一個句子，首先需要將其分為多個單詞或多個片語。例如， “I come from New York" => "I/come from/New York"

javascript-陣列2

一，建立陣列的兩種方式： 1.利用陣列自變數。 var arr=[1,2,3]; console.log(arr[0]); 2.（建構函式）利用new Array()。

股市技術面操作的量化交易--量化交易2-投資方法

行業輪動發展理論根據產業鏈進行股市的劃分，在上中下游進行利潤和週期的排序，並根據發展規律，相關性排序，進行行業選擇。

陣列2與推箱子·遊戲

陣列2==推箱子 include<conio.h>===>getch()//獲取鍵盤上的輸入氣泡排序：給陣列排序

C語言練習2.1 之陣列2

技術標籤：XD# C語言學習作業c語言 C語言練習2.1 之陣列2 目錄排序2馬鞍點查詢Z字形掃描中間數楊輝三角字串壓縮字元統計

leetcode 81搜尋旋轉排序陣列2 C++

技術標籤：leetcode刷題記錄c++leetcode 利用二分查詢 1.左半部分增序，target在左邊則進行二分查詢。

python-量化交易-2-pandas資料讀取

技術標籤：量化交易python 讀取資料到一個數據框架中，dataframe = pd.read_csv(file_path,index_col = [‘交易日期’],error_bad_lines = False)

向量量化的C語言實現_numba從入門到精通（5）—強大的向量化vectorize和guvectorize...

技術標籤：向量量化的C語言實現（jit和vectorize的引數總結在第6章裡會寫）在機器學習的程式設計過程中，經常會涉及到很多複雜的迴圈，往往程式中最消耗時間的也是這部分程式碼，好在後來提出了向量化的概念

codeup陣列2--逆序

技術標籤：codeupc語言演算法將一個長度為10的整型陣列中的值按逆序重新存放。如：原來的順序為1,2,3,4,5,6,7,8,9,0，要求改為0,9,8,7,6,5,4,3,2,1

假期java自學-----陣列2

今天對java語言中陣列部分進行了深入學習： Java中定義陣列的語法有兩種：typearrayName[];type[]arrayName;type為Java中的任意資料型別，包括基本型別和組合型別，arrayName為陣列名，必須是一個合法的識別符號，[

向量化、Python 中的廣播、python _ numpy 向量的說明

1向量化向量化是非常基礎的去除程式碼中 for 迴圈的藝術，減少執行時間，在python中使用np.dot()進行向量化。

這就是TDSQL的向量化執行引擎？有效降低函式呼叫開銷，提升CPU利用率

在“國產資料庫硬核技術沙龍-TDSQL-A技術揭祕”系列分享中，5位騰訊雲技術大咖分別從整體技術架構、列式儲存及相關執行優化、叢集資料互動匯流排、Fragment執行框架/查詢分片策略/子查詢框架以及向量化執行引擎等多

高階程式設計--編寫有效的程式碼（有效的資料輸入、向量化、並行化）

高階程式設計--編寫有效的程式碼在程式設計師中間流傳著一句話：“優秀的程式設計師是花一個小時來除錯程式碼而使得它的運算速度提高一秒的人。”R是一種鮮活的語言，大多數使用者不用擔心寫不出高效的程式碼。作為

CSUST 遞增陣列2 題解(思維+分段考慮)

題目連結題目思路這個題目其實就是本來就是嚴格單調上升的,這是關鍵條件那麼對於\\(a[i]=a[i]-i\\)，題目轉化為是否有\\(a[i]\\)為\\(0\\)

黑鯊 4S 預熱：雙磁碟陣列 2.0 加持，UFS 和 SSD 寫入雙加速

10 月 11 日訊息黑鯊 4S 系列手機將於 10 月 13 日 15:00 正式釋出，今日黑鯊方面繼續為該機預熱。據悉，該機搭載最新的高通驍龍 888 Plus 旗艦處理器，擁有雙磁碟陣列 2.0 設計，支援 UFS 和 SSD 寫入雙加速，讀寫

Branch 向量化

Branch 向量化問題發現定位昨天晚上小夥伴告訴我有一個case的效能不太理想，讓我看看

陣列2

concat()、join()、reverse()、sort() <!-- * @Author: your TM_cc * @Date: 2021-10-28 21:37:01 * @LastEditTime: 2021-10-29 11:54:35

ArrayFire---向量化陣列(2)

相關推薦