1. 程式人生 > >50倍時空算力提升,阿裏雲RDS PostgreSQL GPU版本上線

50倍時空算力提升,阿裏雲RDS PostgreSQL GPU版本上線

阿裏 http 技術分享 技術 art 顯卡 因數 公有雲 雲盤

2019年3月19日,阿裏雲RDS PostgreSQL數據庫GPU規格版本正式上線,開啟了RDS異構計算並行加速之路。該版本在RDS(關系型數據庫服務)的雲基礎設施層面首次完成了與阿裏雲異構計算產品的適配,實現了PostgreSQL時空引擎Ganos在空間圖形圖像處理上的並行計算加速,成為國內第一個將GPU應用於商業空間信息領域的數據庫。

  1. GPU並行計算

GPU(Graphic Processing Unit)是一種高並行架構圖形處理器,其最突出的特點就是計算核心多,相比傳統CPU四個、八個等計算核心, GPU的計算核心可以多達到幾千個,加上數據高速緩存和流控制,這樣的結構非常適合對計算密集型且易於並行處理的數據進行計算加速。GPU最初是被設計用來專門處理並行圖形計算問題的,近年來,隨著GPU在人工智能和高性能計算領域應用越來越多,GPU已經成了更強大且更廣義的處理器代名詞。

技術分享圖片
伴隨該版本的發布,RDS在雲基礎設施層面首次完成了GPU計算框架的適配,為雲上數據庫構建異構計算並行環境建立了重要基礎。由於空間圖形圖像數據體量大、計算復雜,首期GPU加速能力主要與阿裏雲數據庫時空引擎 Ganos結合,大幅提升空間數據處理性能。PostgreSQL時空引擎 Ganos為一種雲數據庫增值服務,為各類時空數據提供雲上的高效存儲、查詢和分析計算服務。

系統提供了CPU與GPU異構計算框架,能自動檢測GPU環境,並建立基於規則的優化方法選擇評估CPU計算、GPU計算或混合計算,用戶做到無感知。在空間計算方面,建立了GIS空間並行模型(如柵格數據的Raster-Chunk-Cell框架)與CUDA(顯卡廠商NVIDIA推出的運算平臺)並行模型的最佳適配,達到減少GPU任務調度,最大化利用GPU資源的目的。

  1. 典型應用場景

2.1 空間數據加速上雲

空間柵格型數據(遙感影像、高程模型等)分幅數多,體量大,上雲速度慢。通過改良基礎算法提高雲數據庫寫入速度是用戶比較關心的應用場景。以柵格數據的重采樣算法為例,三次卷積采樣以及更高級的重采樣算法成像質量好,但運算量會成倍增加。因此,提升基礎算法的處理效率是加快柵格數據處理應用的關鍵。按輸出10000*10000像素大小的遙感影像數據來計算,需要獨立運行1億次采樣算法,屬於計算密集型操作,且柵格數據呈矩陣模型,可充分利用GPU並行加速能力提高重采樣效率。

技術分享圖片

2.2 影像實時動態投影

在遙感空間應用中,因數據來源或采集方式不同,往往存在坐標系統不一致的情形。當需要疊加統一顯示時,要麽事先轉成同一坐標系,要麽進行實時動態投影。前者會存在數據冗余問題,而後者更為高效,但往往因動態投影計算量大,在CPU環境下往往很難達到實時顯示效果。通過GPU並行計算提升動態投影計算效能可解決這一問題。

技術分享圖片

2.3 移動對象數據處理

隨著互聯網出行、位置感知技術的快速發展,移動對象(飛機、船、車、行人等)產生的數據量越來越多,大量的軌跡數據的接入、更新和顯示,給數據傳輸和存儲帶來很大的挑戰。通過借助GPU並行計算能力,對移動對象的軌跡數據進行實時動態抽稀處理,可達到減少存儲量、快速傳輸顯示的目的。

技術分享圖片

  1. 加速性能評估

經對比測試,以遙感影像三次卷積重采樣純算法加速為例,GPU並行計算較CPU平均提升50倍左右,且隨數據量越大、計算越復雜,提升效果越明顯。從全鏈路角度,當數據存儲在SSD雲盤時,遙感影像入庫(含索引創建)GPU較CPU快9-15倍;當數據存儲在OSS(Object Storage Service,對象存儲服務)時,數據入庫全流程GPU較CPU加速4-7倍。

技術分享圖片

  1. 使用途徑

阿裏雲RDS for PostgreSQL數據庫GPU規格版本已經在公有雲上線,目前僅在華東2(上海)開放。用戶購買時,請選擇PG10基礎版,並在規格欄選擇GPU加速機型,系統已經默認帶有GPU環境。用戶使用時不需要設置任何參數即可體驗GPU加速計算帶來的性能體驗。

50倍時空算力提升,阿裏雲RDS PostgreSQL GPU版本上線