進行異構計算時,GPU,FPGA,CPU,DSP這些平臺各有什麼特點?如何選擇?
恰好做系統方案時評估過,有些經驗,正好來回答。不過只能簡單說一下,具體資料屬於公司機密。不知題主想做哪類運算。就純粹運算能力來說。
先從最弱的說起
一般來講最弱的是cpu。雖然cpu主頻最高,但是單顆也就8核,16核的樣子,一個核3.5g,16核也就56g,再考慮指令週期,每秒最多也就30g次乘法。還是定點的。
dsp雖然主頻不如cpu,但是勝在乘法器多,隨隨便便帶16個乘法器,還是浮點的。再來個4核,8核,還有特定的演算法硬體加速,所以雖然主頻只有1,2g但是運算能力還是比cpu強。當然現在出現了帶專用乘法器的cpu,dsp也集了arm核,這兩個的界限開始模糊了。
gpu的主頻一般在500mhz左右,但是核多啊,比如titan,有380多個流處理單元,500*400就是200g這個量級,遠大與於前面2者了。
fpga的運算能力的,拿高階的來說。,3000多個固定乘法器,拿數字邏輯還能搭3000個,最快能到接近300mhz, 也就是1800g這個量級。
但是這幾個應用場合不同,cpu雖然運算不行,但是擅長管理和排程,比如讀取資料,管理檔案,人機互動等,例程多,輔助工具也很多。
dsp相比而言管理弱了,運算加強了。這兩者都是靠高主頻來解決運算量的問題,適合有大量遞迴操作以及不便拆分的演算法。
gpu管理更弱,運算更強,但由於是多程序併發,更適合整塊資料進行流處理的演算法
fpga能管理能運算,但是開發週期長,複雜演算法開發難度大。適合流處理演算法,不管是整塊資料進還是一個一個進。還有實時性來說,fpga是最高的。前3種處理器為了避免將運算能力浪費在資料搬運上,一般要求累計一定量資料後才開始計算,產生群延時,而fpga所有操作都並行,因此群延時可以很小
2月份更新
感謝Shu Zhang的指出,引數是不對,我只是使用手頭現有的器件進行評估,並沒有使用高階器件進行估算。而且之前關於功耗,成本,面積,供應情況,以及採購策略等前置約束條件均未提及。不過基本策略應該沒問題的。實際也跑過驗證了。當然這裡面也留餘量了。這裡呈現的是個工程問題的結論
相關推薦
進行異構計算時,GPU,FPGA,CPU,DSP這些平臺各有什麼特點?如何選擇?
恰好做系統方案時評估過,有些經驗,正好來回答。不過只能簡單說一下,具體資料屬於公司機密。不知題主想做哪類運算。就純粹運算能力來說。 先從最弱的說起 一般來講最弱的是cpu。雖然cpu主頻最高,但是單顆也就8核,16核的樣子,一個核3.5g,16核也就56g,再考慮指令週期,每秒最多也就30g次乘法。還是
目前在機器學習領域異構計算得到重視,GPU佔據主流位置,Fpga初現端倪,不知fpga在機器學習的前景如何?
2016 11/7 更新: 加入了伺服器端FPGA與GPU的比較 ===================== 本文原來發布在《矽說》專欄,歡迎關注:)FPGA vs. ASIC,誰將引領移動端人工智慧潮流? - 矽說 silicon talks - 知乎專欄 FPGA vs. ASIC 首先講講FPGA和A
阿里雲異構計算產品,是如何保障雙11業務的?
一年一度的雙11購物狂歡節,是全球商家和消費者的盛會,同時也是一場技術的盛會,人臉識別,圖片搜尋,字元識別,語音識別,8K視訊直播,智慧推薦,語音助手等最先進的技術手段被廣泛使用,為大促的各個環節保駕護航。作為IT基礎設施的基石,阿里雲ECS為阿里集團雙十一業務提供了強有力的計算保障。
CPU+GPU異構計算程式設計簡介
分享一下我老師大神的人工智慧教程!零基礎,通俗易懂!http://blog.csdn.net/jiangjunshow 也歡迎大家轉載本篇文章。分享知識,造福人民,實現我們中華民族偉大復興!  
MySQL中關於金額資料進行運算求和/整數時精度丟失/清空表資料,自增從1開始
關於MySQL的使用總結: 1.金額欄位型別為String時,進行求和運算 2.查詢DECIMAL型別資料小數點後精度缺失丟失為0的小數 3.清空表的資料,id自增從1開始的方法 1.金額欄位型別為String時,進行求和運算 之前
OpenCL的多GPU和多核CPU異構計算--1
原作者:飛鴻驚雪 地址點選開啟連結 本文主要探究OpenCL的GPU和多核CPU的異構計算問題,主要簡要闡述了什麼是OpenCL異構計算,講述CPU和GPU各自的特點,並且把他們結合起來做異構計算的前景。然後具體講述在高效能實驗室Linux工作站上如何搭建多GPU和多核
OpenCL的多GPU和多核CPU異構計算--2
本文主要探究OpenCL的GPU和多核CPU的異構計算問題,主要簡要闡述了什麼是OpenCL異構計算,講述CPU和GPU各自的特點,並且把他們結合起來做異構計算的前景。然後具體講述在高
深入理解 CPU 和異構計算晶片 GPU/FPGA/ASIC
王玉偉,騰訊TEG架構平臺部平臺開發中心基礎研發組,組長為專家工程師Austingao,專注於為資料中心提供高效的異構加速雲解決方案。目前,FPGA已在騰訊海量圖片處理以及檢測領域已規模上線。 隨著網際網路使用者的快速增長,資料體量的急劇膨脹,資料中心對計算的需求也
CPU+GPU異構計算編程簡介
win windows 不能 ado 另一個 基於 旋轉 方式 objects 分享一下我老師大神的人工智能教程吧。零基礎!通俗易懂!風趣幽默!還帶黃段子!希望你也加入到我們人工智能的隊伍中來!http://www.captainbed.net 異構計算(CPU +
阿裏雲異構計算發布:輕量級GPU雲服務器實例VGN5i
比例 原因 com www. log 分享 比較 vid 雲上 阿裏雲發布了國內首個公共雲上的輕量級GPU異構計算產品——VGN5i實例,該實例打破了傳統直通模式的局限,可以提供比單顆物理GPU更細粒度的服務,從而讓客戶以更低成本、更高彈性開展業務。適用於雲遊戲、VR/AR
掃盲人工智能的計算力基石--異構計算
價格 str 分享 動作 隨著 人員 tps 協處理器 加速 摘要: 本文將帶領入門讀者了解CPU,GPU,FPGA,ASIC和異構計算的一些基本概念和優缺點,希望幫助入門者和愛好者建立基本的芯片概念人工智能有三要素:算法,計算力,數據。我們今天主要來講講計算力。計算力歸根
異構計算:軟硬件結合全棧助力AI大爆發
水平 實時 ges follow 要求 構建 col 分布式 合作夥伴 摘要: 2018杭州雲棲大會,異構計算專場精彩回顧 9月20日上午,杭州雲棲小鎮E1-2會場,備受業界關註的2018年杭州雲棲大會異構計算專場召開。 近年來,人工智能持續爆發,對算力提出了更高的要求。異
書籍 opencl異構計算
本書將介紹在複雜環境下的OpenCL和並行程式設計。這裡的複雜環境包含多種裝置架構,比如:多芯 CPU,GPU,以及完全整合的加速處理單元(APU)。 OpenCL 2.0最新的改進: 共享虛擬記憶體(Shared virtual memory)可增強程式設計的靈活性,從而能大幅度減少在資料
異構計算
十歲的小男孩 本文淺顯的講解下X-PU之間的區別,CPU、GPU、TPU、NPU、BPU、DPU。 CPU CPU( Central Processing Unit, 中央處理器)就是機器的“大腦”,也是佈局謀略、發號施令、控制行動的“總司令官”。 CPU的結構主要包括
阿里雲異構計算產品是如何保障雙11業務的
一年一度的雙11購物狂歡節,是全球商家和消費者的盛會,同時也是一場技術的盛會,人臉識別,圖片搜尋,字元識別,語音識別,8K視訊直播,智慧推薦,語音助手等最先進的技術手段被廣泛使用,為大促的各個環節保駕護航。作為IT基礎設施的基石,阿里雲ECS為阿里集團雙十一業務提供了強有力的計算保障。 阿里雲異構計算產品—
阿裏雲異構計算產品是如何保障雙11業務的
提取 在線 理念 彈性 都是 消費者 視頻直播 當前 購物 一年一度的雙11購物狂歡節,是全球商家和消費者的盛會,同時也是一場技術的盛會,人臉識別,圖片搜索,字符識別,語音識別,8K視頻直播,智能推薦,語音助手等最先進的技術手段被廣泛使用,為大促的各個環節保駕護航。作為IT
阿里雲異構計算團隊亮相英偉達2018 GTC大會
1、首屆雲原生計算國際會議上,彈性計算研究員伯瑜介紹了基於虛擬化、容器化編排技術的雲端計算作業系統PouchContainer 首屆雲原生計算國際會議(KubeCon + CloudNativeCon,China,2018)在上海舉辦,彈性計算研究員伯瑜介紹了基於虛擬化、容器化編排技術的雲端計算作業系統Po
異構計算:軟硬體結合全棧助力AI大爆發
摘要: 2018杭州雲棲大會,異構計算專場精彩回顧 9月20日上午,杭州雲棲小鎮E1-2會場,備受業界關注的2018年杭州雲棲大會異構計算專場召開。 近年來,人工智慧持續爆發,對算力提出了更高的要求。異構計算作為大計算時代的解決方案,意在打破傳統通用計算的限制,融合不同指
OpenCL:一種異構計算架構
轉載 王博部落格,https://www.cnblogs.com/wangshide/archive/2012/01/07/2315830.html OpenCL:一種異構計算架構 目錄 1 摘要 2 為什麼需要OpenCL? 3 OpenCL架構
OpenCL異構計算資料收集
Easy OpenCL with Python OpenCL與python聯合工作:與CUDA的前景分析 如果你對python熟,可以用 PyOpenCL, 兼顧 host 端的簡潔與 de