1. 程式人生 > >騰訊雲FPGA的深度學習演算法

騰訊雲FPGA的深度學習演算法

GPU 執行深度學習演算法比 CPU  快很多,但是由於高昂的價格以及超大的功耗對於給其在IDC大規模部署帶來了諸多問題。有人就要問,如果做一個完全為深度學習設計的專用晶片(ASIC),會不會比  GPU  更有效率?事實上,要真的做一塊深度學習專用芯片面臨極大不確定性,首先為了效能必須使用最好的半導體制造工藝,而現在用最新的工藝製造晶片一次性成本就要幾百萬美元。去除資金問題,組織研發隊伍從頭開始設計,完整的設計週期時間往往要到一年以上,但當前深度學習演算法又在不斷的更新,設計的專用晶片架構是否適合最新的深度學習演算法,風險很大。可能有人會問Google不是做了深度學習設計的專用晶片TPU?從Google目前公佈的效能功耗比提升量級(十倍以上的提升)上看,還遠未達到專用處理器的提升上限,因此很可能本質上採用是資料位寬更低的類GPU架構,可能還是具有較強的通用性。這幾年,FPGA  就吸引了大家的注意力,亞馬遜、facebook等網際網路公司在資料中心批量部署了FPGA來對自身的深度學習以雲服務提供硬體平臺。