1. 程式人生 > 其它 >自動駕駛網路大學課程W7L2 ML硬體架構

自動駕駛網路大學課程W7L2 ML硬體架構

本週的課程只有一份材料,一般是一週兩堂課的,這周只有一堂課。

按一週兩堂課的頻率,要真正理解每週課程的材料,需要大量的文獻閱讀才能領會材料討論的問題。課程材料的選擇每份材料都是選了一個研究的熱點,內容跨度很大,絕對是高強度的學習,名校果然不同凡響。

說回來,本週課程的材料是一種晶片設計的架構,通過設計可程式設計的處理單元和記憶體單元,通過對這些單元的程式設計可以匹配並行處理的pattern,相當於對可以識別出可以並行處理的部分,並解除安裝到這顆晶片上去,起到加速的效果。

文章說和FPGA相比,可程式設計性是對處理單元和記憶體單元的程式設計,而FPGA的程式設計性是基於每個LUT結構,比較複雜和耗時,這顆晶片相當於半定製的結構。

處理單元和記憶體單元組成網狀結構,處理單元採用SIMD結構,記憶體包括片上記憶體和片外記憶體分別儲存不同時效的資料。

文章還是異構計算的思路,需要軟體配合來識別出可以並行的模式pattern,並將計算任務編譯到該晶片中去。

結論:在本文中,我們描述了Plasticine,一種新的可重構架構,它可以有效地執行由並行模式組成的稀疏和密集應用程式。我們確定了捕獲稀疏和密集演算法所需的關鍵計算模式,並描述了能夠以流水線、向量化的方式執行並行模式的粗粒度模式和記憶體計算單元。這些單元利用了我們程式設計模型中關於層次並行性、區域性性和記憶體訪問模式的資訊。然後,我們使用設計空間探索來指導Plasticine架構的設計,並建立一個完整的軟硬體程式設計堆疊,將應用程式對映到中間表示,然後在Plasticine上執行。我們發現,在113 mm2的區域預算中,與FPGA相比,Plasticine的效能提高了95倍,每瓦特效能提高了77倍。