1. 程式人生 > 資訊 >全球首款,阿里達摩院成功研發基於 DRAM 的 3D 鍵合堆疊存算一體晶片

全球首款,阿里達摩院成功研發基於 DRAM 的 3D 鍵合堆疊存算一體晶片

12 月 3 日訊息,據阿里雲官方釋出,阿里達摩院成功研發存算一體晶片。這是全球首款基於 DRAM 的 3D 鍵合堆疊存算一體晶片。它可突破馮・諾依曼架構的效能瓶頸,滿足人工智慧等場景對高頻寬、高容量記憶體和極致算力的需求。在特定 AI 場景中,該晶片效能提升 10 倍以上,效能比提升高達 300 倍。

為什麼要研發存算一體晶片?

隨著人工智慧應用場景的爆發,現有的計算機系統架構的短板逐漸顯露,例如功耗牆、效能牆、記憶體牆等問題。

其主要癥結在於:

一是資料搬運帶來了巨大的能量消耗。在傳統架構下,資料從記憶體單元傳輸到計算單元需要的功耗是計算本身的約 200 倍,因此真正用於計算的能耗和時間佔比很低。

二是記憶體的發展遠遠滯後於處理器的發展。目前,處理器的算力以每兩年 3.1 倍的速度增長,而記憶體的效能每兩年只有 1.4 倍的提升。後者的效能極大地影響了資料傳輸的速度,這也被認為是傳統計算機的阿克琉斯之踵。

存算一體晶片是目前解決以上問題的最佳途徑 —— 它類似於人腦,將資料儲存單元和計算單元融合為一體,大幅減少資料搬運,從而極大提高計算並行度和能效。

這一技術早在 90 年代就被提出,但受限於技術的複雜度、高昂的設計成本以及應用場景的匱乏,過去幾十年業界對存算一體晶片的研究進展緩慢。如今,達摩院希望通過自研創新技術解決算力瓶頸這一業界難題。

此外,存算一體晶片在終端、邊緣端以及雲端都有廣闊的應用前景。例如 VR/AR、無人駕駛、天文資料計算、遙感影像資料分析等場景中,存算一體晶片都可以發揮高頻寬、低功耗的優勢。

從長遠來看,存算一體技術還將成為類腦計算的關鍵技術。

實現存算一體的三種路線

實現存算一體有三種技術路線:

  • 近儲存計算(Processing Near Memory):計算操作由位於儲存晶片外部的獨立計算晶片完成。

  • 記憶體儲計算(Processing In Memory):計算操作由位於儲存晶片內部的獨立計算單元完成,儲存單元和計算單元相互獨立存在。

  • 記憶體執行計算(Processing With Memory):儲存晶片內部的儲存單元完成計算操作,儲存單元和計算單元完全融合,沒有一個獨立的計算單元。

其中,近存計算通過將計算資源和儲存資源距離拉近,實現對能效和效能的大幅度提升,被認為是現階段解決記憶體牆問題的最佳途徑。達摩院本次也是沿著這一方向進行突破。

混合鍵合 3D 堆疊技術

為了拉近計算資源和儲存資源的距離,達摩院計算技術實驗室創新性採用混合鍵合 (Hybrid Bonding) 的 3D 堆疊技術進行晶片封裝 —— 將計算晶片和儲存晶片 face-to-face 地用特定金屬材質和工藝進行互聯。

比起業內常見的封裝方案 HBM,混合鍵合 3D 堆疊技術擁有高頻寬、低成本等特點,被認為是低功耗近存計算的完美載體之一。

此外,記憶體單元採用異質整合嵌入式 DRAM ,擁有超大記憶體容量和超大頻寬優勢。

獲悉,在計算晶片方面,達摩院研發設計了流式的定製化加速器架構,對推薦系統進行“端到端”加速,包括匹配、粗排序、神經網路計算、細排序等任務。

這種近存架構有效解決了頻寬受限的問題,最終記憶體、演算法以及計算模組的完美融合,大幅提升頻寬的同時還實現了超低功耗,展示了近存計算在資料中心場景的潛力。

達摩院表示,最終的測試晶片顯示,這種存算技術和架構的優勢明顯:

能通過拉近儲存單元與計算單元的距離增加頻寬,降低資料搬運的代價,緩解由於資料搬運產生的瓶頸,而且與資料中心的推薦系統對於頻寬/記憶體的需求完美匹配。

該晶片的研究成果已被晶片領域頂級會議 ISSCC 2022 收錄。未來,達摩院希望能進一步攻克存內計算技術,並逐步優化典型應用、生態系統等方面。