1. 程式人生 > 資訊 >谷歌 TPU AI 演算法祕密武器:數週的晶片佈局設計,現在只要 6 小時

谷歌 TPU AI 演算法祕密武器:數週的晶片佈局設計,現在只要 6 小時

6 月 10 日報道,谷歌用人工智慧提高晶片設計速度的研究,已發表於國際頂級期刊 Nature。

原本人類專家需要花費數週時間的晶片佈局設計,通過一種深度強化學習方法,平均 6 小時內就能完成這個過程

這項工作並不完全新穎,包括谷歌人工智慧負責人 Jeff Dean 在內的谷歌工程師團隊,在一年前發表的一篇預印版論文中已經提到了這一技術。

谷歌部落格:點此檢視

而在 Nature 最新發表的論文中,谷歌原始研究團隊稱其已微調該技術,來設計即將推出的、以前未宣佈的谷歌張量處理單元(TPU)的生成,專門用於加速人工智慧(AI)

該論文題目為《一個快速晶片設計的布圖佈局方法》(A graph placement methodology for fast chip design)。如果這一技術公開,或有助於讓資金受限的初創企業開發滿足特定需求的自家晶片,並縮短晶片設計週期,使硬體更好地適應快速發展的研究。

論文連結:點此檢視

晶片設計自動化挑戰大,效能難達人類水準

微芯片面積約為幾十到數百毫米平方,容納數千個元件,如記憶體、邏輯和處理單元,外加許多公里的超薄電線將這些元件連線在一起。

設計過程中,全域性佈線是最複雜和耗時的階段之一,這涉及研究這些元件的最佳放置位置,就像建築師設計建築的內部空間一樣,如何以最好的規劃容納所有所需的固定裝置和配件。

在這項研究中,谷歌研究人員提出了一種基於深度強化學習的晶片佈局方法,目標是將電路元件和標準單元的網表節點對映到一個晶片畫布上,從而優化功率、效能和麵積(PPA),同時遵守對佈局密度和佈線擁塞的限制。

自 20 世紀 60 年代以來,提出了許多自動化的晶片平面圖方法,但沒有一種方法達到人類專家上手所能實現的效能。此外,晶片複雜性的指數增長,使這些技術難以在現代晶片上使用。

人類晶片設計師往往必須使用電子設計自動化(EDA)工具迭代數月,對晶片網表進行 RTL 描述,並手動將該網表放置在晶片畫布上。

基於這種長達 72 小時的反饋,設計師要麼得出結論,認為設計標準已經達到,要麼向上遊 RTL 設計師提供反饋,後者然後修改低階程式碼,使放置任務更容易。

而谷歌提出的深度強化學習方法,是一種具有泛化能力的晶片佈局方法。通過領域自適應策略,它能夠跨晶片進行推廣,可以自行從經驗中學習,使其晶片佈局設計能力變得更好、更快

用遊戲系統、10000 個晶片佈局訓練

訓練跨晶片推廣的 AI 驅動設計系統具有挑戰性,因為它需要學會優化將所有可能的晶片淨列表放置在所有可能的畫布上。

晶片平面圖類似於具有各種部件、板塊和獲勝條件的遊戲,因此可以用包含狀態、動作、狀態轉移、獎勵四個關鍵要素的強化學習方法

,通過訓練一個智慧體,用累計獎勵最大化,讓 AI 優化晶片佈局的能力持續增強。

從空晶片開始,谷歌團隊的系統按順序放置元件,直到實現一個完全佈局的網表。

為了指導系統選擇首先放置的元件,元件按降序由大到小排序;首先放置較大的元件會減少以後沒有可行放置的可能性。

▲ 隨著訓練進行,開源 RISC-V 處理器 Ariane 的巨集位置。左邊是從零開始訓練的策略,右邊是針對這個晶片進行預訓練的策略。每個矩形代表一個單獨的巨集位置。(圖源:谷歌)

訓練該系統需要建立一個包含 10000 個晶片佈局的資料集,其中輸入是與給定佈局相關的狀態,標籤是佈局的獎勵(即線長和擁塞)

研究人員首先選擇了 5 個不同的晶片淨網表,並用 AI 演算法為每個網表建立 2000 個不同的佈局位置。

該系統花了 48 個小時在英偉達 Volta 顯示卡和 10 個 CPU 上“預訓練”,每個 CPU 都有 2GB 的 RAM。

在一項測試中,谷歌研究人員將他們的系統建議與手動基線 —— 谷歌 TPU 物理設計團隊建立的上一代 TPU 晶片設計 —— 進行比較。

結果顯示,系統和人類專家均生成符合時間和擁塞要求的可行位置,而 AI 系統在面積、功率和電線長度方面優於或媲美手動佈局,同時滿足設計標準所需的時間要少得多

未來工作:或為晶片設計全自動化奠定基礎

谷歌稱其系統推廣和生成“高質量”解決方案的能力具有“重大影響”,為與晶片設計過程的早期階段進行優化提供了機會。

大規模的架構探索以前是不可能的,因為評估給定的架構需要數月的努力。

谷歌團隊認為,修改晶片的設計或對效能產生巨大影響,並可能為晶片設計過程的完全自動化奠定基礎

此外,雖然谷歌團隊的系統被用於設計下一代谷歌 TPU,但研究人員認為,它可以應用於晶片設計以外的有影響力的放置規劃問題,包括城市規劃、疫苗測試分發和大腦皮層對映等一系列應用。

結語:減少設計晶片時間,或優化供應鏈流程

Nature 社論認為,谷歌這一研究大大縮短設計晶片所需的時間,將極大地幫助提速供應鏈,但技術專長必須廣泛共享,以確保公司的“生態系統”真正全球化。產業必須確保節省時間的技術不會趕走擁有必要核心技能的人

更易訪問、更高效的微晶片將為自動駕駛汽車、5G 通訊和 AI 的發展提供動力,這些機會不容錯過。但重要的是,要考慮使用自動化設計技術的更廣泛影響,特別是需要具有相關技能和專業知識的人,和提高目前手動完成流程的人的技能。

晶片佈局無論是手動還是自動化,都需要計算、電子工程和裝置物理方面的專業知識。這些技能需要時間來學習,在一個生產微晶片以外許多其他產品的行業中,同樣非常需要這些技能。

至關重要的是,相關公司要理解這一點,並採取適當步驟來滿足其本地和全球的技能需求。自動化往往加劇了人們對裁員的擔憂。事實上,保持電子行業的勢頭,需要有遠見的人和公司來創造下一代微晶片。