手機AI晶片的諸神之爭
https://www.toutiao.com/i6630375745803780615/
2018-12-02 20:44:12
寒武紀科技創始人及CEO陳天石此前在一次公開活動上提到這樣一個小八卦:谷歌大腦專案用了1.6萬個CPU核跑了7天才完成貓臉識別。
講這個八卦的意圖在於說明,CPU/GPU用於智慧資訊處理效率十分低下,神經網路處理器是迄今為止最好解決方案。
麻省理工斯隆管理學院教授埃裡克·布萊恩約弗森在《第二次機器革命》一書提到,創新所做的真正工作並不是提出什麼大的和新鮮的事物,而是把已經存在的事物重組起來。
手機處理器能不能把CPU/GPU和神經網路處理器結合(NPU)在一起,讓手機同時具備三者的優勢?這是過去幾年半導體產業在探索的一個課題。
11月中旬三星釋出了旗艦處理器Exynos 9820處理器晶片組,預計將會在年底量產,在明年年初Galaxy S10系列旗艦機上使用。Exynos 9820最大的賣點在於,終於有獨立的神經網路處理單元(NPU),這讓裝置內AI運算速度比前代快了7倍。
這僅僅只是今天移動處理器市場競爭的一個小切口。從華為、蘋果、聯發科的初露鋒芒,再到高通、三星的迎頭趕上。
半導體巨頭們用迴旋激盪的你追我趕,改變了“Tick-Tock”鐘擺定律的線形增長趨勢,直接讓手機處理器市場邁入AI能力競爭的新階段。
華為的激進
獨立AI處理單元的競爭起源於2017年9月。9月2日,在德國IFA2017舉辦期間,華為正式釋出全球首款人工智慧移動計算平臺麒麟970。
之所以稱之為“人工智慧移動計算平臺”是因為,麒麟970第一次搭載了寒武紀的NPU——NPU和CPU、GPU的功能是相對應的,指的是就是在傳統手機晶片核心CPU、GPU、ISP、DSP等基礎上,加上一顆用於神經元計算的獨立處理單元,英文名 Neural Network Processing Unit,簡稱NPU,中文含義為“神經元網路”。
10天后,蘋果釋出iPhone X,A12處理器上同樣搭載了晶片設計方面跟進華為整合類似NPU模組。這時業內才發現,獨立神經網路處理器已經成了潮流。
華為為了搶NPU世界第一這個旗號,動作非常激進,特意把釋出會提前到了蘋果iPhone X的前面。之後甚至也能看到一大批《蘋果A12處理器跟進華為整合NPU,手機AI設計看中國》的類似文章出現。
事實上,蘋果和華為的規劃幾乎是在同期展開的。並不存在誰學誰的問題,華為的激進,目的在於做大國產晶片的市場口碑。搶到“全球首款獨立AI處理單元”的釋出,這對麒麟處理器的營銷會有極大增益。
不可否認的是,華為這種策略推動了半導體產業對獨立神經網路處理單元的重視,也加劇了這個產業的競爭。華為也願意在神經網路處理單元軍備競賽中和其他企業“打對手牌”。在今年3月,聯發科推出搭載雙核APU處理器單元的P60之後,華為9月又在德國IFA展上釋出了麒麟980,同樣搭載了雙核NPU。
這種軍備競賽的策略,雖然有時會超出當下需要,但是卻通過這種“過度競爭”的方式,讓獨立神經網路處理單元得到了普及。
至此,有沒有獨立用於AI計算的處理單元,已經成了考驗手機處理器的核心要素。
和兩三年前手機處理器僅僅是效能堆疊不太一樣,獨立神經網路處理單元的出現讓效能堆疊的線形競爭又上升了一個維度。
高通的保守
雖然華為很激進,相比行業其他廠商,高通顯得保守、遲疑很多。
在2017年年底亮相後,眾人大跌眼鏡,驍龍845基本還是沿襲上一代驍龍835的架構。在AI方面,高通驍龍845並沒有專用於處理AI任務的NPU,而是拿出原本做ISP影像處理的Hexagon 685 DSP來處理AI應用,效能不夠的時候再轉換使用GPU來應付。
在AI和拍照同時工作這類過載場景,本來這些模組就已經處於負荷比較大的狀態,再增加AI訴求,必然會對整個執行效率造成影響,不僅會拖慢速度,還比較耗電。
不管怎麼說,高通還是通過這種曲線救國的策略支援上了AI功能。那麼,高通為什麼不願意在高通驍龍845上加入NPU模組呢?
我們可以從很多細節處找到答案。雷軍在小米MIX2S釋出前夕,曾在微博上透露驍龍845晶片加上17%的進口增值稅後,成本為500多元,是驍龍660晶片的三倍多——這個價格已經是非常高昂了。
業內分析,如果其中增加一塊單獨的NPU模組,勢必要將晶片架構打亂,而且還會產生額外的研發、專利以及物料成本。
其實成本上升還是小事,高通作為安卓陣營的龍頭老大,驍龍845旗艦處理器要供應給上十家手機企業,這些手機企業眾口難調,有些企業講究價效比,並不一定願意上NPU。有些企業願意上,卻還要派出人和高通一起駐場適配,企業不一定能抽掉人手。
高通可能自己也清楚NPU是大方向,但面臨不同企業的不同訴求,選擇不上NPU還是最經濟、最實惠、最便捷的方案。
高通保守的原因,大概率還是因為在市場地位穩固,變革的動力相對不足。外加之前要應付博通的併購、反壟斷調查導致利潤承壓,失去了對市場的敏感度。
不過,在今年年中,高通看到行業形勢變化,還是迅速反應過來,對外透露了內建NPU模組處理器的計劃,包含驍龍710的下一代720及在明年初的旗艦處理器8150上也都會加入NPU模組。
高通的加入雖然有被動因素,卻可以看作是對獨立神經網路處理單元的最佳認可,有助於把整體市場做大。
聯發科的求變
在華為、蘋果、高通、三星那裡,獨立神經網路處理單元被稱作為NPU,聯發科則是進一步改進獨立AI硬體處理單元,並展開了跨平臺的延展,並將其稱之為APU。
聯發科在今年3月釋出了P60處理器。這款處理器因為低功耗、高效能、AI逆光拍照等特性,釋出之後不久就被OPPO、vivo這類大廠選中,成為中高階機種上搭載的核心處理器。
相比於華為、蘋果在AI處理單元上的嘗試,P60直接加入了雙核APU——也就是兩個獨立AI處理單元。
而上個月聯發科剛推出的P70也一樣搭載了雙核APU,而市場傳聞,聯發科接下來下一顆處理器會有旗艦級的AI算力,是聯發科重點投入的產品,瞄準的是高通旗艦市場。
聯發科已經有1年多在中高階市場面臨高通的競爭壓力,但是這款產品可能會幫助聯發科奪回過去的中高階市場份額。
之所以叫APU而不叫NPU,其實已經顯示出了聯發科對獨立AI晶片的思考角度。聯發科的開創之處在於,它並非是零敲碎打推出AI處理器,它有一套自己的體系。
不同於高通、三星以單核為主,而是可擴充,實現單核到多核的人工智慧處理單元。要知道,未來手機上人工智慧的操作只會越來越多,單核心肯定不夠用,雙核甚至四核是遲早的問題,早點上雙核,實際上是在早做準備。
多核心的APU同樣也可以適應有更豐富的場景應用,不僅僅只是照片處理。未來手機的AI使用場景也必然是越來越豐富,面部識別、面部美化、場景檢測、手勢檢測、系統性能優化、語音識別等場景下,都會要用到AI功能,多核心的APU可以抽掉出算力去應付不同場景不同應用,提高手機的運算速度。
APU還支援市場上現有的幾乎所有AI架構,和手機配合在一起,會有更好的體驗。包括Google的TensorFlow、Caffe、Amazon的MXNet、Sony的NNabla等。作業系統方面,聯發科同時支援Android與Linux系統,這對於物聯網智慧化的推廣,起到關鍵的影響。
因為現在越來越多的智慧硬體,如汽車等都是採用了Linux系統,適應不同的AI架構,便於把APU推廣到不同的運算平臺上。
Tick-Tock要打破
這也牽扯到了最後一個問題——AI處理器未來究竟會有哪些運用場景。
隨著5G技術和AI技術的串聯,未來智慧手機、智慧家庭到自動駕駛,甚至AR、VR會成需要一攬子的解決方案,獨立神經網路處理單元的跨平臺需求會愈加強烈。
中國AI晶片“小三巨頭”的說法——地平線、寒武紀和深鑑科技三者都是這個市場的開拓者。
寒武紀垂直於手機業務、深鑑科技主要聚焦於安防,地平線則是圍繞智慧零售、智慧城市、自動駕駛三個領域提交解決方案。
三小巨頭的出現,恰恰說明了處理器市場尋找跨平臺橫向拓展的市場空間。
APU恰恰主打跨平臺, 今年年初,聯發科在CES釋出了NeuroPilot人工智慧平臺,主攻智慧手機、智慧家庭、自駕車的終端邊緣運算。聯發科不僅僅整合AI處理器與NeuroPilot SDK軟體開發套件技術,將AI帶入廣泛的消費性產品中。也讓手機處理器的AI單元和其他消費電子產品相連。提前佈局APU,其實也是在為未來計算平臺出現、融合做考慮。
考慮這個問題的不只是聯發科,還有三星。
韓媒ETNews在今年年初報道,三星電子LSI事業部正在開發名為“Exynos Auto”的汽車晶片,計劃在今年年底前量產,並將供應給奧迪、哈曼等公司,後者已成為三星子公司。
三星Exynos Auto將成為首款內建NPU模組的三星晶片。NPU在汽車上可用於分析車內影象感測器接收到的影象訊號。因此,它能夠幫助構建更高效的ADAS(高階駕駛員輔助系統),ADAS可用來識別車道和障礙物。
多年以前,英特爾半導體開創了“Tick-Tock”鐘擺定律。“工藝年-構架年”統治了十餘年,每一年處理器也只有感知力極小的線形增長。
伴隨著“日拱一卒”演進,AI晶片終於到了要突破“Tick-Tock”這個鐵律的階段。