從黑科技到熱科技 釋放算力加速AI落地
第三輪人工智慧浪潮經過幾年的發展,今年在業界聽到最多的詞就是“場景”。在科技界,AI技術逐漸成熟;在應用界,對AI的價值逐漸認可。人工智慧產業進入了技術兌現、技術紅利的關鍵階段。
AI快速增長的背後,是算力指數級的增長。在今年2021人工智慧計算大會(AICC2021)上,IDC聯合業界領導廠商浪潮資訊一起釋出《2021-2022中國人工智慧計算力發展評估報告》(以下簡稱:報告),IDC已經連續第四年對AI算力進行分析,透過資料看到了明顯的變化。
“第一是政策上越來越重視,而且國家開始投資做智算中心了。第二是應用方面的落地比以前越來越成熟。第三是算力本身相比幾年前有了很大的提高。”IDC企業研究助理副總裁周震剛表示。
中國工程院院士、浪潮首席科學家王恩東
從技術成熟度曲線來看,人工智慧處於一個穩步爬升期。算力作為AI發展的支撐,“計算產業面臨著多元化、巨量化、生態離散化交織的趨勢與挑戰。”中國工程院院士、浪潮首席科學家王恩東認為,一方面多樣化的智慧場景需要多元化的算力,巨量化的模型、資料和應用規模需要巨量的算力,算力已經成為人工智慧繼續發展的重中之重;另一方面從晶片到算力的轉化依然存在巨大鴻溝,多元算力價值並未得到充分釋放。如何快速完成多元晶片到計算系統的創新,已經成為推動人工智慧產業發展的關鍵環節。
吃AI紅利,透過算力看潛力
AI的價值不僅在於其技術本身,而是AI賦能傳統產業帶來的社會經濟全面升級。全球各國都在加速AI佈局,已有60多個國家和地區出臺人工智慧政策,釋出國家級AI 戰略。其中,美國和中國在AI的發展上領跑全球。
對於AI的發展,算力就像是之前的電力一樣,是智慧時代的支撐,賦能數字經濟的方方面面。可以說,算力在一定程度上決定AI的進度。IDC 預測,2021 年全球企業在人工智慧軟體、硬體和服務的總投資將超 850 億美元;預計將在2025年增至2,045億美元,五年複合增長率(CAGR)達24.5%。全球科技巨頭未來會持續加大算力的投資,以亞馬遜、Facebook、谷歌、阿里、騰訊、百度為代表的頭部企業在基礎設施的投資規模將超過全球的一半。IDC 預測,到 2025 年,全球排名前八位的CSP將消耗50%以上伺服器和儲存基礎架構。
中國科技產業起步較晚,過去幾十年在很多領域都處於跟跑階段。AI是一個全新的機遇,也是中國科技產業反超的機會,中國起點不低。同時通過AI賦能傳統產業也是中國經濟轉型的機會點,無論是科技產業還是傳統產業,對AI的發展都充滿期待。
算力已經成為數字時代的核心生產力,是拉動數字經濟向前發展的新動能。對於AI算力的投入,也將加快人工智慧這一重要的數字化技術與實體經濟的融合,賦能傳統產業轉型升級,催生新產業新業務新模式,為我國數字經濟做強做優做大做出應有的貢獻。IDC認為,擁有較高算力基礎建設能力的企業/組織或國家,將更有可能在人工智慧帶來的紅利中更多地獲利。
從算力的角度來評估,中國伺服器廠商成為全球伺服器市場的中堅力量,特別是浪潮資訊在全球AI伺服器的市佔率位居第一。受疫情影響,中國伺服器市場仍保持高增長勢頭,IDC 最新發布的《全球人工智慧市場半年度追蹤報告》顯示,中國人工智慧伺服器頭部廠商市場規模同比增長率可超 50%。顯然,在AI算力方面中國是有一定優勢的。接下來就是把算力轉化為潛力,吃到AI紅利。所以報告中通過對算力的評估分析了一些城市、行業的AI程度,透視其潛力。
從城市來看,各個城市間人工智慧角逐加劇,算力基礎設施是重要競爭力。2021年中國人工智慧城市排行榜,排名前五城市依次為北京、杭州、深圳、南京,上海。與2020年相比,南京進入前五,濟南進入前十名。在這個排名中我們看到南京處於很靠前的位置,這正是由於當地政府的重視,一方面針對AI的發展出臺了一系列的產業規劃,另一方面是在南京落地了長三角地區規模最大、算力最強的智慧計算中心,提供公共性的AI算力服務,幫助當地企業實現AI應用加速落地,為城市人工智慧產業化發展提供高速通道。
從行業角度來看,算力的行業滲透與行業的智慧化程度緊密相關。在中國市場,網際網路行業滲透度第一,這與阿里、位元組、騰訊這樣的網際網路企業對於AI的應用密切相關。接下來是金融行業人工智慧應用速度加快並超過政府行業,位列第二。製造、交通和能源行業在人工智慧的應用也更加深入,分列第五、第七和第九位。相比去年,人工智慧在各個行業的滲透度都在增加。
最有啟發的資料是,採用人工智慧三年以上的企業,已經獲得顯著收益,被訪企業平均收入增加9.8%、流程時間縮短20.4%、生產效率提升21.6%。顯然,早期部署AI的企業已經吃到紅利,取得超出行業整體的增長速度。
系統創新彌補多元晶片與算力之間的鴻溝
王恩東院士從AI發展的洞察中看到三大趨勢和挑戰:多元化、巨量化、生態離散化。計算產業的這三大趨勢造成兩大鴻溝:一是多元化晶片與巨量算力之間,二是算力與智慧場景落地之間。跨越這兩道鴻溝,是行業穩定爬坡進入快速增長通道的必然選擇。
AI的爆發不僅是算力的線性增加,人工智慧應用需求日漸豐富,催生晶片多元化發展。2020年以GPU為代表的AI加速晶片所交付的計算力總和已經超過了通用CPU,預計到2025年,加速晶片所提供的計算力可能超過80%。
此外,GPU依然是資料中心加速的首選,佔有90%以上的市場份額,與此同時ASIC、FPGA和NPU等其他晶片也在各個領域被越來越多地採用。而ASIC,FPGA,NPU等其他非 GPU 晶片也在各個行業和領域被越來越多地採用,整體市場份額接近 10%,預計到 2025 年其佔比將超過 20%。
“晶片多元化為產業AI化的加速提供了重要的產業基礎和更加豐富的選擇。但是,晶片從造出來到大規模用起來,還存在巨大的產業鴻溝。”王恩東表示,多元算力價值並未得到充分釋放,將百花齊放的AI晶片轉變成一個通用性強、綠色高效、安全可靠的計算系統,已經成為推動人工智慧產業發展關鍵破局環節。
當然這也是非常難的一道門檻。我們知道,AI晶片在單一計算系統中往往高密度整合,帶來系統功耗、匯流排速率、電流密度的不斷提升,AI計算系統的設計面臨巨大挑戰。例如一臺浪潮AI伺服器,需要整合超過10000個零部件,包含50多類專用晶片、30多個技術方向以及100多種傳輸協議,涉及到材料、熱力學、電池技術、流體力學、化學等一系列學科;需要經歷30多個流程、150多種加工和製造的工藝、280多個關鍵過程的控制點,如何確保整個系統的可靠性是一個非常精細且複雜的工程。
王恩東院士用一個生動形象的比喻,來類比計算系統創新的難度:“從火箭發動機到運載火箭,要在迴圈、控制、結構等很多領域做大量的工作。晶片到計算系統同樣如此,需要完成體系結構、訊號完整性、散熱、可靠性等大量系統性設計工作。”
也就是說,上游有很多晶片企業,研發出各類很牛的晶片,但是把這些晶片有機地組合實現強算力進而對下游應用實現支撐,這中間的挑戰非常之大,這也是浪潮這類企業最大的價值所在。
浪潮資訊副總裁、浪潮資訊 AI&HPC產品線總經理劉軍對此做了更詳盡的解釋:智算時代,每一個特定應用場景的計算特點不同,資料量都非常大,按照傳統通用的計算晶片模式,計算效能相對比較低,所以需要針對特定領域的應用去做智算架構的創新,多元AI晶片繁榮從產業本質上成為發展的驅動力。
浪潮作為一個平臺廠商通過兩個方面的努力來抹平這道鴻溝。
一是算力平臺本身,要支援不同的晶片,能夠有一個非常高效能、強壯的平臺來統一容納各種晶片,提供晶片之間的高速交換、節點之間的高速資訊連通,“浪潮現在是唯一一個能夠設計、研發、支援八顆國產最高階的AI晶片在一個系統裡面進行高速互聯的AI伺服器的廠商。”劉軍表示。在AI算力平臺方面浪潮一路領跑,以先進的技術換來全球市場份額第一的地位。
二是軟體層面,每一顆晶片都需要與客戶的應用對接,這就意味著使用者要為不同的AI晶片構築新的煙囪系統。浪潮的AI開發服務平臺AIStation構建了一個支援多元異構AI晶片的規範介面的標準,目前已經接入了國內外六家公司的12款AI晶片,可以在一個資源平臺上面實現高效管理多元的AI晶片,這就給客戶最終使用帶來極大的方便,他們只需要聚焦於自己業務的創新,不需要為底層多元算力分散精力,從而大大提升了創新的效率。
“浪潮將發揮算力平臺領導廠商的作用,建立起多元AI晶片和產業AI化之間的橋樑。”劉軍表示。
“源1.0”填補算力與應用之間的鴻溝
人工智慧那麼好,但是怎麼跟客戶的業務、應用場景結合?一面是轟轟烈烈在發展的AI技術,一面是迫不及待想通過AI創新的企業。“我們發現很多科學家在用不同領域的模型去解決問題,但當場景或者資料發生了變化,就要推倒重來,大大影響了產業落地速度。”劉軍認為在AI技術與應用場景之間的鴻溝主要是來自通用性的挑戰,大多數AI模型都只能用於某一特定領域,通用性不強,限制產業AI化程序。
人工智慧如何發展出像人類具備邏輯、意識和推理的認知能力,是人工智慧研究一直在探索的方向。“目前來看,通過大規模資料訓練超大引數量的巨量模型,被認為是非常有希望實現通用人工智慧的一個重要方向。”王恩東院士認為,隨著巨量模型的興起,巨量化已成為未來人工智慧發展非常重要的一個趨勢。
近年來人工智慧的發展,已經從“大煉模型”逐步邁向了“煉大模型”的階段,全球知名的AI領先公司在巨量模型上都予以重兵投入。這兩年大模型這個概念特別熱,谷歌、微軟、英偉達、浪潮、智源研究院、百度、阿里等公司相繼推出了各自的巨量模型。顯然,“巨量資料、巨量演算法和巨量算力”正在成為邁向通用人工智慧的重要路徑。
其中浪潮人工智慧研究院釋出的“源1.0”致力於打造最“博學”的中文AI模型, “源1.0”的單體模型引數量達2457億,超越美國OpenAI組織研發的GPT-3,是目前全球最大中文巨量模型,佔據權威中文語言理解測評基準CLUE的零樣本學習(zero-shot)和小樣本學習(few-shot)2項榜單榜首。
“原來的(AI)方式,我們培養了很多隻會擰螺絲的人或者是隻會敲錘的人。今天我們練出來是一個八級的鉗工,你只要稍微示範一下他就都會幹,並且幹得比別人還出色。”劉軍這樣形象的比喻“源1.0”的價值。“源1.0”聚合了AI最強算力平臺、最優質的演算法模型開發能力,將支撐和加速行業智慧的構建,最終幫助使用者完成業務智慧轉型升級,以具備通用性的智慧大模型成就行業AI大腦。
在懂懂看來,以“源1.0”為代表的大模型的價值點就在於可感知、自學習、可進化的能力,這將大大加速AI的場景化落地程序。以前AI是低效、繁瑣的,而有了大模型,AI將進入高效工業化階段,快速普及。IDC報告也認為,演算法模型發展愈加複雜,巨量模型將是規模化創新的基礎,“源1.0”等巨量模型的出現,讓構建大模型、提升AI處理效能成為發展趨勢。
大模型提供了AI工業化程序的工具,解決了巨量化的挑戰,但在真正落地時還有一個挑戰就是與場景的深度結合。每個行業、每個企業的場景千差萬別,大模型是AI領域的科學家開發,而與實際業務對接則需要大量的真正懂行業、懂應用的各領域專業人才來落地。來自埃森哲的一份調研報告顯示,70%以上有技術的研究機構、科技公司缺需求場景、缺領域知識和資料,70%以上的行業使用者缺技術人才、缺AI平臺和實踐能力。
為了徹底填平AI算力與AI應用之間的鴻溝,浪潮採用開放開源的理念,“源1.0”將以開放API、開放資料集、開原始碼等多種形式為業界提供開放合作,相關高校和科研機構、產業夥伴及智慧計算中心使用者可基於“源1.0”模型探索演算法創新以及開發各類智慧化應用。
浪潮在大家的印象中是一家做伺服器的企業,為什麼會涉足大模型?事實上,浪潮本質上是希望通過算力去推動產業、經濟的發展,而作為硬體的伺服器只是其產業形態之一。產業在進化,AI產業化、產業AI化,對大模型提出迫切的需求,而作為浪潮這樣一家平臺型企業,向下有多元晶片合作伙伴,向上有千行百業的客戶,做大模型可以順利地將AI算力與應用場景之間打通。“第一,產業需要。第二,我們不幹,誰來幹呢?”在劉軍看來,浪潮做大模型是一件水到渠成的事。
其實上,AI就是處於這樣一個演進的過程中,需要更多浪潮這樣的企業,承擔起更多的責任,填補一個一個鴻溝,AI產業化、產業AI化才會真正加速到來。