1. 程式人生 > 資訊 >10 倍 TPU 算力、首個量子 AI 園區,你谷歌還是你谷歌

10 倍 TPU 算力、首個量子 AI 園區,你谷歌還是你谷歌

谷歌 I/O(開發者大會)2021 大會在今日凌晨 1 點線上召開。在本次大會中,谷歌涵蓋了晶片 TPU、會話式語音 AI(人工智慧)、搜尋模型 MUM、Android 12 系統、實時 AR 地圖、智慧辦公、全息 3D 視訊聊天等方面的技術探討。

此外,谷歌還重點關注了,使用者的隱私安全和環境保護這兩大塊問題的解決方案。雖然今年大會受到了疫情的影響,只能在線上召開,自然是讓人們少了些參與感。但“感覺”不夠,“內容”來湊!這次谷歌帶給大眾的驚喜絲毫不少於大會的線下體驗。

01. 力推前沿計算:第四代 TPU 算力飈十倍,首個量子 AI 園區來了

在谷歌 I/O 2021 開發者大會的主題演講期間,谷歌研究與健康部門副總裁 Jeff Dean 披露了張量處理單元(TPU)晶片的相關細節,它可用於開展 AI 訓練,然後生成 AI 模型,並有望用於智慧揚聲器、手機等裝置中。Dean 解釋:“谷歌將 4096 個四代 TPU 整合到一個 Pod 中,使一個 Pod 就可以提供超過一個 Exoflops(浮點算力為 10^18)的 AI 計算能力。”

得益於系統內部的互聯速度及架構優化,TPU v4 算力可達 v3 的兩倍,實際效能更是比 v3 提升了十倍之多。

之前的 AI Pod 主要是採用了 TPU 的整合設計,而在第四代版本中,谷歌運用了光纖線路,不僅使不同板塊組合到一起,還使維護工作更加輕鬆。此外,谷歌對單獨的 AI 系統進行訓練,用以識別語音、文字、照片和視訊等資訊,還試圖通過研發 MUM(多工統一模型)技術來改進相應的 AI 軟體。

▲谷歌 TPU AI 加速器

大會上,谷歌表示將在美國加利福尼亞建立一個全新量子 AI 園區,包括第一個量子資料中心和量子處理晶片製造設施,預計在十年內打造一臺商業級量子計算機,這將在幫助他們建造機器、研發新材料方面發揮巨大的作用。目前谷歌的首個量子計算實驗室已經僱傭了數十名研究人員和工程師,未來將會有更多技術人員加入。

“由於資料處理最基本元素的量子位元易受到外加干擾,所以增強量子位元的穩定性是目前構建量子園的首要任務。加上量子計算依賴於控制超小粒子的怪異物理定律,這也使研發過程受阻。”Jeff Dean 說道。

谷歌計劃將現實世界中的多個量子位元,組合成為一個有效的虛擬量子位元(又稱“邏輯量子位元”),兩者的比例約為 1000:1。此前技術人員預計需要 1000 個邏輯量子位元,才能完成實際的計算工作量。但對於目前只有數十個量子位元的谷歌來說,這個專案目標確實比較遙遠。

02. 突破性會話式 AI:從冥王星聊到紙飛機無需重訓練

在今年的谷歌 I/O 會議上,谷歌強調了其對 AI 語言理解的工作,推出一個名為 LaMDA 的實驗模型。研發人員在大會上展示了使用者與 LaMDA 充當的冥王星和紙飛機的對話,可以看出對話自然合理,並不像普通聊天機器人那般毫無邏輯。谷歌稱該模型有一天可以增強其對話式 AI 助手的功能,並允許進行更自然的對話,這對於軟體和網頁翻譯功能起著巨大作用。

LaMDA 模型最初是一種被稱為 Transformer 的機器學習技術,它在處理計算機語言方面非常出色,並支援 AI 公司 OpenAI 的 GPT-3(一種迴歸語言模型)的相容。一直以來,AI 和 LaMDA 模型就像是麵包和黃油的關係。AI 技術為 LaMDA 模型助力的同時,它也推動著語言理解和運用的融合。

▲AI 語音系統邏輯圖

AI 語音助手的構建,有助於更好的理解使用者所需的資訊訴求,因為谷歌部分產品都是基於對計算語言的解讀,而 AI 語音則是它的核心技術。谷歌執行長 Sundar Pichai 在演講中提到:“語言的豐富性和靈活性使其成為人類最偉大的工具之一,它也是電腦科學的最大挑戰之一。雖然現在與 LaMDA 的智慧對話,可以根據上下文內容提供建議和答案,讓對話不違和地進行下去,但它仍是處在研發初期,想要達到 AI 助手的對話功能,還需要時間的磨合”。

03. 比 BERT 強 1000 倍的搜尋模型 MUM,提供更靈活可靠的搜尋結果

談論到搜尋功能,谷歌在此次 I/O 大會上公佈了一個全新的多工統一模型 MUM。它是建立在一個 Transformer 架構之上,但卻比 BERT 要強大 1000 倍。MUM 可以理解語言、接受 75 多種語言的培訓,還能同時處理文字、圖片、視訊等資訊,並最終得到統一且具有極強參考價值的資訊。

在釋出會上谷歌演示了一個 MUM 的使用案例,當用戶想去攀登富士山時,自己需要做哪些準備?MUM 通過使用者提供的照片,視訊,路線圖等資訊,並針對富士山和亞當斯山的季節、地質等差異,提出最合理的攀登路線、時間和裝備需求。

在這個例子中,MUM 結合使用者所提供的資訊,綜合分析後的提出最適合的解決方案。但目前 MUM 和 LaMDA 一樣還處於開發階段,何時能正式推出,時間尚不明確。

04.AI + 影象處理強強聯手,做動圖、診療面板、升級 AR 地圖

當下使用者電子相簿裡的照片可謂是越來越多了,但要如何在需要的時候準確找到目標照片呢?谷歌推出了一個名為稱為小圖案(Little Patterns)的全新 AI 功能。這個模式可以將使用者相簿裡,三個類似物件的照片歸類為一類,方便使用者檢視。Little Patterns 還將利用電影中畫面轉場技術,把兩張相似的照片製作成動畫影象。

此外,谷歌還透露正在研發一種新工具,可以輕鬆地從照片庫中刪除某一人的全部照片,例如,想忘記卻頻繁出現在相簿中的前任。

在醫療健康方面,谷歌之前研發的 AI 深度學習系統,它能像面板科醫生一樣準確識別 26 種常見的面板病,該項技術還曾在春季刊的科學雜誌《Nature》上發表。

基於此項技術,谷歌正在嘗試利用 AI,通過檢測面板、頭髮和指甲,幫助人們瞭解自身身體狀況。具體點說就是,人們使用手機拍攝下身體出現異常的部位,然後該技術將從具有 288 例的資料庫中進行症狀識別,並給出相應的治療方案。

據悉,該項技術通過了對數百萬張患病面板圖片和健康面板影象的學習,還對 6.5 萬張臨床環境影象模型進行了培訓。在測試階段,谷歌技術人考慮了患者年齡、面板型別、性別和種族等不同因素的存在,並對不同患者約 1000 張患病面板影象進行了模擬。

谷歌健康首席健康官 Karen DeSalvo 說:“我們每年大概會收到 100 億次關於面板症狀的查詢,大多數人們都喜歡自行在網際網路上了解治療方案,由此我們想到用 AI 來解決這個問題。”DeSalvo 希望這項技術可以幫助輕度患者們高效、快速、準確地獲取相關資訊,同時也為面板科醫生減小就診壓力。

今年大會宣佈了將加強 Live View(實時檢視)功能,可以讓使用者增強現場感,實現“環遊世界”的體驗。

自 2019 年推出 Live View 測試版以來,人們就可以通過谷歌地圖看到一些公共場所的實時檢視,像機場、購物中心、公園等區域。現在,谷歌將推出大範圍的 Live View,並將為使用者整合出更多有用的資訊,比如通過餐廳的實時檢視,人們可以瞭解其繁忙程度,然後估算出大概的用餐時間等。同時,谷歌地圖還提供使用者評論及上傳照片的功能,便於人們對該地區的瞭解和判斷。

谷歌地圖預計到今年年底,將在包括柏林、聖保羅、西雅圖和新加坡等 50 個新城市,提供更加詳細的 Live View。當用戶開啟地圖時,不僅能知道路線規劃,還能瞭解當前地理位置下,周邊環境、建築的具體資訊。同時,地圖還將為人們推薦周邊的酒店、餐廳或是娛樂等服務。

不僅如此,Live View 還在一些複雜的十字路口街道設定了“標籤”,它將自動根據使用者常用的位置資訊(如家或工作的地址)來提供更準確的定位服務。“谷歌地圖今年有望增加,多達 100 多項人工智慧的程式設計。”谷歌地圖技術部門的 Liz Reid 說。

谷歌地圖另外一個重點升級是,它將利用人工智慧識別來預測使用者的“緊急剎車事件”。簡單來說就是地圖根據對於道面資訊路況的監測,有意識地提前對使用者發出危險警告,幫助使用者規避因緊急剎車而出現的交通事故。據谷歌表示,在這項技術的指導下,每年可以預防 1 億次緊急剎車事件的發生。

對於谷歌 Pixel 手機來說,它最大的亮點是,升級了圖片處理器的相關技術,使其更具有包容性。“這項技術旨在讓相機裡的有色人種,能夠毫無保留地呈現他們的自然之美,使照片上的顏色更加精準。”谷歌技術研發人員解釋道。

更準確地說,這項技術主要是改變了相機的白平衡和曝光演算法,讓它更廣泛的蒐集深色人種的資料資訊,避免照片中過亮和不飽和的有色人種,從而提高圖片顏色的準確性。同時,谷歌還表示之後將會把這項技術應用到更多的產品設計中。

此外,在手機相機的應用上,谷歌還推出了新的人像自拍模式,為捲髮和波浪髮型建立深度準確的影象資訊抓取。雖然目前該技術還是存在一些問題,但還是個值得研發的專案。

05. 智慧畫布改變協作辦公:讓你一邊編輯文件,一邊視訊溝通

在企業辦公方面,谷歌在 Google Workspace 中推出了一項新協作工具 ——Smart Canvas(智慧畫布),它可以更高效地將文件、表格和幻燈片進行組合,提供無縫的工作體驗。

同時,谷歌將 Google Meet 功能也整合進了 Smart Canvas 中,方便使用者在編輯文件時能實時交流。Google Meet 還支援 AI 自動縮放以實現最佳人臉顯示並提供自定義檢視。最後,Google Meet 在消除噪音方面做了改進,整合 AI 來提升視訊質量、優化取景和對焦,以及提供翻譯能力。

06. 實時全息 3D 視訊聊天:相隔千里也猶如面對面

在 I/O 大會上,谷歌介紹了一項名為 Project Starline 的視訊會議新技術。它能夠藉助 3D 成像技術來獲取使用者資訊,然後通過實時資料壓縮技術,以藉助現有網路來傳輸大量資料。其特點是讓使用者產生“面對面”交談的真實感。

Project Starline 技術通過大量設定攝像頭、深度感測器、專用照明和其他定製的硬體,可以達到毫無距離感的現場交流效果。這個技術目前僅在谷歌舊金山灣區、紐約和西雅圖的部分辦公室中啟用。谷歌希望,這項技術在未來能夠進一步降低成本和獲取性,最終實現人們能在察覺不到硬體裝置的前提下,全身心地投入視訊交流中去。

在技術應用方面,谷歌計劃將 Project Starline 介紹給包括醫院和媒體機構在內的商業部門,並與之合作。

07. 谷歌 Wear OS 與三星 Tizen 可穿戴作業系統深度整合

當提及可穿戴裝置,尤其是智慧手錶時,大家的第一印象可能是 Apple Watch,但谷歌才是這個領域的早期玩家。

從最開始的 Moto 360 ,谷歌智慧手錶就賺足大眾眼球,後來因為種種原因,技術和軟體沒有得到推進,其產品也就無疾而終了。以至於後來推出的 Android Wear 也未能讓谷歌逆襲。

如今,之前的 Android Wear 早已更名為 Wear OS。谷歌在今年一月收購了元老級的穿戴裝置玩家 Fitbit,原以為將會在這次的大會上宣佈穿戴裝置新品,但出乎意料的是,谷歌只是宣佈與三星 Tizen 系統聯合打造全新的可穿戴平臺。

依目前資訊來看,谷歌意識到可穿戴產品的大趨勢,是運動監測和健康追蹤的功能。因此,他們將研發重點放在了 Fitbit 的健康監測系統上。通過迄今為止已售出 1.3 億臺的 Fitbit 獲得大量資料,技術人員對研究人群進行資料分析,從而得到更準確的運動、健康資料,用於開發新一代的 Wear OS。

本次 I/O 大會還透露,Wear OS 可支援使用者的個性化體驗,並新增多樣性的手勢操控。例如,雙擊手錶的一個按鈕將轉換到其他頁面,像此類的快捷方式使用者可以自定義設定。此外,谷歌與 26 個國家合作,推出 Wear OS 版的谷歌地圖。YouTube 也將推出 Wear OS 版本,將在晚些時候釋出,其功能包括線上聽音樂或是下載音樂。

08.Android 12 風格全翻新,手機充當車鑰匙

谷歌 I/O 2021 大會的主題演講公佈了 Android 12 公測版,除了谷歌 Pixel 手機外(Pixel 3 及更高階版本),它還適用於 OnePlus、聯想、華碩、OPPO、Realme、夏普、Tecno、TCL、vivo、小米和中興的裝置。

本次 Android 12 可以說是歷上最大的變化,給使用者帶來了全新的頁面視覺設計語言 Material You,使用者將能夠通過自定義調色盤和重新設計的小工具來完全個性化自己的手機。Material You 提供了各種豐富的介面主題,作業系統的顏色也會隨著桌布的改變而改變。

▲Android 12 頁面設計

但值得注意的是,並不是所有新功能都同時推出,它會隨著系統版本的更新而相繼出現。在未來 Material You 設計將適用於包括智慧手機、平板電腦、可穿戴裝置、智慧顯示器、物聯網專案、智慧家居在內的所有裝置。

▲Android 12 版本釋出的時間線

此次 Android 12 簡化了互動和重新設計了整個底層系統,不僅提升了系統的流暢性和效率。還使 CPU 使用時間減少了 22%,並將系統伺服器對大核心的使用減少 15%。

在使用者體驗上,Android 12 通知欄會變得更加直觀、有趣,使用者可以一目瞭然地看到應用通知、或是目前正在收聽和觀看的內容。同時還支援快捷設定,讓使用者通過滑動和點選來控制大部分的作業系統。

全新的 Android 12 支援管理 Android TV 裝置上的內容,當找不到電視遙控器或是車鑰匙的時候,這項技術可以算是那些丟三落四使用者的福音了。

數字汽車鑰匙也正在投放市場。谷歌 Pixel 和三星手機將支援 Android 12 使用數字鑰匙。目前,寶馬是唯一一家確認使用此新功能的汽車製造商。

09. 安全至上

在 Android 12 中,谷歌引入了 Android 私有計算核心(Private Compute Core),可以安全地儲存用於機器學習的資料,用以增強保護使用者個人資訊的安全性、私密性。私有計算核心能讓使用者在音訊和智慧回覆等方面與網路隔離,是所有操作都在裝置上執行,與網路隔離,以此來以保護使用者的隱私。同時,私有計算核心的保護措施是開源的,完全可以由安全社群檢查和驗證。

在 I/O 大會上,谷歌推出了瀏覽器內建密碼管理功能。當它發現密碼有可能被洩露時,它會建議使用者及時修改密碼。目前這個功能會先在 Android 的 Chrome 中推出。

關於個人賬戶的隱私安全問題,谷歌系統推出了一個密碼保護資料夾的功能。這項技術可以通過設定密碼,幫助使用者保護那些最私密的照片。與此同時,谷歌還為使用者提供了自動刪除功能。系統將會自動刪除,在賬戶保留時間超過 18 個月的活動記錄。目前,有 20 億賬戶開啟了自動刪除功能。

Android 12 具有了一個名叫 Privacy Dashboard 的隱私面板,類似於之前系統的 My Activity 面板。面板上面記錄了使用者在過去一段時間內都做過什麼操作、瀏覽過什麼頁面、生成了哪些資料,它允許使用者快速對這些資訊進行管理,包括刪除操作記錄和相關的資料,駁回特定 App 的許可權等操作。

10. 到 2030 年實現運營中使用無碳能源

保護環境,人人有責。今年的大會,谷歌除了帶來技術層面的驚喜,Sundar Pichai 還立下環保戰書:到 2030 年,成為第一家全天候零碳的公司。注意,這裡的零碳指的是包括全球所有的谷歌辦公室。這個想法的提出,就如同立下“在 10 年內建設量子計算機”的目標一樣大膽。

不管怎麼說,這都是一項艱鉅的任務。去年,谷歌釋出了首個業界所謂的“碳智慧計算平臺”,它按照清潔能源的供給情況,智慧地進行計算負載分配。簡單點說就是,谷歌把高效能、高消耗的計算負載給分配到風能更充足的夜晚,以及太陽能更充足的正午,讓風能和太陽能去轉化這些計算負載。

目前這個碳智慧計算平臺通過升級後,可採用機器學習對計算負載的日間變化進行預測,然後提前完成冗雜的分配和備案等操作。谷歌還提到,這將不影響業務的實際執行效率和使用者的正常使用。“到明年的這個時候,我們應該有能力把超過三分之一的非生產用途計算負載,給分配到清潔能源更充沛的地區去。”Sundar Pichai 說。

11. 結語:Android 12 為大會造勢,AI 應用才是大會重點

由於疫情原因今年穀歌 I/O 大會只能以線上形式舉辦,但谷歌作為科技領域的頂端技術創造者,每次釋出會都為大眾帶來不一樣的驚喜。

這次大會正式釋出了 Android 12 系統,但還是以 AI 領域的應用為主,谷歌推出了自然語義模型 LaMDA 和用於醫療領域的 AI 治療。另外還有谷歌地圖 Live View 技術的全面應用、雖然萬眾期待的 Wear OS 手錶沒有推出,但還是透露了些相關資訊,值得期待。