盤點 | 2018全球人工智慧突破性技術TOP10(附報告)
來源:錢塘大資料
本文約4400字,建議閱讀8分鐘。
本文為大家介紹了十項中外人工智慧領域富有突破性的技術。
人工智慧是個高科技、寬領域、多維度、跨學科的集大成者,從立足大資料、圍繞網際網路的純計算機應用,逐步衍生到人們日常生產生活的方方面面,在細微之處改善和改變著我們。目前,不少新技術、新模式已經逐步投入到現實運用,但是多數領域仍然處在推廣、試驗、研究階段,如何把握推廣人工智慧技術的重大機遇,讓更廣大的老百姓像普及手機一樣,用上人工智慧,這是我們這一代人必須面對的時代發展“必答題”。
2018年人工智慧技術已在多方面實現突破進展,國內外的科技公司都在不斷嘗試將人工智慧應用於更多領域,不論科技巨頭還是初創企業,都在致力於不斷創新,推動技術進步,接下來我們就來看看十項中外人工智慧領域富有突破性的技術。
後臺回覆“區塊鏈”,獲取本文報告。
1. 基於神經網路的機器翻譯
入選理由:翻譯是“自然語言處理”的最重要分支,也是比較難的一支。早年間,機器翻譯還被視作 “低階翻譯”被嘲諷,如今神經網路的機器翻譯準確性大大提高,堪比專業人工翻譯。我們熟知的谷歌翻譯、微軟語音翻譯以及搜狗語音識別等都是基於此項技術。
技術突破:機器翻譯是科研人員攻堅了數十年的研究領域,其技術核心是一個擁有海量結點的深度神經網路,可以自動的從語料庫中學習翻譯知識。
人類大腦處理語言的過程毫無疑問是最為複雜的認知過程之一,曾經很多人都認為機器翻譯根本不可能達到人類翻譯的水平。神經網路中的多層感知就試圖模擬人類大腦神經多層傳遞處理的過程,但通常不超過三層。2006年,科學家提出了神經網路的深度學習演算法,使至少具有7層的神經網路訓練成為可能。由於能夠比較好地模擬人腦神經元多層深度傳遞的過程,它在解決一些複雜問題的時候有著非常明顯的突破性表現。
今年3月,微軟宣佈其研發的機器翻譯系統首次在通用新聞的漢譯英上達到了人類專業水平,實現了自然語言處理的又一里程碑突破,將機器翻譯超越人類業餘譯者的時間,提前了整整7年。
重大意義:基於神經網路的機器翻譯,直接改善了之前逐詞直譯的效果,升級為以整個句子為單位進行翻譯。
點評:機器翻譯在手,縱橫四海不是問題。
2. 基於多感測器跨界融合的機器人自主導航
入選理由:機器人的終極目標是為人類提供智慧化的服務,其中自主導航是近年來人類一直想要攻克的技術壁壘,臻迪(PowerVision)通過聲吶、視覺等多感測器融合,使其水下機器人能實現自主導航及智慧識別,在智慧機器人領域內取得了突破性進展。
技術突破:隨著機器人的應用場景及作業任務越來越複雜,單一感測器難以滿足應用需求。而多感測器的資訊融合對硬體資源依賴程度比較高,臻迪(PowerVision)基於自身在機器人行業深耕細作多年所積累的各類感測器、慣性導航、運動控制、相機、視覺檢測/識別、SLAM等核心技術,以及深度學習的深入研究,通過嵌入式端一體化整合平臺的系統架構及優化設計,突破了移動平臺硬體資源的限制,使水下機器人更加準確、智慧、全面地感知目標,並具備對水下目標進行鎖定、檢測、識別、跟隨的能力。
重大意義:通過導航控制、聲吶、視覺技術與深度學習的結合實現了機器人在全域性環境中的定位及自主導航,以及智慧化應用,為人類探索更為廣闊的水下應用提供了強有力的技術保障。
點評:這也許是未來人工智慧落地的最佳方式
3. DuerOS對話式人工智慧系統
入選理由:DuerOS3.0能夠為使用者帶來了劃時代的自然對話互動,包括情感語音播報、聲紋識別等能力在內的自然語言互動技術的全面升級。
技術突破:DuerOS是百度度祕事業部研發的對話式AI作業系統,擁有10大類目的250多項技能。DuerOS包括了從語音識別到語音播報再到螢幕顯示的一個完整互動流程,以及背後支撐互動的自然語言理解、對話狀態控制、自然語言生成、搜尋等等核心技術,這些技術支撐著應用層和能力層的實現。
2018年7月4日,最新的DuerOS 3.0正式釋出,使賦能的產品能夠實現語音多輪糾錯,進行復雜的遞進意圖識別與帶邏輯的條件意圖識別,從而更加準確判斷使用者意圖,最終實現功能升維——利用擴充套件特徵理解使用者行為。基於此,DuerOS3.0提供了包括有屏裝置解決方案、藍芽裝置解決方案和行業解決方案等在內超過20個跨場景、跨裝置的解決方案。
重大意義:DuerOS率先開啟AI時代商業化,將為生態合作伙伴從產品、內容與推廣三大方面提供完整的應用方案支援,加速AI裝置落地。
點評:小度小度,請問下一個技術我寫什麼?
4. 移動AR技術
入選理由:未來AR與AI需要相互加持,可以將AR比喻成AI的眼睛。
技術突破:集成了眾多計算機科技和圖形影象學技術,包括實時渲染技術、空間定位追蹤、影象識別、人機互動、顯示技術、雲端儲存、資料傳輸、內容開發工具等領域。
AR技術不僅展現了真實世界的資訊,而且將虛擬的資訊同時顯示出來,兩種資訊相互補充、疊加。在視覺化的增強現實中,使用者利用頭戴顯示器,把真實世界與電腦圖形多重合成在一起,便可以看到真實的世界圍繞著它。增強現實技術包含了多媒體、三維建模、實時視訊顯示及控制、多感測器融合、實時跟蹤及註冊、場景融合等新技術與新手段,為人類感知資訊提供了新的方式。
未來移動AR技術將向創意性AR應用、基於位置的AR體驗、多人AR體驗發展。
重大意義:隨著蘋果 ARKit、谷歌 ARCore 的釋出,移動AR在兩大移動平臺上均意義重大。這也意味著,全球 5 億臺支援 AR 功能的移動裝置正在吸引所有的公司入局,這些公司正在將資料與 API 相結合,為使用者創造新的 AR 體驗。
點評:感覺自己離進入真正的二次元世界不遠了。
5. 生物特徵識別技術
入選理由:行為識別技術應用於安防,為安全又上了一道鎖。
技術突破:店鋪安裝攝像頭已經是一件非常普遍的行為,但普通的攝像頭只能紀錄店鋪內人們的行為,如果發現盜竊需要通過觀看監控記錄人工排查,耗時費力。
而近日,日本電信巨頭宣佈已研發出一款名為“AI Guardman”的新型人工智慧安全攝像頭,這款攝像頭可以通過對人類動作意圖的理解,在盜竊行為發生前就能準確預測,從而幫助商店識別偷竊行為,發現潛在的商店扒手。
這套人工智慧系統採用開源技術,能夠實時對視訊流進行掃描,並預測人們的姿勢。當遇到監控中出現可以行為時,系統會嘗試將姿勢資料與預定義的“可疑”行為匹配,一旦發現就會通過相關手機App來通知店主。據相關媒體報道,這款產品使得商店減少了約四成的盜竊行為。
重大意義:通過行為識別技術,能夠第一時間發現犯罪分子,預測犯罪行為,有效保護店鋪安全。
點評:去日本的商店買東西一定要果斷,被誤會成小偷就不好啦。
6. 機器人流程自動化
入選理由:機器人流程自動化能夠幫助甚至代替人類負擔大量簡單且單一、重複而繁重的工作,並且效率更高、零失誤。
技術突破:機器人流程自動化(RPA)是通過使用高效能認知技術實現業務的自動化和工作的效率。人類只需在操作介面上編寫需要人工完成的工作流程,即可處理各種業務,如瀏覽器,雲,以及各種軟體。
Gartner資料顯示,在過去的一年中,全球範圍中大型商業巨頭裡有300家陸陸續續開展了RPA工程,將原先手工化的流程進行自動化改革。隨著科技的進步RPA將融入更多人工智慧技術,即智慧流程自動化(Intelligent Process Automation)。相當於在基於規則的自動化基礎(RPA)之上增加基於深度學習和認知技術的推理、判斷、決策能力。
重大意義:機器人流程自動化能夠大幅提升企業的工作效率,減少人員投入,幫助企業降低成本,讓人類釋放生產力,騰出雙手去做價值更高的事情。
點評:小白領被嚇的瑟瑟發抖,請老闆別炒我。
7. 畫素級聲源定位系統PixelPlayer
入選理由:從視覺和聽覺訊號角度實現聲源分離,開闢研究新途徑。
技術突破:在進行音樂編輯時,一般是利用均衡器將音樂中的低音部分調出來,而麻省理工學院電腦科學和人工智慧實驗室的研究人員發現了更好的解決方案。他們所研發的新系統PixelPlayer。
PixelPlayer能夠通過結合聲音和影象資訊,機器學習系統能以無監督的方式從影象或聲音中識別目標、定點陣圖像中的目標,以及分離目標產生的聲音。當我們給定一個輸入視訊,PixelPlayer可以聯合地將配音分離為目標元件以及在影象幀上定位目標元件。PixelPlayer 允許在視訊的每個畫素上定位聲源。
簡單點說就是PixelPlayer能識別出視訊中哪個物體發出哪些聲音,並將聲音分離出來。
重大意義:PixelPlayer能夠過濾伴奏、識別音源,不僅能幫助人類處理音樂,還能夠幫助機器人更好地理解其他物體所產生的環境聲音。
點評:如果老師用了這個系統,就能立刻找出課堂交頭接耳的同學。
8. 兼顧高精度學習和低精度推理的深度學習晶片
入選理由:這個晶片可以涵蓋了目前已知的最佳訓練和最好推理,能夠保持所有處理器元件能夠得到資料和工作。
技術突破:該深度學習晶片是IBM正在研究的專案之一。IBM將這個晶片的目標利用率定在90%。這將是一個質的突破,為了實現這一突破,IBM的研發團隊做了兩項創新。
首先,利用率低通常是因為存在於晶片周圍的資料流瓶頸。為了突破這些資訊障礙,該專案的團隊開發了一個“定製”的資料流系統。該資料流系統是一種網路方案,可以加速資料從一個處理引擎到下一個處理引擎的傳輸過程。它還針對要處理的是學習任務還是推理任務以及不同的精度進行了優化。
第二項創新是團隊使用專門設計的“便箋本”形式的片上儲存器,而不是CPU或GPU上的傳統高速緩衝儲存器。構建它的目標是為了保持資料流經晶片的處理引擎,並確保資料在恰當的時間處於正確的位置。為了獲得90%的利用率,IBM必須使設計出的便箋本具有巨大的讀/寫頻寬。
重大意義:該晶片可以執行當前所有的三種主要深度學習AI:卷積神經網路(CNN)、多層感知器(MLP)和長-短期記憶(LSTM)。這些技術共同主導了語言、視覺和自然語言處理。
點評:目前深度學習技術陷入瓶頸,IBM的深度學習晶片也許能夠扭轉這一局勢。
9. 智慧代理訓練平臺
入選理由:智慧代理技術使計算機應用趨向人性化、個性化。它能夠以主動服務的方式完成的一組操作的機動計算實體,不需要人的即時干預。
技術突破:智慧代理技術具有解決問題所需的豐富知識、策略和相關資料,能夠進行相關的推理和智慧計算,智慧代理還可以在使用者沒有給出十分明確的需求時推測出使用者的意圖、興趣或愛好,並按最佳方式代為其完成任務,並能自動拒絕一些不合理或可能給使用者帶來危害的要求;智慧代理還從經驗中不斷自我學習,能夠根據環境調整自身的行為,從而提高處理問題的能力。
智慧代理技術可以應用於商業、智慧搜尋代理、數字圖書館、電子商務和遠端教育的研究等,現在它也被應用於遊戲領域。
Unity是全球領先的遊戲開發公司之一,去年其推出了機器學習平臺ML-Agents,讓AI開發人員和研究人員在Unity模擬和遊戲環境中,使用演化策略、深度強化學習和其他訓練方法來訓練智慧代理。這種模擬訓練的方法在工業機器人、無人機、無人駕駛車輛和遊戲角色設計中均有著廣泛應用。
重大意義:Unity以使機器學習研究人員獲得最強大的訓練場景為使命,為快速增長的AI愛好者群體探索深度學習提供了一個研究平臺。
點評:NPC越來越聰明,對於遊戲手殘黨來說可能不是個好事。
10. 入耳式人工智慧
入選理由:耳機從外變成了智慧穿戴裝置,可以無限延續使用時間和場景。
技術突破:蘋果在今年即將推出的AirPods 2中加入了Siri喚起、內建晶片等等,可以收集行走步數、心率資料和體溫等等,還可以通過內建陀螺儀捕捉使用者頭部移動狀況甚至定位位置,當然也可以通過麥克風接受命令,再通過揚聲器進行反饋。
谷歌的實時翻譯無線耳機PixelBuds常被拿來與AirPods相比,PixelBuds對Google Assistant的喚起十分迅速,只要把手指放在耳機的觸控板上,幾乎同一時刻就可以和Google Assistant進行對話。
AirPods與PixelBuds讓我們重新定義了耳機對人類的作用,相比手腕上的智慧手錶,耳機顯然可以更方便的進行語音互動,在接收資訊時更無需佔用寶貴的視覺空間。還將智慧音箱式的遠場互動變成更自然也更快捷的近場互動。
重大意義:智慧耳機讓智慧助理更接近隨身隨行,蘋果、谷歌的涉足,必將帶起一波耳中AI的風潮。
點評:現在我們手機不離手,以後可能要耳機不離耳了。
我們看到這些科技公司或者科研團隊,學習翻譯、研究捕魚、開發遊戲、做著音樂……看似“不務正業”,而這恰恰證明了,人工智慧不單單是一種技術或一個產品。
從IBM、蘋果,到谷歌,百度,所有的人工智慧巨頭都在嘗試軟體、硬體、應用場景的聯通。聰明的科技公司都不再單一的專注於自己的傳統業務,而是著眼於未來,不斷創新技術,跨界融合打造一個整合的生態系統。
後臺回覆“區塊鏈”,獲取本文報告。