1. 程式人生 > >《人工智慧標準化白皮書2018》釋出完整版

《人工智慧標準化白皮書2018》釋出完整版

【導讀】1月18日,召開國家人工智慧標準化總體組、專家諮詢組成立大會,在會上,國家標準化管理委員會宣佈成立國家人工智慧標準化總體組、專家諮詢組,負責全面統籌規劃和協調管理我國人工智慧標準化工作。會議貫徹了黨的十九大會議關於推動人工智慧和實體經濟深度融合精神,會議還解讀了《人工智慧標準化助力產業發展》、《促進新一代人工智慧產業發展三年行動計劃(2018-2020)》,全面推進人工智慧標準化工作,促進人工智慧產業發展。

人工智慧標準化白皮書

(2018 版)

指導單位:國家標準化管理委員會工業二部

編寫單位:中國電子技術標準化研究院

二零一八年一月

▌編寫單位(排名不分先後)

中國電子技術標準化研究院 中國科學院自動化研究所北京理工大學 清華大學 北京大學 中國人民大學 北京航空航天大學 科大訊飛股份有限公司 華為技術有限公司 國際商業機器(中國)有限公司阿里雲端計算有限公司 中國科學院計算技術研究所 中國電信集團公司 騰訊網際網路加(深圳)有限公司 阿里巴巴網路技術有限公司 上海計算機軟體技術開發中心 上海智臻智慧網路科技股份有限公司 北京愛奇藝科技有限公司 北京有生志廣科技有限公司 極限元(北京)智慧科技股份有限公司 北京位元組跳動科技有限公司(今日頭條) 北京商湯科技開發有限公司 浙江螞蟻小微金融服務集團有限公司 百度網路技術有限公司 英特爾(中國)有限公司 松下電器(中國)有限公司 重慶凱澤科技股份有限公司 海爾工業智慧研究院有限公司 重慶中科雲從科技有限公司 北京格靈深瞳資訊科技有限公司

▌目錄

▌1 前言

1.1 研究背景

人工智慧概念誕生於 1956 年,在半個多世紀的發展歷程中,由於受到智慧 演算法、計算速度、儲存水平等多方面因素的影響,人工智慧技術和應用發展經歷 了多次高潮和低谷。2006 年以來,以深度學習為代表的機器學習演算法在機器視 覺和語音識別等領域取得了極大的成功,識別準確性大幅提升,使人工智慧再次 受到學術界和產業界的廣泛關注。雲端計算、大資料等技術在提升運算速度,降低 計算成本的同時,也為人工智慧發展提供了豐富的資料資源,協助訓練出更加智 能化的演算法模型。人工智慧的發展模式也從過去追求“用計算機模擬人工智慧”, 逐步轉向以機器與人結合而成的增強型混合智慧系統,用機器、人、網路結合成 新的群智系統,以及用機器、人、網路和物結合成的更加複雜的智慧系統。

作為新一輪產業變革的核心驅動力,人工智慧在催生新技術、新產品的同時, 對傳統行業也具備較強的賦能作用,能夠引發經濟結構的重大變革,實現社會生 產力的整體躍升。人工智慧將人從枯燥的勞動中解放出來,越來越多的簡單性、 重複性、危險性任務由人工智慧系統完成,在減少人力投入,提高工作效率的同 時,還能夠比人類做得更快、更準確;人工智慧還可以在教育、醫療、養老、環 境保護、城市執行、司法服務等領域得到廣泛應用,能夠極大提高公共服務精準 化水平,全面提升人民生活品質;同時,人工智慧可幫助人類準確感知、預測、 預警基礎設施和社會安全執行的重大態勢,及時把握群體認知及心理變化,主動 作出決策反應,顯著提高社會治理能力和水平,同時保障公共安全。

人工智慧作為一項引領未來的戰略技術,世界發達國家紛紛在新一輪國際競 爭中爭取掌握主導權,圍繞人工智慧出臺規劃和政策,對人工智慧核心技術、頂 尖人才、標準規範等進行部署,加快促進人工智慧技術和產業發展。主要科技企 業不斷加大資金和人力投入,搶佔人工智慧發展制高點。2017 年,我國出臺了 《新一代人工智慧發展規劃》(國發〔2017〕35 號)、《促進新一代人工智慧產業 發展三年行動計劃(2018-2020 年)》(工信部科〔2017〕315 號)等政策檔案, 推動人工智慧技術研發和產業化發展。目前,國內人工智慧發展已具備一定的技 術和產業基礎,在晶片、資料、平臺、應用等領域集聚了一批人工智慧企業,在 部分方向取得階段性成果並向市場化發展。例如,人工智慧在金融、安防、客服 等行業領域已實現應用,在特定任務中語義識別、語音識別、人臉識別、影象識 別技術的精度和效率已遠超人工。

標準化工作對人工智慧及其產業發展具有基礎性、支撐性、引領性的作用, 既是推動產業創新發展的關鍵抓手,也是產業競爭的制高點。當前,在我國人工 智慧相關產品和服務不斷豐富的同時,也出現了標準化程度不足的問題。人工智 能涉及眾多領域,雖然某些領域已具備一定的標準化基礎,但是這些分散的標準 化工作並不足以完全支撐整個人工智慧領域。另一方面,人工智慧屬於新興領域, 發展方興未艾,從世界範圍來看,標準化工作仍在起步過程中,尚未形成完善的 標準體系,我國基本與國外處於同一起跑線,存在快速突破的機會視窗。只要瞄 準機會,快速佈局,完全有可能搶佔標準創新的制高點,反之,則有可能喪失良 機。因此,迫切需要把握機遇,加快對人工智慧技術及產業發展的研究,系統梳 理、加快研製人工智慧各領域的標準體系,明確標準之間的依存性與制約關係, 建立統一完善的標準體系,以標準的手段促進我國人工智慧技術、產業蓬勃發展。

1.2 研究目標及意義

本白皮書前期在國標委工業二部和工信部科技司的指導下,通過梳理人工智 能技術、應用和產業演進情況,分析人工智慧的技術熱點、行業動態和未來趨勢, 從支撐人工智慧產業整體發展的角度出發,研究制定了能夠適應和引導人工智慧 產業發展的標準體系,進而提出近期急需研製的基礎和關鍵標準專案。

本白皮書並不預期成為人工智慧領域的全面技術和產業綜述,不求面面俱到, 僅針對目前人工智慧領域涵蓋的技術熱點和產業情況進行分析,研究提出人工智 能標準體系。人工智慧標準化工作尚處於起步階段,本白皮書只作為人工智慧領 域技術、產業和標準化之間初始的連線紐帶,並將在今後不斷根據技術、產業和 標準化的發展需求進行修訂。本白皮書不過多地給出人工智慧領域觀點性的陳述, 力求以較為淺顯易懂的語言和方式進行闡述。

本白皮書的意義在於與業界分享人工智慧領域的研究成果和實踐經驗,呼籲 社會各界共同加強人工智慧領域的技術研究、產業投入、標準建設與服務應用, 共同推動人工智慧及其產業發展。

▌2 人工智慧概述

2.1 人工智慧的歷史及概念

2.1.1人工智慧的起源與歷史

人工智慧始於 20 世紀 50 年代,至今大致分為三個發展階段:第一階段(20 世紀 50 年代——80 年代)。這一階段人工智慧剛誕生,基於抽象數學推理的可 程式設計數字計算機已經出現,符號主義(Symbolism)快速發展,但由於很多事物 不能形式化表達,建立的模型存在一定的侷限性。此外,隨著計算任務的複雜性 不斷加大,人工智慧發展一度遇到瓶頸;第二階段(20 世紀 80 年代——90 年代 末)。在這一階段,專家系統得到快速發展,數學模型有重大突破,但由於專家 系統在知識獲取、推理能力等方面的不足,以及開發成本高等原因,人工智慧的 發展又一次進入低谷期;第三階段(21 世紀初——至今)。隨著大資料的積聚、 理論演算法的革新、計算能力的提升,人工智慧在很多應用領域取得了突破性進展, 迎來了又一個繁榮時期。人工智慧具體的發展歷程如圖 1 所示。

長期以來,製造具有智慧的機器一直是人類的重大夢想。早在 1950 年,Alan Turing 在《計算機器與智慧》中就闡述了對人工智慧的思考。他提出的圖靈測試 是機器智慧的重要測量手段,後來還衍生出了視覺圖靈測試等測量方法。1956年,“人工智慧”這個詞首次出現在達特茅斯會議上,標誌著其作為一個研究領 域的正式誕生。六十年來,人工智慧發展潮起潮落的同時,基本思想可大致劃分 為四個流派:符號主義(Symbolism)、連線主義(Connectionism)、行為主義 (Behaviourism)和統計主義(Statisticsism)(注:由於篇幅原因,本白皮書不 對四個流派進行詳細闡述)。這四個流派從不同側面抓住了智慧的部分特徵,在 “製造”人工智慧方面都取得了里程碑式的成就。

1959 年,Arthur Samuel 提出了機器學習,機器學習將傳統的製造智慧演化 為通過學習能力來獲取智慧,推動人工智慧進入了第一次繁榮期。20 世紀 70 年 代末期專家系統的出現,實現了人工智慧從理論研究走向實際應用,從一般思維 規律探索走向專門知識應用的重大突破,將人工智慧的研究推向了新高潮。然而, 機器學習的模型仍然是“人工”的,也有很大的侷限性。隨著專家系統應用的不 斷深入,專家系統自身存在的知識獲取難、知識領域窄、推理能力弱、實用性差 等問題逐步暴露。從 1976 年開始,人工智慧的研究進入長達 6 年的蕭瑟期。

在 80 年代中期,隨著美國、日本立項支援人工智慧研究,以及以知識工程 為主導的機器學習方法的發展,出現了具有更強視覺化效果的決策樹模型和突破 早期感知機侷限的多層人工神經網路,由此帶來了人工智慧的又一次繁榮期。然 而,當時的計算機難以模擬複雜度高及規模大的神經網路,仍有一定的侷限性。 1987 年由於 LISP 機市場崩塌,美國取消了人工智慧預算,日本第五代計算機項 目失敗並退出市場,專家系統進展緩慢,人工智慧又進入了蕭瑟期。

1997 年,IBM 深藍(Deep Blue)戰勝國際象棋世界冠軍 Garry Kasparov。 這是一次具有里程碑意義的成功,它代表了基於規則的人工智慧的勝利。2006 年,在 Hinton 和他的學生的推動下,深度學習開始備受關注,為後來人工智慧 的發展帶來了重大影響。從 2010 年開始,人工智慧進入爆發式的發展階段,其 最主要的驅動力是大資料時代的到來,運算能力及機器學習演算法得到提高。人工 智慧快速發展,產業界也開始不斷湧現出新的研發成果:2011 年,IBM Waston 在綜藝節目《危險邊緣》中戰勝了最高獎金得主和連勝紀錄保持者;2012 年, 谷歌大腦通過模仿人類大腦在沒有人類指導的情況下,利用非監督深度學習方法 從大量視訊中成功學習到識別出一隻貓的能力;2014 年,微軟公司推出了一款 實時口譯系統,可以模仿說話者的聲音並保留其口音;2014 年,微軟公司釋出全球第一款個人智慧助理微軟小娜;2014 年,亞馬遜釋出至今為止最成功的智 能音箱產品 Echo 和個人助手 Alexa;2016 年,谷歌 AlphaGo 機器人在圍棋比賽 中擊敗了世界冠軍李世石;2017 年,蘋果公司在原來個人助理 Siri 的基礎上推 出了智慧私人助理 Siri 和智慧音響 HomePod。

目前,世界各國都開始重視人工智慧的發展。2017 年 6 月 29 日,首屆世界 智慧大會在天津召開。中國工程院院士潘雲鶴在大會主論壇作了題為“中國新一 代人工智慧”的主題演講,報告中概括了世界各國在人工智慧研究方面的戰略: 2016 年 5 月,美國白宮發表了《為人工智慧的未來做好準備》;英國 2016 年 12 月釋出《人工智慧:未來決策制定的機遇和影響》;法國在 2017 年 4 月制定了《國 家人工智慧戰略》;德國在2017年5月頒佈全國第一部自動駕駛的法律;在中國, 據不完全統計,2017 年運營的人工智慧公司接近 400 家,行業巨頭百度、騰訊、 阿里巴巴等都不斷在人工智慧領域發力。從數量、投資等角度來看,自然語言處 理、機器人、計算機視覺成為了人工智慧最為熱門的三個產業方向。

2.1.2人工智慧的概念

人工智慧作為一門前沿交叉學科,其定義一直存有不同的觀點:《人工智慧 ——一種現代方法》中將已有的一些人工智慧定義分為四類:像人一樣思考的系 統、像人一樣行動的系統、理性地思考的系統、理性地行動的系統。維基百科上定義“人工智慧就是機器展現出的智慧”,即只要是某種機器,具有某種或某些 “智慧”的特徵或表現,都應該算作“人工智慧”。大英百科全書則限定人工智 能是數字計算機或者數字計算機控制的機器人在執行智慧生物體才有的一些任 務上的能力。百度百科定義人工智慧是“研究、開發用於模擬、延伸和擴充套件人的 智慧的理論、方法、技術及應用系統的一門新的技術科學”,將其視為計算機科 學的一個分支,指出其研究包括機器人、語言識別、影象識別、自然語言處理和 專家系統等。

本白皮書認為,人工智慧是利用數字計算機或者數字計算機控制的機器模擬、 延伸和擴充套件人的智慧,感知環境、獲取知識並使用知識獲得最佳結果的理論、 方法、技術及應用系統。

人工智慧的定義對人工智慧學科的基本思想和內容作出瞭解釋,即圍繞智慧活動而構造的人工系統。人工智慧是知識的工程,是機器模仿人類利用知識完成 一定行為的過程。根據人工智慧是否能真正實現推理、思考和解決問題,可以將 人工智慧分為弱人工智慧和強人工智慧。

弱人工智慧是指不能真正實現推理和解決問題的智慧機器,這些機器表面看 像是智慧的,但是並不真正擁有智慧,也不會有自主意識。迄今為止的人工智慧 系統都還是實現特定功能的專用智慧,而不是像人類智慧那樣能夠不斷適應複雜 的新環境並不斷湧現出新的功能,因此都還是弱人工智慧。目前的主流研究仍然 集中於弱人工智慧,並取得了顯著進步,如語音識別、影象處理和物體分割、機 器翻譯等方面取得了重大突破,甚至可以接近或超越人類水平。

強人工智慧是指真正能思維的智慧機器,並且認為這樣的機器是有知覺的和 自我意識的,這類機器可分為類人(機器的思考和推理類似人的思維)與非類人 (機器產生了和人完全不一樣的知覺和意識,使用和人完全不一樣的推理方式) 兩大類。從一般意義來說,達到人類水平的、能夠自適應地應對外界環境挑戰的、 具有自我意識的人工智慧稱為“通用人工智慧”、“強人工智慧”或“類人智慧”。 強人工智慧不僅在哲學上存在巨大爭論(涉及到思維與意識等根本問題的討論), 在技術上的研究也具有極大的挑戰性。強人工智慧當前鮮有進展,美國私營部門 的專家及國家科技委員會比較支援的觀點是,至少在未來幾十年內難以實現。

靠符號主義、連線主義、行為主義和統計主義這四個流派的經典路線就能設 計製造出強人工智慧嗎?其中一個主流看法是:即使有更高效能的計算平臺和更 大規模的大資料助力,也還只是量變,不是質變,人類對自身智慧的認識還處在 初級階段,在人類真正理解智慧機理之前,不可能製造出強人工智慧。理解大腦 產生智慧的機理是腦科學的終極性問題,絕大多數腦科學專家都認為這是一個數 百年乃至數千年甚至永遠都解決不了的問題。

通向強人工智慧還有一條“新”路線,這裡稱為“模擬主義”。這條新路線 通過製造先進的大腦探測工具從結構上解析大腦,再利用工程技術手段構造出模 仿大腦神經網路基元及結構的仿腦裝置,最後通過環境刺激和互動訓練模擬大腦 實現類人智慧,簡言之,“先結構,後功能”。雖然這項工程也十分困難,但都 是有可能在數十年內解決的工程技術問題,而不像“理解大腦”這個科學問題那 樣遙不可及。

模擬主義可以說是符號主義、連線主義、行為主義和統計主義之後的第五個 流派,和前四個流派有著千絲萬縷的聯絡,也是前四個流派通向強人工智慧的關 鍵一環。經典計算機是數理邏輯的開關電路實現,採用馮諾依曼體系結構,可以作為邏輯推理等專用智慧的實現載體。但要靠經典計算機不可能實現強人工智慧。要按模擬主義的路線“仿腦”,就必須設計製造全新的軟硬體系統,這就是 “類腦計算機”,或者更準確地稱為“仿腦機”。“仿腦機”是“模擬工程”的 標誌性成果,也是“仿腦工程”通向強人工智慧之路的重要里程碑。

2.2 人工智慧的特徵

(1)由人類設計,為人類服務,本質為計算,基礎為資料。從根本上說, 人工智慧系統必須以人為本,這些系統是人類設計出的機器,按照人類設定的程 序邏輯或軟體演算法通過人類發明的晶片等硬體載體來執行或工作,其本質體現為 計算,通過對資料的採集、加工、處理、分析和挖掘,形成有價值的資訊流和知 識模型,來為人類提供延伸人類能力的服務,來實現對人類期望的一些“智慧行 為”的模擬,在理想情況下必須體現服務人類的特點,而不應該傷害人類,特別 是不應該有目的性地做出傷害人類的行為。

(2)能感知環境,能產生反應,能與人互動,能與人互補。人工智慧系統 應能借助感測器等器件產生對外界環境(包括人類)進行感知的能力,可以像人 一樣通過聽覺、視覺、嗅覺、觸覺等接收來自環境的各種資訊,對外界輸入產生 文字、語音、表情、動作(控制執行機構)等必要的反應,甚至影響到環境或人 類。藉助於按鈕、鍵盤、滑鼠、螢幕、手勢、體態、表情、力反饋、虛擬現實/ 增強現實等方式,人與機器間可以產生互動與互動,使機器裝置越來越“理解” 人類乃至與人類共同協作、優勢互補。這樣,人工智慧系統能夠幫助人類做人類 不擅長、不喜歡但機器能夠完成的工作,而人類則適合於去做更需要創造性、洞 察力、想象力、靈活性、多變性乃至用心領悟或需要感情的一些工作。

(3)有適應特性,有學習能力,有演化迭代,有連線擴充套件。人工智慧系統 在理想情況下應具有一定的自適應特性和學習能力,即具有一定的隨環境、資料 或任務變化而自適應調節引數或更新優化模型的能力;並且,能夠在此基礎上通 過與雲、端、人、物越來越廣泛深入數字化連線擴充套件,實現機器客體乃至人類主體的演化迭代,以使系統具有適應性、魯棒性、靈活性、擴充套件性,來應對不斷變化的現實環境,從而使人工智慧系統在各行各業產生豐富的應用。

2.3 人工智慧參考框架

目前,人工智慧領域尚未形成完善的參考框架。因此,本章基於人工智慧的 發展狀況和應用特徵,從人工智慧資訊流動的角度出發,提出一種人工智慧參考 框架(如圖 2 所示),力圖搭建較為完整的人工智慧主體框架,描述人工智慧系 統總體工作流程,不受具體應用所限,適用於通用的人工智慧領域需求。

人工智慧參考框架提供了基於“角色—活動—功能”的層級分類體系,從 “智慧資訊鏈”(水平軸)和“IT 價值鏈”(垂直軸)兩個維度闡述了人工智 能系統框架。“智慧資訊鏈”反映從智慧資訊感知、智慧資訊表示與形成、智慧 推理、智慧決策、智慧執行與輸出的一般過程。在這個過程中,智慧資訊是流動 的載體,經歷了“資料—資訊—知識—智慧”的凝練過程。“IT 價值鏈”從人 工智慧的底層基礎設施、資訊(提供和處理技術實現)到系統的產業生態過程, 反映人工智慧為資訊科技產業帶來的價值。此外,人工智慧系統還有其它非常重 要的框架構件:安全、隱私、倫理和管理。人工智慧系統主要由基礎設施提供者、 資訊提供者、資訊處理者和系統協調者 4 個角色組成。

(1)基礎設施提供者

基礎設施提供者為人工智慧系統提供計算能力支援,實現與外部世界的溝通, 並通過基礎平臺實現支撐。計算能力由智慧晶片(CPU、GPU、ASIC、FPGA 等 硬體加速晶片以及其它智慧晶片)等硬體系統開發商提供;與外部世界的溝通通 過新型感測器製造商提供;基礎平臺包括分散式計算框架提供商及網路提供商提 供平臺保障和支援,即包括雲端儲存和計算、互聯互通網路等。

(2)資訊提供者

資訊提供者在人工智慧領域是智慧資訊的來源。通過知識資訊感知過程由數 據提供商提供智慧感知資訊,包括原始資料資源和資料集。原始資料資源的感知 涉及到圖形、影象、語音、文字的識別,還涉及到傳統裝置的物聯網資料,包括 已有系統的業務資料以及力、位移、液位、溫度、溼度等感知資料。

(3)資訊處理者

資訊處理者是指人工智慧領域中技術和服務提供商。資訊處理者的主要活動 包括智慧資訊表示與形成、智慧推理、智慧決策及智慧執行與輸出。智慧資訊處 理者通常是演算法工程師及技術服務提供商,通過計算框架、模型及通用技術,例 如一些深度學習框架和機器學習演算法模型等功能進行支撐。

智慧資訊表示與形成是指為描述外圍世界所作的一組約定,分階段對智慧信 息進行符號化和形式化的智慧資訊建模、抽取、預處理、訓練資料等。

智慧資訊推理是指在計算機或智慧系統中,模擬人類的智慧推理方式,依據 推理控制策略,利用形式化的資訊進行機器思維和求解問題的過程,典型的功能 是搜尋與匹配。

智慧資訊決策是指智慧資訊經過推理後進行決策的過程,通常提供分類、排 序、預測等功能。

智慧執行與輸出作為智慧資訊輸出的環節,是對輸入作出的響應,輸出整個 智慧資訊流動過程的結果,包括運動、顯示、發聲、互動、合成等功能。

(4)系統協調者

系統協調者提供人工智慧系統必須滿足的整體要求,包括政策、法律、資源和業務需求,以及為確保系統符合這些需求而進行的監控和審計活動。由於人工 智慧是多學科交叉領域,需要系統協調者定義和整合所需的應用活動,使其在人 工智慧領域的垂直系統中執行。系統協調者的功能之一是配置和管理人工智慧參 考框架中的其他角色來執行一個或多個功能,並維持人工智慧系統的執行。

(5)安全、隱私、倫理 安全、隱私、倫理覆蓋了人工智慧領域的其他 4 個主要角色,對每個角色都 有重要的影響作用。同時,安全、隱私、倫理處於管理角色的覆蓋範圍之內,與 全部角色和活動都建立了相關聯絡。在安全、隱私、倫理模組,需要通過不同的 技術手段和安全措施,構築全方位、立體的安全防護體系,保護人工智慧領域參 與者的安全和隱私。

(6)管理 管理角色承擔系統管理活動,包括軟體調配、資源管理等內容,管理的功能 是監視各種資源的執行狀況,應對出現的效能或故障事件,使得各系統元件透明 且可觀。

(7)智慧產品及行業應用 智慧產品及行業應用指人工智慧系統的產品和應用,是對人工智慧整體解決 方案的封裝,將智慧資訊決策產品化、實現落地應用,其應用領域主要包括:智 能製造、智慧交通、智慧家居、智慧醫療、智慧安防等。

▌3 人工智慧發展現狀及趨勢

依據參考框架中所涉及到的人工智慧相關技術,本節重點介紹近二十年來人 工智慧領域關鍵技術的發展狀況,包括機器學習、知識圖譜、自然語言處理、計 算機視覺、人機互動、生物特徵識別、虛擬現實/增強現實等關鍵技術。

3.1 人工智慧關鍵技術

3.1.1 機器學習

機器學習(Machine Learning)是一門涉及統計學、系統辨識、逼近理論、 神經網路、優化理論、電腦科學、腦科學等諸多領域的交叉學科,研究計算機 怎樣模擬或實現人類的學習行為,以獲取新的知識或技能,重新組織已有的知識 結構使之不斷改善自身的效能,是人工智慧技術的核心。基於資料的機器學習是 現代智慧技術中的重要方法之一,研究從觀測資料(樣本)出發尋找規律,利用 這些規律對未來資料或無法觀測的資料進行預測。根據學習模式、學習方法以及 演算法的不同,機器學習存在不同的分類方法。

(1)根據學習模式將機器學習分類為監督學習、無監督學習和強化學習等。

監督學習

監督學習是利用已標記的有限訓練資料集,通過某種學習策略/方法建立一 個模型,實現對新資料/例項的標記(分類)/對映,最典型的監督學習演算法包括 迴歸和分類。監督學習要求訓練樣本的分類標籤已知,分類標籤精確度越高,樣 本越具有代表性,學習模型的準確度越高。監督學習在自然語言處理、資訊檢索、 文字挖掘、手寫體辨識、垃圾郵件偵測等領域獲得了廣泛應用。

無監督學習

無監督學習是利用無標記的有限資料描述隱藏在未標記資料中的結構/規律, 最典型的非監督學習演算法包括單類密度估計、單類資料降維、聚類等。無監督學 習不需要訓練樣本和人工標註資料,便於壓縮資料儲存、減少計算量、提升演算法 速度,還可以避免正、負樣本偏移引起的分類錯誤問題。主要用於經濟預測、異 常檢測、資料探勘、影象處理、模式識別等領域,例如組織大型計算機叢集、社 交網路分析、市場分割、天文資料分析等。

強化學習

強化學習是智慧系統從環境到行為對映的學習,以使強化訊號函式值最大。 由於外部環境提供的資訊很少,強化學習系統必須靠自身的經歷進行學習。強化 學習的目標是學習從環境狀態到行為的對映,使得智慧體選擇的行為能夠獲得環 境最大的獎賞,使得外部環境對學習系統在某種意義下的評價為最佳。其在機器 人控制、無人駕駛、下棋、工業控制等領域獲得成功應用。

(2)根據學習方法可以將機器學習分為傳統機器學習和深度學習。

傳統機器學習

傳統機器學習從一些觀測(訓練)樣本出發,試圖發現不能通過原理分析獲 得的規律,實現對未來資料行為或趨勢的準確預測。相關演算法包括邏輯迴歸、隱 馬爾科夫方法、支援向量機方法、K 近鄰方法、三層人工神經網路方法、Adaboost 演算法、貝葉斯方法以及決策樹方法等。傳統機器學習平衡了學習結果的有效性與 學習模型的可解釋性,為解決有限樣本的學習問題提供了一種框架,主要用於有 限樣本情況下的模式分類、迴歸分析、概率密度估計等。傳統機器學習方法共同 的重要理論基礎之一是統計學,在自然語言處理、語音識別、影象識別、資訊檢 索和生物資訊等許多計算機領域獲得了廣泛應用。

深度學習

深度學習是建立深層結構模型的學習方法,典型的深度學習演算法包括深度置 信網路、卷積神經網路、受限玻爾茲曼機和迴圈神經網路等。深度學習又稱為深 度神經網路(指層數超過 3 層的神經網路)。深度學習作為機器學習研究中的一 個新興領域,由 Hinton 等人於 2006 年提出。深度學習源於多層神經網路,其實 質是給出了一種將特徵表示和學習合二為一的方式。深度學習的特點是放棄了可 解釋性,單純追求學習的有效性。經過多年的摸索嘗試和研究,已經產生了諸多 深度神經網路的模型,其中卷積神經網路、迴圈神經網路是兩類典型的模型。卷 積神經網路常被應用於空間性分佈資料;迴圈神經網路在神經網路中引入了記憶 和反饋,常被應用於時間性分佈資料。深度學習框架是進行深度學習的基礎底層 框架,一般包含主流的神經網路演算法模型,提供穩定的深度學習 API,支援訓練 模型在伺服器和 GPU、TPU 間的分散式學習,部分框架還具備在包括移動裝置、雲平臺在內的多種平臺上執行的移植能力,從而為深度學習演算法帶來前所未有的 執行速度和實用性。目前主流的開源演算法框架有 TensorFlow、Caffe/Caffe2、CNTK、 MXNet、Paddle-paddle、Torch/PyTorch、Theano 等。

(3)此外,機器學習的常見演算法還包括遷移學習、主動學習和演化學習等。

遷移學習

遷移學習是指當在某些領域無法取得足夠多的資料進行模型訓練時,利用另 一領域資料獲得的關係進行的學習。遷移學習可以把已訓練好的模型引數遷移到 新的模型指導新模型訓練,可以更有效的學習底層規則、減少資料量。目前的遷 移學習技術主要在變數有限的小規模應用中使用,如基於感測器網路的定位,文 字分類和影象分類等。未來遷移學習將被廣泛應用於解決更有挑戰性的問題,如 視訊分類、社交網路分析、邏輯推理等。

主動學習

主動學習通過一定的演算法查詢最有用的未標記樣本,並交由專家進行標記, 然後用查詢到的樣本訓練分類模型來提高模型的精度。主動學習能夠選擇性地獲 取知識,通過較少的訓練樣本獲得高效能的模型,最常用的策略是通過不確定性 準則和差異性準則選取有效的樣本。

演化學習

演化學習對優化問題性質要求極少,只需能夠評估解的好壞即可,適用於求 解複雜的優化問題,也能直接用於多目標優化。演化演算法包括粒子群優化演算法、 多目標演化演算法等。目前針對演化學習的研究主要集中在演化資料聚類、對演化 資料更有效的分類,以及提供某種自適應機制以確定演化機制的影響等。

3.1.2 知識圖譜

知識圖譜本質上是結構化的語義知識庫,是一種由節點和邊組成的圖資料結 構,以符號形式描述物理世界中的概念及其相互關係,其基本組成單位是“實體 —關係—實體”三元組,以及實體及其相關“屬性—值”對。不同實體之間通過 關係相互聯結,構成網狀的知識結構。在知識圖譜中,每個節點表示現實世界的 “實體”,每條邊為實體與實體之間的“關係”。通俗地講,知識圖譜就是把所有不同種類的資訊連線在一起而得到的一個關係網路,提供了從“關係”的角度 去分析問題的能力。

知識圖譜可用於反欺詐、不一致性驗證、組團欺詐等公共安全保障領域,需 要用到異常分析、靜態分析、動態分析等資料探勘方法。特別地,知識圖譜在搜 索引擎、視覺化展示和精準營銷方面有很大的優勢,已成為業界的熱門工具。但 是,知識圖譜的發展還有很大的挑戰,如資料的噪聲問題,即資料本身有錯誤或 者資料存在冗餘。隨著知識圖譜應用的不斷深入,還有一系列關鍵技術需要突破。

3.1.3 自然語言處理

自然語言處理是電腦科學領域與人工智慧領域中的一個重要方向,研究能 實現人與計算機之間用自然語言進行有效通訊的各種理論和方法,涉及的領域較 多,主要包括機器翻譯、機器閱讀理解和問答系統等。

(1)機器翻譯

機器翻譯技術是指利用計算機技術實現從一種自然語言到另外一種自然語 言的翻譯過程。基於統計的機器翻譯方法突破了之前基於規則和例項翻譯方法的 侷限性,翻譯效能取得巨大提升。基於深度神經網路的機器翻譯在日常口語等一 些場景的成功應用已經顯現出了巨大的潛力。隨著上下文的語境表徵和知識邏輯 推理能力的發展,自然語言知識圖譜不斷擴充,機器翻譯將會在多輪對話翻譯及 篇章翻譯等領域取得更大進展。

目前非限定領域機器翻譯中效能較佳的一種是統計機器翻譯,包括訓練及解 碼兩個階段。訓練階段的目標是獲得模型引數,解碼階段的目標是利用所估計的 引數和給定的優化目標,獲取待翻譯語句的最佳翻譯結果。統計機器翻譯主要包 括語料預處理、詞對齊、短語抽取、短語概率計算、最大熵調序等步驟。基於神 經網路的端到端翻譯方法不需要針對雙語句子專門設計特徵模型,而是直接把源 語言句子的詞串送入神經網路模型,經過神經網路的運算,得到目標語言句子的 翻譯結果。在基於端到端的機器翻譯系統中,通常採用遞迴神經網路或卷積神經 網路對句子進行表徵建模,從海量訓練資料中抽取語義資訊,與基於短語的統計 翻譯相比,其翻譯結果更加流暢自然,在實際應用中取得了較好的效果。

(2)語義理解

語義理解技術是指利用計算機技術實現對文字篇章的理解,並且回答與篇章 相關問題的過程。語義理解更注重於對上下文的理解以及對答案精準程度的把控。 隨著 MCTest 資料集的釋出,語義理解受到更多關注,取得了快速發展,相關數 據集和對應的神經網路模型層出不窮。語義理解技術將在智慧客服、產品自動問 答等相關領域發揮重要作用,進一步提高問答與對話系統的精度。

在資料採集方面,語義理解通過自動構造資料方法和自動構造填空型問題的 方法來有效擴充資料資源。為了解決填充型問題,一些基於深度學習的方法相繼 提出,如基於注意力的神經網路方法。當前主流的模型是利用神經網路技術對篇 章、問題建模,對答案的開始和終止位置進行預測,抽取出篇章片段。對於進一 步泛化的答案,處理難度進一步提升,目前的語義理解技術仍有較大的提升空間。

(3)問答系統

問答系統分為開放領域的對話系統和特定領域的問答系統。問答系統技術是 指讓計算機像人類一樣用自然語言與人交流的技術。人們可以向問答系統提交用 自然語言表達的問題,系統會返回關聯性較高的答案。儘管問答系統目前已經有 了不少應用產品出現,但大多是在實際資訊服務系統和智慧手機助手等領域中的 應用,在問答系統魯棒性方面仍然存在著問題和挑戰。

自然語言處理面臨四大挑戰:一是在詞法、句法、語義、語用和語音等不同 層面存在不確定性;二是新的詞彙、術語、語義和語法導致未知語言現象的不可 預測性;三是資料資源的不充分使其難以覆蓋複雜的語言現象;四是語義知識的 模糊性和錯綜複雜的關聯性難以用簡單的數學模型描述,語義計算需要引數龐大 的非線性計算。

3.1.4 人機互動

人機互動主要研究人和計算機之間的資訊交換,主要包括人到計算機和計算 機到人的兩部分資訊交換,是人工智慧領域的重要的外圍技術。人機互動是與認知心理學、人機工程學、多媒體技術、虛擬現實技術等密切相關的綜合學科。傳統的人與計算機之間的資訊交換主要依靠互動裝置進行,主要包括鍵盤、滑鼠、 操縱桿、資料服裝、眼動跟蹤器、位置跟蹤器、資料手套、壓力筆等輸入裝置,以及印表機、繪圖儀、顯示器、頭盔式顯示器、音箱等輸出裝置。人機互動技術 除了傳統的基本互動和圖形互動外,還包括語音互動、情感互動、體感互動及腦 機互動等技術,以下對後四種與人工智慧關聯密切的典型互動手段進行介紹。

(1)語音互動

語音互動是一種高效的互動方式,是人以自然語音或機器合成語音同計算機 進行互動的綜合性技術,結合了語言學、心理學、工程和計算機技術等領域的知 識。語音互動不僅要對語音識別和語音合成進行研究,還要對人在語音通道下的 互動機理、行為方式等進行研究。語音互動過程包括四部分:語音採集、語音識 別、語義理解和語音合成。語音採集完成音訊的錄入、取樣及編碼;語音識別完 成語音資訊到機器可識別的文字資訊的轉化;語義理解根據語音識別轉換後的文 本字元或命令完成相應的操作;語音合成完成文字資訊到聲音資訊的轉換。作為 人類溝通和獲取資訊最自然便捷的手段,語音互動比其他互動方式具備更多優勢, 能為人機互動帶來根本性變革,是大資料和認知計算時代未來發展的制高點,具 有廣闊的發展前景和應用前景。

(2)情感互動

情感是一種高層次的資訊傳遞,而情感互動是一種互動狀態,它在表達功能 和資訊時傳遞情感,勾起人們的記憶或內心的情愫。傳統的人機互動無法理解和 適應人的情緒或心境,缺乏情感理解和表達能力,計算機難以具有類似人一樣的 智慧,也難以通過人機互動做到真正的和諧與自然。情感互動就是要賦予計算機 類似於人一樣的觀察、理解和生成各種情感的能力,最終使計算機像人一樣能進 行自然、親切和生動的互動。情感互動已經成為人工智慧領域中的熱點方向,旨 在讓人機互動變得更加自然。目前,在情感互動資訊的處理方式、情感描述方式、 情感資料獲取和處理過程、情感表達方式等方面還有諸多技術挑戰。

(3)體感互動

體感互動是個體不需要藉助任何複雜的控制系統,以體感技術為基礎,直接 通過肢體動作與周邊數字裝置裝置和環境進行自然的互動。依照體感方式與原理 的不同,體感技術主要分為三類:慣性感測、光學感測以及光學聯合感測。體感 互動通常由運動追蹤、手勢識別、運動捕捉、面部表情識別等一系列技術支撐。與其他互動手段相比,體感互動技術無論是硬體還是軟體方面都有了較大的提升, 互動裝置向小型化、便攜化、使用方便化等方面發展,大大降低了對使用者的約束, 使得互動過程更加自然。目前,體感互動在遊戲娛樂、醫療輔助與康復、全自動 三維建模、輔助購物、眼動儀等領域有了較為廣泛的應用。

(4)腦機互動

腦機互動又稱為腦機介面,指不依賴於外圍神經和肌肉等神經通道,直接實 現大腦與外界資訊傳遞的通路。腦機介面系統檢測中樞神經系統活動,並將其轉 化為人工輸出指令,能夠替代、修復、增強、補充或者改善中樞神經系統的正常 輸出,從而改變中樞神經系統與內外環境之間的互動作用。腦機互動通過對神經 訊號解碼,實現腦訊號到機器指令的轉化,一般包括訊號採集、特徵提取和命令 輸出三個模組。從腦電訊號採集的角度,一般將腦機介面分為侵入式和非侵入式 兩大類。除此之外,腦機介面還有其他常見的分類方式:按照訊號傳輸方向可以 分為腦到機、機到腦和腦機雙向介面;按照訊號生成的型別,可分為自發式腦機 介面和誘發式腦機介面;按照訊號源的不同還可分為基於腦電的腦機介面、基於 功能性核磁共振的腦機介面以及基於近紅外光譜分析的腦機介面。

3.1.5 計算機視覺

計算機視覺是使用計算機模仿人類視覺系統的科學,讓計算機擁有類似人類 提取、處理、理解和分析影象以及影象序列的能力。自動駕駛、機器人、智慧醫 療等領域均需要通過計算機視覺技術從視覺訊號中提取並處理資訊。近來隨著深 度學習的發展,預處理、特徵提取與演算法處理漸漸融合,形成端到端的人工智慧 演算法技術。根據解決的問題,計算機視覺可分為計算成像學、影象理解、三維視 覺、動態視覺和視訊編解碼五大類。

(1)計算成像學

計算成像學是探索人眼結構、相機成像原理以及其延伸應用的科學。在相機 成像原理方面,計算成像學不斷促進現有可見光相機的完善,使得現代相機更加 輕便,可以適用於不同場景。同時計算成像學也推動著新型相機的產生,使相機 超出可見光的限制。在相機應用科學方面,計算成像學可以提升相機的能力,從 而通過後續的演算法處理使得在受限條件下拍攝的影象更加完善,例如影象去噪、去模糊、暗光增強、去霧霾等,以及實現新的功能,例如全景圖、軟體虛化、超 解析度等。

(2)影象理解

影象理解是通過用計算機系統解釋影象,實現類似人類視覺系統理解外部世 界的一門科學。通常根據理解資訊的抽象程度可分為三個層次:淺層理解,包括 影象邊緣、影象特徵點、紋理元素等;中層理解,包括物體邊界、區域與平面等; 高層理解,根據需要抽取的高層語義資訊,可大致分為識別、檢測、分割、姿態 估計、影象文字說明等。目前高層影象理解演算法已逐漸廣泛應用於人工智慧系統, 如刷臉支付、智慧安防、影象搜尋等。

(3)三維視覺

三維視覺即研究如何通過視覺獲取三維資訊(三維重建)以及如何理解所獲 取的三維資訊的科學。三維重建可以根據重建的資訊來源,分為單目影象重建、 多目影象重建和深度影象重建等。三維資訊理解,即使用三維資訊輔助影象理解 或者直接理解三維資訊。三維資訊理解可分為,淺層:角點、邊緣、法向量等; 中層:平面、立方體等;高層:物體檢測、識別、分割等。三維視覺技術可以廣 泛應用於機器人、無人駕駛、智慧工廠、虛擬/增強現實等方向。

(4)動態視覺

動態視覺即分析視訊或影象序列,模擬人處理時序影象的科學。通常動態視 覺問題可以定義為尋找影象元素,如畫素、區域、物體在時序上的對應,以及提 取其語義資訊的問題。動態視覺研究被廣泛應用在視訊分析以及人機互動等方面。

(5)視訊編解碼

視訊編解碼是指通過特定的壓縮技術,將視訊流進行壓縮。視訊流傳輸中最 為重要的編解碼標準有國際電聯的 H.261、H.263、H.264、H.265、M-JPEG 和 MPEG 系列標準。視訊壓縮編碼主要分為兩大類:無失真壓縮和有失真壓縮。無損壓 縮指使用壓縮後的資料進行重構時,重構後的資料與原來的資料完全相同,例如 磁碟檔案的壓縮。有失真壓縮也稱為不可逆編碼,指使用壓縮後的資料進行重構時, 重構後的資料與原來的資料有差異,但不會影響人們對原始資料所表達的資訊產 生誤解。有失真壓縮的應用範圍廣泛,例如視訊會議、可視電話、視訊廣播、視訊監控等。

目前,計算機視覺技術發展迅速,已具備初步的產業規模。未來計算機視覺 技術的發展主要面臨以下挑戰:一是如何在不同的應用領域和其他技術更好的結 合,計算機視覺在解決某些問題時可以廣泛利用大資料,已經逐漸成熟並且可以 超過人類,而在某些問題上卻無法達到很高的精度;二是如何降低計算機視覺算 法的開發時間和人力成本,目前計算機視覺演算法需要大量的資料與人工標註,需 要較長的研發週期以達到應用領域所要求的精度與耗時;三是如何加快新型演算法 的設計開發,隨著新的成像硬體與人工智慧晶片的出現,針對不同晶片與資料採 集裝置的計算機視覺演算法的設計與開發也是挑戰之一。

3.1.6 生物特徵識別

生物特徵識別技術是指通過個體生理特徵或行為特徵對個體身份進行識別 認證的技術。從應用流程看,生物特徵識別通常分為註冊和識別兩個階段。註冊 階段通過感測器對人體的生物表徵資訊進行採集,如利用影象感測器對指紋和人 臉等光學資訊、麥克風對說話聲等聲學資訊進行採集,利用資料預處理以及特徵 提取技術對採集的資料進行處理,得到相應的特徵進行儲存。識別過程採用與注 冊過程一致的資訊採集方式對待識別人進行資訊採集、資料預處理和特徵提取, 然後將提取的特徵與儲存的特徵進行比對分析,完成識別。從應用任務看,生物 特徵識別一般分為辨認與確認兩種任務,辨認是指從儲存庫中確定待識別人身份 的過程,是一對多的問題;確認是指將待識別人資訊與儲存庫中特定單人資訊進 行比對,確定身份的過程,是一對一的問題。

生物特徵識別技術涉及的內容十分廣泛,包括指紋、掌紋、人臉、虹膜、指 靜脈、聲紋、步態等多種生物特徵,其識別過程涉及到影象處理、計算機視覺、 語音識別、機器學習等多項技術。目前生物特徵識別作為重要的智慧化身份認證 技術,在金融、公共安全、教育、交通等領域得到廣泛的應用。下面將對指紋識 別、人臉識別、虹膜識別、指靜脈識別、聲紋識別以及步態識別等技術進行介紹。

(1)指紋識別 指紋識別過程通常包括資料採集、資料處理、分析判別三個過程。資料採集 通過光、電、力、熱等物理感測器獲取指紋影象;資料處理包括預處理、畸變校正、特徵提取三個過程;分析判別是對提取的特徵進行分析判別的過程。

(2)人臉識別 人臉識別是典型的計算機視覺應用,從應用過程來看,可將人臉識別技術劃 分為檢測定位、面部特徵提取以及人臉確認三個過程。人臉識別技術的應用主要 受到光照、拍攝角度、影象遮擋、年齡等多個因素的影響,在約束條件下人臉識 別技術相對成熟,在自由條件下人臉識別技術還在不斷改進。

(3)虹膜識別 虹膜識別的理論框架主要包括虹膜影象分割、虹膜區域歸一化、特徵提取和 識別四個部分,研究工作大多是基於此理論框架發展而來。虹膜識別技術應用的 主要難題包含感測器和光照影響兩個方面:一方面,由於虹膜尺寸小且受黑色素 遮擋,需在近紅外光源下采用高分辨影象感測器才可清晰成像,對感測器質量和 穩定性要求比較高;另一方面,光照的強弱變化會引起瞳孔縮放,導致虹膜紋理 產生複雜形變,增加了匹配的難度。

(4)指靜脈識別 指靜脈識別是利用了人體靜脈血管中的脫氧血紅蛋白對特定波長範圍內的 近紅外線有很好的吸收作用這一特性,採用近紅外光對指靜脈進行成像與識別的 技術。由於指靜脈血管分佈隨機性很強,其網路特徵具有很好的唯一性,且屬於 人體內部特徵,不受到外界影響,因此模態特性十分穩定。指靜脈識別技術應用 面臨的主要難題來自於成像單元。

(5)聲紋識別 聲紋識別是指根據待識別語音的聲紋特徵識別說話人的技術。聲紋識別技術 通常可以分為前端處理和建模分析兩個階段。聲紋識別的過程是將某段來自某個 人的語音經過特徵提取後與多複合聲紋模型庫中的聲紋模型進行匹配,常用的識 別方法可以分為模板匹配法、概率模型法等。

(6)步態識別 步態是遠距離複雜場景下唯一可清晰成像的生物特徵,步態識別是指通過身 體體型和行走姿態來識別人的身份。相比上述幾種生物特徵識別,步態識別的技術難度更大,體現在其需要從視訊中提取運動特徵,以及需要更高要求的預處理 演算法,但步態識別具有遠距離、跨角度、光照不敏感等優勢。

3.1.7 虛擬現實/增強現實

虛擬現實(VR)/增強現實(AR)是以計算機為核心的新型視聽技術。結合 相關科學技術,在一定範圍內生成與真實環境在視覺、聽覺、觸感等方面高度近 似的數字化環境。使用者藉助必要的裝備與數字化環境中的物件進行互動,相互影 響,獲得近似真實環境的感受和體驗,通過顯示裝置、跟蹤定位裝置、觸力覺交 互裝置、資料獲取裝置、專用晶片等實現。

虛擬現實/增強現實從技術特徵角度,按照不同處理階段,可以分為獲取與 建模技術、分析與利用技術、交換與分發技術、展示與互動技術以及技術標準與 評價體系五個方面。獲取與建模技術研究如何把物理世界或者人類的創意進行數 字化和模型化,難點是三維物理世界的數字化和模型化技術;分析與利用技術重 點研究對數字內容進行分析、理解、搜尋和知識化方法,其難點是在於內容的語 義表示和分析;交換與分發技術主要強調各種網路環境下大規模的數字化內容流 通、轉換、整合和麵向不同終端使用者的個性化服務等,其核心是開放的內容交換 和版權管理技術;展示與交換技術重點研究符合人類習慣數字內容的各種顯示技 術及互動方法,以期提高人對複雜資訊的認知能力,其難點在於建立自然和諧的 人機互動環境;標準與評價體系重點研究虛擬現實/增強現實基礎資源、內容編 目、信源編碼等的規範標準以及相應的評估技術。

目前虛擬現實/增強現實面臨的挑戰主要體現在智慧獲取、普適裝置、自由 互動和感知融合四個方面。在硬體平臺與裝置、核心晶片與器件、軟體平臺與工 具、相關標準與規範等方面存在一系列科學技術問題。總體來說虛擬現實/增強 現實呈現虛擬現實系統智慧化、虛實環境物件無縫融合、自然互動全方位與舒適 化的發展趨勢。

3.1.8 人工智慧技術發展趨勢

綜上所述,人工智慧技術在以下方面的發展有顯著的特點,是進一步研究人 工智慧趨勢的重點。

(1)技術平臺開源化 開源的學習框架在人工智慧領域的研發成績斐然,對深度學習領域影響巨大。 開源的深度學習框架使得開發者可以直接使用已經研發成功的深度學習工具,減 少二次開發,提高效率,促進業界緊密合作和交流。國內外產業巨頭也紛紛意識 到通過開源技術建立產業生態,是搶佔產業制高點的重要手段。通過技術平臺的 開源化,可以擴大技術規模,整合技術和應用,有效佈局人工智慧全產業鏈。谷 歌、百度等國內外龍頭企業紛紛佈局開源人工智慧生態,未來將有更多的軟硬體 企業參與開源生態。

(2)專用智慧向通用智慧發展 目前的人工智慧發展主要集中在專用智慧方面,具有領域侷限性。隨著科技 的發展,各領域之間相互融合、相互影響,需要一種範圍廣、整合度高、適應能 力強的通用智慧,提供從輔助性決策工具到專業性解決方案的升級。通用人工智 能具備執行一般智慧行為的能力,可以將人工智慧與感知、知識、意識和直覺等 人類的特徵互相連線,減少對領域知識的依賴性、提高處理任務的普適性,這將 是人工智慧未來的發展方向。未來的人工智慧將廣泛的涵蓋各個領域,消除各領 域之間的應用壁壘。

(3)智慧感知向智慧認知方向邁進 人工智慧的主要發展階段包括:運算智慧、感知智慧、認知智慧,這一觀點 得到業界的廣泛認可。早期階段的人工智慧是運算智慧,機器具有快速計算和記 憶儲存能力。當前大資料時代的人工智慧是感知智慧,機器具有視覺、聽覺、觸 覺等感知能力。隨著類腦科技的發展,人工智慧必然向認知智慧時代邁進,即讓 機器能理解會思考。

3.2 人工智慧產業現狀及趨勢

人工智慧作為新一輪產業變革的核心驅動力,將催生新的技術、產品、產業、 業態、模式,從而引發經濟結構的重大變革,實現社會生產力的整體提升。麥肯 錫預計,到 2025 年全球人工智慧應用市場規模總值將達到 1270 億美元,人工智 能將是眾多智慧產業發展的突破點。

通過對人工智慧產業分佈進行梳理,提出了人工智慧產業生態圖,主要分為 核心業態、關聯業態、衍生業態三個層次,如圖 3 所示。

下面將重點對核心業態包含的智慧基礎設施建設、智慧資訊及資料、智慧技 術服務、智慧產品四個方面展開介紹,並總結人工智慧行業應用及產業發展趨勢。

3.2.1 智慧基礎設施

智慧基礎設施為人工智慧產業提供計算能力支撐,其範圍包括智慧感測器、 智慧晶片、分散式計算框架等,是人工智慧產業發展的重要保障。

(1)智慧晶片

智慧晶片從應用角度可以分為訓練和推理兩種型別。從部署場景來看,可以 分為雲端和裝置端兩步大類。訓練過程由於涉及海量的訓練資料和複雜的深度神 經網路結構,需要龐大的計算規模,主要使用智慧晶片叢集來完成。與訓練的計 算量相比,推理的計算量較少,但仍然涉及大量的矩陣運算。目前,訓練和推理 通常都在雲端實現,只有對實時性要求很高的裝置會交由裝置端進行處理。

按技術架構來看,智慧晶片可以分為通用類晶片(CPU、GPU、FPGA)、基於 FPGA 的半定製化晶片、全定製化 ASIC 晶片、類腦計算晶片(IBM TrueNorth)。 另外,主要的人工智慧處理器還有 DPU、BPU、NPU、EPU 等適用於不同場景 和功能的