1. 程式人生 > >預見未來: 微軟亞洲研究院看下一個二十年

預見未來: 微軟亞洲研究院看下一個二十年

預見未來: 微軟亞洲研究院看下一個二十年
(上圖為微軟全球資深副總裁、微軟亞太研發集團主席、微軟亞洲研究院院長洪小文)

2018年11月8日,微軟亞洲研究院迎來了二十週年慶典。1998年11月,微軟亞洲研究院正式在北京成立,是微軟設在美國本土以外規模最大的研究機構。20年來,微軟亞洲研究院已發展成為具有世界影響力的計算機基礎及應用研究機構。目前,微軟亞洲研究院擁有200多名研究人員,以及超過300名訪問學者和實習生,主要聚焦於自然使用者介面、智慧多媒體、大資料與知識挖掘、人工智慧、雲和邊緣計算、電腦科學基礎等六大研究領域。

截至2018年11月,微軟亞洲研究院已在國際頂級學術會議和期刊上公開發表5,000餘篇論文,其中有50多篇榮獲“最佳論文”獎,最近公佈的人工智慧領域頂級學術大會AAAI 2019論文入選名單中有27篇來自微軟亞洲研究院。此外,諸多全球性的科技突破也來自微軟亞洲研究院:2015年微軟亞洲研究院開發的計算機視覺系統在ImageNet挑戰賽中首次超越了人類物體識別分類的能力;2018年在由斯坦福大學發起的SQuAD文字理解挑戰賽榜單上,微軟亞洲研究院的R-NET和NL-NET模型分別在兩個維度上率先超越了人類分數;2018年3月,由微軟亞洲研究院與微軟雷德蒙研究院共同研發的機器翻譯系統,在通用新聞報道測試集newstest2017的中-英測試集上首次達到了可以與人工翻譯媲美的水平。

而在不斷突破科研邊界的時候,微軟亞洲研究院也在深刻影響微軟的產品體系。從微軟智慧雲Azure、Office 365到微軟小冰、必應(Bing)搜尋、再到Xbox以及HoloLens,可以說微軟幾乎每一款產品都有微軟亞洲研究院的烙印,微軟亞洲研究院還通過自身的技術積累和科研創新孵化了很多廣受歡迎的應用和技術平臺。而從微軟亞洲研究院走出來的人才,幾乎撐起了中國科技產業的創新領軍隊伍,包括李開復、張亞勤、王堅、馬維英、芮勇、李世鵬、王海峰等在ICT、網際網路和投資領域都是頂尖級領軍科技人才。

微軟亞洲研究院還孵化出了多個工程院,包括微軟中國雲端計算與人工智慧事業部和微軟(亞洲)網際網路工程院,不僅推動了微軟產品的開發與落地,還進一步完善了微軟在中國和亞太地區的研發佈局,促進了微軟亞太研發集團的成立。2018年9月,微軟亞洲研究院宣佈在上海成立微軟亞洲研究院-上海,同時宣佈與上海市徐彙區人民政府以及上海儀電(集團)有限公司合作建立微軟-儀電人工智慧創新院。

過去二十年,微軟亞洲研究院已經做出了卓越的成就。未來二十年,微軟亞洲研究院怎麼看?微軟亞洲研究院成立20週年之際,微軟亞洲研究院各領域的資深專家在機器學習、計算機視覺、系統研究、資料智慧、個性化推薦系統、自然語言處理、計算機圖形學等十餘個人工智慧核心技術方向發表了文章,解讀了對未來十年到二十年技術趨勢的觀點。本文節選了已經發表了六篇,與讀者分享微軟亞洲研究院的“預見未來”。

好的系統“大象無形”

在整個計算科研和產品創新體系中,計算機系統是最基礎、最根本也是最重要的領域。計算機系統研究涉及的方面非常寬廣,即包括軟體層面的作業系統、資料庫系統、編譯系統行裝,也包括硬體層面的CPU指令集、記憶體、儲存系統、伺服器和資料中心結構等。

微軟亞洲研究院認為,“大音希聲,大象無形”是“好系統”的體現。“無形”就意味著現代計算系統設計要能夠自然而然地陪伴著大眾,但卻也讓大眾能夠“視而不見”,這就像無處不在的加油站或電源介面,這些設施遮蔽了複雜的城市供油和供電線路。

在可見的未來,系統研究仍將把“無形”作為重要設計理念,讓應用開發者和大眾無需面對底層系統的複雜性。未來的技術趨勢是一個現實世界和虛擬世界邊界消失的過程,也可以簡單地說是“虛擬和現實世界的融合”。而這些變化背後需要大量的各型可嵌入可連線的感測器和執行裝置、智慧化的資料分析和服務以及混合現實和浸入式體驗裝置的支援。

在雲端計算系統架構方面,現在一個顯然的技術趨勢就是如何從完全中心化的雲端計算進化到新的去中心化的計算。例如:IoT和邊緣計算的興起就在這個背景下產生。更重要的,從計算機架構和哲學範疇出發,去中心化一直是整個世界占主導地位的一種系統設計。當然,完全去中心化也是不切實際的。未來讓資料和計算如何無縫在雲端和終端遷移、互動以及協作將成為系統研究的一個重要方向,從作業系統、儲存系統乃至一致性協議都需要進一步改進。

未來計算對實時性的要求越來越高,如何針對性的設計相應的計算平臺,是系統研究的一個課題。儲存平臺的發展,從BigTable、MongoDB到Spanner, 遵循以提高可擴充套件性為首要需求,但對一致性的要求也越來越強,高可擴充套件及強一致性的儲存平臺將是未來的趨勢之一。在智慧邊緣計算方面,如何對系統的效能和能耗進行優化,是一個值得持續研究的課題。另外,在邊緣計算中,模型是儲存和執行在邊緣裝置上的。因此,如何保護模型資料不被非法複製和盜用就成了一個重要的問題。在安全、隱私和可信計算方面,安全硬體、區塊鏈和可驗證的軟體技術將一起構成新的安全基礎。

軟體和硬體的一體設計變為一個未來的重要趨勢。如何更好的定義硬體和軟體之間的邊界以及合適的抽象、如何找出它們之間的最好劃分成為了系統體系結構設計的重要問題。例如,對於深度學習、Tensor和計算圖的引入就軟體和硬體如何合作完成這種新的計算模式提出了新的要求;大資料領域、資料運算的抽象結合定製的加密和壓縮晶片也將進一步提高雲計算平臺處理大資料的效率。在新的一體化設計革命中,新的特定領域程式語言、編譯器和優化、以及虛擬化技術也將同時變革。

異構系統正成為近年來計算機體系結構研究的一個熱點。深度學習加速器、FPGA為基礎的可重構硬體、通用可程式設計加速器以及新的通用處理器都在不斷創新。而記憶體硬體的創新例如高速非易失性記憶體(Non Volatile Memory,NVM)、記憶體封裝的創新例如HBM(High Bandwidth Memory )以及體系結構的創新例如記憶體解聚(Memory Disaggregation)也將幫助計算從記憶體訪問頻寬和延遲的瓶頸中解放出來。

未來的人工智慧計算系統的前端表達能力將越來越靈活,逐漸趨於通用計算;同時,後端的計算能力將越來越強大。面對前、後端的快速發展,自動化的編譯優化框架成為了銜接兩者的必經之路。而在人工智慧時代,大規模計算系統不僅要在大規模裝置上才能高效地處理海量資料,更需要能支援多種不同型別任務的混合執行的能力。未來,不同的計算任務在實際中的邊界將變得越來越模糊,很多現實的應用中的資料分析都是由這些計算任務組合而成的綜合體。現在更多大型系統有著更多的隨機性,控制變數和環境變數大幅增加。這些新的變化,讓人工智慧可能發揮更大的作用。在將來,系統研究者需要探索如何將基於統計學習的方法更加廣泛的應用到大型複雜系統的設計和控制中去。

機器學習還有哪些可以期待?

近年來,有很多新型的機器學習技術受到人們的廣泛關注,也在解決實際問題中,提供了有效的方案,包括深度學習、強化學習、對抗學習、對偶學習、遷移學習、分散式學習、以及元學習。機器學習雖然取得了長足的進步,也解決了很多實際問題,但是機器學習領域仍然存在著巨大的挑戰。

首先,主流的機器學習技術是黑箱技術,無法預知暗藏的危機。為解決這個問題,則需要讓機器學習具有可解釋性、可干預性。其次,目前主流的機器學習的計算成本很高,亟待發明輕量級的機器學習演算法。另外,在物理、化學、生物、社會科學中,人們常常用一些簡單而美的方程(比如像薛定諤方程這樣的二階偏微分方程)來描述表象背後的深刻規律。那麼在機器學習領域,是否也能追求到簡單而美的規律呢?如此的挑戰還有很多,不過微軟亞洲研究院對於這個領域未來的發展仍然充滿信心。

其中,在輕量級機器學習和邊緣計算方面,邊緣計算指的是在網路邊緣節點來處理、分析資料,而邊緣節點指的是在資料產生源頭和雲端計算中心之間具有計算資源和網路資源的節點,比如手機就是人與雲端計算中心之間的邊緣節點,而閘道器則是智慧家居和雲端計算中心之間的邊緣節點。在理想環境下,邊緣計算指的是在資料產生源附近分析、處理資料,降低資料的流轉,進而減少網路流量和響應時間。隨著物聯網的興起以及人工智慧在移動場景下的廣泛應用,機器學習與邊緣計算的結合就顯得尤為重要。

值得一提的是量子機器學習,這是量子計算和機器學習的交叉學科。量子計算機利用量子相干和量子糾纏等效應來處理資訊,這和經典計算機有著本質的差別。目前量子演算法已經在若干問題上超過了最好的經典演算法,我們稱之為量子加速。當量子計算遇到機器學習,可以是個互利互惠、相輔相成的過程:一方面可以利用量子計算的優勢來提高經典的機器學習演算法的效能,如在量子計算機上高效實現經典計算機上的機器學習演算法。另一方面,也可以利用經典計算機上的機器學習演算法來分析和改進量子計算系統。

而在簡單而美的規律方面,面對大自然紛繁複雜的現象和系統,前人已經得出一個出乎意料的結論:貌似複雜的自然現象都由簡單而優美的數學規律所刻畫,如偏微分方程。Mathematica的建立者、知名電腦科學家、物理學家Stephen Wolfram也曾給出過類似的觀察和結論: “事實證明,物理和其他科學領域幾乎所有的傳統數學模型最終都基於偏微分方程。”既然自然現象背後簡而美的數學定律如此普遍,那麼能否設計一種方法來自動學習和發現現象背後的數學定律呢?這個問題顯然很難,但並非完全不可能。

即興學習是機器學習的另一個有趣研究方向。預測學習利用所有當前可用的資訊,基於過去和現在預測未來,或者基於現在分析過去。問題是,生活的世界是否可以預測?這個問題的答案是不明確的。與預測學習對世界的假設不同,即興學習假設異常事件的發生是常態。即興智慧是指當遇到出乎意料的事件時可以即興地、變通地處理解決問題的能力。即興學習意味著沒有確定的、預設的、靜態的可優化目標。直觀地講,即興學習系統需要進行不間斷的、自我驅動的能力提升,而不是由預設目標生成的優化梯度推動演化。換言之,即興學習通過自主式觀察和互動來獲得知識和解決問題的能力。

社會機器學習讓機器模擬人類社會的行為。當前,機器學習的目的是模擬人類的學習過程。但是到目前為止,機器學習忽視了一個重要的因素,也就是人的社會屬性。既然人類的智慧離不開社會,那麼能否讓機器們也具有某種意義的社會屬性,模擬人類社會中的關鍵元素進行演化,從而實現比現在的機器學習方法更為有效、智慧、可解釋的“社會機器學習”呢?事實上,現在的機器學習方法中已經開始出現“社會智慧”的零星影子。由於社會屬性是人類的本質屬性,社會機器學習也將會是利用機器學習從獲取人工智慧到獲取社會智慧的重要方向。

通向AI幸福的未來路徑

人工智慧正在改變我們的生活,更在變革或顛覆著各行各業。人工智慧在創造機遇的同時,也給人類世界帶來了諸多挑戰。

挑戰一:機器或取代人類,造成失業與貧富不均。挑戰二:人工智慧威脅人類自身安全與社會秩序。挑戰三:人工智慧或促成資訊壟斷或意見兩極。面對這些人工智慧帶來的挑戰,問題已從最初的“它可以做什麼”變為了“它應該做什麼”。人工智慧創造了許多契機,也帶來了不確定性。應保持開放的態度,也保留質疑的精神,面對這些挑戰並抓住其中的機遇。

應對AI挑戰,微軟亞洲研究院提出可以考慮以下路徑:

路徑一:推廣計算思維普及教育,讓每一個人成為AI的理解者與受益者。在對計算機智力超越人類智力的擔憂背後,呈現出基礎教育中計算思維培養的缺失。讓新一代受教育者學會運用電腦科學的基本概念來解決問題、設計系統和理解人類行為,正成為建立其未來競爭力的關鍵。

微軟的目標是使人工智慧全民化。自2014年起,微軟亞洲研究院積極與教育部和大中小學合作,以計算思維為切入點,通過產學合作協同育人專案,改革計算機基礎教育模式。五年來,已有近140門相關課程在全國29省市的110餘所高校中開設,由東部發達地區的重點高校帶動西部教學資源稀缺的地方高校,惠及數百萬師生。同時,通過“創新杯”、“程式設計之美”、“程式設計一小時”等系列競賽活動,讓“計算思維”的概念為高等教育、基礎教育界所重視,為其推廣做出了貢獻。資訊化和智慧化的時代背景對人才提出了新的要求,計算機基礎教育和計算思維普及的重要性也與日俱增,微軟正在與國內外計算機領域學者一起,為這個嶄新的時代創造更多可能。

路徑二:推動各行業數字化轉型,讓每家公司成為AI的使用者與創造者。技術變革將行業發展裹挾其中,我們看到人工智慧在教育、醫療、養老、環境保護、城市執行、司法服務等領域的廣泛應用。人工智慧發展的核心是資料,而各行業都儲備著大量資料,若以人工智慧技術有效利用這些資料,行業革新將不只是願景。

數字化轉型的內涵遠不止於將傳統業務數字化,這只是漫漫征途的第一步,智慧化是我們希望到達的“遠方”。人工智慧技術應深入到各行各業,與具體的應用場景結合,從而徹底變革傳統的行業工作模式與產品形態。例如微軟亞洲研究院與華夏基金就人工智慧在金服領域的應用開展戰略合作研究,與培生教育共同開發了英語學習應用「朗文小英」,並與東方海外航運 (OOCL) 展開合作計劃,通過應用人工智慧研究,改善航運網路營運以提升效率。在醫療領域,微軟亞洲研究院與輝瑞公司合作構建了冠心病、腦卒中、高血壓、高血脂等常見慢性病的知識圖譜及智慧問答系統,以幫助患者與醫生進行更有效地溝通。

路徑三:加強國家和政府引導,讓AI在政策、法律和規範的指導下更具效能。在人工智慧面對的諸多挑戰中,技術不是最終難題,人在其中的能動性更值得關注。經過幾代人、無數傑出的科學家研發而成的人工智慧,必須得到更好的管理與規範,才能真正地造福人類。我們亦需要一股力量來緩解科技對人類社會造成的衝擊,政策和法律正是重要的規範與疏導力量。

前面提到的三大挑戰中,很多問題能夠也需要通過國家幫助解決,譬如失業、貧富不均、安全保障、壟斷和偏見、教育等問題都需要政府的力量。就失業問題而言,根據前幾次工業革命的經驗,工業革命後人的智力、人對新事物的接受度也會隨之提升。但不幸的是,人的進步與科技進步並非同步的,這中間有一個時間差。如何讓這段時間平滑過渡,讓受到科技衝擊的人能夠有其他選擇,這就需要國家和政府的關注與幫助。同時,如何有效消除資料壁壘、提升使用者體驗,這也需要政府的努力。

路徑四:敦促科技公司自律,讓AI更加安全可靠,更透明,更可解釋。科技公司是人工智慧技術的受益者,也應當肩負起技術應用的社會責任,讓人工智慧變得更加可靠。微軟自開啟人工智慧領域研究以來,始終關注人工智慧開發與應用的道德倫理問題,作為聯合創辦人創立了人工智慧合作組織(PAI),致力於推進相關問題的討論。

個性化推薦系統

據報道,推薦系統給亞馬遜帶來了35%的銷售收入,給Netflix帶來了高達75%的消費,並且Youtube主頁上60%的瀏覽來自推薦服務。如何搭建有效的推薦系統,意義深遠。微軟亞洲研究院從深度學習的應用、知識圖譜的應用、強化學習的應用、使用者畫像、可解釋推薦等幾個方面,一起看看推薦系統的未來。

深度學習技術在推薦系統中的應用前景很廣闊。其中的一個挑戰是多樣化資料融合:使用者或者物品的資料往往是複雜多樣的,物品的內容可以包括文字、影象、類別等資料,使用者的行為資料可以來自社交網路、搜尋引擎、新聞閱讀應用等多個領域,使用者的行為反饋也可以電商網站中的搜尋、瀏覽、點選、收藏、購買等多種行為。在這些不同的維度中,不同使用者或物品的資料分佈也千差萬別;使用者在不同的行為反饋上的資料量也不同,點選行為的資料量往往遠大於購買行為的資料量。因此,單一、同構的模型是不能有效地處理這些多樣化的資料的,如何深度融合這些複雜資料是一個技術難點。

在捕捉使用者長短期偏好方面,使用者的偏好大致可以分為長期和短期兩類,長期偏好往往指使用者的長期興趣所在,短期偏好指的是使用者在當前環境下的即時興趣,例如最近一週比較喜歡的熱門歌曲。如何結合情境因素的影響,將使用者的長期偏好與短期需求更緊密、有效地結合起來,也是推薦系統的研究熱點。

與社交網路相比,知識圖譜是一種異構網路,因此針對知識圖譜的推薦演算法設計要更復雜和精巧。將知識圖譜引入推薦系統,主要有如兩種不同的處理方式:基於特徵的知識圖譜輔助推薦,核心是知識圖譜特徵學習的引入;基於結構的推薦模型,則更加直接地使用知識圖譜的結構特徵。例如,微軟亞洲研究院使用了向外傳播法,將每個使用者的歷史興趣作為知識圖譜上的種子集合,沿著知識圖譜中的連結迭代地向外擴充套件等。

通過融合深度學習與知識圖譜技術,推薦系統的效能取得了大幅的提升。然而,多數的推薦系統仍是以一步到位的方式建立的。在此,往往要假設已充分獲取使用者資料,且其行為會在較長時間之內保持穩定。然而對於諸多現實場景,例如電子商務或者線上新聞平臺,使用者與推薦系統之間往往會發生持續密切的互動行為。在這一過程中,使用者的反饋將彌補可能的資料缺失,同時有力地揭示其當前的行為特徵,從而為系統進行更加精準的個性化推薦提供重要的依據。

構建推薦系統的核心任務之一在於如何準確地分析出使用者的興趣特點,也就是常說的使用者畫像。簡單說來,使用者畫像是指從使用者產生的各種資料中挖掘和抽取使用者在不同屬性上的標籤,如年齡、性別、職業、收入、興趣等。目前,主流使用者畫像方法一般是基於機器學習尤其是有監督學習的技術,但仍面臨著挑戰,特別是如何從多源異構使用者資料中構建深度、統一和動態的使用者畫像,相應可展開的研究方向包括:構建具有更強表徵能力的使用者表示模型;基於多源和異構資料的使用者畫像;不同平臺使用者畫像資料的共享和使用者隱私保護;面向使用者畫像的統一使用者表示模型等。

前面所提及的研究,大都將重心放在提高推薦準確性上,但與推薦物件的溝通考慮得不夠。是否能夠以使用者容易接受的方式,充分抓住使用者心理,給出適當的例子與使用者溝通。研究發現,這樣的系統不僅能夠提升系統透明度,還能夠提高使用者對系統的信任和接受程度 、使用者選擇推薦產品的概率以及使用者滿意程度,設計這樣一個可解釋的推薦系統是終極目標。目前,微軟亞洲研究院在考慮從下面三個方面進行研究:利用知識圖譜增強演算法解釋能力;模型無關的可解釋推薦框架;結合生成模型進行對話式推薦,例如與微軟小冰合作,為小冰生成音樂推薦解釋等。

影象識別:機遇與挑戰並存

在計算機視覺領域,影象識別這幾年的發展突飛猛進。影象識別技術的高價值應用就發生在身邊,例如視訊監控、自動駕駛和智慧醫療等,而這些影象識別最新進展的背後推動力是深度學習。儘管到目前為止深度學習在影象識別方面已經取得了巨大成功,但在它進一步廣泛應用之前,仍然有很多挑戰需要我們去面對。與此同時,也看到了很多具有未來價值的研究方向。

挑戰一:如何提高模型的泛化能力。影象識別技術在可以被廣泛應用之前,一個重要的挑戰是,怎樣才能知道一個模型對未曾出現過的場景仍然具有很好的泛化能力。

挑戰二:如何利用小規模和超大規模資料。雖然深度學習通過利用大量標註資料在各種任務中都取得了巨大的成功,但現有的技術通常會因為只有很少的標記例項可用而在小資料情景中崩潰。這個情景通常被稱為“少樣本學習(few-shot learning)”,並需要在實際應用中仔細考慮。另一個極端是如何利用超大規模資料有效地提高識別演算法的效能,並且目前的演算法並不能很好地利用這種超大規模資料 。

挑戰三:全面的場景理解。除了識別和定位場景中的物體之外,人類還可以推斷物體和物體之間的關係、部分到整體的層次、物體的屬性和三維場景佈局。獲得對場景的更廣泛的理解將會幫助例如機器人互動這樣的應用,因為這些應用通常需要物體標識和位置以外的資訊。這個任務不僅涉及到對場景的感知,而且還需要對現實世界的認知理解。要實現這一目標,還有很長的路要走。

挑戰四:自動化網路設計。近年來,影象識別這一領域的重心從設計更好的特徵轉向了設計更新的網路架構。然而,設計網路架構是一個冗長乏味的過程,它需要處理大量的超引數和設計選擇。調優這些元素需要有經驗的工程師花費大量的時間和精力。更重要的是,一個任務的最優架構和另一個任務的最優架構可能是完全不同的。

資料智慧的未來熱點

資料智慧研究契合當今大資料時代各領域、各行業從資料中挖掘、實現價值,進行數字化轉型的迫切需要,因而在近年來得到了充分重視,發展迅速。展望未來,資料智慧技術將朝著更自動、更智慧、更可靠、更普適、更高效的方向繼續發展。

熱點1:在更高的語義理解水平上進行分析。為了更加智慧地分析資料,需要對資料有更加豐富的語義理解。與知識圖譜 (Knowledge Base) 不同,雖然資料分析中最常用的關係資料模型也是對實體和關係的建模,但是關係資料模型的建模是為查詢和儲存效能而優化的,往往丟失了大量語義資訊。如何引入領域知識和常識型知識,對於更好地理解資料至關重要。

熱點2:構造通用知識和模型的框架。人類對知識和方法能夠舉一反三,觸類旁通。具體到資料分析領域,分析中用到的知識和模型需要在不同資料物件和分析任務之間共享和遷移。在機器學習領域,已經有很多相關工作,也提出了一些方法,比如遷移學習、多工學習、預學習模型等等。要實現這個“舉一反三”的目標,除了需要深入研究具體的機器學習演算法,也需要從模型和知識的框架體系來思考,研究適合資料分析領域的通用知識和模型的原語體系,以及知識和模型的遷移共享的統一框架。

熱點3:建立高質量的訓練資料集和基準測試資料集。由於訓練資料的缺乏,人工智慧、深度學習等技術在資料智慧領域的進一步應用遇到了很大的困難。正如ImageNet資料對於計算機視覺領域的研究起到了顯著的推動作用一樣,資料智慧領域的研究也亟需建立起一整套公用的大規模、高質量的訓練資料集和基準測試資料集。一旦有了豐富的訓練資料,資料智慧領域的很多研究,諸如自動分析、自然語言互動、視覺化推薦等等,將會取得突破性的進展。

熱點4:提供具有可解釋性的分析結果。使用者將不再滿足於僅僅依賴黑盒式的智慧、端到端地作用於整個任務,而需要更細粒度的、有針對性的、更透明的資料智慧。例如,資料智慧用於財務審計系統中,準確推薦最有風險的交易記錄進行優先審查,以達到在最小化系統風險的前提下,最大化審計效率。在這類系統的研發中,需要構建可理解性強的模型。在推薦高風險交易記錄的同時,儘量提供系統是依據哪部分資訊、通過怎樣的邏輯判斷這是一條高風險交易的相關依據。這與過去通常使用的黑盒技術路線有了明顯的變化,將成為今後技術發展的一個趨勢。

熱點5:人類智慧和機器智慧更加緊密融合。現有人工智慧技術從本質上依然只是被動服從人類設定的既定邏輯然後自動地執行,歸根到底還是無法突破人類傳授的學習框架,沒有創造力。因此在可預見的未來,資料智慧將依然無法擺脫人與機器協作的模式,需要全面地總結人類在資料分析方面的智慧和經驗,便於轉化為機器演算法,系統化地整合到已有的智慧系統當中。

熱點6:強大的指導性分析成為主流。資料分析的核心目標之一便是指導行動,無論分析得有多好,如果不採取行動,那麼分析的價值就不會得到實質的體現,這就是指導性分析的重要價值所在。現在的資料智慧技術在給出指導性分析的同時,並沒有具備足夠解釋性的模型,無法提供充足的依據,從而不足以讓人類使用者充分信任自動推薦的結果。提供具有更好解釋性的指導性分析是一個趨勢。

熱點7:基於隱私保護的資料分析更加成熟完善。通過從立法、技術、到使用者參與等全方位的共同努力,隱私保護將被進一步納入到未來的資料分析中。從技術層面, 應該確保個人資料由資料主體控制如何收集、管理、處理和共享,並在整個生命週期得到保護,同時應開發並部署保護隱私的資料處理技術,以便在保護隱私的前提下,資料得以處理並獲得想要的結果。

熱點8:智慧分析助手得到普及。在不久的將來,智慧的資料分析助手能夠幫助人類更加高效地分析和利用資料。這些資料分析智慧助手通過自然語言對話的方式與人交流資料分析的任務和結果,理解分析的背景和上下文,可以完成人類交給的特定資料分析任務 (根據分析的語義層級不同,可分為基本分析命令和高階資料探勘任務),也可以把具有商業價值的資料事實推薦給相關人類使用者 (比如自動從資料中挖掘到的資料洞察),並對某些資料事件做出智慧判斷和適當的反應 (比如自動對資料中需要注意的變化進行提示和警報)。這樣的智慧體還具有一定的學習能力,能夠通過與人類分析師的對話交流積累特定領域的知識,從而能夠更加具有針對性和更加智慧地進行自動資料分析。

熱點9:協作化的可視分析。隨著各種溝通工具的興起和普及,協作化的可視分析會成為熱點。不同於傳統的面對面、小規模的協作,新的協作分析往往是非同步的和大規模的,人們在不同的時間和地點,使用不同的裝置,對同一個資料進行可視分析。在此過程中,如何協調人們的協作?如何避免重複性的工作?如何保證不同人在不同的顯示終端上看到的資料是一致的?如何共享各種資訊?如何搭建一個高效的協作平臺?這些都是需要解決的技術挑戰。

熱點10:視覺化將無所不在。在更長遠的將來,相信視覺化終將變得透明。就像文字和語音一樣,廣泛***到我們的日常生活中。為此需要有三個方面的技術儲備:視覺化檢視必須能夠被快速地生產和消費;要進行互動方式的變革,各種人類更習慣的方式 (例如手勢、筆紙、觸控等) 需要慢慢演化成更成熟的互動手段;需要顯示裝置的普及,只有當顯示裝置無處不在的時候,視覺化才能真正變成一種溝通的基本方式。

站在微軟亞洲研究院新舊二十年之交,微軟全球資深副總裁、微軟亞太研發集團主席、微軟亞洲研究院院長洪小文表示:為什麼研究院的同仁會選擇在微軟公司做基礎研究,而不是去大學的實驗室?其中的答案是顯而易見的,計算機作為一門應用型學科,要讓研究成果從實驗室走出去,融入到產品研發和實際應用中,直達使用者體驗,貫通創新價值鏈條的全程,才能成就技術發展的最大的社會效能。

微軟亞洲研究院曾被《麻省理工學院技術評論》(MIT Technology Review)譽為“世界上最火的計算機實驗室”,如今的微軟亞洲研究院還將有望成為“最有商業遠見的計算機實驗室”——與微軟的產品與商業緊密結合在一起,微軟亞洲研究院正走在“計算商業”的大路上。(文/寧川)