AI時代的序幕
機器與人的區別,一個技術和哲學雙重問題
機器是否能思考?機器和人的區別是什麽?早在17世紀,勒內·笛卡爾就曾經思考過這個問題,當時他給出的推論是,機器雖然能夠根據人動作做出不同的反應,但是並不能以各種方式組織語言類演講表達,因此機器不同於人類。 這位被視為解析幾何之父的數學家,同時也是西方現代哲學的奠基人;醉心哲學研究的他,留下了“我思故我在”的名言。
應該說,類似笛卡爾這樣的哲學思考和論斷,起到了安撫人心的作用。在機器隆隆作響的三次工業革命進程中,從未引起如今這般全社會範圍對機器智能的恐慌。農業人口減少,但是促生了工人群體,並湧現了重多具備專業知識的中產階級;高新科技產業的發展不僅帶來了體積更小、速度更快、能耗更小、價格更低、可靠性更強的各類專業計算機器,而且實現了信息的互聯互通,人們享受著技術進步帶來的成果。
1950年,也就是半個多世紀前,計算機先驅圖靈在一篇《計算機機器與智能》論文中提出了一個試驗,如何確定一個機器是否有與人類等價的智能。 在這個試驗中,所有對話內容都是以文本形式傳遞的,即問題和答案通過計算機鍵盤輸入和屏幕輸出。
圖靈測試自此引發了業內數十年內的無數次試驗, 偶爾有一些試驗聲稱自己通過了圖靈測試,但是莫衷一是,並沒有取得廣泛的認同。大家也因此‘沾沾自喜’地以為機器還是無法與人類相提並論。
業界普遍認為,在圖靈測試提出的六十四年之後的2014年,一個聊天機器程序成功讓人類相信它是一名13歲男孩。同年,英國倫敦Google DeepMind團隊開始研發人工智能圍棋軟件,並陸續戰勝了圍棋職業棋手李世石、柯潔以及五人團隊。僅僅經過兩年時間,AlphaGo就從業余棋手成為了真正打敗天下打遍天下無敵手的世界第一;最新代Alpha Zero則可以通過自我學習完成21天戰勝中國棋神。
這時,AI贏得了空前的關註。人類,開始恐慌。
別慌,AI是專項代工,而非全能特工
AI雖然取得了巨大成就,但是距真正服務現實生活還有一定距離。李開復在其剛剛結束的達沃斯見聞中寫道:“Deepmind團隊Mustafa非常坦誠地說:‘Alpha zero沒有那麽神,外界對它有點誇大了。它要想工作,必須滿足三個前提:可預測環境(圍棋規則),清晰獎勵系統(輸贏),無變數(variability) 。’也並不是外界說的不受監督,Alpha zero的監督來自於它的結構和訓練環境,這些依賴強化學習的具體方法在現實生活中效果不是很好。在現實生活中我們無法提供模擬器,進行巨量訓練來形成算法。……,因為真實世界比遊戲復雜很多。”
回顧以往,AI(Artificial Intelligence)經歷了三個重大階段,早期探索階段是圖靈測試提出的1950年左右,基於數學統計學,通過公式表達數據變量之間關系,並將該邏輯編寫於代碼中;1980年左右開始機器學習(Machine learning),基於各種算法實現提取特征、分類,進行數據加工或/和模型訓練等工作;而2006年左右深度學期迅速崛起,這種基於深度神經網絡的模式,無需手動提取特征或分類。
取自英偉達公司關於人工智能的演講分享
目前,人類依然在研究人腦工作原理,人工智能無法完全取代人類思考,但是在給定具體場景和工作任務的情況下,人工智能完全可以勝任那些單一、重復、枯燥的工作。可以認為,AI更多地被嘗試在不同領域成為合格的任務執行者,比如自動駕駛、聽寫轉譯、人臉考勤、城市交通數據感知和決策等。
不如,思考怎樣用好AI服務於公民。不如,擁抱AI。
AI+對話,古老但充滿活力的課題
實際生活中,對話服務存在各種各樣的場景。比如語音搜索信息(查詢天氣或路況),發起一個任務相關的一連串請求(預定某次航班及座位),咨詢類溝通(選擇酒店或者電話套餐)等等。
提及對話自然繞不開圖靈測試,在圖靈測試提出之後,業界不斷努力沈澱出經典的自然語言處理(NLP)技術,建立聲學模型,並相繼引入機器學習及深度學習,文本和語音素材的處理能力節節攀高。時至今日,計算機已經可以在一些場景下與人順暢地溝通交流。也正基於此,客服行業正在逐步從勞動密集型專向技術密集型。
傳統上語音識別聲學模型一般采用GMM-HMM進行建模。2011年以來,隨著深度學習技術的發展,基於DNN-HMM的建模方法取得了長足發展,相比傳統方法可以使語音識別的準確率相對提升20%-30%,2014年左右已取代前者成為學術界和工業界的主流配置。為了充分理解上下文,研究人員先提出一種長短時記憶網絡(LSTM-RNN),而後又對LSTM進行了擴展,使用雙向長短時記憶網絡(BLSTM-RNN)進行聲學模型建模。BLSTM可以有效地提升語音識別的準確率,相比於DNN模型,相對性能提升可以達到15%-20%。
以阿裏巴巴集團為例,阿裏智能語音使用的是基於LC-BLSTM-DNN hybrid的語音識別聲學模型,在產品數據上相比DNN取得了17%-24%的相對識別錯誤率下降。早在2015年底,阿裏智能語音就已經上線了該種模型,這是該模型在工業界的首次應用。這次應用,不僅大大提升了識別準確率,更解決了BLSTM需整句轉寫和不能支持在線服務的問題。同時,阿裏智能語音在工業界首個上線了Low Frame Rate模型,將模型計算速度提高了3倍,大大降低了LC-BLSTM的計算消耗,即單核能夠支持的路數是普通的語音識別廠商的的3倍。
2016年4月阿裏開始重構智能助理,以AI和人工結合方式提供智能購物、極速服務的私人助理體驗,問題解決準確率達90%,2016年雙十一智能助理接待6500萬人次,對話1億輪次。隨後,阿裏開放給商家AI機器人產品,與千牛/旺旺深度整合,服務了3萬+活躍商家。去年,上線了面向個人和企業的會話式機器人開放平臺,並同時通過場景+產品+服務+方法論+合作夥伴的形式,向金融、航空、運營商、教育、醫療等行業快速推廣。
AI+工作流,枯燥繁瑣的工作丟給誰
工作中難免會有一些操作繁瑣的事情,比如數據導入、采購訂單填寫、發票管理、員工考勤等,這些涉及數字等重要信息的工作,容不得半點馬虎,但是不得不承認,這背後的操作單調重復且並不給員工們帶來巨大的能力提升。
企業應當充分利用計算機優化信息系統和業務流程,認真思考組織架構和核心技術。不應該讓有能力的員工,被工作拖沓得失去耐心和熱情。
比如,薪資結算這項工作,需要由分公司的人事專員首先獲取員工考勤、工時、合同工資等相關信息,在薪酬系統中提交按照規則計算出相應的數字,再經過一定的審批流程後,執行付款。在這一項工作中,可能會從數個不同系統和不同部門獲取信息,步驟繁瑣;並且事關薪酬,切不可有差池;而倘若員工人數可觀,那麽則更加繁重。
以財務部門工作為例,大集團內的相關財務需要橫跨多個部門,具有眾多的共享協作工作,如總賬管理、工程核算、現金流預測、預算管控、資產管理、稅務申報、稅表管理、入庫歸檔等等。
阿裏集團也曾經面臨同樣的困境,隨著業務發展,遇到了越來越多的各部門協作、復雜流程和效率低下的問題,亟需一種方法提高工作效率、讓人專註於更有價值的工作。碼棧,於2011年,應運而生。在內部千錘百煉之後,於2015年實現了4000用戶、累積執行2.5億條任務的突破,碼棧RPA產品於2016年起賦能阿裏平臺客戶與合作夥伴。
據悉,碼棧RPA已經成功服務於阿裏集團財務部、天安人壽集團客服部門、安踏財務部門、螞蟻金服、中國進出口銀行浙江省分行等多家客戶。其中,財報入庫機器人只需要5分鐘左右即可完成耗費人力8小時的工作,將工作效率提升1000%;而其他種類如資金管理機器人、廣告復核機器人、增值稅申報機器人等可提升100%、500%、800%的工作效率。
AI + 運維, 堪比會補天的女媧神仙
運維部門是公司IT系統的防線。一臺服務器很好管理,交給初級工程師也還算放心;數幾臺有點緊張,需要精銳團隊齊心協作;但是,如果上萬臺呢?上萬臺中運行著成百上千的應用,就務必需要有跨越式、躍遷化的管理方法了。
在巨大的運維重任下,阿裏巴巴集團內部嘗試了借助人工智能來更好地管理業務故障,將業務數據、應用性能和基礎架構三個維度綜合考察,再結合數據存儲、AI算法、數據分析、數據呈現等方法,可以針對業務異常事件自動拆解相關維度,逐層剝離定位故障原因,實現故障的一鍵快速恢復。同時兼具告警與預測功能,關聯多個業務場景進行上下遊根因分析,進行異常自動告警;通過時間序列分析和機器學習可以對未來一段時間的業務指標趨勢進行預測。更難能可貴的是,這種AIOps的方式可以根據變化自動調整算法參數,全程自動學習無需人工幹預。
此外,在阿裏內部經過千錘百煉的AI智能基線,基於歷史數據,可以簡潔直觀地發現異常趨勢。據悉,智能基線幫助阿裏集團將故障發現準確率從40%提高到80%,故障召回率從30%提高到80%,每周節省因誤報而花費的操作時間29小時。
AI + 門店,管理運營的好參謀
如同運維上萬臺機器一樣,運營連鎖品牌門店也需要可以“以一當百”地提效管理工具;連鎖門店的信息管理鏈條較長,從門店、區域再到總部匯總、集團領導層,反饋周期長引發無法及時糾偏、管控乏力、整體效率低等後果。
目前,阿裏雲推出的智能巡店解決方案,不僅具備如實時監控、視頻輪巡、移動段觀看等基礎監控,而且增添了智能點檢、異常事件處理、在線考評經營成果等功能。該方案基於圖像識別技術,對連鎖門店的監控視頻進行智能分析,輔助督導員遠程巡店。
在人類社會發展的長河中,隨著技術的不斷叠代,人們漸漸從枯燥重復的勞動中解放出來。洗衣機將衣物清洗變成了只需幾分鐘的簡單操作,微波爐帶來了幹凈而高效的食物加熱方式,汽車火車飛機等交通工具大大縮短了旅途時間。
AI作為當今時代,是冉冉升起的技術新星,也不可避免地步入了我們的社會生活。
阿裏雲,也會一如既往地致力於以科技服務社會。
閱讀原文?
本文為雲棲社區原創內容,未經允許不得轉載。
AI時代的序幕