1. 程式人生 > >人工智能將完成審計的前99步工作(修訂)

人工智能將完成審計的前99步工作(修訂)

二次 想象 百度 編譯 因此 詞法 格式化 制造 感受

https://zhuanlan.zhihu.com/p/21677391

0.利益無關

正因為我沒有利益相關,所以才能寫出不偏頗的觀點。知乎上搜索人工智能+審計,無數人在問:德勤引入人工智能,對行業趨勢有什麽影響。無數審計師也在回答,不可能替代,即使是最激進的回答,也包括一個短期內不可替代。我認為這是一種自大,或者說對強大又不可知事物的惶恐。另一方面,如果把問題延伸到程序員或者專業人工智能從業者上,他們的觀點往往截然相反地表示,人工智能很快就能取代除了人與人溝通的一切工作。這也是一種狂妄,同樣不可取。

1. 概述

人工智能作為一個正在快速崛起的領域,對很多行業直接或間接地產生了影響。機械制造、數據錄入等行業的初級工種已經基本被計算機和機器人所取代,行業的就業崗位數量已經受到了沖擊;另一方面,在醫藥分析、審計、法律等行業,人工智能也讓從業者,尤其是初級從業者感受到了壓力。針對審計是否能被人工智能取代這一問題,不同的人回答千差萬別。大多數審計師的答案都是人工智能不可能替代審計師本身,即使是最激進的回答,也是一個短期內不可替代。另一方面,如果把問題延伸到程序員或者專業人工智能從業者上,他們往往截然相反地表示,人工智能很快就能取代除了人與人溝通的一切工作。一個行業絕不可能永遠不變,也絕不是一蹴而就地改變的。本文通過分析人工智能的現狀、技術和挑戰以及審計行業特點及現在發展狀況,就兩者的結合情況和趨勢進行論述。

2. 人工智能的概念

從Alpha Go戰勝李世石名揚天下後,深度學習這個詞躍然紙上,成為了學術研究的寵兒。從百度指數(圖1)可以看出深度學習這個詞在Alpha Go 第二次戰勝李世石後達到了巔峰,此後一直平均值之上。一些行業外人士也把人工智能和深度學習畫上等號,甚至認為人工智能就是學習得非常深的意思。其實大錯特錯。

技術分享圖片

圖1-深度學習的百度指數變化

人工智能的意思是讓計算機具有人腦的認知能力。這個概念在1940年左右被提出,主要是科學家希望用計算機模擬人類的認知體系。但是隨著腦科學和計算機技術的發展,研究者發現人腦的復雜程度和認知過程的難度遠遠地超過人類的想象,就像一段程序無法驗證自身的ERROR一樣,人類發現通過自己編程來模擬大腦活動,甚至再造一個大腦簡直是天方夜譚。這時,科學家想到一個簡潔一些的辦法:只通過給定輸入和輸出,不通過強制的硬邏輯讓計算機認知,而是通過大量數據的輸入,讓計算機通過結果來理解過程和認知事物,這就是機器學習的雛形。

深度學習則是機器學習的一種方法,目前普遍采用的機器學習方法包括支持向量機、人工神經網絡等等,而深度學習則是多層神經網絡的使用。深度學習的概念由Geoffrey Hinto研究團隊於2006年提出,其基礎是深度置信網絡提出非監督貪婪逐層訓練算法,為解決深層結構相關的優化難題帶來希望。目前深度學習在圖像識別、聲音識別等領域有非常出色的表現。

由此可見,人工智能、機器學習和深度學習是一個遞進的關系,前一層成為後一層的底層建築,而後一層是在前一層基礎上對某個問題點的具體研究成果。

2.德勤引入人工智能

德勤在今年三月宣布將引入人工智能,其總裁喬恩·拉斐爾(Jon Raphael)也發文稱人工智能將在未來大幅度提高審計的質量。這裏的質量,喬恩·拉斐爾認為包含三個維度:速度、成本和效用。喬恩·拉斐爾在其《How Artificial Intelligence can Boost Audit Quality》一文中指出,德勤計劃使用人工智能替代目前由人工主要負責的文件審查(document review)工作。這是一項耗費時間且耗費人力的工作。文件審查工作的內容主要是審計師通過審核公司合同和相關文本,提取出審計相關的數據,並且歸納成信息,與公司財務報告進行對比,形成審計報告(圖3)。

技術分享圖片

圖2-審計信息流程

喬恩·拉斐爾表示,德勤將主要使用人工智能中的使用自然語言處理技術(Natural Language Process)處理審計中需要理解的文檔。自然語言處理技術是讓計算機理解人類語言所表達的內容的技術。在自然語言處理技術中,大量使用了編譯原理相關的技術,例如詞法分析,句法分析等等,除此之外,在理解這個層面,則使用了語義理解,機器學習等技術。作為唯一由人類自身創造的符號,自然語言一直是機器學習界不斷研究的方向。

喬恩·拉斐爾還舉了一個例子,文檔審查時經常碰到的一個情況是自動調整條款(escalation clauses)。在不同的情況下,自動調整條款的調整內容、調整幅度在各種行業、企業和具體條目中是完全不同的。在傳統上,對自動調整條款的理解高度依托審計師的經驗判斷。如果人工智能實現機器判斷,那麽可以極大降低審計師工作的復雜度。

另外德勤將要引入人工智能的方向還包括:數字環境下的一站式決策輔助、大數據技術下分析財務報表和改變物料計數方式等。

3. 現有人工智能技術的不足

雖然德勤宣布引入人工智能在整個審計行業和計算機行業引起了不小的震動,但是從3月份到現在,德勤並沒有發布更加具體的引入方式。除此之外,德勤的行為並沒有讓其他會計師事務所諸如普華永道、畢馬威和安永的跟進。以上兩點顯示出了人工智能目前技術尚有不足。

首先,是現有的算法技術和計算水平還不足以滿足審計行業的要求。目前主要使用的深度學習算法訓練模型訓練耗時,並且模型的正確性檢驗復雜。

另外,審計行業需要很多的先驗知識,但人工智能,尤其是自然語言處理方面的先驗知識的建立非常麻煩。舉一個簡單的例子:“貓趴在火爐旁邊睡覺,因為它非常溫暖。”此句中的“它”字,在語言學上稱為代詞多指。對於此句中的“它”,任何人都可以很輕松地理解“它”代指的是火爐。但是讓計算機理解“它”的指代性是非常困難的,因為它需要了解到“火爐一般是溫暖的”、“貓喜歡溫暖”這些背景信息。這些背景信息就被稱為先驗知識。在審計行業中的先驗知識非常繁雜且重要,這是目前的人工智能技術需要攻克的難關。

3.未來的人工智能對審計行業的影響

人們預言未來時,往往依據當前的科技變化率作為一個基準值,但是實際上科技的變化率是在增加的,我們在簡短的一段時間內並不能觀測到(圖3)。

技術分享圖片

圖3-科技發展趨勢曲線

在知乎上的審計師的普遍觀點是,人工智能在50年內將會取代初級審計師的工作。我對這種觀點不敢同意。簡而言之,整個審計行業出現不過100年,不論是審計方法、流程還是技術都已經發生翻天覆地的轉變,而且這種轉變在可見的未來會隨著市場和科技的發展繼續存在。如果不願意承認未來的審計行業會有十分龐大的變化,或者認為行業革新會發生在不可見的未來遙遠的從業者,很容易被未來所淘汰。我認為在未來10年內,審計行業會有一個巨大的改變,即人的作用從全產業鏈覆蓋變成了最後一步的鋪路人。具體原因如下:

1. 加速回報定律(Law of Accelerating Returns)在可見的未來依然生效。

未來學家克茲維爾(Kurzweil)認為從整個20世紀100年的人類科學技術進步,按照2000年的速度只要20年就能達成——換言之,21世紀初的平均發展速度是20世紀平均發展速度的5倍。他認為2000年開始只要花14年就能達成整個20世紀一百年的進步,而之後2014年開始只要花7年(2021年),就能達到又一個20世紀一百年的進步。幾十年之後,我們每年都能達成好幾次相當於整個20世紀的發展,再往後,說不定每個月都能達成一次。按照加速回報定律,克茲維爾認為人類在21世紀的進步將是20世紀的1000倍。我一直是加速回報定律的擁躉,因為這個定律以過去的很短一段時間為基準,是一個開放性的定律,並且在過去的很長一段時間都被證明是正確的。
摩爾定律就是一個典型的加速回報定律的例子。雖然摩爾定律從誕生伊始就一直被認為將會失效,然而其一直走過了30年的時光,讓人類的計算能力從簡單的數值計算進化到了復雜的人工智能算法。我們有理由相信摩爾定律在可見的未來仍然有效。

人工智能從1960年誕生,經歷了20世紀40年的發展都沒有獲得足夠應用,然而在21世紀的前15年卻開始大放異彩,登上一次又一次報紙新聞的頭條。究其原因,是因為加速回報定律在起作用。新科技初始的發展進步非常緩慢,一旦突破一個瓶頸期,人們可以觀測到它的進步後,就會越來越快地發展,直到在某些方面取代人類。

2. 人工智能對人類發起的是“降維打擊”。

“降維打擊”出自中國科幻作家劉慈欣的科幻小說《三體》。降維打擊讓處在三維空間的生物進入二維空間,直接導致其物體自身微觀粒子相互作用發生變化、生物分子無法穩定存在。

互聯網和人工智能所帶來的認知轉變,不僅存在於“更快、更好”的層面,而是完全不同的快和完全不同的好。

在審計行業中,審計師的“快”就是快速理解審計項目的目的、流程和操作方法,“好”就是按照既定戰略完成審計任務的能力。現有的工具,例如Excel、ACL等,均是在提高審計師的審計速度和準確度。

但是人工智能來了,就如同三維空間的我們觀察二維空間行動的螞蟻一樣,人工智能看待我們的審計過程也有一種統治感。讓一只螞蟻腳上沾滿墨水,把一張白紙爬成完全黑色是十分困難的,但是我們作為人類,可以拿起白紙,直接把它蘸在墨汁裏,這樣一張完美的“黑紙”就產生了。人工智能處理我們現在的審計問題就是如此。它不需要完全理解人類的思維模式並且按部就班地按照人類的行為模式操作,而是通過大數據的輸入和輸出反饋,自我形成一套認知方式。以目前的計算機能力,人工智能系統可以在1個月之內遍歷這個世界上所有的審計項目,只要算法輸入信息和輸出反饋合理,它將成長為一個超過世界上所有審計師的存在。

根據以上兩點,我認為人工智能在未來的審計中會有深入的應用,並且極大地改變審計行業。

4.人工智能行業未來的創業機會

我把現在的整套創新商業模式分為兩類:科學依托的商業創新和無科學依托的商業創新。科學依托的商業創新是著名投資人王煜全關註的美國大學研究項目的創新,具有高科學性。無科學依托的商業創新就是除了這種形式以外的其他創新。兩種創新本質的區別是創新資源的稀缺種類不同。科學依托的商業創新的稀缺資源就是科學本身,如果你不知道一個理論或者沒有最新科學研究的一手資料,你就完全不可能進入該行業,成為攪局者。而無科學依托的商業創新的稀缺性在於理解能力、執行力和社會資源,即對行業、產業的現狀和發展的理解能力、企業團隊的執行能力和企業所能調動的社會資源才是這種創新的壁壘。例如,Space-X就是一個科學依托的創新,其掌握的低成本火箭發射技術一直是領先於整個世界的,這也就是其能夠處在一個長期的藍海市場的原因。又例如,谷歌所代表的搜索引擎,其技術雖然復雜,但是已經是一個成熟並基本公開的技術。我們可以看到,我國的搜索引擎市場可謂百花齊放。它們成功的原因各種各樣,不過歸根結底還是更理解中文搜索、產品團隊更加勤奮和社會資源豐富這三個原因。這就屬於非科學依托的創新。

審計的人工智能化屬於第二種創新,這種創新的特征就是由小漸大。所謂由小漸大,就是說在這種行業中,很難有人能做一個全產業鏈的整合者。中國式創新,尤其是創業公司,基本都遵從這個邏輯。無法整合全產業鏈,並不意味著利潤的下降或者份額的減小。在社會分工越來越細致的今天,全產業整合已經不能代表一個企業的核心競爭力。相反,一個企業的競爭力應當體現在它在某些領域的不可替代性。如果創業公司能夠發布一套解決審計行業一小部分問題的人工智能系統,其將會很容易成為行業中的不可替代者。

以下是我思考整理的人工智能在審計行業中的創業方向。

1.文檔信息提取格式化(Document data extraction and format)

文檔信息提取格式化是將文件中的條款和數字等內容提取並轉換成格式化的數據,在人工下,這個部分的過程主要是將審計師的理解力轉換為邏輯判斷,而人工智能需要讓程序自動完成文字語義的認知。目前主要的難點就在於自然語言處理(NLP)發展情況。如果想進入這個行業,創業者首先要做的就是如何建立審計先驗知識的框架,只有搭建了框架後才可能讓自己的產品可以媲美審計師的能力。審計工具不是Siri,出錯率必須為0%,因此程序需要具有極強的準確性、容錯率和數據信息交叉復現。在2016年5月,谷歌開源了其基於人工智能系統Tensorflow的自然語言分析模型SyntaxNet。這個模型的先驗知識框架非常龐大,在低速信息輸入和高速信息輸入的情況下,識別自然預言的正確率已經超過94%和92.4%。除此之外,目前Kira公司的機器學習系統正在為審計行業量身打造相關產品。

2.自動報表生成(Report automation)

目前審計行業使用的軟件,主要的功能就是生成分析報表,但是這依靠大量的人力。人工智能所能做的,就是將這些工作自動化,或者部分自動化。IBM的OpenPages提供的功能包括審計計劃制定、文件自動歸檔、時間成本記錄和審計報告生成等功能。依托於IBM強大的計算能力和在大數據、雲計算業務上的長足發展,OpenPages已經擺脫了僅僅用計算機替代人做的階段,而是達到了用計算機部分代替人想的階段。雖然IBM這種大公司已經進入了審計行業人工智能化的爭奪戰中,但這不代表小企業沒有自己的機會。人工智能除了需要依托好的算法,還要有足夠的學習樣本。隨著互聯網的開放,小企業也有了獲取大數據的機會,另外,小企業的定制化能力更強,因此只要完成某些特定行業、特定步驟的高度自動化軟件的開發,小企業將會比大企業更有競爭力

3.文件發布(Document publishing)

目前的人工智能主要停留在理解層面,而講述能力卻不足,簡而言之,人工智能技術在目前是一個“聰明的啞巴”,只會聽和讀。例如目前的一些新聞機構,雖然宣稱自己在使用人工智能進行快速新聞創作,但是實際上只是讓機器將一些信息填充到已經寫好的模板之中。

在未來,人工智能說和寫的能力將提升上來,這時,使用人工智能創建審計報告將會節省大量人力精力。但是,目前相關的研究成果還比較少,可以算是以科學為依托的創新,目前看來小企業在這方面沒有什麽競爭優勢。這也是我將這種創業思路放在最後提的原因。

總而言之,人工智能的大潮將會對很多行業造成沖擊,審計行業無法避免,就應該去適應。人工智能不是將人的作用完全拋棄,而是省略掉一些重復、耗時的中間環節。正如本文題目所說,我認為人工智能在未來會在審計行業的第2步到第99步都有所作用,而最重要的第一步,計劃制定,和最後一步,審計匯報中,人的作用都是不可忽視甚至是不可替代的。

人工智能將完成審計的前99步工作(修訂)