AI市場上最稀缺的人才是什麼?
首先,我覺得懂人工智慧,我是說的是真正懂人工智慧的人才,是非常稀缺的。
那麼什麼叫真正懂呢?
就是了解人工智慧物理意義的人,而不僅僅是懂演算法。
什麼才是真正懂人工智慧——庖丁解牛:
舉個我自身的例子。我在清華大學唸書時,就用過神經網路,我會用,但我不懂,不懂它的底層意義到底是什麼,不懂這個東西為什麼能夠訓練出來,不理解計算機到底是怎麼思考的。
這是一個非常重要的思維門檻。
對於深度學習來說,由於這裡面是一個黑箱,你可以不知道機器在某一點到底在思考什麼,但機器思考的那套整體邏輯和大概每一層單元在幹什麼,你要很清楚。
目前,能理解到這個層次的人非常少。
打個比方,有個詞叫庖丁解牛。你首先得在眼睛裡,大腦裡有這頭牛的全貌,然後你還必須很會使用這個刀。而不是說你拿著這把刀,你就可以迅速地把這頭牛解剖了。
你只有既理解牛、又理解刀的使用方法,你才能達到庖丁解牛的境界。
同樣,人工智慧也是這麼一個工具。
給你一大堆圖片,讓你訓練出一個模型,你用tensorflow跑出來了,但明天讓你訓練語音,後天訓練物流雜亂的資料化資訊,你就蒙圈了。
再比如,有個模型是要用CNN加上全連線的,你的模型是用對抗網路更好一點,那麼你的模型就可以不使用神經網路,而應該使用Randomforest,有了模型你應該使用這個,你為什麼要使用這個,你是通過大量的演算法、經驗做出來的。
對我來說,最大的幫助是,一個程式設計的感性認識。我在大學研究生的時候,我做了大量的程式設計,天天在debug,debug特別鍛鍊人對於機器底層運轉的思考,一套10萬行的程式出錯了,你怎麼能夠迅速給他debug出來,這個你要去理解計算機到底容易在什麼地方出錯。
人工智慧更復雜,人工智慧在除錯的過程中,沒有debug的提示器,因為它全是資料和資料之間,它是一個數值計算,不能收斂的過程,就是你算著算著錯了,你也不知道什麼地方出錯了,你只能看到這個資料發散了,這是一個特別要命的問題,因為你的程式一點都沒有寫錯,只是你的資料結構、網路結構弄錯了,這個要求程式設計師對這個演算法的物理模型、場景模型極其明確物理意義的過程,這是非常複雜的,很難描述這個事情。
最稀缺人才——人工智慧架構師:
我有一個特點,我所有學到的東西,我都能從零開始推,就是老師講的所有東西我都可以從零開始推。這個東西叫元認知。
元認知越底層的人,他在理解一件事情的時候所佔用腦子裡的記憶體越少。比如說讓我去描繪一個整個的商業案件,有人是背書,從頭到尾背下來,我看一遍以後,我可能一個單位我就記住了,然後就忘了,下次讓我描述這個事,我把這個單元提出來就可以描述。
人工智慧也是,它是一套工具,一個真正好的工程師,他手裡所有的人工智慧都是演算法,比如現已知的,人工智慧大類的演算法可能有七八類,像支援向量機,神經網路、randomforest,adaboost等一大堆,他在看到一個模型後,能迅速判斷哪個模型更適合。
比如說為什麼語義識別是用迴圈網路和LSTM來做識別?因為語義是一個線性的資訊流,這個線性資訊流裡面要記住前面很遠的資訊,同時要忘掉很大一部分資訊,再記住當前的資訊,所以,用LSTM能非常完美的解決這個問題,但LSTM在影象識別上就不Work了、在量化金融中的優勢也不明顯。
這裡,很多人會認為股票和語義都是一個時間序列函式,或者是前後序列函式。為什麼LSTM訓練這個很好用,訓練股票就不行了呢?
這個,就需要回到元認知。因為他們的資料結構完全不一樣,你得理解什麼模型處理什麼實體結構。
再比如,CNN適合處理大量資料、超大量的資料,且資料和資料之間有明確相關條件,所以,CNN適合處理影象,因為影象的畫素之間具有相關性。
而同樣的一個情況,語義又不適合了。比如“我寫程式”這四個字,每個字之間一對一的相關性並不是那麼強,但他有一個整體相關性,他跟影象識別是不一樣的。簡單理解的話,語義是一維函式,影象是二維函式。
所以,這些都是很細節的東西。你只有在使用了大量的程式之後,跑著跑著,才能感知到,哦,原來這個應該用什麼演算法跑,那個不能用什麼演算法跑。因為人工智慧屬於黑暗森林,你只能慢慢去摸索,摸索哪個是最適合的。你不可能第一天就調試出來,搞清楚哪種場景,到底該用什麼程式,這個程式應該有多少層的網路、結構、單元,每一層單元有什麼樣的引數,應該跟什麼程式進行配合,是否需要兩個程式進行嫁接,是否需要高階的比如對抗型的、或者輔助型、或者嫁接型等。你需要不斷地錘鍊和思考,才能出來這樣的感覺,都是一點一點悟出來的。
所以,回到最開始的問題,我覺得如果用一個特定的職位來定義,這個最稀缺的人才是人工智慧架構師。
他能抽象出你最應該使用什麼樣的工具。在他之下,其他人就可以在一個更細的層面上,去琢磨這個工具具體應該怎麼來用。
不過,人工智慧架構師又分三個層次。
人工智慧架構師的三個層次:
第一層:物理模型架構。
有的時候大家在訓練一件事情的相關性上,可能會把兩個事情分開放。其實應該把兩個事件放在一起,把相關性作為訓練物件來進行訓練,這樣訓練可能會更好。
或者把一個隱藏的物理意義作為訓練物件,把相關性和兩個事情都放在一起,然後再進行訓練。
但很多人就想不到這點,就拿兩個事情直接去訓練相關性,這是錯誤的。
物理模型架構,這是最裡的一層,需要深刻理解物理意義,當知道各種各樣的函式該怎麼去用的時候,火候就差不多了。
第二層:當我們確定怎麼訓練拓撲模型之後,拓撲模型框架出來的時候,基於拓撲框架我選用什麼樣的網路模組,具體需要訓練成什麼效果,然後再具體去訓練。
第三層:等這些模組全選好了,每一層用多少個單元、多少個引數,你有沒有這個能力。第一層的神經元你可以選擇100個,第二層的你選10個,第三個選擇多少個,然後用卷積你又選擇多少個,核有多大,3×3的、5×5的、10×10的,你到處去試,試一年可能才試出結果來。
好的工程師第一刀就可以給你切到差不多的點上,你這個模型基本10層網路,每一層大概10個神經元,卷積核的層數大概3層,全連結層7層就夠了,他會一上來就給你做這個東西。
目前,這三種架構人才都很稀缺。
要培養一個這樣的人才,很難很難,必須跨界,尤其物理模型架構層面,必須跨界。你必須要能理解這個東西在物理層面上的意義,你必須經歷過不一樣思維模式的業務,有開闊的眼界,比如從事過社會、社科、商業等多種型別的工作,然後再反過來去看這件事情,就容易了。
為什麼說一定要跨界呢?因為跨界會對你補充另外一個部分的素養,跨界就是補足你的資料,這叫“一個向量空間的完備性”,你跨界是用來幹這個的。
我見過的特別優秀的能扛起人工智慧架構師這類角色的人很少。我很欣賞第四正規化的戴文淵,他就可以把銀行所需要的演算法場景變成一定的函式需求,他屬於在工程師裡情商比較高,相對比較跨界的稀缺人才。
要成為一個這樣的人才,我覺得至少要十年時間。
這類人才,一定是有強感知能力的,他有感知整個社會存在的能力,而不是把眼睛全放在眼前的技術上。
