這11個觀點可能會讓你和深度學習擦肩而過...
本文來源微信公眾號將門創業(thejiangmen)。
作者:Carlos E. Perez
歡迎人工智慧領域技術投稿、約稿、給文章糾錯,請傳送郵件至
我大部分走路的時間還有睡夢中的潛意識裡都會琢磨著Deep Learning 的問題。Peter Thiel 有一個很有名的說法——“最後一個公司的優勢”。意思是你可能不需要具備“第一啟動的優勢”,但是你一定要成為你行業裡最後一個站著的公司。就像Google有可能是最後一個搜尋引擎公司,Amazon有可能是最後一個做電商的, Facebook希望不是最後一個社交網路公司等。但是讓我夜裡輾轉反側的是——深度學習有可能會是“人類最後一個發明”(Last Invention of Man)。
但是,咱們先別想那麼遠。不管怎樣,Kurzweil在他《奇點臨近( Singularity)》一書中預計在2045年實現的設想也是30年之後的事情。我們現在要做的就是在這30年裡弄清楚想生活在像電影《極樂(Elysium)》中那樣,還是什麼別的不知名的腐爛廢水裡。
因此,我提出“專家”團隊可能會讓你和深度學習帶來的重要改革擦肩而過的11個理由,供大家參考。
這僅僅是機器學習(Machine Learning)
從業人員接觸神經網路一般都是從線性迴歸的介紹然後再到邏輯迴歸。這是因為人工神經網路(ANN)用的數學公式是一樣的。所以這裡瞬間產生偏見,導致人們認為經典的機器學習方式在深度學習的世界裡也可行。最後,對於DL最天真的解釋就是它是多層的ANN。
當然,我們也有其他種類的機器學習方式,他們是用和DL不同的公式。但是,ML所有方法最基本的目標和一般概念都是曲線擬合。意思就是如果你能找到一個合數據吻合的模型,它就是個好答案。但在DL系統裡,因為模型的引數太多,這些系統會預設過度擬合數據,這就足夠證明DL和ML是完全不同的系統了。
這僅僅是優化
DL系統有一個損失函式(loss function),它會測量預測和輸入的資料吻合有多好。經典的優化問題也有損失函式,也稱為“目標函式”(objective functions)。這兩個系統會使用不同的啟發式方法(heuristics)去探索在很大的配置空間裡的最優點。以前人們認為DL 系統的 solution surface 已經很複雜,並且是不可能找到答案的。但神奇的是,一個很簡單的優化方法——隨機梯度下降法(Stochastic Gradient Descent )就可以得到很好的結果。
這就告訴我們其實這裡還有別的事情,和我們認識的優化完全不同的東西。
這是個黑盒子
很多資料科學家都不太喜歡DL,因為它的預測缺少很多可解釋性——這不僅是DL也是ML都有的特徵。資料科學家更喜歡使用概率方法,因為他們有更多模型的控制。這個導致他們的系統會用最少量的引數做預測。這一切的推動力量都是源於對“簡單化或‘奧卡姆剃刀原理(Occam’s Razor)’是對所有事物最好的解釋”的信念。
但概率方法在判斷圖形、語音甚至文字上其實是沒有競爭力的,這是因為DL方法比人類還能更好的找到模型。只是我們的大腦更信任窮舉法。其實沒有任何資料科學家找到過可以很好判斷圖形的主要因素,也沒有任何DL實驗依據證明簡約模型(parsimonious models)比互動模型(entangled models)效果更好。對於那些真的需要解析的案例,現在有些新的DL方法可以對其提供可解釋性和不確定性提供幫助。如果一個DL系統可以提供影象說明,那它也很可能可以生成對預測的解釋。
太早了,太快了
這是一個自然的偏見,一個只有5年曆史並且急速進化且易變的科技太不可信。我們當時也是這麼說微型處理器、網際網路、網路和移動技術的。對於大部分人來說,先等等看是安全的方法。對於沒有花很多時間分析細節的那些人來說,這的確是一個合理的方式。但這也是一個有風險的策略,不去關注有可能是暫時的安全,但是別的公司搶你的飯碗可能意味的你的滅絕。
太多泡沫
有很多現在DL能幹的是在兩年前都覺得是完全不可能的。沒有人預見到電腦能在圍棋上戰勝人類;沒有人預見到現在會有無人車;沒有人預見到我們能有星際迷航那樣的翻譯能力。這些都那麼不可思議並且肯定有誇張的成分在。不好意思,我在這裡要戳破你迴避的“泡泡”,DL真的存在,並且你每次用手機都在使用它。
AI 的冬季會回來的
我們經歷過太多次因AI的前景所帶來的失望結果。這個說法走得很遠,因為這在以前經常發生,所以它早晚會再次發生。這個問題是,儘管那些失望存在,但AI的研究帶來了很多軟體功能的飛躍,而且這些功能我們現在都自然而然地使用著,並且從來都沒有察覺到他們的存在。“優秀的老式人工智慧”(Good Old-Fashioned AI)已經嵌入在很多今日的系統裡。
現在對DL 的開發正在加速進行,而且我們也有很多大問題需要解決。需要大量資料和缺少無監督的訓練是其中的兩個問題。但這不代表我們今天的成果沒有價值。DL已經可以開車了,如果現在再來一個冬季,就這一點就足夠證明現有階段已經十分有用了。
我們沒有足夠的理論解釋它怎麼工作
目前,研究團隊還沒有紮實的理論來解釋為什麼DL這麼有效。我們想過為什麼多層神經網路比少幾層的更有效,但是我們還不能理解收斂性如何發生,或者好的泛化如何實現。DL現在就是一個實驗品,我們還在學習這類系統的特徵。同時,雖然沒有紮實的理論理解,這些工程師一樣在前進。
研究員們正在利用他們的直覺和受過教育的猜測建立更好的模型。換句話說,他們不會為了等待更好的理論而暫停他們的發展。這和生物科技領域的研究一樣,他們測試很多種組合然後遇到他們不能解釋的新發現。科學和科技的發展的確有些不確定的混亂,但是你不應該因為這而放棄它的優點。
這不來源於生物靈感
DL和我們大腦裡的神經元差異很大。DL 的學習方式(比如SGD)是不能用我們大腦裡的什麼結構去類比的。但這裡的論據是,如果它不和大腦類似,它就不能執行大腦能做到的推理和學習。這當然不是很有力的論據。可飛機雖然長得不想鳥,但是它一樣會飛呀。
我不是這裡的專家
自己沒有專業知識不是逃避不去外面找專業知識的藉口。並且,這也不應該成為阻止你的專家團隊去學習這個新技術的理由。但是,如果你的專家是教條死板的那種,這就說明你應該去尋求第二個沒有偏見的意見。
這在我的問題上不適用
一個企業有很多業務流程。如果你沒有去檢查哪些流程是可以被現有的DL自動化的,那你就沒有權力去說DL對你不適用。其次,你可能會發現現在沒有的、但是可以用DL實現的流程或商業機會。你真的不能回答這個問題,直到你在這方面做了盡職的調查工作。
我沒有資源
Google、Facebook等很多大公司挖走了很多DL的 天才。 這些企業沒有興趣和小公司合作,去發現它們具體的需求和機會。但所幸這些大公司還允許它的研究員公開他們的研究成果。所以我們可以看到它們最新的發展成果,並且可以提取它們學到的知識,應用在你的場景裡。還有些公司比如Intuition Machine,加入它們會讓你取得在DL 技術上的競爭優勢。
想了解人工智慧背後的那些人、技術和故事,歡迎關注人工智慧頭條: