物理學家揭示深度學習原理：神經網路與宇宙本質驚人關聯

阿新 • • 發佈：2019-01-09

　　哈佛大學和 MIT 的物理研究者日前在 arXiv.org 發文，提出深度學習的成功不僅關乎數學，也離不開物理。他們在論文中指出，引數有限的神經網路之所以能夠分析有無數種可能的複雜問題，是因為宇宙中所有事物都能由一組性質簡單的函式表示。此外，宇宙具有層次結構，而神經網路中的層能夠將每一步近似為因果序列。因此，現實世界問題非常適於神經網路建模。這一假說如果正確，不僅揭示了深度學習如此有用的原因，還能說明人類大腦為何擅長分析複雜問題，有助於加速人工智慧發展。

　　過去幾年，深度學習技術轉變了人工智慧世界。那些一度被視為只有人類才能夠做到的事情，一項一項地被機器斬獲。深度神經網路現在比人類更擅於識別人臉、識別物體，在古老的技藝圍棋上更是把人打得落花流水。

　　但有一個問題。為什麼層層堆疊起來的網路能夠解決這麼多的複雜問題，還沒有人講得出數學上的道理。儘管深度神經網路取得了巨大的成功，但是沒有人知道它們是如何做到這一點的。

　　不過，哈佛大學的 Henry Lin 和 MIT 的 Max Tegmark 給出了轉機。他們認為數學家之所以狼狽不堪，是因為事情的關鍵在於世界萬物運作的道理——宇宙的本質。換句話說，答案在物理而非數學裡。

　　首先，我們假設要將幾兆的灰度影象分類，判斷該影象是一隻貓還是一隻狗。

　　這樣一幅圖片含有幾百萬畫素，每一個畫素都有 256 個灰度值。因此，從理論上說，一共有 256^1000000 種可能的影象，每一種都需要計算是否組成了貓或狗。而神經網路只有幾萬或幾百萬的引數，卻不知怎的能夠很輕鬆地完成這項分類的任務。

　　用數學的語言講，神經網路的工作方式是用較為簡單的函式逼近複雜的函式。當要分類貓或狗的影象時，神經網路必須實現一個函式，這個函式將一百萬的灰度畫素作為輸入，輸出它可能代表的圖案的概率分佈。

　　問題是，數學函式的數量相比用於逼近它們的可能的網路的數量，多了好幾個量級。但儘管如此，深度神經網路仍然能夠得到正確答案。

　　現在 Lin 和 Tegmark 表示他們已經知道了原因。答案是宇宙由為數不多的一組函式所掌控。換句話說，如果用數學式子表示物理定律，那麼所有事物都能由一組性質簡單的函式所表示。

　　舉例來說，多項式函式 f(x)=x2，二次方程 y=x2 指數為 2，而 y=x^24，指數為 24，以此類推。

　　很顯然，指數的數量是有限的，物理定律中也只出現了有限的多項式。“目前還不清楚原因，但是我們的宇宙能被低階的漢密爾頓多項式準確地描述。”Lin 和 Tegmark 說。通常而言，物理定律的多項式，指數都在 2 到 4 之間。

　　物理定律還有其他的重要性質。舉例來說，與旋轉和位移有關的物理定律通常是對稱的。旋轉一隻貓或一隻狗 360°，這隻貓或狗看起來與原來是一樣的；將一隻貓或狗位移 10 米、100 米或 1000 米，這隻貓或狗跟原來相比，看起來還是一樣的。這一點也為識別貓狗帶來了便利。

　　這些性質表明，神經網路不需要逼近幾近無限的數學函式，而只需要逼近其中最簡單的一組就可以了。

　　還有一種性質也為神經網路所用。那就是宇宙結構具有層次。“基本粒子形成原子，原子又形成分子、細胞、器官、行星、太陽系、銀河系等等，”Lin 和 Tegmark 表示。此外，複雜結構也往往是由一系列簡單的步驟生成。

　　這也是為什麼說神經網路結構具有重要性：這些網路中的層能夠將每一步近似為因果序列。

　　Lin 和 Tegmark 以宇宙微波背景輻射為例，近年來，有很多不同的空間飛行器都以很高的解析度描繪了這種輻射，而物理學家也為這些影象為什麼會具有這種形式而感到疑惑不解。

　　Lin 和 Tegmark 指出，不管原因為何，無疑宇宙微波背景輻射是一個因果層次的結果。“一套宇宙學引數（比如暗物質的密度）決定了我們宇宙密度波動的功率譜，而這又決定了我們接收到的早期宇宙微波背景輻射的模式，這些模式與來自銀河系的前景無線電波干擾相結合，產生一個能被衛星望遠鏡記錄下來的頻率天圖。”他們說。

　　每一個因果層都比上一層含有更多的資訊。雖然宇宙引數是有限的，但是天圖和干擾卻含有幾十億的數字。物理學的目標是分析這些大數字，讓它們揭示出較小一些的數字。

　　而當現象具有這種層次結構時，神經網路就能大幅提高分析效率。

　　“我們證明了深度廉價學習（deep and cheap learning）不僅依賴於數學，還取決於物理，物理學中一些常見的極為簡單的概率分佈非常適於神經網路建模。”Lin 和 Tegmark 得出這樣的結論。

　　這是一項十分重要而又十分有趣的研究。人工神經網路受生物神經網路啟發而來，因此Lin 和Tegmark 的假說不僅解釋了深度學習為什麼如此有用，還說明了人類大腦理解宇宙的原因。演化不知怎地形成了一種分析宇宙奧妙理想的人腦結構。

　　這一結果為人工智慧研究打開了一扇門。現在，我們終於明白了深度神經網路為何有用，而且數學家也能著手研究是什麼數學性質讓深度神經網路這麼有用。“加深對深度學習分析理解能力的認知，能夠進一步提升深度學習。”Lin 和 Tegmark 表示。

　　深度學習近年來取得了飛速發展。有了這一新的理解，該領域的發展速度勢必變得更快。

　　編譯來源：

　　The Extraordinary Link Between Deep Neural Networks and the Nature of the Universe

物理學家揭示深度學習原理：神經網路與宇宙本質驚人關聯

物理學家揭示深度學習原理：神經網路與宇宙本質驚人關聯

從零開始學深度學習二：神經網路

斯坦福大學深度學習筆記：神經網路

吳恩達.深度學習系列-C1神經網路與深度學習-w3-（作業：一個隱藏層進行二維資料分類）

吳恩達.深度學習系列-C1神經網路與深度學習-W2-（作業：神經網路思想的邏輯迴歸）

吳恩達.深度學習系列-C1神經網路與深度學習-w4-（作業：建立神經網路）

吳恩達.深度學習系列-C1神經網路與深度學習-W3淺層神經網路

深度學習--卷積神經網路工作原理

深度學習-卷積神經網路CNN-BN(Batch Normalization) 原理與使用過程詳解

[深度學習]卷積神經網路：卷積、池化、常見分類網路

使用深度學習的CNN神經網路破解Captcha驗證碼

深度學習 --- 徑向基神經網路RBF詳解

吳恩達深度學習筆記(21)-神經網路的權重初始化為什麼要隨機初始化？

深度學習入門系列-神經網路

深度學習 --- 卷積神經網路CNN（LeNet-5網路學習演算法詳解）

深度學習 --- 卷積神經網路CNN（LeNet-5網路詳解）

深度學習之人工神經網路學習

吳恩達深度學習筆記(29)-神經網路訓練的方差和偏差分析

吳恩達《深度學習-改善深層神經網路》3--超引數除錯、正則化以及優化

吳恩達《深度學習-卷積神經網路》2--深度卷積神經網路

物理學家揭示深度學習原理：神經網路與宇宙本質驚人關聯

相關推薦