神經網路“煉丹爐”內部構造長啥樣？牛津大學博士小姐姐用論文解讀

阿新 • • 發佈：2020-10-13

蕭簫發自凹非寺
量子位報道 | 公眾號 QbitAI

神經網路就像“煉丹爐”一樣，投喂大量資料，或許能獲得神奇的效果。

“煉丹”成功後，神經網路也能對沒見過的資料進行預測了~

然而，這種情況下，神經網路其實成了“黑匣子”——具有一定的功能，但看不見是怎麼起作用的。

如果只做簡單的影象分類，其實還好；但如果用在醫學方向，對疾病進行預測，那麼神經網路下的“判斷”就不可輕信。

如果能瞭解它是怎麼工作的，就更好了。

出於這種考慮，來自牛津大學的博士生Oana-Maria Camburu撰寫了畢業論文《解釋神經網路 （Explaining Deep Neural Networks）》。

在這篇論文中，她將這些“黑匣子”一個個開啟，對神經網路原理進行了詳細的解釋。

為什麼要開啟神經網路“黑匣子”？

事實上，神經網路之所以起作用，最直觀的原因就是，它由大量非線性函式組成。

這些非線性函式，使得網路可以學習原始資料中各種抽象級特徵。

然而，也正是因為神經網路中的這些非線性函式，使得人類往往難以理解，它們是如何起作用的。

這就導致神經網路在疾病預測、信用額度、刑法等方向上“不太受歡迎”。

醫生和法律相關的研究者往往更樂意採用可解釋模型，例如線性迴歸、決策樹，因為神經網路在疾病預測中的確出過問題：

人們利用神經網路預測肺炎患者的病情發展，其中一項患者特徵為是否有哮喘病史。

神經網路經過訓練後預測，有哮喘病史的患者死於肺炎的可能性較低。

但其實結果恰好相反，哮喘本身會給肺炎帶來雪上加霜的效果。

之所以資料表明哮喘患者較少死於肺炎，往往是因為哮喘能被及早發現，所以患者得肺炎後能被及早治療。

如果這種神經網路被應用於實踐中，將會帶來非常危險的結果。

此外，即使是神經網路，也會對男女性別產生刻板印象、產生種族偏見。

例如，調查表明，有些語料庫和模型，在預測再犯時，會更“偏愛”男性。

除了錯誤的預測和種族、性別歧視以外，神經網路還很脆弱。

無論是對影象進行小改動欺騙分類演算法、還是用語音識別瞞過NLP模型，神經網路被“爆雷”的情況也不少。

為了讓神經網路應用於更多的方向，也為了讓我們更好地學習它的原理，作者從兩個方向對神經網路進行了解釋。

2種方法解釋神經網路

“事後再解釋”

第一種方法，稱之為基於特徵的解釋方法，又叫“事後再解釋”——因為這種方法，是在神經網路訓練好後，才對其輸入特徵進行解釋的。

這種方法針對文字的詞（token）、或是針對影象的超畫素（super pixels），進行“事後”解釋。

目前這種方法應用較為普遍，不容易出現解釋偏見，但需要驗證解釋方法的真實性。

這裡的根本原理，是研究外部解釋方法給出的解釋、與模型本身生成的自然語言解釋之間，是否存在相關性，而相關性具體又是什麼。

在論文中，作者引入了一種新的驗證方法，來判斷解釋方法的真實性。

讓神經網路自己解釋

那麼，如果能讓神經網路一邊訓練、一邊“解釋自己”呢？

這是論文提到的第二種方法，即在模型中植入一個生成預測解釋的模組，對預測的結果進行解釋。

至於神經網路對自己的解釋是否正確，還需要人為進行判斷。

在這裡面，作者同樣引入了一種判斷方法，對模型自己生成的解釋進行判斷，從而得出神經網路解釋的結果。

對神經網路詳細結構、具體解釋方法感興趣的小夥伴，可以戳下方論文地址檢視~

作者介紹

Oana-Maria Camburu，來自羅馬尼亞，目前是牛津大學的博士生，主修機器學習、人工智慧等方向。

高中時期，Oana-Maria Camburu曾獲IMO（國際奧數競賽）銀牌。她曾經在馬普所、谷歌實習，讀博期間，論文被ACL、EMNLP、IJCNLP等頂會收錄。

論文地址：
https://arxiv.org/abs/2010.01496

— 完 —

本文系網易新聞•網易號特色內容激勵計劃簽約賬號【量子位】原創內容，未經賬號授權，禁止隨意轉載。

榜單徵集！7大獎項鎖定AI TOP企業

「2020中國人工智慧年度評選」正式啟幕！將從公司、人物、產品、社群四大維度共7個獎項尋找優秀的AI企業，歡迎大家掃碼報名參與。

榜單將於12月揭曉，也期待與百萬從業者們，共同見證這些優秀企業的榮譽！

量子位QbitAI · 頭條號簽約作者

վ'ᴗ' ի 追蹤AI技術和產品新動態

一鍵三連「分享」、「點贊」和「在看」

科技前沿進展日日相見~

神經網路“煉丹爐”內部構造長啥樣？牛津大學博士小姐姐用論文解讀

蕭簫發自凹非寺量子位報道 | 公眾號 QbitAI 神經網路就像“煉丹爐”一樣，投喂大量資料，或許能獲得神奇的效果。

GPU必知必會 | 哪款顯示卡配得上我的煉丹爐

公眾號關注 “ML_NLP” 設為 “星標”，重磅乾貨，第一時間送達！ **來自 **|NewBeeNLP

TCN（時序卷積網路）+LSTM（長短期記憶人工神經網路）+AOA （attention-over-attention）情感分析之做實驗、撰寫論文科研小結（1）

關於被導師通知要寫論文這件事 2022.3.16，距離我20歲生日也有一週了。三人完成的研究，原以為我是主要負責做實驗的。然而，16號這天例會上我卻得到了單獨寫另外一篇論文的通知。只有沉默，沒有抗議(´っω•｀。)開

Google的面試題長啥樣？看完被吊打

本文翻譯自 Google 工程師/面試官 Alex Golec 的文章：Google Interview Questions Deconstructed: The Knight’s Dialer；來源：實驗樓，翻譯：實驗樓掃地阿姨，原文：https://medium.com/@alexgolec/google-inter

微軟 Win11 長啥樣？Windows 11 新功能特性大預測

幾天前，一份據稱是“Windows 11”的映象安裝包在網上意外洩露。從試用結果來看，應該就是微軟打算在當地時間 6 月 24 日，也就是北京時間的 6 月 25 日推出的“下一代 Windows”。不過和誘人的官方宣傳相比，眼前這

火星上出生的孩子長啥樣：骨骼脆弱、視力不佳、面板可能變綠

11 月 12 日訊息，據外媒報道，美國太空探索技術公司 SpaceX 創始人埃隆・馬斯克 (Elon Musk) 希望將人類送上火星殖民，以此幫助人類成為“多行星物種”，從而延續人類的文明。然而，這可能會導致火星出生的兒童遭受

Linux 核心到底長啥樣

目錄一.簡介二.結構地基地面層程序表http程序21程序22程序到檔案系統定時任務管道411程序躍層

小牛電動創始人李一男造車，實探常州工廠：首款車型到底長啥樣？

國內又來了一家新造車公司，這次是創投與科技圈的知名創業者李一男的牛創新能源。今天上午，牛創在常州釋出了自己的品牌 —— 自遊家（英文名 NIUTRON），同時也向到場媒體展示了其首款車型的外觀內飾設計並公佈了一

Python人臉融合告訴你，你的下一代長啥樣

前言和換臉演算法的簡單粗暴相比，人臉融合演算法就要彈性的多。顧名思義，人臉融合是對兩張人臉進行融合處理，生成的人臉同時具

《鬼谷八荒攻略》防止煉丹炸爐技巧分享

《鬼谷八荒》通過煉丹可以製作多種不同功效的丹藥，當時操作不當的話會出現炸爐的情況。下面請看由“晚安提莫”帶來的《鬼谷八荒》防止煉丹炸爐技巧分享，希望對大家有用。

MongoDB的基本特性與內部構造的講解

MongoDB是一個介於關係資料庫和非關係資料庫之間的產品，是非關係資料庫當中功能最豐富，最像關係資料庫的。他支援的資料結構非常鬆散，是類似json的bjson格式，因此可以儲存比較複雜的資料型別。Mongo最大的特點是他

Pytorch 神經網路—自定義資料集上實現教程

第一步、匯入需要的包 import os import scipy.io as sio import numpy as np import torch import torch.nn as nn

numpy實現神經網路反向傳播演算法的步驟

一、任務實現一個4 層的全連線網路實現二分類任務，網路輸入節點數為2，隱藏層的節點數設計為：25,50,25，輸出層2 個節點，分別表示屬於類別1 的概率和類別2 的概率，如圖所示。我們並沒有採用Softmax 函式將網路輸

自適應線性神經網路Adaline的python實現詳解

自適應線性神經網路Adaptive linear network，是神經網路的入門級別網路。相對於感知器，採用了f（z）=z的啟用函式，屬於連續函式。

基於python的BP神經網路及異或實現過程解析

BP神經網路是最簡單的神經網路模型了，三層能夠模擬非線性函式效果。難點：

Pytorch實現神經網路的分類方式

本文用於利用Pytorch實現神經網路的分類！！！ 1.訓練神經網路分類模型 import torch

Pytorch 搭建分類迴歸神經網路並用GPU進行加速的例子

分類網路 import torch import torch.nn.functional as F from torch.autograd import Variable import matplotlib.pyplot as plt

pytorch下使用LSTM神經網路寫詩例項

在pytorch下，以數萬首唐詩為素材，訓練雙層LSTM神經網路，使其能夠以唐詩的方式寫詩。

Python利用全連線神經網路求解MNIST問題詳解

本文例項講述了Python利用全連線神經網路求解MNIST問題。分享給大家供大家參考，具體如下：

關於pytorch中全連線神經網路搭建兩種模式詳解

pytorch搭建神經網路是很簡單明瞭的，這裡介紹兩種自己常用的搭建模式： import torch

神經網路“煉丹爐”內部構造長啥樣？牛津大學博士小姐姐用論文解讀

蕭簫 發自 凹非寺量子位 報道 | 公眾號 QbitAI

為什麼要開啟神經網路“黑匣子”？

2種方法解釋神經網路

“事後再解釋”

讓神經網路自己解釋

作者介紹

相關推薦

蕭簫發自凹非寺
量子位報道 | 公眾號 QbitAI