1. 程式人生 > >我們理解高階視覺嗎?---讀後總結

我們理解高階視覺嗎?---讀後總結

高階視覺缺乏一個唯一的,一致性的定義。最近幾十年的工作大多數都集中在物件的識別問題上,主要是在視覺系統的一個場景當中去識別一個或者一群物件。重要的是在其中忽略了物件的位置、大小、光線以及它周圍所呈現的物體。當物件識別作為了高層視覺的操作框架的時候,僅僅通過視覺神經來解決問題顯然已經不足以解決問題了。所以作者將在這裡陳述這項工作所做出的成績和不足,並且一起討論了是否應該重新形成我們對高階視覺的理解。

一、直覺性的錯誤:為什麼視覺是如此的困難?

1、3D的世界被轉換成了2D的平面圖像去處理,其中就會很容易的忽視一些重要的資訊

2、我們人類的視覺感知是從人類的進化就開始了,而對於計算機則是不同的過程、

3、我們在視覺系統上的能力擾亂了我們基本的直覺

二、尋求高階視覺操作的定義

關於高階視覺的一個功能性的定義是在某種程度上集中精力於處理物件或者其表面的物理引數,而不是關注於光線投擲到視網膜上所測量到的物理引數。

三、讀出物件的身份

對於人類,在視網膜神經細胞上的資訊呈現並不是一種形式,它可以很容易的為了引導行為通過順流神經元很容易的被讀出。

對於提取物件資訊,在探查高階神經編碼上線性分類器是一種合理的解碼選擇。

四、探索物件識別上面臨的挑戰

1、定義一個物件是十分困難的。我們可以表達特定物件的名稱,但是每個物件都有很多種分類、用途、外觀等特性,我們很難用簡單的修飾將其準確的表達出來。

2、構建具有代表性的刺激方案物件是困難的。

3、有大量的證據表明高水平視覺皮層的神經元依賴於正在觀察的場景。

五、物件識別是正確的框架問題嗎?

對於這個問題,應該引用作者的一句比較經典的話:驅動我們對高階視覺理解的關鍵不在於去解決問題,而是去探索一個豐富的關於視覺要做什麼的框架性問題。