1. 程式人生 > >論文筆記《Selective Search for object recognition》

論文筆記《Selective Search for object recognition》

影象包含的資訊非常的豐富,其中的物體(Object)有不同的形狀(shape)、尺寸(scale)、顏色(color)、紋理 (texture),要想從影象中識別出一個物體非常的難,還要找到物體在影象中的位置,這樣就更難了。圖中給出四個例子,來說明物體識別 (Object Recognition)的複雜性以及難度。(a)中的場景是一張桌子,桌子上面放了碗,瓶子,還有其他餐具等等。比如要識別“桌子”,我們可能只是指桌子本身,也可能包含其上面的其他物體。這裡顯示出了影象中不同物體之間是有一定的層次關係的。(b)中給出了兩隻貓,可以通過紋理(texture)來找到這兩隻貓,卻又需要通過顏色(color)來區分它們。(c)中變色龍和周邊顏色接近,可以通過紋理(texture)來區分。(d)中的車輛,我們很容易把車身和車輪看做一個整體,但它們兩者之間在紋理(texture)和顏色(color)方面差別都非常地大。