Side Window Filtering 論文解讀和C++實現

阿新 • • 發佈：2019-08-23

Side Window Filtering

剛開始看到這篇論文的時候，我就很感興趣想去復現一把看看效果。

這篇論文是今年 CVPR oral 且不是深度學習方向的，其核心貢獻點就是：

不管原來的濾波器保不保邊，運用了side-window思想之後，都可以讓它變成保邊濾波！

於是利用業餘時間，參考作者開源的matlab程式碼，我用C++實現了一下Side-window

盒子濾波，其他濾波器有時間再試下，下面是github的連結，讀者可以去跑下程式碼看看效果玩下，

從實驗結果上看我覺得算是復現了論文的效果：

https://github.com/Ldpe2G/ArmNeonOptimization/tree/master/sideWindowBoxFilter

我們來看下復現論文的效果，對於一張普通圖片，經典的盒子濾波和side-window

盒子濾波的效果對比：

從濾波結果對比上可以看到，經典的盒子濾波隨著對同一張圖片反覆應用盒子濾波的迭代次數

的增加，視覺效果是越來越模糊，到了30次迭代的時候已經糊的沒法看了，但是Side-window

盒子濾波即使迭代了30次，對於邊緣的保持還很好，和原圖基本看不出大的區別，就是邊緣細節

有些丟失。然後對原圖加上椒鹽噪聲，再對比下濾波效果：

從濾波結果對比上可以看到，經典的盒子濾波到了10次迭代的時候，雖然椒鹽噪聲已經很好

的消除了，但是圖片也變得很模糊，邊緣都細節都丟失了，但是Side-window盒子濾波卻能

很好的消除椒鹽噪聲的同時，對於邊緣的保持還很好，基本上算是還原了原圖。

下面從我的理解上去簡單解讀下這篇論文的核心思想，還有我在復現過程中的一些實現

細節介紹。目前的經典濾波演算法基本都是，以某個畫素點為中心，按照濾波半徑，把這個

包括畫素點和其領域加權組合得到輸出，一般公式如下：

Ω是以畫素點 i 為中心的濾波視窗，w是濾波權值，q是原影象素值，I'是輸出結果。

但是這樣以一個畫素為中心去濾波會的問題在於，如果一個畫素點處在邊緣位置

（這裡的邊緣不是指圖片的大小邊界，而是指影象中物體的邊緣）的話，以畫素為

中心的濾波會導致濾波結果的邊緣部分變模糊。具體是為什麼，論文中給出了分析過程。

首先來看下，論文中的一張圖：

文中提到為了分析方便只討論3種典型的邊緣，分別是圖中的

(a)階梯狀邊緣、(b)斜坡狀邊緣和(c)屋頂狀邊緣。論文中也給出了這3三種邊緣的形象展示：

然後文中採用了泰勒展開去分析，首先假定，影象上(x, y)座標點的畫素值為g(x, y)，對於

圖中展示的情況來看，函式 g(x, y)是連續但不可導的。對於(a)階梯狀邊緣的 'a' (藍色方框那個店)

點來說，文中定義 'a-' 和 'a+' 來分別表示 'a' 點左極限 (x - ε, y)，和右極限 (x + ε, y)。且 ε > 0。

很明顯從圖中可以看出來 g(x - ε, y) ≠ g(x + ε, y) 且/或（文中的用詞是"and (or)"）

g'(x - ε, y) ≠ g'(x + ε, y)，導數也不等由於邊緣部分的跳躍。因此對於這兩塊區域的泰勒展開也是

不一樣的，首先來看下泰勒展開的一般公式：

“泰勒公式是將一個在 x=x0 處具有n階導數的函式 f(x) 利用關於 (x - x0) 的n次多項式來

逼近函式的方法。”----百度百科

根據文中的分析，這裡設定 f(x) = g(x - 2ε, y)，x0 = x - ε，則根據泰勒展開公式：

g(x - 2ε, y) ≈ f(x0) + f'(x0)(x - x0)

= g(x - ε, y) + g'(x - ε, y)(x - 2ε - (x - ε))

= g(x - ε, y) + g'(x - ε, y)(- ε)

同理，設 f(x) = g(x + 2ε, y)，x0 = x + ε，則泰勒展開得：

g(x + 2ε, y) ≈ f(x0) + f'(x0)(x - x0)

= g(x + ε, y) + g'(x + ε, y)(x + 2ε - (x + ε))

= g(x + ε, y) + g'(x + ε, y)ε

所以從兩邊的泰勒展開式可以得出結論，對於 'a-' 區域的濾波估計肯定是來自區域 'a' 的左邊，

而對於 'a-' 估計是來自於 'a' 的右邊，然後類比分析區域 'b'，'c' 和 'd' 都可以得到類似的結論。

因此分析得到的結論是，如果一個畫素點處於影象中的邊緣位置，那麼濾波的時候就應該把

濾波器的邊緣和該畫素點對齊，而不是把濾波器的中心和該畫素點對齊。受該發現的啟發，

文中提出了一個新的保邊濾波策略，就是把每個濾波畫素點都當成是潛在的邊緣點，然後

對於每個待濾波的畫素點，生成幾種不同的濾波子視窗，然後把這些濾波視窗的邊緣或者

角點位置和該畫素點對齊，然後濾波得到結果，最後根據把這些子視窗的濾波之後的最佳

重構結果作為最終的濾波結果。以上就是side window 濾波的思想。

然後文中提出了8個方向的濾波視窗，分別是上、下，左、右、左上、右上、左下和右下。

還有對於視窗的分析，最後就可以得到side window filter的核心演算法流程：

然後論文中又詳細分析了 box filter 和 side window box filter 對於上面提到的三種經典

邊緣的濾波之後的保留情況。文中給出分析的圖表如下：

總的來說結論就是 side window box filter 對於階梯和斜坡狀的邊緣都能完整的保留，

而對於屋頂狀邊緣雖然不能完整的保留邊緣，但是也比經典的盒子濾波要好很多。

在復現過程中，本來一開始是想對文中提到的8種side window去分別寫對應的盒子濾波的，

因為盒子濾波有個經典的優化思路，可以讓執行時間不受濾波半徑的影響，

具體可以參考我之前寫得一篇部落格：

移動端arm cpu優化學習筆記----一步步優化盒子濾波（Box Filter）

後來仔細想了下，這8個side window其實也就是邊界處理不同，核心運算邏輯都是一致的，

最後就是抽象成一個函式，對於不同的side window傳不同的邊界引數，

就不需要每個視窗寫一個函數了，具體可以看看github上的程式碼。

最後看看一組結果，看看在迭代10次的情況下，經典box filter 和 side window box filter的結果對比：

熊貓寶寶原圖

濾波結果, box filter, iteration = 10

濾波結果, side window box filter, iteration = 10

熊貓寶寶原圖+椒鹽噪聲

去噪結果, box filter, iteration = 10

去噪結果, side window box filter, iteration = 10

Sub-window Box F

Side Window Filtering 論文解讀和C++實現

Side Window Filtering 剛開始看到這篇論文的時候，我就很感興趣想去復現一把看看效果。這篇論文是今年 CV

線性代數-矩陣-加減 C和C++實現

for 通過 turn oba c語言 bsp operator column name 原理解析：（此處補圖）本節編寫矩陣的加法和減法，兩個矩陣相加，即把兩個相同大小的矩陣對應的元素分別相加。兩個矩陣相減，把兩個相同大小矩陣的對應元素分別相減。 C++語言：矩

線性代數-矩陣-【5】矩陣化簡 C和C++實現

tar tput c++ spec 但是 exc c++語言 emp opened 點擊這裏可以跳轉至【1】矩陣匯總：http://www.cnblogs.com/HongYi-Liang/p/7287369.html 【2】矩陣生成：http://www.cnblog

編程之美—象棋將帥問題java和C++實現

象棋解決思路這樣如下圖：然後我的java實現public class xiangqi { public static void main(String[] args) { byte s=81; while(s!=0){ if((s/9%3)==(

最簡單的排序算法（C和C++實現）

最簡單的排序算法（C和C++實現）1、算法思想如下圖：把待排序的數都存在對應的數組的下標中，如果待排序的數有重復的，就用對應的數組加一，最後把數組的下標打印出來即可。2、源碼（C）如下：#include <stdio.h>int main (void){ int a[100], i, j,

LBP特徵Matlab和C實現

LBP特徵成為區域性二值模式，具有旋轉不變性，不受光照影響主要分為一下幾個步驟： 1.中心點鄰域內8個畫素，以中心點畫素值為閾值，鄰域內八個畫素值大於中心點畫素值即為1，小於中心點畫素值即為0 2.周圍八個畫素點形成一個八位的二進位制串比如11111111，即為255，0000

1049 數列的片段和 ——c實現

1049 數列的片段和（20 分）給定一個正數數列，我們可以從中擷取任意的連續的幾個數，稱為片段。例如，給定數列 { 0.1, 0.2, 0.3, 0.4 }，我們有 (0.1) (0.1, 0.2) (0.1, 0.2, 0.3) (0.1, 0.2, 0.3, 0.4) (

Leetcode 929 獨特的電子郵件（Python和C++實現）

每封電子郵件都由一個本地名稱和一個域名組成，以 @ 符號分隔。例如，在 [email protected]中， alice 是本地名稱，而 leetcode.com 是域名。除了小寫字母，這些電子郵件還可能包含 ','

快速排序c 和c++實現

#include <iostream> #include <vector> using namespace std; void Qsort(int a[], int low, int high) { if(

可變形卷積解讀和程式碼實現（TF）

#呼叫普通卷積獲得輸出，輸出結果為(b,h,w,2c)表示圖片中每個畫素需要偏移的量（x,y) offsets = super(ConvOffset2D, self).call(x) #reshape一下輸出，方便後續操作，(b*c,h,w,2)表示共有b*c個圖片，每個圖片為h*w

LeetCode- 16. 最接近的三數之和（Medium）python和c++實現

給定一個包括 n 個整數的陣列 nums 和一個目標值 target。找出 nums 中的三個整數，使得它們的和與 target 最接近。返回這三個數的和。假定每組輸入只存在唯一答案。例如，給定陣列 n

python 和c++實現旋轉矩陣到尤拉角的變換

在攝影測量學科中，國際攝影測量遵循OPK系統，即是xyz轉角系統，而工業中往往使用zyx轉角系統。旋轉矩陣的意義：描述相對地面的旋轉情況，yaw-pitch-roll對應zyx對應k,p,w #inc

Leetcode 929 獨特的電子郵件（Python和C++實現）

每封電子郵件都由一個本地名稱和一個域名組成，以 @ 符號分隔。例如，在 [email protected]中， alice 是本地名稱，而 leetcode.com 是域名。除了小寫字母，這些電子郵件還可能包含 ',' 或 '+'。如果在電子郵件地址的本

基於OpenCV和C++實現最大閾值分割演算法

程式碼如下：： /********************************************************************************************************** *檔案說明: * 基於Ope

白話貝葉斯理論及在足球比賽結果預測中的應用和C#實現

貝葉斯分類的基礎是概率推理，就是在各種條件的存在不確定，僅知其出現概率的情況下，如何完成推理和決策任務。概率推理是與確定性推理相對應的。而樸素貝葉斯分類器是基於獨立假設的，即假設樣本每個特徵與其他特徵都不相關。舉個例子，如果一種水果其具有紅，圓，直徑大概4英寸等特徵，該水果可以被判定為是蘋果。

圖的表示方法和C++實現

圖的表示最長用的兩種方法是： 1）、鄰接矩陣表示法 2）、鄰接表表示下面是兩種構造圖的方法 1）鄰接矩陣： #include <iostream> #include <vector> us

動態規劃演算法和c++實現國王與金礦問題

這個連結講解動態規劃通俗易懂：https://blog.csdn.net/baidu_37107022/article/details/73188963 https://blog.csdn.net/baidu_37107022/article/details/7318912

C實現字元型陣列轉整形和C++實現字串轉整形

1、利用C語言實現字元型陣列轉換成整形，其中需要考慮到很多邊界條件，其實現程式碼如下： #include<stdio.h> #include<limits.h>//標頭檔案定義最大最小的整形 #include<iostream>//包含

原理和C++實現的演示程式（附原始碼）

http://blog.csdn.net/mahabharata_/article/details/71856907 大二的時候，曾受老師所託，用C++而不是OpenGL去寫B樣條曲線的教學程式。時隔一年，發現原始碼找不見了，所以重新寫了一遍，也完善了部分功能，順

分別用C和C++實現了連結串列結構

C實現：這裡寫程式碼片 LINKED_LIST.h typedef struct S_NODE { float data; struct S_NODE *link; }Node; //建立連結串列 Node* Create()

Side Window Filtering 論文解讀和C++實現

相關推薦