1. 程式人生 > 實用技巧 >前端:An iterative image registration technique with an application to stereo vision

前端:An iterative image registration technique with an application to stereo vision

這篇論文主要記錄Lucas 光流法,KLT光流跟蹤的基礎

【摘要】 主要講了影象配準的一種方法–利用影象的空間強度梯度和牛頓迭代法找到好的匹配。此方法更快(僅從較少的匹配中篩選)且適用於旋轉、尺度、裁剪等變換。

【簡介】 現存的方法代價大且不能處理旋轉或者其他變形的情況,提出了一種新的技術–採用空間強度梯度資訊找到最佳匹配。這樣就可以利用更多影象資訊找到兩幅圖的最佳匹配。這種方法比按固定順序計算可能的配準位置需要比較的次數更少。此法利用了許多應用中兩幅圖已經近似配準了,且可以處理任何線性形變。
【配準問題介紹】
給定函式F(x)和G(x),分別表示各自在兩幅圖中的畫素值,x是個向量。要求一個視差向量h,使F(x+h)和G(x)的某些距離測度最小,其中x屬於區域R。

在這裡插入圖片描述
三種典型的距離度量:
在這裡插入圖片描述

本文將提出一種更通用的影象差度度量方法,L2 norm和歸一化相關都是該方法的特例。L1 norm可以看做是L2 norm的一種合理逼近。
【現存技術】
一種最顯而易見的影象配準方法就是窮舉搜尋h的可能值空間,計算其距離。但非常低效。根據上次的h計算其附近可以使函式值下降的h作為下個h值,這樣迭代。但可能會陷入區域性最優。序貫想相似性檢測演算法(SSDA)。SSDA通過人為設定一個固定閾值,及早地終止在不匹配位置上的計算,以此減小計算量,達到提高運算速度的目的。選取一個誤差準則,設定一個不變閾值。在子圖象中隨機選取一點,計算它與模板中相應點的絕對誤差值, 將每一隨機點對的誤差累加起來,若累加到第r次時誤差超過設定閾值,則停止累加。停止準則主要由這個固定閾值和累加次數r。

一些配准算法採用了一種由粗到細的策略。先用上面的某種方法在低解析度下找到最佳配準,然後將其作為高解析度中的可能匹配位置的約束。一些利用金字塔的影象理解系統採用了這種方法。
上面這些方法有些可以互相結合使用。爬山法和窮舉搜尋只解決了如何找到最佳匹配,SSDA解決了計算差異函式的方法。因此,可以用SSDA和爬山法或者窮舉搜尋結合,也可以用由粗到細策略。

本文介紹了搜尋h空間的順序。具體講,先確定一個初始h,再用每一點的空間強度梯度修正當前h,直到達到最優匹配。迭代過程採用的是牛頓迭代法。該配準方法可以和coarse-fine策略結合。
【配准算法】
本節先介紹一種針對一維配準問題的直接方法,再介紹另外一種可以推廣到多維的方法。然後介紹怎麼將此技術推廣到其他型別配準。最後討論演算法應用和效能。

1. 一維問題
我們希望在F(x)和G(x)=F(x+h)之間找到一個水平視差h。
在這裡插入圖片描述
根據對x附近的F(x)進行線性逼近。對於很小的h,
在這裡插入圖片描述

當h足夠小,逼近就可以寫成等號。後面會介紹通過平滑影象擴大h的範圍,這樣就可以直接寫等號了。
將x一點的情況推廣到多點:
在這裡插入圖片描述

當F(x)接近線性時,(1)線性逼近得很好;反之當|F”(x)|很大時則逼近不好。根據這個關係,可以對上式進行改進,再根據公式(4),可以設計一個計算權重的方法,就是公式(5)。|F”(x)|越小,權重越大。從圖2可以看出,當x為兩條曲線交叉點時,按(2)算出的h是0,但是因為此時G’(x)和F’(x)的差很大,所以權重很小,這就符合邏輯了。最終的h是公式(6)。
在這裡插入圖片描述

得到h的估計值,就可以將F(x)移動h的距離,重複這一過程得到一系列的牛頓迭代。理想情況下h會收斂到一個最優值。迭代表示為
在這裡插入圖片描述

2. 另一種推導
上面的推導不能直接推廣到二維情況,因為二維線形逼近形式不同。另一個原因是(2)中分母可能為0。因此,將(1)改為
在這裡插入圖片描述
求得h
在這裡插入圖片描述

這個除了權重係數為和公式(6)基本相同。當且僅當對任意x,F’(x)=0時,分母為0,而此時h沒有定義。
對應的迭代公式
在這裡插入圖片描述

  1. 效能
    相比於沒有權重的方法,該方法能在更廣的範圍更快收斂。