1. 程式人生 > >關於全景影象的拼接

關於全景影象的拼接

這段時間一直在做全景影象拼接,略有小成。總結一下:

影象拼接概括起來說,分兩大步驟。第一步,配準。第二步,融合。

配準有基於模板匹配的,有基於特徵點匹配的。現在的主流是基於特徵點匹配的,SIFT是熱點。

融合的方法有很多,有最簡單的線性過渡,有經典的拉普拉斯金字塔融合(多波段融合),有基於小波變換的融合,還有比較新而且效果很讚的泊松影象編輯融合,可惜泊松影象編輯的這個方法我還沒有實現出來,只是實現了基於拉普拉斯金字塔的融合,效果挺不錯。

以下三篇論文是權威和經典,如果有能力消化並實現,那麼一個完整的全景拼接系統就有了。
1) Construction of panoramic mosaics with global and local alignment. 
   Heung-Yeung Shum and Richard Szeliski. 2000.
2) Eliminating Ghosting and Exposure Artifacts in Image Mosaics. 
   Matthew Uyttendaele, Ashley Eden and Richard Szeliski. 2001.
3) Automatic Panoramic Image Stitching using Invariant Features. 
   Matthew Brown and David G. Lowe. 2007.

ps: 上面論文作者其中的Richard Szeliski是計算機視覺界的翹楚,在微軟研究院工作,最近出了新書《Computer Vision: Algorithm and Applications》英文版,200多美刀。不過該大牛在他的個人網站上放了書稿,pdf格式,絕對值得下載。