BoW模型用於影象檢索的一般化流程

阿新 • • 發佈：2018-12-31

--來自肉麻的開題報告

以經典BoW模型實現一個影象檢索的方法，BoW檢索的一般流程如圖2所示：

圖2 BoW檢索流程

最初的BoW在影象檢索中應用的流程主要分為以下幾步：

1、特徵提取。在訓練階段，將影象用很多“塊”（patch）表示，以SIFT特徵為例，影象中每個關鍵點就是一個patch，每一個patch特徵向量的維數128。

2、字典構建。假設共有M幅訓練影象，字典的大小為100，即有100個詞，用K-均值演算法對所有的patch進行聚類，等k-均值收斂時，將得到每一個聚類最後的質心，這100個質心（維數128）就是詞典裡的100個詞，詞典構建完畢。

3、字典表示。在測試階段，對每幅影象初始化一個維數100、值全為0的直方圖，計算測試影象每個patch與字典中單詞的距離，距離patch最近的單詞對應的直方圖計數加1，將所有patch計算完畢後的直方圖即為影象的字典表示。

4、影象檢索。訓練圖與測試圖都以100維向量表示，對每個待檢索影象，只需在字典中計算所有訓練圖與其距離，並返回最近的若干幅即可。

特徵提取是演算法的開始，也在很大程度上決定了演算法的效能。

PS:1.該圖參考的是LiFeiFei2006年的資料，原圖是用於object recognition的；

2.培訓完過後開始總結特徵；

3.實驗Gabor特徵+LDA；

from: http://blog.csdn.net/polly_yang/article/details/8241471