BoW模型用於影象檢索的一般化流程
阿新 • • 發佈:2018-12-31
--來自肉麻的開題報告
以經典BoW模型實現一個影象檢索的方法,BoW檢索的一般流程如圖2所示:
圖2 BoW檢索流程
最初的BoW在影象檢索中應用的流程主要分為以下幾步:
1、特徵提取。在訓練階段,將影象用很多“塊”(patch)表示,以SIFT特徵為例,影象中每個關鍵點就是一個patch,每一個patch特徵向量的維數128。
2、字典構建。假設共有M幅訓練影象,字典的大小為100,即有100個詞,用K-均值演算法對所有的patch進行聚類,等k-均值收斂時,將得到每一個聚類最後的質心,這100個質心(維數128)就是詞典裡的100個詞,詞典構建完畢。
3、字典表示。在測試階段,對每幅影象初始化一個維數100、值全為0的直方圖,計算測試影象每個patch與字典中單詞的距離,距離patch最近的單詞對應的直方圖計數加1,將所有patch計算完畢後的直方圖即為影象的字典表示。
4、影象檢索。訓練圖與測試圖都以100維向量表示,對每個待檢索影象,只需在字典中計算所有訓練圖與其距離,並返回最近的若干幅即可。
特徵提取是演算法的開始,也在很大程度上決定了演算法的效能。PS:1.該圖參考的是LiFeiFei2006年的資料,原圖是用於object recognition的;
2.培訓完過後開始總結特徵;
3.實驗Gabor特徵+LDA;
from: http://blog.csdn.net/polly_yang/article/details/8241471