1. 程式人生 > >樣本採集過程中需要注意的問題

樣本採集過程中需要注意的問題

專案:客流量統計系統

樣本採集:

目標:人頭

攝像頭架設位置:垂直

樣本取樣:包括頭部邊緣的人頭作為檢測目標

樣本採集需要注意的問題:

  • 樣本的大小:需要按照一定的比例(1:1)採集,可以使用ps設定扣取目標並縮放到統一尺度下
  • 樣本的基準參考點:儘量保持人頭的頭頂居於圖片的中心位置,以防止圖片過於偏於某個方向而引入較多的噪聲

目標:頭和肩膀

攝像機架設位置:垂直

樣本取樣部位:包括完整的人頭和部分肩膀資訊

樣本採集需要注意的問題:

  • 樣本的大下:按照一定的比例(1:1)採集,(頭和肩膀的取樣形狀會隨著人體的不同姿勢而發生改變,如果用矩形框,人在水平站立和傾斜45度時取樣的矩形框比例不同,為了統一標準,選取正方形)
  • 樣本的基準參考點:儘量將人頭擺放著中間位置,並按照人頭的大小將取樣區域擴大為人頭的1.5-2倍作為樣本。(原因:如果選取包含人體的全部肩部和頭部資訊,會隨著人體的旋轉,取樣的大下發生變化,可能不利於特徵的分類)

樣本訓練:

分類器:svm

樣本比例:如果使用opencv自帶的svm進行特徵訓練,對於二分類問題,正負樣本比例接近1:1,若正負樣本個數差異較大,聽朋友說可以通過加權svm來控制分類器

樣本數量:在客流統計系統中,正負樣本分別大於4000張

樣本更新:在使用svm訓練出分類器後,需要用測試樣本對分類器進行測試,分別將誤檢和虛檢的目標新增到正負樣本中,更新樣本(主要是更新負樣本,正樣本主要依靠人工扣取更新),直至正負樣本分別收斂為止。

svm係數調整:對於線性分類器,引數C值對svm的分類結果有較大影響,可以通過調節c值獲取較好的分類器,同樣訓練的迭代次數同樣對此有影響,常見的部落格中用到的是100次迭代。但是在使用過程中,用到了1E5--1E7有較好的效果,說明迭代次數較大時,分類器效能較好。