1. 程式人生 > >人臉識別入門知識-視訊組成

人臉識別入門知識-視訊組成

(一)影象的認識

圖片分向量圖和畫素圖,向量圖是由數學表示,比較抽象,不太好理解,高數的集合中講過向量,就是既有方向又有大小的直線,比如你腦海裡想象一個四邊形,這個四邊形就是向量的。CDR、CAD處理的影象就是向量圖,因為是數學表示的,可以無限放大和縮小,不會產生鋸齒。畫素圖是由矩陣的畫素點組成,每個畫素點就是個小方塊,每個方塊中一般是有三個用位元組表示的數,表示RGB,合成後只能顯示一種顏色,單位面積內畫素點越密集,影象越清晰。但是放大以後因為畫素點是方形的,所以能看見鋸齒,越放大單位面積的畫素點越少,所以也越來越模糊,PS軟體就是處理畫素圖的。JavaCV也是典型的畫素圖處理軟體,通過相機、攝像頭獲取到的圖片都是畫素圖。

(二)畫素點的認識

畫素點每次只能顯示一個顏色,顏色由3基本色(RGB)或者4基本色(CMYK)組成,在任何裝置彩色螢幕上顯示的都是RGB畫素,彩色印表機列印的是CMYK色。這就是為什麼在電腦上顯示的顏色和打印出來的顏色有小許不同。JavaCV、opencv主要演算法就是計算畫素點的顏色,通過各種數學變換得到相似度一類的。這種處理方式不是處理最小量,在某些方面還是有缺陷,在向量圖上處理,會更加細緻。大腦內的所有影象都是向量的。

(二)視訊的認識

視訊由圖片組成,一幀代表一張圖片,幀率就是指每秒切換多少張圖片。