1. 程式人生 > >Facial Landmark Detection(人臉特徵點檢測)

Facial Landmark Detection(人臉特徵點檢測)

image

作為計算機視覺研究員,我們很早就開始研究人臉。人臉分析領域最廣為人知的就是人臉識別(face recognition).但是為了識別一幅影象中的人臉,我們首先必須要找到影象中人臉的位置。因此人臉檢測(face detection)-定位一幅影象中的人臉並且返回一個包圍人臉的矩形或者正方形(bounding rectangle/square)是一個熱門的研究領域。2001年,Paul Viola 和Michael Jones 發表了史詩級論文<< “Rapid Object Detection using a Boosted Cascade of Simple Features.>>.在OpenCV早期甚至某種程度下在現在,OpenCV的致命武器就是對
Viola and Jones face detector的一個比較好的實現。

一旦你找到了人臉附近的包圍盒,最顯然的研究當然是準確識別人臉不同特徵的位置(比如,眼角、瞳孔、嘴巴、鼻子等)。人臉特徵檢測(face feature detection)也稱為 “facial landmark detection”, “facial keypoint detection” and “face alignment”,你可以在Google找到類似的文獻。

Facial Keypoint Detection

人臉關鍵點檢測有很多應用。如下做了一些列舉:

Facial feature detection improves face recognition

人臉特徵點可以被用來將人臉對齊到平均人臉(mean face shape),這樣在對齊之後所有影象中的人臉特徵點的位置幾乎是相同的。直觀上來看,用對齊後的影象訓練的人臉識別演算法更加有效,這個直覺已經被很多論文驗證。

Head pose estimation

一旦你知道了一些特徵點的位置,你也可以估計頭部的姿勢。換句話說,你可以解決頭部在空間中的定向問題,或者通俗的講就是人朝那裡看的問題。

Face Morphing (人臉變形)

人臉特徵點可以對齊人臉,這樣可以生成兩張人臉的中間影象。如下圖:
image

Virtual Makeover(虛擬化妝)

在我的公司
我們已經寫了自己的人臉特徵點檢測器。檢測出的特徵點被用來計算嘴的輪廓,眼睛等用來渲染虛擬化妝。Figure2z展示了這一效果:
image

Face Replacement

先前的報告中,我們展示瞭如何使用人臉特徵點去預測人臉的吸引力

很明顯,在圖片和視訊上進行人臉特徵點檢測為許多有趣的應用提供了很多的可能性。下面我們就將介紹一些有用的特徵點檢測工具。

Facial Feature Detection & Tracking Libraries

過去五年來,這個領域很火,部分原因是大量可以用來訓練的資料如LFPWHelen被提供。我在下一節列了很多論文。但是我不建議胡亂實現這些論文,因為已經有開源的實現。

Dlib(C++/Python)

Dlib是機器學習,計算機視覺,影象處理,線性代數中眾多演算法的集合。庫中大多數是標頭檔案,你可以直接直接包含在C++應用中。或者你更喜歡Python?沒問題,他也有一個Python介面.

我個人更喜歡Dlib因為程式碼是簡潔的,有大量的註釋,也可以被用來商用。他們選擇實現的演算法是非常快的,並且是準確的,你可以很容易整合這個庫到你的C++工程中,而你需要做的僅僅是包含標頭檔案.

如何編譯Dlib?

  1. 從Github上下載:
git clone https://github.com/davisking/dlib.git
  1. 建立Examples(OSX\Linux)
cd dlib/examples
mkdir build
cd build
cmake .. 
cmake --build . --config Release

這些例子是一個開始使用Dlib的非常好的方法。拷貝一個例子的cpp檔案,修改它,修改examples/CMakeLists.txt 並且像上面一樣再一次編譯它。很容易吧!
3. 編譯dlib python 模組

cd dlib/python_examples 
./compile_dlib_python_module.bat
  1. 設定 PYTHONPATH 環境變數
# Put the following line in .bashrc or .profile
export PYTHONPATH=/path/to/dlib/python_examples:$PYTHONPATH
  1. 測試python模組
python -c "import dlib"

如果以上都沒有問題的話,你就設定好了。

How to run Dlib’s facial landmark detector ?

當你編譯好examples後,為了在網路攝像頭上執行人臉特徵點檢測器,可以這樣做:

cd examples/build/
#Download the face landmark model 
wget http://dlib.net/files/shape_predictor_68_face_landmarks.dat.bz2
tar xvjf shape_predictor_68_face_landmarks.dat.bz2
./webcam_face_pose_ex

如果你想要在單個影象上執行,你可以這樣試試:

./face_landmark_detection_ex shape_predictor_68_face_landmarks.dat faces/*.jpg

CLM-Framework (C++)

CLM-framework,也被稱為劍橋人臉跟蹤器,是一個用來進行人臉特徵點檢測和頭部姿勢估計的C++庫。你可以看看他在包含的video檔案裡工作的多麼好啊!在OSX上編譯這個庫有點兒挑戰但是也不太難。庫依賴於OpenCV3和X11.

有兩個重要的事說明Dlib可以挑戰CLM-Framework。首先,Dlib比CLM-Framework更快。其次,Dlib的license允許你商用。如果要挑一個的,我會使用Dlib.有趣的是,CLM-Framework依賴於Dlib.

如何編譯CLM-Framework?

編譯CLM-Framework在OSX上有點兒複雜。對於Windows和linux,這裡有一份詳細的說明.為了在OSX上編譯version 1.3.0,我使用了linux的指示,但是發生了很多改變。

許多依賴項可以使用brew安裝.

在檔案CMakeLists.txt(如下劃掉的被後面的取代)

find_package( OpenCV 3.0 REQUIRED )

find_package( OpenCV 3.0 REQUIRED HINTS /path/to/opencv )

INCLUDE_DIRECTORIES(${OpenCV_INCLUDE_DIRS})

INCLUDE_DIRECTORIES(/opt/X11/include)

在檔案exe/SimpleCLM/SimpleCLM.cpp中

writerFace = VideoWriter(tracked_videos_output[f_n], CV_FOURCC(‘D’,’I’,’V’,’X’), 30, captured_image.size(), true);

writerFace = VideoWriter(tracked_videos_output[f_n], CV_FOURCC(‘M’,’P’,’4′,’V’), 15, captured_image.size(), true);

如何執行CLM-Framework人臉檢測器?

編譯後,可執行檔案在bin路徑中.對於視訊中展現的網路攝像頭Demo,你可以這樣使用:

bin/SimpleCLM

Face++ ( FacePlusPlus ) : Web API

人臉特徵點檢測最好的實現之一就是Face++.他們在300 Faces in-the-Wild
Landmark Detection Challenge,2013取得了冠軍。他們提供了一個易用的API。問題是你需要上傳一張圖片到他們的伺服器,這個將帶來很多隱私上的擔憂。但是如果隱私不是問題的話,Face++是一個好的選擇。你可以在
http://www.faceplusplus.com/demo-landmark/
看到一個Demo.

Facial Feature Detection Research

許多不同的方法都可以用來解決這個問題。很難再部落格中對其歸類。我簡單地列出了一些重要論文。
1. Active Appearance Model (AAM) by T. Cootes, G. Edwards and C. J. Taylor. [1998]
2. Face Alignment through Subspace Constrained Mean-Shifts by Jason M. Saragih, Simon Lucey and Jeffrey F. Cohn. [2009]
3. Localizing Parts of Faces Using a Consensus of Exemplars by Peter N. Belhumeur, David W. Jacobs, David J. Kriegman, Neeraj Kumar [ 2011 ]
4. Face Alignment by Explicit Shape Regression by Xudong Cao Yichen Wei Fang Wen Jian Sun [2012]
5. Supervised Descent Method and Its Applications to Face Alignment by Xuehan Xiong and Fernando De la Torre [2013]
6. Constrained Local Neural Fields for robust facial landmark detection in the wild by Tadas Baltrusaitis, Peter Robinson, and Louis-Philippe Morency. [2013]
7. Extensive Facial Landmark Localization with Coarse-to-fine Convolutional Network Cascade by Erjin Zhou, Haoqiang Fan, Zhimin Cao, Yuning Jiang and Qi Yin. [2013]
8. Face alignment at 3000 fps via regressing local binary features by S Ren, X Cao, Y Wei, J Sun. [2014]
9. Facial Landmark Detection by Deep Multi-task Learning by Zhanpeng Zhang, Ping Luo, Chen Change Loy, and Xiaoou Tang. [2014]
10.One Millisecond Face Alignment with an Ensemble of Regression Trees by Vahid Kazemi and Josephine Sullivan. [2014]