基於無線訊號的手勢識別研究現狀調查
摘要:進入21世紀以來,人機互動技術持續發展,手勢識別是代表之一。2013年,華盛頓大學的研究人員提出了使用無線訊號進行手勢識別的方法,給傳統的手勢識別技術帶來的一定的挑戰,但是這一技術並不是很成熟,暫時沒有投入商業使用。本文詳細介紹了手勢識別,並敘述了基於無線射頻的手勢識別的研究現狀。
關鍵詞:無線訊號、手勢識別、人機互動
一、背景
進入二十一世紀以來,隨著世界科技持續不斷的進步以及計算機突飛猛進的發展和普及,人機互動技術(Human-Computer Interaction,簡稱HCI)在世界各國的可持續發展中變得越來越重要。人機互動指的是人與計算機這兩者之間通過使用某種指定的互動方式(如滑鼠、手勢、聲音等),去完成指定任務而產生資訊交換的過程[1]。人們研究HCI技術的主要目的是實現人與計算機之間的溝通和交流,使得計算機懂得人類的意圖,去幫助人們提高其生活質量,構建更加智慧的社會。
近年來,伴隨虛擬現實、增強現實、可穿戴計算等技術的出現,此時的HCI技術(以計算機為中心的、傳統的、基於滑鼠和鍵盤的、單一的互動技術)越來越不能滿足人們的需求。因此,多渠道的自然使用者互動介面應運而生,顧名思義就是在原有的HCI中,加入了手勢、脣語、語音、表情、眼神、意念等人類很自然的資訊進行多渠道的互動。更進一步地,我們不僅可以和計算機互動,還可以和手機、智慧電視等智慧裝置進行互動,比如最廣為人知的微軟公司生產的體感遊戲控制系統Kinect[2],不但極大地豐富了人們的生活,而且拓展了HCI技術的應用領域。
手勢是一種直觀、形象、容易學習、資訊量豐富和具有很強視覺衝擊的人體語言,通常利用人體發出的動作來傳達相關資訊,可以稱得上是人們日常生活中的第二語言[3]。手勢語言清晰明瞭、自然友好,受到了人們、特別是相關研究人員越來越廣泛的關注。由於我們可以用手做出千變萬化的動作,而每個動作所代表的含義也是豐富多彩的,因此,研究手勢識別對於發展 HCI技術有十分重大的作用,同時對改善人類社會的生活有著巨大的意義:可用於智慧家居對家居進行手勢控制,減弱對遙控器、移動終端的依賴,減少額外成本;可用於手語識別,幫助聾啞人等不方便人群提高其生活水平;可用於汽車領域中的車聯網,如通過用不同的手勢喚醒汽車系統的不同功能,如開啟娛樂系統,調出導航系統等,不用親自去按開關按鈕,方便司機的操作,減少風險,提高其工作效率;可用於機器人的遠端控制,如火災現場、抗洪搶險一線、礦下作業、化學實驗現場等危險不便直接操控的特殊場合下,我們通過手勢遠端控制機器人作業;可用於搭建家庭娛樂平臺,豐富家庭生活,比如應用於體感遊戲,增加遊戲的趣味性和可玩性;可用於教學或會議,如用手勢控制PPT的翻頁,文件的開啟與關閉,報表的展示等,方便工作[4]。
目前,手勢識別的方式主要有基於感測器的手勢識別、基於視覺的手勢識別、基於無線射頻的手勢識別。本文重點討論基於無線射頻的手勢識別。其中比較成熟的基於無線射頻的手勢識別系統有:WiVi[5]、WiSee[6]、AllSee[7]、WiTrack[8]等。
二、研究現狀
2.1 概述
在人機互動迅猛發展的時代,手勢識別作為其極其重要的研究領域,已經引起了世界各國的高度重視。根據手勢動作資料採集的渠道不同,我們可以將其主要分為三個方向(Figure 1):基於感測器(Sensor-based)的手勢識別、基於視覺(Vision-based)的手勢識別和基於無線射頻(RF-based)的手勢識別[4]。
Figure 1 手勢識別主要技術
隨著無線技術(Wireless Technology)的提高和無線網路的覆蓋範圍面積的擴大,基於IEEE 802.11a/g/n協議的無線路由器慢慢普及到我們的日常生活當中。我們周圍幾乎時時刻刻都存在著無線訊號(如圖1-5),如中國移動的CMCC等。WiFi訊號具有低開銷,容易部署等優點。在 SIGCOMM’ 13上,Fadel Adib和Dina Katabi利用MIMO Interface Nulling和逆合成孔徑雷達(Inverse SyntheticAperture Radar,簡稱ISAR)技術去消除靜止物體的反射,捕捉運動物體的反射訊號,從而識別出運動物體的軌跡[5]。隨後,華盛頓大學的Qifan Pu等人在USRP-N210實驗平臺上利用無線射頻的多普勒效應(目標靠近或遠離無線熱點都引起無線訊號的改變),提出了WiSee,實現了覆蓋整個家庭的九個手勢識別,如推、拉、踢、閃等,平均識別率高達94%[6]。2014年,哥延根大學的Stephan Sigg等人,從簡單方便的思路出發,提取了接收訊號強度指示器(Received Signal Strength Indicator,RSSI)的強度來進行簡單的動作識別[9]。MIT的研究人員開發的Witrack採用調頻連續波(Frequency Modulated Continuous Wave,簡稱FMCW)技術去計算從發射端出發,經過目標物體再反射回到接收端的時間(Time of Flight, TOF)去追蹤目標[8]。他們最近的研究結果Wiz可以檢測多個使用者的動作和識別三維的手勢指向[10]。 WiTrack和Wiz都可以植入消費電子產品當中,用於判斷使用者進出門,從而自動開關燈;識別手勢指向,自動開啟空調等裝置。而Bryce Kellogg等人從功耗角度出發,製作了特殊的低開銷的硬體AllSee,從電視訊號和RFID訊號中提取出手勢的相關資訊,從而識別出八個手勢[7]。Pedro等人在執行 IEEE 802.11 a/g/n協議的WARP(Wireless Open-Access Research Platform)平臺上實現了細粒度的手勢識別[11]。
2.2 WiTrack
WiTrac是一種三維運動追蹤與檢測裝置。它的工作過程是發射無線訊號並接受從人體反射回來的無線訊號,通過相應演算法,得出人體各部分的距離資訊,完成三維追蹤。它不要求使用者攜帶任何無線收發裝置,而且它可以在有牆或者其他WiFi訊號干擾的環境下使用。WiTrack裝置的功耗很低,它所傳送的無線訊號的功率比普通WiFi訊號小100倍,比手機訊號小1000倍。
WiTrack技術利用人體對於無線電訊號的反射來實現對人體的定位和運動追蹤。試驗裝置是一個T型的支架,中間點放置一個receiver,三個頂點放置三個transmitters,這樣的設定使得裝置可以立體地監測人體運動。
Witrack的優點在於可以進行釐米級地運動追蹤,它可以把人體的中心定位在一個x,y軸上10-13釐米,z軸上21釐米的三維空間中,還可以對被測人體的手的指向進行粗追蹤,這一功能具有96.9%的精度。WiTrack技術可以融入到電子消費產品中,適用於一系列的應用中:
應用於遊戲:使用者在配備有WiTrack的遊戲裝置情況下,再也不用像以前一樣坐在電視電腦前玩遊戲。使用者可以在家中自由地走動,裝置可以自動追蹤使用者的動作,比如使用者可以通過躲在沙發或者牆的後面來控制遊戲中人物躲避敵人。
應用老年人照護:眾所周知,跌倒是造成65歲以上老年人致命或非致命性傷害的首要元凶。當前的兩種跌倒檢測方法,一種需要老年人佩戴可穿戴式感測器,這使得老年人生活不便,一種需要使用攝像頭來檢測老年人跌倒,這會侵犯到老年人的隱私。WiTrack則可以通過從人體反射回的無線訊號強度的變化來檢測老年人是否跌倒,其準確率可達96%。
應用於智慧家居:WiTrack可以通過檢測使用者手指的方向來控制使用者手指方向的傢俱的開關,如燈的開關。使用者只需要在開燈前,用手指一下要開的燈即可。
2.3 WiSee
研究人員證實,通過使用客廳裡的一個經改裝的WiFi路由器和幾個無線裝置,使用者僅用一個簡單的手勢就可在家裡的任何房間操控自己的電子產品和家用電器該專案首席研究員、華盛頓大學電腦科學與工程助理教授西亞姆·高勒科塔將之稱為對既有無線訊號進行再利用的新方式。利用無線訊號進行手勢識別,免去了部署更多感測器的需要。
華盛頓大學研究團隊將此項技術命名為“WiSee”,它可以聰明地測出WiFi訊號下人們動作所產生的多普勒頻移。就目前9個手勢的平均識別率為94%,標準偏差為4.6%。研究報告已提交給第19屆國際移動計算和網路大會。“WiSee”在概念上與微軟Xbox Kinect類似,但技術更簡單,價格也更便宜,並且使用者不必在同一房間控制其裝置,因為WiFi訊號可穿越牆壁,不受視線或聲音障礙的約束。
研究團隊將一臺標準WiFi路由器改裝成“智慧”接收裝置,其基本上能偵聽房間中智慧手機、膝上型電腦、平板電腦等所有電子裝置發出的無線訊號。
一個人在移動時,會造成無線訊號頻率的輕微變動。手或腳的移動會導致接收裝置檢測到多普勒頻移變化。與WiFi訊號動輒20兆的頻寬及5吉赫的執行頻率相比,這些頻變是非常小的,通常只有幾個赫茲。研究人員開發了一種演算法來檢測這些細微的變化。
該技術目前可識別推、拉、刺、投等9種不同的手勢。WiSee在一個兩居室內測試證明,它還可以將系統放到人所在的另外的房間。除了在範圍上有優勢外,一個配備多天線及支援MIMO的WiFi基站可以支援多人識別,這樣可讓多達5人在同一住所同時操作手勢而不混淆。當一個人移動,會稍微改變無線訊號的頻率。移動一隻手或一隻腳,會導致接收器探測到被稱為多普勒頻移的模式變化。研究者開發出一套演算法用以偵測頻移。它能辨識九種不同的全身姿勢,從推、拉、揮拳到全身扭動。在執行的總共900個手勢中,WiSee的辨識準確度達到94%。
如果使用者想使用WiSee,必須執行一個特定的重複手勢順序來獲得接收機的訪問權。此種密碼概念將保持系統的安全和防止鄰居或黑客控制使用者家中的裝置。無線接收器與使用者鎖定後,使用者才可與家中的電子裝置進行正常的手勢互動。接收機則要進行程式設計以理解對應每個電子裝置的特定手勢。
不過,這個技術的操作過程是否簡便,使用者是否需要熟記手勢來進行操作這些都是需要考慮的問題。如果該技術可以趨向成熟,它在智慧家居上將起到非常大的作用,而且這還是在WiFi本身已經有所普及的情況下。要想真正做到實用,還需要商榷怎樣使這項技術做到簡單、方便。
2.3 WiG
WiG是深圳大學的何文鋒同學在他的碩士學位論文中提到的由作者搭建的基於WiFi的手勢識別實驗系統。它是一個基於現有的 WiFi 裝置和商用的無線網絡卡,利用無線訊號物理層的通道狀態資訊 CSI 來進行的 device-free(不需攜帶額外裝置)的手勢識別系統,包含硬體模組和軟體模組。
在硬體模組中,發射端是一個普通的商用路由器,稱為AP (Access Point)。接收端是一個裝有商用無線網絡卡(如Intel 5300無線網絡卡)的臺式電腦,稱為DP(Detect Point) 。AP和DP通過無線網絡卡連線上,然後AP在持續不斷地傳送無線訊號,與此同時,實驗人員在AP與DP之間做手勢動作。
在軟體模組中,包含CSI資料採集、CSI資料預處理、CSI資料去噪、CSI資料異常檢測、特徵提取和分類器分類這六部分。
WiG系統分為三個流程: CSI資料採集、CSI 資料預處理和去噪、CSI 資料異常檢測、特徵提取和分類。
WiSee[6], Al1See[9], WiTrack[8]等都是基於軟體無線電平臺USRP或專用的硬體上實現的。雖說Pedro等人不是使用軟體無線電平臺,而是WARP平臺,但是WARP和USRP一樣,使用昂貴的振盪器,成本很高。一套WARP實驗平臺就需要十幾萬人民幣,不利於大規模部署。
而WiG系統使用的是現有的無線設施以及商用的無線網絡卡,因此WiG系統為更普遍的基於無線訊號的手勢識別提供了一種可行的方案,但是其實際的效果有待進一步考證。
三、總結和展望
3.1 總結
手勢識別是HCI技術研究中非常關鍵的一個部分。基於無線射頻的系統,如WiVi, WiSee, Al1See等都是基於軟體無線電平臺USRP或專用的硬體上實現的,成本很高,不利於推廣普及。WiG系統使用了現有的無線設施以及商用的無線網絡卡,但是其實際效果有待進一步考證。
基於無線射頻的手勢識別有其本身的有點,比如:低開銷、容易大規模部署、可以在黑暗中使用、可以穿牆等等;但是它也有其本身的侷限性,如手勢的準確定義以及何文鋒的論文中提到的“不能進行身份識別”等。
3.2 展望
針對何文鋒的論文中提到無線射頻技術“不能進行身份識別”,筆者認為,姿勢識別可以結合WiFi定位[12]、姿勢識別、步態分析等技術:先進行姿勢識別和WiFi定位,將識別後的姿勢以及位置資訊傳給步態分析系統,一定時間內可以達到身份識別的目的,之後繼續利用WiFi定位進行人物跟蹤。這一方法對WiFi定位技術和姿勢識別的精確度較高,目前可能很難達到,在此只是提出可能的猜想。
隨著對手勢識別的深入,基於無線射頻的手勢識別相關演算法的精確度必將進一步提升,使得其對相關裝置的要求降低,甚至使用普遍的WiFi設施以及商業化的無線網絡卡既可達到使用標準,最終實現這一技術的普及。
參考文獻
[1]王雁.互動資訊設計研究[D].湖南:中南大學.2011.
[2]Microsoft.Kinect[EB/OL].[2014-12-12].
[3]百度百科.手勢DEB/OLD. X2014-12-25].http://baike.baidu.com/view/179746.htm
[4]何文鋒。基於WIFI的手勢識別研究[D].深圳:深圳大學.2015
[5] Adib F, Katabi D. Seeing Through Walls Using WiFi [C]. Proceedings of the ACM SIGCOMM 2013 conference. Hong Kong: ACM, 2013.
[6] Pu Q, Gupta S, Gollakota S, et al. Whole-home gesture recognition using wireless signals[C]Proceedings of the 19th annual international conference on Mobile computing & networking.ACM, 2013: 27-38.
[7] Kellogg B, Talla V, Gollakota S. Bringing gesture recognition to all devices[C] Proceedings of the 11th USENIX Symposium on Networked Systems Design & Implementation. Seattle, Wa: ACM, 2014, 14
[8] Adib F, Kabelac Z, Katabi D, et al. 3d tracking via body radio reflections[C] Proceedings of the 11th USENIX Symposium on Networked Systems Design &Implementation. Seattle, Wa: ACM,2014, 14
[9] Sigg S, Blanke U, Troster G. The telepathic phone: Frictionless activity recognition from WiFi-rssi[C]Proceedings of the IEEE international conference on Pervasive Computing and Communications. Budapest: IEEE, 2014: 148-155.
[10] Adib F, Kabelac Z, Katabi D. Multi-Person Motion Tracking via RF Body Reflections [J]. 2014.
[11] Melgarejo P, Zhang X, Ramanathan P, et al. Leveraging directional antenna capabilities for fine-grained gesture recognition}C}//Proceedings of the 2014 ACM International Joint Conference on Pervasive and Ubiquitous Computing. Seattle, Wa: ACM, 2014: 541-551.
[12]劉春燕. 基於 WIFI與慣性技術的行人室內定位演算法研究 [D].北京:中國地質大學.2015
相關推薦
基於無線訊號的手勢識別研究現狀調查
摘要:進入21世紀以來,人機互動技術持續發展,手勢識別是代表之一。2013年,華盛頓大學的研究人員提出了使用無線訊號進行手勢識別的方法,給傳統的手勢識別技術帶來的一定的挑戰,但是這一技術並不是很成熟,暫時沒有投入商業使用。本文詳細介紹了手勢識別,並敘述了基於無線
語音識別研究現狀
前言總結目前語音識別的發展現狀,dnn、rnn/lstm和cnn算是語音識別中幾個比較主流的方向。2012年,微軟鄧力和俞棟老師將前饋神經網路FFDNN(Feed Forward Deep Neural Network)引入到聲學模型建模中,將FFDNN的輸出層概率用於替換之
06《基於卷積神經網路LeNet-5的車牌字元識別研究》學習總結
一、本篇介紹 二、本文主要內容(知識點) 1、概要 2、卷積神經網路介紹 1.卷積層 2.次抽樣層 3、LeNet-5介
基於FDC2214感測器的手勢識別裝置(MSP430)
今年的江蘇省電賽,我們選擇了手勢識別裝置(D題)。 裝置使用MSP430F5529開發板,TI的FDC2214電容感測器,外設使用4*4矩陣按鍵進行功能切換、數碼管顯示感測器數值、LED燈顯示手勢狀態。 FDC2214是4路輸入電容感測器,我們使用覆銅板平均分成八分,構成
基於深度學習的語音識別研究-CTC理論推導(四)
有時候學習真的得循序漸進,並沒有速成的方法,本小白在經歷了大約一個月終於把CTC的從頭到尾大致看完了,下面講一下我的理解,歡迎各位朋友批評指正。 首先,我們得知道為什麼要引入CTC,前面部落格講到,之前在做語音的聲學模型的時候,我們的資料形式是幀與標籤的分別對齊,以Th
基於C++的Kinect手勢識別實現
在WPF下有一些開源的Kinect手勢識別庫,Kinect for windows sdk 1.7以上版本的Tool kit還提供了很多手勢的UI控制元件,相當方便。 但是,考慮到效率問題,我們的專案必須使用到C++開發(之前有WPF開發的版本,操作不夠流暢)。 K
基於神經網路的2D攝像頭的手勢識別系統實現(一)
一、手勢識別的分類 若按照攝像頭的種類(2D攝像頭、深度攝像頭)來分,可分為兩類,1)基於2D攝像頭的二維手勢識別 和 2)基於3D攝像頭(如微軟的kinnect)三維手勢識別。早期的手勢識別識別是基於二維彩色影象的識別技術,所謂的二維彩色影象是指通過普通攝
【論文筆記】《基於深度學習的中文命名實體識別研究》閱讀筆記
作者及其單位:北京郵電大學,張俊遙,2019年6月,碩士論文 摘要 實驗資料:來源於網路公開的新聞文字資料;用隨機欠取樣和過取樣的方法解決分類不均衡問題;使用BIO格式的標籤識別5類命名實體,標註11種標籤。 學習模型:基於RNN-CRF框架,提出Bi-GRU-Attention模型;基於改進的ELMo可
基於android的語音識別
wifi listview appid stat perm state c語音 utility extend 1.註冊賬戶,添加應用 2.針對android平臺的選擇應用,下載SDK 3.將SDK的libs下文件拷貝到工程的libs目錄下 4.添加用戶權限
基於 OpenCV 的人臉識別
權重 apc 更多 你在 控制 leg 神經網絡 註意事項 初始化 基於 OpenCV 的人臉識別 一點背景知識 OpenCV 是一個開源的計算機視覺和機器學習庫。它包含成千上萬優化過的算法,為各種計算機視覺應用提供了一個通用工具包。根據這個項目的關於頁面,OpenCV
基於802.11Fuzz技術的研究
組成 隨機數 學術 分析 路徑 trace trap ner 相關 轉自安全客 關於無線的Fuzz最開始接觸了解時,國內基本毛線都搜不到。經過幾個月的資料搜集和學習,將大約全網的fuzz資料整理翻譯分析並讀懂寫下,就為填補國內空白,也希望無線愛好者能多多交流。 在各個安全
基於瀏覽器的人臉識別標記
能夠 條件 技術 實現 ref pla 文字 -1 ict 最近,Chrome在Chrome中集成了一套與圖形識別相關的 API——Shape Detector API,只需要少量代碼就能夠實現人臉識別、二維碼/條形碼識別和文本識別。雖然這些 API 還處於實驗階段,只要條
基於Docker的OCR識別系統的誕生
ocr識別系統開發字符OCR識別系統的原因:眾所周知谷歌開源的tesseract-ocr是一套字符識別系統,其最新版本4.00采用了lstm(Long Short-Term Memory,長短時記憶網絡)神經網絡進行字符的訓練與識別,其支持100多種語言(字符),對於比較標準的印刷體字符,其識別準確率非常高(
一種基於python的人臉識別開源系統
無意中 sdn 要求 測試用例 不出 例子 https bin 人臉識別 今天在搜索人臉識別的文章時,無意中搜到一個比較開源代碼,介紹說是這個系統人臉的識別率 是比較高的,可以達到:99.38%。這麽高的識別率,著實把我嚇了一跳。抱著實事求是的態度。個人 就做了一些驗證
Android 手勢識別—縮放
含義 -- sdn ret 面具 lap sea protect not 上一篇講解了手勢識別中的點擊和雙擊事件的識別,用到的是GestureDetector類和GestureDetectorCompat類,用於監聽用戶觸摸屏幕中的簡單動作。 縮放 基本用法如下
知物由學 | 基於DNN的人臉識別中的反欺騙機制
ctu 打印 mage eas 系統 分類 傳遞 實時 技術分享 “知物由學”是網易雲易盾打造的一個品牌欄目,詞語出自漢·王充《論衡·實知》。人,能力有高下之分,學習才知道事物的道理,而後才有智慧,不去求問就不會知道。“知物由學”希望通過一篇篇技術幹貨、趨勢解讀、人物思考和
Lua 中使用Finger Touch 處理手勢識別
min system star 射線 type event call The 錯誤 Finger Touch 是一種處理手勢識別的插件,在遊戲開發中經常會用到,這裏我先簡單介紹一下Finger Touch(如有錯誤 歡迎指正) : #region Event
【轉載】2017 軟件測試行業現狀調查報告_From_51testing_On_20180625
圖片 com sting margin cti 下載 from 一份 月份 這份報告由51Testing 發布,他們會在每年年中發布會一份測試行業調查報告,今年是在6月份發布的。 報告下載地址: http://www.51testing.com/index.php?act
https ddos檢測——研究現狀
format sts unknown info UNC app efi arm webserver from: https://jyx.jyu.fi/bitstream/handle/123456789/52275/1/URN%3ANBN%3Afi%3Ajyu-201612
AliOS Things手勢識別應用演示
sta cli ado i2c ofo roc 轉載 ges lcd 摘要: 1. 概述 手勢識別作為一種輔助的人機交互方式,在人機脫離的場景下可以提供方便的交互體驗。本文介紹基於AliOS Things + STM32F413H Discovery開發板實現手勢交互功能的