1. 程式人生 > >領域應用 | 基於知識圖譜的警用安保機器人大資料分析技術研究

領域應用 | 基於知識圖譜的警用安保機器人大資料分析技術研究

本文轉載自公眾號:警察技術雜誌。 

郝久月  樊志英   汪寧   王欣  

摘   要:構建大資料支撐下的智慧應用是公安資訊化發展的趨勢,警用安保機器人大資料分析平臺的核心功能包括機器人智慧人機互動和前後端融合的大資料情報分析研判。闡述了知識圖譜技術在警用安保機器人人機互動和情報分析領域應用的突出優勢,並從知識構建、推理挖掘、決策服務等方面提出了警用安保機器人大資料分析系統建設的總體方案。

關鍵詞:知識圖譜   機器人   大資料   綜合研判

引言

警用安保機器人綜合運用物聯網、人工智慧、雲端計算、大資料等技術,具備自主感知、自主行走、自主保護、互動交流、便民服務、警用巡邏等能力,可輔助警察完成基礎性、重複性、危險性的工作,持續推動警務服務升級。隨著人工智慧的不斷髮展,警用安保機器人更加關注機器人智慧化能力,以及機器人與現有公安資訊化流程無縫對接的大資料智慧分析平臺的建設能力。智慧化已經成為衡量機器人效能的首要標準。

本文總結知識圖譜技術在警用安保機器人大資料分析領域應用的技術優勢,並圍繞警用安保機器人後臺智慧人機互動和前後端融合的大資料情報分析研判兩大核心功能提出系統建設的總體方案。

一、知識圖譜技術

目前,人工智慧的進展突出體現在以深度學習為代表的機器學習以及以知識圖譜為代表的知識工程兩大領域。腦科學領域的一些最新研究進展為機器人的研發帶來了新的啟示。相關研究顯示,人腦在進行閱讀、問答、計算等非反射性活動時,通常會調動大腦中的多個功能區域,同時進行協作決策。如圖1所示,人腦的網路化協作過程主要是為了充分使用不同區域所獲得和儲存的資訊,從而做出綜合性的決策研判。由此可以看出,網路是一種建模多源資訊和多種要素的有效方法。

640?wx_fmt=jpeg

知識圖譜(Knowledge Graph)是一種語義網路,包含大量實體和概念及其之間的語義關係,知識圖譜中所富含的實體、概念、屬性、關係等資訊,提供了從“關係”角度去分析問題的能力。因此,為了充分組織和管理人機互動過程中和機器人自感知過程中獲取的海量資料,知識圖譜技術的第一階段,應從多源異構資料中識別出目標、行為、時空關係等構建系統的本體模型,進而,將要素通過相互作用的方式系統整合,形成目標關係的知識關聯網路。因此,知識圖譜在警用安保機器人智慧化領域的應用具有巨大潛能。

二、警用知識庫構建技術

機器人的人機語音互動功能是決定機器人友好性和智慧性的關鍵因素,智慧問答是未來智慧化發展中人機互動的主要方式。智慧問答的核心在於聊天語料和知識推理兩部分。當前,網際網路和專有網路上,研究人員已建立了通用問詢知識庫包含衣食住行等多個方面的常用知識。然而,針對警用安保機器人面向公安業務的知識庫目前仍處於研究階段。

從技術層面,問答系統按照知識來源可以分為檢索式問答(Retrieval-based Question Answering, RQA)和基於知識庫的問答(Knowledge Base Question Answering,KBQA)。RQA的知識來源為非結構化的文件,針對使用者的問句對一個文件集合進行排序,並返回排序結果,或者將單個文件中與問題最相關的特定語句返回。KBQA的知識來源為結構化的知識庫,針對使用者的問句,利用知識庫進行查詢和推理,得出最終答案。區別於聊天機器人,KBQA更關注事實性問題;區別於RQA,KBQA返回的不是文件排序結果或相關的句子,而是直接給出答案。針對公安行業,警務安保機器人更應以正規、明確的方式對群眾提問進行準確回答。因此採用KBQA的方式,構建警用安保機器人知識庫,問答系統需要通過自然語言處理技術,將使用者問句中的主題實體識別出來,並連結到知識庫中對應的實體,通過關係路徑推斷推理出主題實體到答案節點的路徑,從而得到最終的問題答案。

三、警用機器人後臺情報分析技術

警用安保機器人具有全面的資料感知功能,將機器人前端感知資料與已建的公安大資料分析系統深度融合,將警用安保機器人巡邏工作納入公安情報分析、處置流程中,使其成為情報分析系統的重要資料來源,後端的情報研判結果可以直接指揮機器人的下一步行動,形成公安大資料情報分析閉環。因此,公安情報分析能力是警用安保機器人大腦的重要組成部分。

在情報分析領域,傳統的情報研判模型通常是由專家系統和邏輯推理計算完成,其存在兩個方面的缺陷。首先,專家知識的獲取嚴重依賴領域專家的知識總結能力,但在實際工作當中,專家知識的總結往往存在著掛一漏萬的情況,大量細節性、隱含但非常關鍵的判定知識難以被引入到專家系統中,這就導致專家系統在實際應用場景中效果往往不夠理想。另一方面,傳統的推理系統往往將各個知識和要素當作孤立的個體對待,對於知識與知識、要素與要素、知識與要素之間的關聯關係沒有非常好的建模。這就導致對於決策資訊的研判與分析十分片面和孤立,單純依賴傳統專家與推理系統分析研判模型難以滿足公安等複雜場景下的實際業務需求。

基於知識圖譜的情報分析模型採用網路組織的方式對資料物件進行組織,其固有優勢明顯,適合應用在機器人後臺中提供分析決策能力。首先,在知識圖譜中,要素物件和物件間關係是能夠獨立進行管理的,模型可以動態調整知識圖譜中節點和邊之間的關係,將目標的識別過程和知識的組織過程有效結合起來。其次,知識圖譜本身和推理系統之間並不是耦合的,使用者可以根據需要定義不同的推理規則,從而挖掘知識圖譜當中的相關關係。這種知識與模型分離的資料管理方式,保障系統能夠支援不同型別的推理決策模型,同時能夠和後續的預測預警模組無縫對接,系統的靈活性大大提高。在系統進行知識升級時,如果是目標識別模組有所改進,可以通過更新知識圖譜中的物件與關聯關係網路進行知識模型升級;如果是後續的預測預警模組進行了升級,則可以脫離知識圖譜,獨立進行模型升級。

目前,基於知識圖譜的情報分析技術已應用於各國的警務情報專案中。其中美國Palantir公司的Gotham平臺構建出一套語義知識搜尋挖掘平臺,總結提煉八個資訊實體:人、車、位置、罪案、逮捕、檔案、備註與其他,並構建不同個體間的知識關聯,極大提高了破案准確率和效率。在國內,知識圖譜技術應用於輔助公安刑偵、經偵等警種的案件偵破工作。針對特定案件,按照人、事、地、物、組織構建社會關係網,結合專家研判經驗規則和知識,迅速呼叫PB及以上量級資料之間的關係,分析推演出案件的研判結果。

四、警用安保機器人後端系統總體架構

警用安保機器人後端系統總體架構的核心功能包括:機器人人機互動平臺和機器人大資料平臺,如圖2所示。

640?wx_fmt=jpeg

(一)機器人人機互動平臺

包含了知識庫的構建、知識儲存、知識應用。前端機器人本體將採集到的語音輸入至語音識別模組,經過自然語言處理,將結構化的實體輸入知識問答系統,獲取答案,並通過語音合成模組進行輸出播放。

1. 知識庫構建

如圖3所示,進一步描述了知識庫的構建過程。知識獲取的主要目的是融合通用知識基礎庫與領域專業基礎庫,抽取其中的概念、例項、屬性和關係。通用基礎庫是指從常識知識中選取和領域相關知識構成的知識庫。領域基礎庫是用來描述領域相關的其他基本知識,如便民服務更關注的證件辦理、安保巡邏更關注的安全常識,其來源於專業領域字典、核心詞彙表等。其次,為了獲取當前最新最實時的領域知識,建立領域更新庫,不斷更新和完善知識庫內容。

640?wx_fmt=jpeg

2. 知識計算

包括屬性計算、關係計算和例項計算。

3. 知識儲存

經驗證的海量知識儲存於圖資料和關係資料庫中。

4. 知識應用

通過建立知識圖譜,可開展語義檢索、個性化推薦、知識問答。其中警用機器人直接呼叫知識問答應用。

(二)機器人大資料平臺

包含了知識庫構建、推理挖掘和決策支援。將機器人感知資料與公安大資料進行深度融合,形成公安情報分析知識庫,利用關聯分析等演算法,實現視覺化分析、關係人挖掘等上層應用,並將分析結果反饋到機器人本體,指導本體下一步工作。

1. 知識庫構建

提取的人、事、地、物、組織等要素物件,將其作為知識圖譜當中的實體進行建模。其次,基於實體—連結二維理論,將實體之間的關係(例如:社交關係、家庭、戶籍、資金往來、住宿出行等關係)抽象為連結表示為連線,儲存在圖資料庫中,形成不同主題的知識圖譜。

2. 推理挖掘

能夠從已有知識中發現隱含知識。在知識圖譜之上,通過開發各類資料研判模型,如物件關係的異常檢測、與特定事件關聯關係的查詢等,就可以有效支撐情報分析中的各項資料研判任務。

3. 決策支援

分析研判結果結合全息影象視覺化、時空視覺化、圖視覺化分析等視覺化分析技術,將資料中多維度知識以易於人類理解的方式儘可能多地提供給決策專家。專家通過系統一鍵下發功能,可快速向前端警用安保機器人下發巡邏指令,到達指定地點,開展資料蒐集或巡邏工作。

五、成果試用

在公安工作的眾多場景,特別是安保工作中,有很多涉及到基於公安行業安保知識圖譜的人機互動場景需求。例如:安保工作中的安保機器人自動區域巡邏、基於動態人臉識別與分析的重點人員現場識別與核驗系統、基於安保人員人臉識別與證件識別雙因子身份認證系統等場景中,通過安保機器人的引入,能大大提高安保工作的效率、水平和安全能力。同時通過將前端安保機器人與後臺大資料分析平臺建立高速、高效、安全的連線與互動通道,能夠切實將後端的行業知識處理分析能力和行業知識圖譜直接服務於一線工作,從而使前端感知機器人變成能夠互動、學習、思考的智慧互動機器人。這點在重要場所的安保機器人實驗工作中已經得到檢驗,對系統架構、技術平臺、安全互聯、知識圖譜的場景化應用進行了實地驗證。下一步將繼續擴大實驗場景和範圍,力爭在完善功能、技術架構、知識圖譜的基礎上,將安保機器人的應用場景推向更大範圍。

六、結語

隨著大資料、雲端計算和人工智慧等技術的快速發展,以智慧化為核心的警用安保機器人大資料平臺已初步應用於公安實戰。利用知識圖譜理論將公安多源、異構大資料進行有效組織,構建以“知識”為核心的知識庫、關聯網路和推理模型,可為警用安保機器人的應用提供重要的技術支撐。

參考文獻:

[1] 陳甜甜.警用巡邏機器人發展研究[J]. 安全技術參考, 2017(4):3-11.

[2] 仇韞琦. 智慧時代人機互動的新方式——KBQA的前世今生. http://mp.weixin.qq.com/s/LkRrPXEjGRugw9LMSS9uJg[EB/OL].2018.

[3] 張華平.從Palantir看公安大資料應用[EB/OL].http://mt.sohu.com /20160523/n450910580.

[4] 明略資料. 明略資料實現人機同行[J]. 網路安全和資訊化, 2017(9):19.

[5] 王元卓, 賈巖濤, 趙澤亞. OpenKN網路大資料時代的知識計算引擎[J]. CCF 通訊, 2014, 10(11): 30-35.

OpenKG.CN

中文開放知識圖譜(簡稱OpenKG.CN)旨在促進中文知識圖譜資料的開放與互聯,促進知識圖譜和語義技術的普及和廣泛應用。

640?wx_fmt=jpeg

點選閱讀原文,進入 OpenKG 部落格。