安防AI大資料全流程解析

阿新 • • 發佈：2018-12-01

安防AI大資料全流程解析

對於安防AI，看上去是AI，實際上最後是大資料，大資料才是智慧化的基礎。人工智慧、深度學習、機器學習、大資料應用在安防AI中，說到底都是對大資料的採集、建模和應用。

本文大致說一下安防AI中，對於大資料的運用過程與環節，讓大家有個大致的印象。
安防AI大資料全流程解析
　　一、安防AI大資料流程三個環節

1. 資料採集

資料採集，有說資料獲取，這是資料的來源，安防AI中這個資料是來源於視訊監控系統中的視訊流，當然往大了說安防，還包括很多內容，但是基本都是以視訊監控為核心，這裡主要指視訊監控系統。

2. 資料預處理

對於採集到的實時或者歷史視訊，是隻能看不能應用的，要呼叫就得結構化，先給視訊流解碼，把視訊流還原成一張張圖片，再對圖片進行預處理。

可能不同的公司對預處理包含的步驟內容說法不太一致，我是以安軟慧視的技術負責人介紹為準。

先對圖片進行目標清洗垃圾，清洗掉模糊的、不合尺寸的，目標無法識別的、無目標物件的等等，當然，有些場景可能只有這樣的影象，這需要用到另外一些影象處理方法，和我們的主題相關但不是一回事。

這樣我們就可以得到基本符合要求的影象。然後對這些影象中的目標物件進行檢測和分割，並改變目標的大小與標準圖片大小一致，目標物件包括人形、人臉、車形等，這樣就可以拿去訓練模型了。

3. 模型訓練

對圖片中的目標物件進行識別，提取和構建模型，在安防AI中，需要的結構化描述是比較具體的，比如對人的描述就包括性別、年齡、髮型特徵、髮飾、上衣款式特徵、下衣款式特徵、鞋帽款式特徵、交通工具特徵、隨身物品特徵、同行人特徵等一系列描述。

對車的描述包括車牌號碼、廠牌、車身顏色、車輛品牌、車輛型別、車輛特徵物（如：年檢標、掛飾、紙巾盒、遮陽板）等。

有了這些識別模型，就可以通過語義分析等技術對視訊資料進行分類處理儲存，並通過後端伺服器的智慧分析功能進行業務處理，將人、車、物的資訊從資料中分離出來。

這樣公安民警就可以進行快速檢索、條件搜圖（人）、以圖搜圖，再配以圖片的拍攝地點、時間等資料，就可以進行軌跡查詢，再匹配一下大安防系統中的住宿、手機號碼、車票等大資料，基本上嫌疑人就是插翅難逃，這對民警的破案效率將是百千倍的提升。這才是安防AI真正的價值所在。

這在上一篇文章《安防AI大規模落地，解析一線場景及創新關鍵點》有過論述。

二、安防AI資料預處理技術及方法

1. 目前常見的資料預處理技術

1）資料清理

資料清理例程就是通過填寫缺失值、光滑噪聲資料、識別或者刪除離群點，並且解決不一致性來進行“清理資料”。

2）資料整合

資料整合過程將來自多個數據源的資料整合到一起。

3）資料規約

資料規約是為了得到資料集的簡化表示。資料規約包括維規約和數值規約。

4）資料變換

通過變換使用規範化、資料離散化和概念分層等方法，使得資料的挖掘可以在多個抽象層面上進行。資料變換操作是提升資料探勘效果的附加預處理過程。

2. 資料清理方法

1）缺失值

對於缺失值的處理，一般是能補的就想辦法把它補上，實在補不上的就丟棄處理。

通常的處理方法有：忽略元組、人工填寫缺失值、使用一個全域性變數填充缺失值、使用屬性的中心度量填充缺失值、使用與給定元組屬同一類的所有樣本的屬性均值或中位數、使用最可能的值填充缺失值。

2）噪聲資料

噪聲是被測量變數的隨機誤差或方差。去除噪聲、使資料“光滑”的技術有分箱、迴歸、離群點分析等。

3）資料清理過程

這個環節主要包括資料預處理、清理方法、校驗清理方法、執行清理工具及資料歸檔。

資料清理的原理是通過分析“無效資料”產生的原因和存在形式，利用現有的技術手段和方法去清理，將“無效資料”轉化為滿足資料質量或應用要求的資料，從而提高資料集的資料質量。

常用的工具有Excel、Access、SPSS Modeler、SAS、SPSS Statistics等。

4）模型構建資料統計分析

資料統計為模型構建提供基礎，只有通過資料統計分析探索到了資料中隱藏的規律，深度學習才有意義，人工智慧才有可能。

資料統計又包括資料分析與結果分析，基本的分析方法有：對比分析法、分組分析法、交叉分析法、因素分析法、結構分析法、漏斗圖分析法、矩陣關聯分析法、綜合評價分析法等。

高階的分析方法有：主成分分析法、因子分析法、對應分析法、相關分析法、迴歸分析法、聚類分析法、判別分析法、時間序列等。這些類別並不是獨一使用的，往往是混合使用的，然後再通過進一步的分析對比從中挑選某些組合模型。

5）資料視覺化

資料視覺化，就是通過一些視覺化圖形或者報表形式進行展示，增強對分析結果的理解。再針對結果進行進一步的資料再分析，使得整個業務環節形成閉環。只有閉環的資料才能真正發揮出深度學習的效用。

三、安防AI大資料的應用

安防大資料的應用當前是圍繞提升破案率和提升警務工作效率為中心的，要想在安防資料的基礎上開發出優秀的應用，必須要深入瞭解警務工作流程，從接處警、現場勘查、情報研判、應急指揮、關聯碰撞、合成作戰，再到各型別警用裝備間的互聯互通，再到各警種間的配合，再到各警種業務資料庫間的融合。

這些都要有詳細地瞭解，才能發現針對刑偵破案、治安防控、交通管理的應用間的差異。

舉例說，比如針對嫌疑人的追蹤，可能是臉，但是大部分時候視訊是識別不出臉的，這是事實，人臉識別僅在車站、機場、銀行等卡點場景才有用。但是絕大多數逃犯都是有點反偵察能力的，不是看到攝像頭就繞著走，就是故意遮擋不讓看，或者乾脆等到天黑再走。

這時候能運用到的主要就是通過嫌疑人的外形特徵進行追蹤，以圖搜圖配上區域範圍選擇、時間段選擇，再配上同行人特徵、隨行物品特徵、工具特徵，就可以有效地對嫌疑人進行高效篩選，再通過綜合情報進行軌跡研判，這種情況下，嫌疑人幾乎就是甕中之鱉，上天無路入地無門。

如果再出現小朋友老年人走失，想找到就是分分鐘的事，再也不會出現讓發動大批警力沿街查詢，動輒耗費數十個小時的情況了。這樣，公安會不喜歡麼？

說到底，大資料最終是為應用服務的，只有最後真正提高了公安民警的工作效率和破案率，才能證明安防AI的價值和意義。這就要求我們既要懂AI業務，又要懂公安業務。脫離了這兩者，想讓安防AI得到大面積推廣是連想都不要想的。

安防AI大資料全流程解析

安防AI大資料全流程解析

大資料架構流程解析

hadoop原始碼解析之hdfs寫資料全流程分析---客戶端處理

Mysql備份系列（3）--innobackupex備份mysql大資料(全量+增量）操作記錄

HBase資料讀取流程解析

打通物聯網任督二脈,海天味業暢談AI+大資料

大資料全系技術概覽

譚安林：大資料在智慧外呼系統的應用

Sift運算元特徵點提取、描述及匹配全流程解析

資料寫入流程解析

2017年末AI大資料行業八大重點回顧

譚安林：大資料在教育行業的研究與應用

HBase －資料寫入流程解析

個人怎麼開發APP？APP開發全流程解析！

大資料全棧式開發語言 – Python

一個遊戲是如何被開發出來的：從立項到Beta，遊戲開發全流程解析

支付寶技術專家李戰斌：安防視訊行為分析系統的技術演進及應用場景 | 2018FMI人工智慧與大資料高峰論壇（深圳站）

中科院AI＋安防報告解密8大趨勢和8大限制

應用大資料和機器學習技術實現車險全流程智慧化的方案（中） -理賠流程智慧化改造

應用大資料和機器學習技術實現車險全流程智慧化的方案（上）

安防AI大資料全流程解析

相關推薦