如何用機器學習定位賬戶冒用問題

阿新 • • 發佈：2017-09-23

賬戶冒用

對於一個互聯網站點，這其實是一個挺平常的問題，因為目前“撞庫”的發生。我們收集的數據主要還是來源於如下數據：

三層數據：IP地址

四層數據：TCP初始端口、TCP初始序列號（不同系統可能存在一些實現上的差異）、滑動窗口大小

七層數據：用戶瀏覽器指紋數據，如UserAgent等能從一定角度體現用戶瀏覽器特征的數據，比如Chrome、Firefox、Safari等就有所不同

應用系統日誌：獲取用戶瀏覽頁面分類信息、頁面轉換序列及相關時間等等。

將一段時間的上述歷史數據（設定窗口，每一項可作為一個維度）通過一定的函數轉換最終進行歸一化處理（Normalization，歸一化也可對不同維度進行加權），然後通過本次瀏覽情況判斷是否是出自同一用戶，如果不是則應發送響應通知原用戶，可能出現冒用情況。

判斷的方法可以使用簡單的余弦夾角、馬爾科夫或距離關系等。形式化的描述就暫不給出了。

如何用機器學習定位賬戶冒用問題

賬戶冒用對於一個互聯網站點，這其實是一個挺平常的問題，因為目前“撞庫”的發生。我們收集的數據主要還是來源於如下數據：三層數據：IP地址四層數據：TCP初始端口、TCP初始序列號（不同系統可能存在一些實現上的差異）、滑動窗口大小七層數據：用戶瀏覽器指紋數據，如UserAgent等能從一定角度體現用戶瀏

如何用機器學習定位賬戶冒用問題

如何用機器學習定位賬戶冒用問題

巧用機器學習定位雲服務器故障

巧用機器學習定位雲伺服器故障

也談用機器學習索引替代B-Tree

為什麼某個問題可以用機器學習方法來解決？

KDD 2018 | Airbnb用機器學習實現房屋動態定價（不看你就out啦！）

獨家 | 資料分析@愛可可-愛生活是否在用機器學習演算法運營微博

用機器學習檢測異常點選流

用機器學習對CTR預估建模（一）

Prismatic：用機器學習分析使用者興趣只需10秒鐘

用機器學習解決問題的思路

7月28日雲棲精選夜讀：【上報紙啦】95後大學生用機器學習PAI大戰老年痴呆

Amazon Project Zero計劃啟動！用機器學習技術辨別仿冒商品

用機器學習打造聊天機器人(三) 設計篇

用機器學習打造聊天機器人(六) 原理篇

關於程式設計師能做什麼副業，我爬相關文章用機器學習演算法分析 | 附原始碼

機器學習實驗（十一）：基於WiFi fingerprints用自編碼器(Autoencoders)和神經網路(Neural Network)進行定位_2(keras版)

機器學習實驗（十）：基於WiFi fingerprints用自編碼器(Autoencoders)和神經網路(Neural Network)進行定位_1(tensorflow版)

機器學習原來如此有趣：用深度學習識別人臉

機器學習實戰（一）—— 用線性回歸預測波士頓房價

如何用機器學習定位賬戶冒用問題

相關推薦