1. 程式人生 > >軌跡資料探勘(trajectory data mining)

軌跡資料探勘(trajectory data mining)

位置採集和移動計算技術的進步已經產生了大量的空間軌跡資料,這些資料代表了移動物體(如人,車輛和動物)的移動性。在過去十年中,已經提出了許多技術來處理,管理和挖掘軌跡資料,促進了廣泛的應用。在本文中,我們對軌跡資料探勘的主要研究進行了系統的調查,提供了該領域的全景及其研究課題的範圍。根據軌跡資料的匯出,軌跡資料預處理,軌跡資料管理以及各種挖掘任務(如軌跡模式挖掘,異常值檢測和軌跡分類)的路線圖,調查探討了連線,相關性,以及這些現有技術之間的差異。該調查還介紹了將軌跡轉換為其他資料格式(如圖形,矩陣和張量)的方法,可以應用更多的資料探勘和機器學習技術。最後,提出了一些公共軌跡資料集。這項調查有助於塑造軌跡資料探勘領域,為社群提供對該領域的快速瞭解。

位置採集和移動計算技術的進步已經產生了大量的空間軌跡資料,這些資料代表了移動物體(如人,車輛和動物)的移動性。在過去十年中,已經提出了許多技術來處理,管理和挖掘軌跡資料,促進了廣泛的應用。在本文中,我們對軌跡資料探勘的主要研究進行了系統的調查,提供了該領域的全景及其研究課題的範圍。根據軌跡資料的匯出,軌跡資料預處理,軌跡資料管理以及各種挖掘任務(如軌跡模式挖掘,異常值檢測和軌跡分類)的路線圖,調查探討了連線,相關性,以及這些現有技術之間的差異。該調查還介紹了將軌跡轉換為其他資料格式(如圖形,矩陣和張量)的方法,可以應用更多的資料探勘和機器學習技術。最後,提出了一些公共軌跡資料集。這項調查有助於塑造軌跡資料探勘領域,為社群提供對該領域的快速瞭解。

其次,在使用軌跡資料之前,我們需要處理一些問題,
例如噪聲濾波,分割和地圖匹配。這個階段稱為軌跡預處理,這是許多軌跡資料探勘任務的基本步驟。噪聲濾波的目標是從軌跡中移除可能由位置定位系統的不良訊號引起的一些噪聲點(例如,在城市峽谷中行駛時)。縱向壓縮組合(對於路線圖)
減少通訊,處理和資料儲存中的開銷),同時保持彈性的自適應。定點檢測演算法移動物體 在一定距離閾值內停留了一段時間。停留點可以代表使用者所去的餐廳或購物中心,比軌跡中的其他點具有更多的語義含義。軌跡分割通過時間間隔,空間形狀或語義含義將軌跡劃分成片段,用於進一步的過程,如聚類和分類。地圖匹配旨在將軌跡的每個點投射到真正產生點的相應路段上。我們詳細介紹第3節中的軌跡預處理。


其次,在使用軌跡資料之前,我們需要處理一些問題,
例如噪聲濾波,分割和地圖匹配。這個階段稱為軌跡預處理,這是許多軌跡資料探勘任務的基本步驟。噪聲濾波的目標是從軌跡中移除可能由位置定位系統的不良訊號引起的一些噪聲點(例如,在城市峽谷中行駛時)。縱向壓縮組合(對於路線圖)
減少通訊,處理和資料儲存中的開銷),同時保持彈性的自適應。定點檢測演算法
移動物體在一定距離閾值內停留了一段時間。停留點可以代表使用者所去的餐廳或購物中心,比軌跡中的其他點具有更多的語義含義。軌跡分割通過時間間隔,空間形狀或語義含義將軌跡劃分成片段,用於進一步的過程,如聚類和分類。地圖匹配旨在將軌跡的每個點投射到真正產生點的相應路段上。我們詳細介紹第3節中的軌跡預處理。


第三,許多線上應用需要立即挖掘軌跡資料(例如,調查交通異常),呼籲有效的資料管理演算法可以快速檢索滿足某些標準的特定軌跡(如時空 - 來自大軌跡語料庫。 通常有兩種主要型別查詢:最近的鄰居和範圍查詢。 前者還與距離度量相關聯,例如兩個軌跡之間的距離。 另外,有兩種型別(歷史和最近)的軌跡,需要不同的管理方法。 我們將在第4節介紹軌跡索引和檢索。


第四,基於前兩個步驟,我們可以進行挖掘任務,如軌跡模式挖掘,軌跡不確定性,異常值檢測和分類。