Python中的GPS軌跡聚類

阿新 • • 發佈：2018-12-08

當我們想要利用智慧手機或智慧手環等個人裝置生成的GPS資料時，G PS軌跡聚類是一種常見的分析。

在本文中，我們將介紹一種在Python中執行GPS軌跡聚類的快速簡便方法。這裡的主要目標是建立包含“相似”軌跡的聚類。例如，我們希望將每天從工作到家的路徑放在同一個聚類中。

本文分為兩個主要部分。首先，我們將描述聚類演算法。在第二部分中，我們將展示如何在Python中使用和自定義演算法。

神經影象演算法與GPS軌跡聚類

在本文中，我們使用了一種用於neuromaging的聚類演算法，而不是像K-Means或DBSCAN那樣使用經典的聚類演算法。

QuickBundles (QB)是一種簡單的聚類演算法，用於磁共振成像中對應用tractography演算法得到的白質纖維進行聚類。

只需檢視下圖，我們就可以看到大腦中的白質纖維看起來像GPS軌跡。

應用tractography演算法獲得的白質纖維的例項

主要思想是將每個GPS軌跡視為白質纖維，然後在同一個聚類中合併“相似”軌跡。在本文的其餘部分，我們將假設GPS Trajectory = White Matter Fiber。

有了這個假設，我們就可以使用原始論文中提供的演算法描述：

演算法如下進行。在演算法的任何一步，我們都有 M個clusters。選擇第一個streamline s1並將其放在第一個cluster c1 ←（{1}，s1,1）; 此時M = 1。對於每個剩餘的streamlines，依次 i = 2 ,. 。。，N：

（i）計算streamline si與所有當前聚類 ce 的質心streamline ve之間的距離， e = 1 ,. 。。，M，其中v動態定義為v = h/n;

（ii）如果任何距離的值me小於聚類閾值θ,，將streamlined i新增到聚類e，最小值為me; ce =（I，h，n），並更新 ce ←(append(I, i), h + s, n + 1); 否則建立一個新的cluster cM + 1 ←（[i]，si，1），M←M + 1.

在下圖中，我們展示了演算法如何根據給定的閾值合併公共質心中的不同streamlines 的示例。

QuickBundle質心具有不同的閾值

閾值是THE要選擇的引數，以優化聚類演算法的行為。如果你想要“大”軌跡，你可以設定閾值的高值。否則，如果您想要小聚類，則需要較低的值。

該論文的作者提供了所提出方法的Python實現。該演算法作為dipy庫的一部分提供，而演算法的文件可在此處獲得（http://nipy.org/dipy/examples_built/segment_quickbundles.html#）。

GPS軌跡聚類

我們使用的資料集來自微軟亞洲研究院釋出的GeoLife GPS Trajectories資料集，可在此處獲得(https://www.microsoft.com/en-us/download/details.aspx?id=52367)。該資料集文件：https://yidatao.github.io/2016-12-23/geolife-dbscan/。

在開始執行聚類之前，讓我們使用gmplot繪製谷歌地圖上的所有軌跡。

資料集中的GPS軌跡

我們現在可以從定義兩個GPS軌跡（streamlines）之間的距離函式開始。我們將使用GeoPy庫中定義的GPS距離，而不是使用QuickBundle中提供的經典歐幾里得距離。

我們計算了兩個軌跡之間的平均點的GPS距離。這種計算距離的方法可以在且僅當兩個軌跡具有相同數量的點時使用，這就是為什麼我們使用ResampleFeature類重新取樣所有軌跡的原因。

一旦定義了兩條軌跡之間的距離，就可以執行QuickBundle聚類演算法。

用於執行軌跡聚類的程式碼

然後，我們可以像以前一樣使用gmplot繪製谷歌地圖上不同聚類中包含的軌跡。

使用gmplot聚類圖

這裡是my_map.html的結果，用於繪製不同的聚類

Cluster ＃0

Cluster ＃2

Cluster ＃30

結論

在本文中，我們描述了一種簡單快速的方法來執行GPS資料的軌跡聚類。目標是使用QuickBundles實現的，QuickBundles是一種應用於神經成像的聚類演算法。

該演算法的主要限制與閾值引數的調整有關。但是，作為資料分析中的所有內容，需要根據所需的群集型別選擇此引數。

Python中的GPS軌跡聚類

當我們想要利用智慧手機或智慧手環等個人裝置生成的GPS資料時，G PS軌跡聚類是一種常見的分析。在本文中，我們將介紹一種在Python中執行GPS軌跡聚類的快速簡便方法。這裡的主要目標是建立包含“相似”軌跡的聚類。例如，我們希望將每天從工作到家的路徑放在同一個聚類中。本文分為兩個主要部分。首先，我們將

k-means+python︱scikit-learn中的KMeans聚類實現( + MiniBatchKMeans)

CP lan sina QQ mmx 機制意義預測內容之前一直用R，現在開始學python之後就來嘗試用Python來實現Kmeans。之前用R來實現kmeans的博客：筆記︱多種常見聚類模型以及分群質量評估（聚類註意事項、使用技巧）聚類分析在客戶

Python中的文件類型

com 編譯 -o bsp env blog 程序 pyo 類型 Python文件類型有3種：源代碼文件、編譯文件、優化文件。源代碼文件：文件以“.py”結尾，為開發程序的代碼保存的文件。編譯文件：文件以”.pyc”結尾，假設源文件1.py，如果將1.py編譯為1.

python實現一個層次聚類方法

mac ima 優先隊列 () don 標簽中位數 filepath normal 層次聚類(Hierarchical Clustering) 一.概念　　層次聚類不需要指定聚類的數目，首先它是將數據中的每個實例看作一個類，然後將最相似的兩個類合並，該過程叠代計算只到剩

【Python學習】Python中的數據類型精度問題

類型一次 /usr logs int 第一次 pytho 整數問題 Python真的很神奇。。。神奇到沒有直接的數據類型概念，並且精度可以是任意精度。想當初，第一次接觸OI算法時，寫得第一個算法就是高精度加法，搗鼓了半天。一切在Python看來，僅僅三行代碼即可完成。

python中的數據類型轉換

數學運算取出重復數據部分 python 人工幹預成了普通 int() 今天想要寫的是python中比較簡單但是又相對重要的數據類型之間的互相轉換。所謂數據類型轉換其實很簡單，生活中就有很多的例子，比如：15+2.2=17.2，看著好像只是一次普通的數學運算，但是卻

第三期預測——6.軌跡聚類2在線預測

軌跡更多一個似的進行是我 src 事情來看一旦我們的聚類算法確定了聚類和原型軌跡，在這種情況下，每個具有三個原型軌跡的三個群集，我們可以開始對在路上遇到的車輛進行在線預測。首先，我們觀察了車輛的部分軌跡。接下來我們比較一下每個集群原型軌跡的相應部分。這個

python中的數據類型和常用運算符

ble 就是 += 至少算數運算符除法邏輯運算符 gen ltr 一. python中常見的數據類型 1. 整數：任何時候運算都是精確的 2. 浮點數：運算的時候，可能會有四舍五入 3. 字符串：字符串是以單引號‘或雙引號"括起來的任意文本 1) 同類型的可以用+號

python中super().init和類名.init的區別

ini 類方法 tro 區別算法繼承應該 per 類的方法 super().__init__相對於類名.__init__，在單繼承上用法基本無差但在多繼承上有區別，super方法能保證每個父類的方法只會執行一次，而使用類名的方法會導致方法被執行多次多繼承時，使用

python中靜態方法、類方法、屬性方法區別

ref self 使用 lan com 通過場景 UNC cme 在python中，靜態方法、類方法、屬性方法，剛接觸對於它們之間的區別確實讓人疑惑。類方法（@classmethod）是一個函數修飾符，表是該函數是一個類方法類方法第一個參數是cls，而實例方法第

python中如何統計一個類的例項化物件

類中的靜態變數需要通過類名.靜態變數名來修改；通過物件不能修改 python中如何統計一個類的例項化物件？？ 1 class Person: 2 #靜態變數count，用於記錄類被例項化的次數 3 count = 0 4 5

python中的數據類型之元組和字典

小括號增加 pytho 元祖 .com objects 必須 err 以及一、元組：俗稱不可變的列表，又被稱為只讀列表。元組用小括號括起來，裏面可以放任何數據類型的數據，查詢可以，循環也可以，切片也可以，但就是不能修改。註意：如果元組中只有一個元素，一定要加一個逗號，

非常易於理解‘類'與'對象’ 間 name 屬性引用關系，暨《Python 中的引用和類屬性的初步理解》讀後感

我想就是 spa 發生來看初步 img 一個同名關鍵字：名稱，名稱空間，引用，指針，指針類型的指針（即指向指針的指針）我讀完後的理解總結： 1. 我們知道，python中的變量的賦值操作，變量其實就是一個名稱name，賦值就是將name引用到一個objec

python中各種數據類型

左右有關 3.1 ont input put bbb 改變可變數字類型整型int 　　作用：年紀，等級，身份證號，qq號等與整型數字有關　　定義：　　age=10 #本質age=int(10) 浮點型float 　　作用：薪資，身高，體重等與

關於如何在Python中使用靜態、類或抽象方法的權威指南

Python中方法的工作方式方法是儲存在類屬性中的函式，你可以用下面這種方式宣告和訪問一個函式 >>> class Pizza(object): ... def __init__(self, size): ... self.size

如何在Python中實現這五類強大的概率分佈

如何在Python中實現這五類強大的概率分佈中文譯文原連結,侵刪。英文出處|How to implement these 5 powerful probability distributions in Python R程式語言已經成為統計分析中的事實標準。但在這篇文

python中的數據類型

lse 條件數據類型哪些浮點 als 十進制描述 int 首先要明白什麽是數據，定義一個變量age=18,18就是數據。為什麽要有數據？數據是用來記錄狀態的。那麽就知道為什麽要有數據類型：因為不同的狀態對應不同的數據類型。數據類型有哪些？數字（整型、浮點型）

Python+pandas實現簡單聚類分析

Python+pandas實現簡單聚類分析應用百度百科對聚類分析的解釋：聚類分析指將物理或抽象物件的集合分組為由類似的物件組成的多個類的分析過程。它是一種重要的人類行為。聚類分析的目標就是在相似的基礎上收集資料來分類。聚類源於很多領域，包括數學，電腦科學，統計學，生物學和

python資料分析：聚類分析（cluster analysis）

何為聚類分析聚類分析或聚類是對一組物件進行分組的任務，使得同一組（稱為聚類）中的物件（在某種意義上）與其他組（聚類）中的物件更相似（在某種意義上）。它是探索性資料探勘的主要任務，也是統計資料分析的常用技術，用於許多領域，包括機器學習，模式識別，影象分析，資訊檢索，生物資訊學，資料

scikit-learn中的KMeans聚類實現

在這篇文章中：之前一直用R，現在開始學python之後就來嘗試用Python來實現Kmeans。之前用R來實現kmeans的部落格：筆記︱多種常見聚類模型以及分群質量評估（聚類注意事項、使用技巧）聚類分析在客戶細分中極為重要。有三類比較常見的聚類模型，K-mea

Python中的GPS軌跡聚類

神經影象演算法與GPS軌跡聚類

GPS軌跡聚類

結論

相關推薦