1. 程式人生 > >方向分佈(標準差橢圓)

方向分佈(標準差橢圓)

點模式的分析中,一般會考察如下五種內容:

 

1、點的疏密,包括點資料的分佈探索,是否一致、均勻或者不均勻。

 

2、點的方位,包括點的分佈和方向。

 

3、點的數量:多少(極值和均值)。

 

4、點的大小:代表的含義(如點一個點代表多少人口)。

 

5、其他,如點的一些動態變化等。

(關於點資料分析的其他詳細的內容,請看蝦神以前的文章,或者再公眾號裡面回覆“點分析”)

 

其中,我們前面說的好幾種演算法,如中心要素、中位數中心和平均中心,都是關於點方位的分析,那麼今天我們要講的這個演算法,就是同時對點的方向和分佈進行分析的一種經典演算法——標準差橢圓。

 

這演算法最早是由美國南加州大學(Universityof Southern California)社會學教授韋爾蒂.利菲弗(D. Welty Lefever)在1926年提出,所以有的書裡面,也把這個演算法稱為Lefever‘s "Standard DeviationalEllipse"(利菲弗方向性分佈)(又到每天的歷史起源科普時間……)。

 

這個演算法最大的特點,就如同他的名詞一樣,是用來度量一組資料的方向和分佈的,生成的結果又正如他的別名一樣,會輸出一個橢圓,如下:

技術分享

 

紅色的點是傷寒發病的案例,藍色的河流是長江太湖流域段,從計算的結果來看,發病的資料方向與長江的流向方向基本一致,而範圍較大。

 

從上圖,我們基本上就可以看出方向分佈工具的主要作用了,它可以識別一組資料的方向以及分佈的趨勢,並且瞭解到這份資料是否具有一些特性,至於有哪些特性,我們後面再說。

 

我們先來看看這個標準差橢圓的生成演算法。

 

其實演算法很簡單,要畫出一個橢圓,雖然比畫圓麻煩點,但是也麻煩不了多少,關鍵的引數如下:

1、確定圓心。

2、確定旋轉角度。

3、確定XY軸的長度。

 

 

這些引數,演算法裡面都給了我們很清晰的公式,只要依照公式來計算就可以了。

 

首先是確定圓心,方向分佈工具的圓心,直接利用的是算數平均中心來計算橢圓的圓心,公式如下:

技術分享

其中,Xi和Yi是每個要素的空間位置座標,X和Y是算數平均中心(算術平均中心請檢視我在2015年8月17日寫的《空間統計之八:平均中心和中位數中心》一文)。

 

SDEx和SDEy就是最後計算出來的橢圓的圓心。

 

然後確定橢圓的方向,以X軸為準,正北方(12點方向)為0度,順時針旋轉,計算公式如下:

技術分享

 

最後確定XY軸的長度,公式如下:

技術分享

 

把所有的資料都帶入到公式中,就很容易的把所有的引數都計算出來,接下去只需要再地圖上畫出結果就行。

 

那麼這個橢圓揭示了一些什麼意義呢?

 

使用ArcGIS的話,方向分佈工具除了生成這樣一個橢圓以外,還會給出如下結果:

技術分享

其中,Shape_Leng和Shape_Area是生成的橢圓的周長和麵積,單位與你資料的單位相同,這裡我的資料是經緯度的,所以生成的結果只能作為相對參考結果。

CenterX和CenterY表示的是橢圓的中心點。

XstdDist和YStdDist表示的X軸的長度和Y軸的長度。

Rotation表示的是橢圓的方向角度。如下:

 

技術分享

 

結果解讀如下:

1、橢圓的長半軸表示的是資料分佈的方向短半軸表示的是資料分佈的範圍,長短半軸的值差距越大(扁率越大),表示資料的方向性越明顯。反之,如果長短半軸越接近,表示方向性越不明顯。如果長短半軸完全相等,就等於是一個圓了,圓的話就表示沒有任何的方向特徵

 

2、短半軸表示資料分佈的範圍,短半軸越,表示資料呈現的向心力越明顯;反之,短半軸越,表示資料的離散程度越大。同樣,如果短半軸與長半軸完全相等了,就表示資料沒有任何的分佈特徵

 

3、中心點表示了整個資料的中心位置,一般來說,只要資料的變異程度不是很大的話,這個中心點的位置大約與算數平均數的位置基本上是一致的,至於資料變異是什麼情況,請看下面第4點。

 

4、有的同學會很疑惑,為什麼你畫的這個橢圓,還有很多的點都在外面,沒有把所有的點都包含進去?那麼就是就是“標準差橢圓”這個名詞裡面的“標準差”的含義所在了。

 

在ArcGIS工具裡面(其他的工具也都差不多),提供了“橢圓大小”(Ellipse_Size)這個引數,這個引數表示你生成的橢圓的級別,一共有三個,如下表:

技術分享

三個級別的橢圓,分別表示了你生成的橢圓,能夠包含68%,95%和99%三個級別的資料,我們通過可以指定要表示的標準差數(1、2 或 3)來決定你生成的橢圓包含的資料比例。

 

當要素具有空間正態分佈時(即這些要素在中心處最為密集,而在接近外圍時會逐漸變得稀疏),第一級標準差(預設值)範圍可將約佔總數 68%的輸入要素的質心包含在內。第二級標準差範圍會將約佔總數 95%的要素包含在內,而第三級標準差範圍則會覆蓋約佔總數 99%的要素的質心。

 

所以,當你選擇不同標準差等級的時候,你發現你的中心點的位置也可能不同。

 

當然,作為空間分析工具,方向分佈一樣可以進行加權計算,這個計算主要還是與中心點的位置確定以及橢圓標準差等級生成的橢圓大小有關係。

 

下面我們來通過一個例項來了解方向分佈工具的應用:

一共有兩年的傷寒病資料,如下,紅色的是2000年的,藍色是2001年的:

技術分享

使用1個標準差的結果,生成的橢圓如上,具體資料如下:

技術分享

我們對關鍵性的兩個指標進行對比:

技術分享

 

生成面積表示範圍,可以發現2000的傷寒病發病情況的範圍要大於2001年的,扁率表示他的方向明確性和向心力的程度,2000年生成的橢圓扁率遠高於2001年的,說明了2000的傷寒發病情況,比2001年的方向趨勢更明顯。

 

2000年生成的橢圓方向與長江的方向基本相相符,所以2000年的傷寒發病源與長江的關係較為密切。而2001年的發病情況雖然方向性並不如2000年的明顯,但是長半軸幾乎與長江垂直,可以基本確認,2001年傷寒發病源與長江關係不大,但是呈現向內陸爆發的趨勢。

 

方向分佈工具在空間統計中是綜合能力最突出的工具之一,有著廣泛的應用,在我們的分析和資料探索的時候,能夠起到非常重大的作用。

 

最後,列出幾個可能的應用:

1、可用來在地圖上標示一組犯罪行為的分佈趨勢,並且能夠確定該行為與特定要素(一系列酒吧或餐館、某條特定街道等)的關係。

 

2、在地圖上標示地下水井樣本的特定汙染,可以指示毒素的擴散方式,這在部署應急防災策略時非常有用。

 

3、對各個物種所在區域的橢圓的大小、形狀和重疊部分進行比較可以分析與物種入侵或者隔離相關的深入資訊。

 

4、繪製一段時間內疾病爆發情況的橢圓可用於建立疾病傳播的模型。

--------------------- 本文來自 HuFeiHu-Blog 的CSDN 部落格 ,全文地址請點選:https://blog.csdn.net/u011596455/article/details/54093948?utm_source=copy