空間機率評估分析工具
1、空間機率評估分析說明
此處所謂的空間機率,是指某件事情,發生在某處的一個機率,如有這樣一個命題:
全市5月份共發生了200起案例,其中發生在A小區的事件總共有16起,問是否有異常?
這裡說明的異常,就是假設全市發生的案例,如果沒有特殊的條件,應該是平均的分布在全市的各個角落(當然實際上不可能,這個與治安情況、流動人口、受教育階層、經濟條件等很多情況有關係。我們這裡討論純粹的自然空間計量關係,暫時不考慮各種人文社會因素),那麼A小區理論上會發生多少起案例,在全市案例的佔百分百數量是多少?對照實際的案例發生資料,來計算是否出現案發異常。
如所示:
其中,黃色的大地區表示全市範圍,藍色的NO.1和NO.2表示其中的兩個小區,黑色圈狀點表示案例發生的情況。
如果不去進行空間機率評估分析的話,NO.1地區發生了怎麼多起案例,是否是正常,如果不正常,那麼超出了正常值多少?
以下通過我們這個空間機率分析工具,來對種情況進行分析
2 、工具說明
空間機率評估分析工具是採用python指令碼編寫的一個功能,通過ArcGIS封裝成了tools,主要介面如下:
一共是七個參數,其中有兩個參數是用於存放臨時資料的設定,最少需要輸入兩個圖層資訊(其中,空間約束範圍圖層和分析地區圖層可能是同一個圖層。)
七個參數的說明如下:
空間約束範圍圖層:最大分析地區,用於計算總的地區量級,必須是要包含所有的分析地區的全集。
分析地區圖層:需要分析空間機率的地區,必須是空間約束範圍的子集。
事件數目據點圖層:實際用於分析的事件點的圖層。
地區分析結果輸出圖層:輸出圖層,用於輸出最後的分析結果,結構與分析地區圖層一致。
分析欄位:分析地區圖層中的一個不可變唯一標識(注意,不可以是OBJECTID這種可變的標識)。
臨時輸出結果存放空間:在分析的過程中臨時產生的資料的存放空間。
臨時統計結果表:在分析的過程中產生的臨時結果表,注意結果表是不可以放在要素資料集中的,所以這裡要獨立設定一個參數。
空間隨機率總量:用於參照機率的樣本總量,預設是10000,根據統計原理,樣本總量越多,越接近理論機率。但是樣本總量越多,計算量就越大,消耗時間就越長。
3、工具用法
運行內容:
啟動並執行過程中會計算出兩組結果,一組是在樣本總量的基礎上,得出理論空間機率,一組是利用實際的樣本資料,得出實際機率。
以上資料也會寫入到輸出結果中。
從結果中可以看出,NO.1地區,在樣本總量為10000的情況下,理論上發生在該地區中的數量只有149件,空間機率只有1.49%,而實際上在102起案例中有12件發生在這個地區中,空間機率高達11.76%,超出了理論機率的接近10倍。這樣就可以認為,此地區發生嚴重的案發異常。
NO.2地區理論上是13%,實際上是17%,略高與理論資料,我們認為是比較正常的情況。
4、執行個體示範
如下執行個體,兩個圖層的基本情況如下:
Jurisdiction是某個城市的某個地區的街區區劃圖。
CrimePoint_All是發生在這個地區內的所有案例的空間分布情況。
現在要分析,在這些街區中,那些街區的案發率高於理論案發率。
分析過程如下:
運行過程如下:
運行結果如下:
通過製圖渲染,把低於理論值的地區設為藍色,高於理論值的地區設為紅色,得出如下空間分布情況:
可以看出,我們理論機率和實際機率的差,從-0.078——0.071之間,分布情況如下:
處於最極端的兩個區分別是92區和39區。,如下:
根據計算出來的結果,就可以繼續採取相應的分析,為什麼這個地區的機率如此之高,是否有什麼特殊的情況發生,如果通過全年度的分時段分析,會得出更多的一些資訊。
5、後續說明
此工具直接利用的是空間隨機分布來計算理論機率,沒有考慮人文社會的因素,所以空間模型非常之簡單,以後如果能夠在工具中加入各種相關因素,分析的結果就會更加的準確。
這裡只是提出一種空間機率評估的思路,還非常不完善,希望有興趣的同仁能夠提出各種寶貴的思路,完成該模型。
by:esri_大蝦盧
PS:對以上工具有興趣的同學,可以關注新浪微博並@Esri_大蝦盧,私信留下郵箱索取。(附:該工具的指令碼採用的是ArcGIS 10.1的python環境編寫的,如果需要運行,請安裝ArcGIS 10.1)