百度地圖、高德地圖的資料從哪裡得到的?
要說資料來源,首先得對地圖資料做一個分類,因為不同分類的資料,其來源,採集方法都是有大不同的。
並非想說上面高票答案的分類方式不對或者不可以,只是說,其分類方式對於完全說明這個問題,可能不是太合適和合理。裡面的一些觀點和描述也有一些小問題,所以做一些勘誤和對問題更有針對性的補充,希望大家不要被一些謬誤的概念所誤導。
要明白地圖的資料分類,必須先理解一個概念,就是地圖圖層的概念:
<img src="https://pic1.zhimg.com/23ebf08471ad7160b57db16ddbc71490_b.jpg" data-rawheight="431" data-rawwidth="321" class="content_image" width="321">
如上圖,電子地圖對我們實際空間的表達,事實上是通過不同的圖層去描述,然後通過圖層疊加顯示來進行表達的過程。
對於我們地圖應用目標的不同,疊加的圖層也是不同的,用以展示我們針對目標所需要資訊內容。
其次呢,我引入一下向量模型和柵格模型的概念,GIS(電子地圖)採用兩種不同的數學模型來對現實世界進行模擬:
- 向量模型:同多X,Y(或者X,Y,Z)座標,把自然界的地物通過點,線,面的方式進行表達
- 柵格模型(瓦片模型):用方格來模擬實體
我們目前在網際網路公開服務中,或者絕大多數手機APP裡看到的,都是基於柵格(瓦片)模型的地圖服務,比如大家看到的百度地圖或者谷歌地圖,其實對於某一塊地方的描述,都是通過10多層乃是20多層不同解析度的圖片所組成,當用戶進行縮放時,根據縮放的級數,選擇不同解析度的瓦片圖拼接成一幅完整的地圖(由於一般公開服務,瓦片圖都是從伺服器上下載的,當網速慢的時候,使用者其實能夠親眼看到這種不同解析度圖片的切換和拼接的過程)
對於向量模型的電子地圖來說,由於所有的資料以向量的方式存放管理,事實上圖層是一個比較淡薄的概念,因為任何地圖元素和資料都可以根據需要自由分類組成,或者劃分成不同的圖層。各種圖層之間關係可以很複雜,例如可以將所有的道路資料做成一個圖層,也可以將主幹道做成一個圖層,支路做成另外一個圖層。圖層中資料歸類和組合比較自由。
而對於柵格模型(瓦片圖)來看,圖層的概念就很重要的,由於圖層是生成製作出來,每個圖層內包含的元素相對是固化的,因此要引入一個底圖的概念
底圖通常是通過選取必要地圖向量資料項,然後通過地圖美工的工作,設定顏色,字型,顯示方式,顯示規則等等,然後渲染得到了(通常會渲染出一整套不同解析度的瓦片地圖)
當然,即便在瓦片圖的服務中,在瓦片底圖之上,依然能夠覆蓋一些簡單的向量圖層,例如道路走向(導航和線路規劃必用),POI點圖層(找個飯館加油站之類的)。只不過瓦片引擎無法對所有地圖資料構建在同一個空間資料引擎之中,比較難以進行復雜的地圖分析和地圖處理。
那麼既然瓦片圖引擎有那麼多的限制和缺陷,為什麼不都直接使用向量引擎呢?因為瓦片圖引擎有著重大的優勢:
1. 能夠負載起大規模併發使用者,向量引擎要耗費大量的伺服器運算資源(因為有完整的空間資料引擎),哪怕只是幾十上百的併發使用者,都需要極其誇張的伺服器運算能力了。向量引擎是無法滿足公眾網際網路服務的要求的。
2. 由於地圖美工介入的渲染工作,瓦片圖可以做得非常好看漂亮和易讀,比較適合普通使用者的瀏覽
附:一張向量地圖截圖:
<img src="https://pic1.zhimg.com/7f653149915d8d813d41ef50f896debc_b.jpg" data-rawheight="891" data-rawwidth="1435" class="origin_image zh-lightbox-thumb" width="1435" data-original="https://pic1.zhimg.com/7f653149915d8d813d41ef50f896debc_r.jpg">
好了,說了這麼多了,其實主要就是為了引入圖層和底圖的概念,以方便說明下面的地圖資料分類
為了說明資料的來源和採集渠道,採集方法,我將地圖資料分為以下幾個型別:
1. 底圖資料: 其實就是地圖中最基本的地物外形資料及一定的相關附加資訊(例如道路名,河流名等)。事實上隨著遙感和航拍衛拍技術的進步,這部分資料依賴實地採集的比例已經越來越小,商業地圖資料商,尤其以高德為代表,處於成本收益考量,基本已經很少採用實地採集的方式了。這部分的資料主要來源於3種:
- 官方地圖:嚴格來說,這不能說是一種單獨的渠道,因為官方地圖的資料本身,也是來源於下面的兩種渠道,但是官方地圖一般來源於政府相關部門的權威測繪和釋出,因此也單算成一種渠道。當然,需要說明的是,地圖廠商能從國家權威部門拿到或者買到的地圖,要比我們日常在街上商店裡買到的地圖要精細豐富很多,當然,很多時候也是用電子格式提供的。
<img src="https://pic2.zhimg.com/8e8a4da1fa39f4e602b1bc6f88e251b5_b.jpg" data-rawheight="339" data-rawwidth="411" class="content_image" width="411">
- 實地外採:說白就是測繪人員利用專業的儀器儀表,在實地環境中測繪所得到的。這樣的採集方法耗時耗人都非常厲害,一則成本高,二則週期長,三則是採環境要求高(去喜馬拉雅山去測測能弄吐血了),而且未必能夠完全跟得上中國現在的城市變化。但是優點在於精度高,置信度,準確度非常高。這是國家測繪部門主要採用的手段,對於像北京市這樣一個城市來說,一般幾年才會完整重新測繪一輪。一般對於大多數商用測繪時,只是用在少數區域性需要時,重點測繪才用得到。
當然,在精度和準確度要求沒有那麼高的地方,實地採集也可以使用一些成本更低更便捷的工具,而不是專業測繪裝置。例如用攜帶高精度GPS或其他定位的手持智慧裝置步行以繪製輪廓等。
- 航片衛片製作:就是通過自己拍攝或者購買的高精度航空照片或者衛星照片或者遙感照片,在此作為底片的基礎上進行人為的向量標註和勾勒,從而形成自己的向量資料。現在的航片或者遙感片的精度已經可以很高了,一般來說做到精度在0.05米的程度已經很容易。高德自己的航片據說已經可以做到0.03米的精度,對於商用地圖資料來說,通常已經夠用了。即便作為國家權威測繪,在大量荒郊野嶺的測繪,也主要依賴於這種手段。
目前常用的航拍或者衛拍手段包括機載數碼攝像,機載遙感以及三維鐳射掃描(主要用於3D地圖資料採集)
<img src="https://pic2.zhimg.com/3d1e5e59727644992943b672518e1fc1_b.jpg" data-rawheight="1128" data-rawwidth="1767" class="origin_image zh-lightbox-thumb" width="1767" data-original="https://pic2.zhimg.com/3d1e5e59727644992943b672518e1fc1_r.jpg">0.05米精度航片
<img src="https://pic4.zhimg.com/92108f9eea8b43a2eb245b412d1588d7_b.jpg" data-rawheight="363" data-rawwidth="500" class="origin_image zh-lightbox-thumb" width="500" data-original="https://pic4.zhimg.com/92108f9eea8b43a2eb245b412d1588d7_r.jpg">衛片路網標註衛片路網標註
<img src="https://pic2.zhimg.com/4e7aa72b87c5e0dbde904d9f81ab4095_b.jpg" data-rawheight="891" data-rawwidth="1435" class="origin_image zh-lightbox-thumb" width="1435" data-original="https://pic2.zhimg.com/4e7aa72b87c5e0dbde904d9f81ab4095_r.jpg"><img
src="https://pic4.zhimg.com/6797b6441dc7d157b72399cc1fe1abb7_b.jpg" data-rawheight="894" data-rawwidth="1440" class="origin_image zh-lightbox-thumb" width="1440" data-original="https://pic4.zhimg.com/6797b6441dc7d157b72399cc1fe1abb7_r.jpg">
航片/衛片標註和勾勒,前面是在底片上的操作,後面是勾勒標註後得到的向量圖
<img src="https://pic1.zhimg.com/1f88c13a9a050c6da73552517ad5c788_b.jpg" data-rawheight="1024" data-rawwidth="1430" class="origin_image zh-lightbox-thumb" width="1430" data-original="https://pic1.zhimg.com/1f88c13a9a050c6da73552517ad5c788_r.jpg">資料加工製作示意圖(來源於高德某公開資料)
從這部分資料來說,百度是沒有自己的採集生產能力的,也沒有執照(沒有測繪資質)。百度的這一塊資料主要是向四維圖新買的。
國內這一塊的資料,主要有兩家供應商,就是高德和四維圖新。
四維圖新和國家測繪單位的關係非比尋常,其資料依賴國家測繪單位供給的佔大頭(當然也有互相供給的)。
高德也有一部分資料來源於國家測繪單位的供給,但是高德自己的航拍製作的能力還是不錯的(還承擔過一些國家測繪機關的測繪任務),相對來說,依賴國家測繪單位資料的比例要低一些。
總的來說,這部分資料的採集生產,在中國需要國家認定的資質,有資質的除了國家測繪機關以外,商業機構本來就不太多,而真正在這個資料供給市場上活躍的,現在主要就是高德和四維圖新這兩家。
其他無論是谷歌地圖也好,蘋果地圖也好,這部分的資料,基本上都是從上述兩家購買的。
2. POI資料:嚴格來說屬於向量資料,不過是最簡單的向量資料,換句話來說就是座標點標註資料。也是電子地圖上最常用的資料圖層。
我們日常在電子地圖上所使用的資料都是POI資料(就是地圖上常見的那種標個氣球的點)。
POI資料只是資訊關聯座標點的資料,不涉及到線和麵,是最簡單的向量資料,用於簡單的地點標註而不需要相應地物輪廓的需求。
POI資料的內容五花八門,一般POI資料的供應商提供的POI資料都是日常常用的場所資料,例如飯店,商店,加油站,銀行等日常常用設施。
當然,在一些特殊的地圖應用領域,也可以委託這些資料供應商或者自行去專門採集特殊用途的POI資料,例如井蓋,消防栓等
<img src="https://pic3.zhimg.com/feff854c76324da17efd2b4194b553b6_b.jpg" data-rawheight="530" data-rawwidth="1101" class="origin_image zh-lightbox-thumb" width="1101" data-original="https://pic3.zhimg.com/feff854c76324da17efd2b4194b553b6_r.jpg">稅務GIS系統標註企業及納稅資訊
值得指出的是,POI資料的編輯更新簡單,同時也經常用於動態資料標註,最經典的莫過於車輛定位標註。
POI資料的採集和生產來源五花八門,不能盡述,總的來說,主要有以下幾種:
a)通過整合GPS的攝像機,步行或者車行,進行掃街持續拍攝,回去以後,再根據拍攝結果手工進行輸入和標註,這種方式適合於大規模的進行採集標註,效率高,成本低,車行居多,尤其適合沿街的店面和場所的採集和標註,是目前資料採集供應商的主要採集手段之一
b)通過專職或者兼職人員,使用手持含GPS的智慧裝置(比如智慧手機),進行拍攝(主要是為了取證),輸入,提交,進行採集。這種採集方式,大多用於上述方法a的補充。在一些車輛不能達到的地方,或者商戶設施變動頻繁的某些區域使用
c)地址反向編譯:通過門牌地址號碼,以及向量地圖中的道路資料,運用演算法進行定位標註。這種標註精度相對最低,準確性也不高,但是成本非常低。用在不需要特別高精度,成本控制也比較嚴的採集領域。大家在地圖服務搜尋框中輸入地址門牌號,可以直接出現標註點,用的就是這個技術。
d)網際網路或者企業獲取:直接從一些專業類服務網站上抓取或者購買(例如大眾點評,攜程),或者直接從大家在其公開的地圖服務上的標註中進行篩選和獲取。這就是google,百度,高德自己免費向社會開放其地圖服務所能夠獲得的利益。尤其對於開放API免費企業客戶的使用,這種獲取是很有價值的。
國內POI資料的供應商沒有太多資質限制,相對底圖資料供應商,要多很多,例如圖吧等都是POI資料供應商,當然四維圖新和高德也提供POI資料,每個POI資料供應商,都有其自己的分類方式,資料定義等內容。很多時候,大家也互相買來買去,互補有無。
百度地圖這方面的資料,主要來自四維圖新和道道通,當然也有其他來源,甚至有少量的自產資料。
高德地圖這方面的資料以自產為主,輔以向一些專業服務商購買(口碑網,大眾點評,攜程,樂途,搜房)
3. 其他資料圖層或資料:常見的有衛圖圖層,交通狀況圖層,三維圖,街景圖。專業一些的領域有樓盤圖,室內圖,氣溫分佈圖,商圈分佈圖,地形圖,水文圖等等。
<img src="https://pic4.zhimg.com/425005488995ca55df0a5559c686b787_b.jpg" data-rawheight="857" data-rawwidth="1378" class="origin_image zh-lightbox-thumb" width="1378" data-original="https://pic4.zhimg.com/425005488995ca55df0a5559c686b787_r.jpg">微觀地圖
<img src="https://pic2.zhimg.com/e57d7ea84c7fd00670e6ee6f7b74c605_b.jpg" data-rawheight="650" data-rawwidth="913" class="origin_image zh-lightbox-thumb" width="913" data-original="https://pic2.zhimg.com/e57d7ea84c7fd00670e6ee6f7b74c605_r.jpg">樓盤市佔圖樓盤市佔圖
<img src="https://pic1.zhimg.com/b0d2cc3fbb416de34701d795b073a60c_b.jpg" data-rawheight="621" data-rawwidth="1021" class="origin_image zh-lightbox-thumb" width="1021" data-original="https://pic1.zhimg.com/b0d2cc3fbb416de34701d795b073a60c_r.jpg">地址災害圖地址災害圖
<img src="https://pic4.zhimg.com/b5f14b407b5a50300a73383509e8a6d3_b.jpg" data-rawheight="527" data-rawwidth="721" class="origin_image zh-lightbox-thumb" width="721" data-original="https://pic4.zhimg.com/b5f14b407b5a50300a73383509e8a6d3_r.jpg">電視有限網路分佈管理圖電視有限網路分佈管理圖
<img src="https://pic3.zhimg.com/ad462b4030bab55b0192c894ef41d5ba_b.jpg" data-rawheight="345" data-rawwidth="454" class="origin_image zh-lightbox-thumb" width="454" data-original="https://pic3.zhimg.com/ad462b4030bab55b0192c894ef41d5ba_r.jpg">室內圖室內圖
<img src="https://pic1.zhimg.com/b66ba17b900610e7a7af7962e7a199c4_b.jpg" data-rawheight="371" data-rawwidth="495" class="origin_image zh-lightbox-thumb" width="495" data-original="https://pic1.zhimg.com/b66ba17b900610e7a7af7962e7a199c4_r.jpg">統計報表圖統計報表圖
<img src="https://pic2.zhimg.com/f596500a440a388287092db3bbdc76b5_b.jpg" data-rawheight="489" data-rawwidth="639" class="origin_image zh-lightbox-thumb" width="639" data-original="https://pic2.zhimg.com/f596500a440a388287092db3bbdc76b5_r.jpg">人口密度圖人口密度圖
<img src="https://pic1.zhimg.com/efee9bca3a2615642d4574afd52c4700_b.jpg" data-rawheight="894" data-rawwidth="1113" class="origin_image zh-lightbox-thumb" width="1113" data-original="https://pic1.zhimg.com/efee9bca3a2615642d4574afd52c4700_r.jpg">三維實景地圖三維實景地圖
<img src="https://pic3.zhimg.com/17705da29f22341cb84376d398eaac26_b.jpg" data-rawheight="775" data-rawwidth="1368" class="origin_image zh-lightbox-thumb" width="1368" data-original="https://pic3.zhimg.com/17705da29f22341cb84376d398eaac26_r.jpg">三維資料示意圖三維資料示意圖
之所以貼這麼多五花八門的圖,主要就是為了說明,基於電子地圖的資料圖層真的是應用範圍和應用領域極廣,不同的圖層,代表了不同的資料,這個領域有大量專業性的應用和資料,其採集方法,來源渠道也五花八門,難以盡述。
簡單說幾種常用資料的來源:
a)交通擁堵資料:這個一般來源於專業的資料供應商,這些供應商和交通部門有較深合作,其資料採集主要依賴於在出租車上安裝的GPS來採集實時車速為主,或者通過攝像頭,紅外探頭,雷達測速測量車速為輔
b)三維資料:主要依賴鐳射掃描以及手工建模處理等
c)假三維資料(那種不能旋轉的45度三維俯檢視):依賴照片拍攝和材質帖紋手工製作。
d)街景:依賴實採拍攝
百度地圖基本上只有最基本常有的一些圖層資料,例如部分三維資料,交通圖層資料,衛片圖層資料等,百度不具備這部分資料的採集和生產能力,都是向不同供應商外購的。
高德地圖有一些專用資料,例如樓盤資料等,高德在一些資料領域有采集和生產能力(例如三維資料等),可以根據客戶的要求進行專業採集生產過程,提供專業的圖層資料。
不過一些特別偏,特別專業的資料領域(就像上面有的有電視網,地址災害圖)就需要應用者自己通過專業的工具進行製作了
有很多特種資料圖層是不能在瓦片圖引擎上顯示,或者在瓦片圖引擎上顯示是沒有任何意義的。
只存在於向量引擎的應用。
總結:
百度的地圖資料主要靠買,高德地圖資料以自己採集生產為主。
就國內的情況來看,主要的資料都依賴於採集。這點和國外發達國家有比較大的差別。在國外發達國家,由於建設速度相對比較緩慢,政府的資訊化水平以及資訊透明做得較好,其實不需要那麼多采集工作。
這個行業內有句話,叫做國外(發達國家)以內勤為主,外勤為輔,國內以外勤為主,內勤為輔。
由於地物變化相對比較緩慢,政府公開和釋出的資料比較及時,透明,準確,可用,因此國外這個行業許多資料生產商直接拿政府公佈資料做一下加工就可以了,改動的地方也不多,國內還比較依賴資料生產上自己採集。
(舉個例子,這裡面比較典型極致的是日本,哪裡新安裝了一個紅綠燈都會在政府網站上及時準確公佈,並標註位置,更不用說樓盤建設,城市建設等大動作了,因此資料生產商拿這些資料來就可以直接用,很少需要自己去採集了)