1. 程式人生 > >去哪兒數據VS美團數據

去哪兒數據VS美團數據

postgre hbase base 健全 開發 數據同步 class 自己 支持

介紹

之前在去哪兒做數據RD,今年來到美團做數據RD,碰巧都是門票方向(現在去哪兒叫度假,美團叫境內),下面都是基於這兩個部門的對比

相同點

都有獨立的數據團隊,老大都重視數據,主要開發語言都是SQL,都用jira管理任務

不同點

一、團隊人數

去哪兒數據RD3-5個人,美團數據RD10-13人。去哪兒有3-5個產品/分析師,數據產品設計、數據分析什麽都做。美團有專業的商分團隊、BI團隊和數據產品數據分析人員,共15-20人

二、業務劃分

去哪兒各個事業部需要獨自承接數據同步、傳輸、清洗、倉庫、應用等工作。這裏的應用包括數據決策支持和線上產品支持,比如:產品價格自動化、用戶發券召回等等

美團專註於倉庫和數據支持,不直接面向終端用戶

三、開發工具

去哪兒的大數據開發工具基本都是自己搭建&維護的,包括不限於:調度系統、報警系統、數據驗證系統、數據同步、數據報表、郵件報表等等,開發使用SHELL。

美團的開發工具比較健全:開發基本無需登錄服務器,web端即可完成開發、測試和上線。調度系統、數據驗證、數據報警都是公司級別的。報表、數據同步工具也沒的說。

四、應用產品

去哪兒數據產品和數據分析一個團隊,所以數據離應用很近,比如:用戶召回、發放代金券、產品定價都是數據RD直接開發

美團專註於數據支持決策,很少會自主發起直接面向終端用戶的產品

五、技術體系

去哪兒數據倉庫搭建在Postgre和Hadoop兩個上面,之所以保留關系型數據庫,因為它的維護和開發成本更低,對接業務更方便

美團數據倉庫搭建在Hadoop上,應用部分再同步到麒麟、Hbase和Mysql

總結

公司級別的數據方案不一樣,造成了最大的差異。去哪兒沒有統一的數據中臺,事業部各自為戰,會有相當的人力放在數據同步、數據清洗、報表開發、數據驗證等基礎工具上面

體量不一樣,去哪兒和美團的訂單量差異很大,所以去哪兒采用關系數據庫的方案,節約了開發和維護成本

去哪兒數據VS美團數據