數據中臺與數據倉庫的區別?
首先,從數據來源來說,數據中臺的數據來源期望是全域數據包括業務數據庫,日誌數據,埋點數據,爬蟲數據,外部數據等。
數據的來源可以是結構化數據或者非結構化的數據。而傳統數倉的數據來源主要是業務數據庫,數據格式也是以結構化數據為主。
其次,建立數據中臺的目標是為了融合整個企業的全部數據,打通數據之間的隔閡,消除數據標準和口徑不一致的問題。數據中臺通常會對來自多方面的的基礎數據進行清洗,按照主題域概念建立多個以事物為主的主題域比如用戶主題域,商品主題域,渠道主題域,門店主題域等等。數據中臺遵循三個one的概念: One Data, One ID, One Service,
然後,在數據應用方面,建立在數據中臺上的數據應用不僅僅只是面向於BI報表,更多面向營銷推薦,用戶畫像,AI決策分析,風險評估等。而且這些應用的特點是比較輕,容易快速開發出來,因為重要的數據分析工作在數據中臺已經完成並且沈澱,之前工作成果都能被多個應用共享。
而傳統的數據倉庫主要是面向報表,數據應用的建設就是傳統煙囪式建設,每次都從頭再來的開發方式。
最後,數據中臺是建立在分布式計算平臺和存儲平臺,理論上可以無限擴充平臺的計算和存儲能力。而多數的傳統數倉工具都是建立的單機的基礎上,一旦數據量變大,會受單機容量的限制。
數據中臺不單單指系統或者工具,而是一個職能部門,通過一系列平臺、工具、流程、規範來為整個組織提供數據資產管理和服務的職能部門。數據中臺負責全域數據采集、數據資產加工和管理、並向前臺業務部門和決策部門提供數據服務的,所以數據中臺的核心應該是數據資產管理和數據賦能。通俗的講就是數據彈藥庫。
以上內容轉自知乎:https://www.zhihu.com/question/282421879
更多面向營銷推薦,用戶畫像,AI決策分析,風險評估等
數據中臺與數據倉庫的區別?