1. 程式人生 > >數據中臺與數據倉庫的區別?

數據中臺與數據倉庫的區別?

開發 targe 重要 包括 rec ogr 傳統 ons 存在

數據中臺從某個意義來說屬於數倉的一種,都是要把數據抽進來建立一個數據倉庫。但是兩者的數據來源建立數倉的目標以及數據應用的方向都存在很大差異

首先,從數據來源來說數據中臺的數據來源期望是全域數據包括業務數據庫,日誌數據,埋點數據,爬蟲數據,外部數據等
數據的來源可以是結構化數據或者非結構化的數據。而傳統數倉的數據來源主要是業務數據庫,數據格式也是以結構化數據為主。

其次,建立數據中臺的目標為了融合整個企業的全部數據,打通數據之間的隔閡,消除數據標準和口徑不一致的問題。數據中臺通常會對來自多方面的的基礎數據進行清洗,按照主題域概念建立多個以事物為主的主題域比如用戶主題域,商品主題域,渠道主題域,門店主題域等等。數據中臺遵循三個one的概念: One Data, One ID, One Service,

就是說數據中臺不僅僅是匯聚企業各種數據,而且讓這些數據遵循相同的標準和口徑,對事物的標識能統一或者相互關聯,並且提供統一的數據服務接口。就像做菜一樣,按照標準化的菜名,先把所有可能用到的材料都準備好。而傳統的數倉主要用來做BI的報表,目的性很單一,只抽取和清洗該相關分析報表用到基礎數據,新增一張報表,就要從底層到上層再做一次。

然後,在數據應用方面,建立在數據中臺上的數據應用不僅僅只是面向於BI報表,更多面向營銷推薦,用戶畫像,AI決策分析,風險評估等。而且這些應用的特點是比較輕,容易快速開發出來,因為重要的數據分析工作在數據中臺已經完成並且沈澱,之前工作成果都能被多個應用共享。
而傳統的數據倉庫主要是面向報表,數據應用的建設就是傳統煙囪式建設,每次都從頭再來的開發方式。

最後,數據中臺是建立在分布式計算平臺和存儲平臺,理論上可以無限擴充平臺的計算和存儲能力。而多數的傳統數倉工具都是建立的單機的基礎上,一旦數據量變大,會受單機容量的限制。

技術分享圖片

數據中臺不單單指系統或者工具,而是一個職能部門,通過一系列平臺、工具、流程、規範來為整個組織提供數據資產管理和服務的職能部門。數據中臺負責全域數據采集數據資產加工和管理、並向前臺業務部門和決策部門提供數據服務的,所以數據中臺的核心應該是數據資產管理和數據賦能。通俗的講就是數據彈藥庫。

技術分享圖片

以上內容轉自知乎:https://www.zhihu.com/question/282421879

更多面向營銷推薦,用戶畫像,AI決策分析,風險評估等
[Gèng duō miànxiàng yíngxiāo tuījiàn, yònghù huàxiàng,AI juécè fēnxī, fēngxiǎn pínggū děng] 技術分享圖片 More for marketing recommendations, user portraits, AI decision analysis, risk assessment, etc.

數據中臺與數據倉庫的區別?