華為資料之道_簡讀
阿新 • • 發佈:2021-11-30
華為 Data
特定的背景和不同的驅動力:
高層對低質量的資料表現的感知疼痛,對資料治理巨大價值的認知
業務模式: 對內 2B 2C 資料去驅動流程效率的提升 生產力的發展最終還會受制於生產關係
資料規模: 海量資料的儲存和分析壓力-有沒有?
資料確權:流程管理體系 人事組織體系 企業文化體系 企業制度體系
人才隊伍:懂技術,懂業務的資料管理的專業隊伍
資料來源:資料採集的全面性
資料應用:資料的生命週期管理 多維資料分析
架構: 企業級資訊架構 部門級資訊架構
資料工作框架-企業級資訊架構
資料來源: 資料來源數字化,資料採集 資料來源建立、讀取、更新、刪除 資料底座 資料湖: 資料交換層+資料處理層 主題關聯:基礎模型、融合模型及洞察主題 資料消費:資料處理層的分析引擎+ 資料應用應用層 資料治理: 資料資產管理 計算資源管理 儲存資源管理 資料治理融入IT實施中
資料分類
1.資料分類: 內部資料和外部資料 非結構化資料和結構化資料 01. 結構化資料: 觀測資料:觀測工具 軟感知資料 硬感知資料 基礎資料 主資料 事務資料 報告資料 規則資料 02.非結構化資料:需要智慧化的IT技術支援 管理物件的標題 格式 等基本特徵和定義 對資料內容的客觀理解進行管理:標籤 ,相似性檢索 相似性連線 治理核心: 對其基本特徵與內容進行提取,並通過元資料落地進行開展 2.治理: 元資料 技術元資料 業務元資料 操作元資料
本書結構:
綜合治理體系、
資料分類
資訊架構、
資料湖和資料主題聯結-資料底座
資料消費
資料質量和資料安全
問題:
額外的人工轉換和翻譯,這極大增加人工成本,延長業務執行週期