1. 程式人生 > >建模中冗餘和正規化的權衡

建模中冗餘和正規化的權衡

本文是個人的一些經驗和思考,歡迎留言討論。
先說一下冗餘和正規化的特點:
冗餘是以儲存換取效能,
正規化是以效能換取儲存。
因此,一般在實際工作中冗餘更受歡迎一些。
模型設計時,這兩方面的具體的權衡,首先要以企業提供的計算能力和儲存資源為基礎。
其次,一般網際網路行業中都根據Kimball模式實施資料倉庫,建模也是以任務驅動的,因此冗餘和正規化的權衡符合任務需要。
例如,一份指標資料,必須在早上8點之前處理完成,但計算的時間視窗又很小,要儘可能減少指標的計算耗時,這時在計算過程中要儘可能減少多表關聯,模型設計時需要做更多的冗餘。